python如何读取.mtx文件
作者:努力干活还不粘人的小妖精 发布时间:2023-11-17 21:26:55
标签:python,读取,mtx
mtx文件是按照稀疏矩阵格式存储的矩阵数据,可以按照以下步骤读取:
1、安装scanpy包
pip install scanpy
2、文件读取
import scanpy as sc
adata = sc.read(filename)
data = adata.X
第一行read之后返回的是annData,第二行通过.X操作得到的是矩阵数据
3、转换为稠密矩阵
data = data.todense()
直接得到的矩阵是稀疏形式的,通过todense函数可转换为稠密矩阵
补充:python读取各种文件方式
Json:
use_time=[]
with open(address,'r') as f: #ubuntu
mobile = json.load(f)
calls = mobile["transactions"][0]["calls"]
for call in calls:
use_time.append(str(call['use_time']))
Excel:
rawdata1=open_workbook(address)
rawdata=rawdata1.sheet_by_index(0)
for i in range(1,rawdata.nrows):
if rawdata.cell(i,date_index).value=="": #跳过空行
continue
else:
if ctype==3: #若为3,则用datetime模块处理日期
date1=rawdata.cell(i,date_index).value
date2 = xldate_as_tuple(date1,0)
date3=datetime(*date2)
if "." in str(rawdata.cell(i,phone_index).value):
phone1=str(rawdata.cell(i,phone_index).value)[:-2]
else:
phone1=str(rawdata.cell(i,phone_index).value)
写EXCEL:
Excel_file = xlwt.Workbook()
sheet = Excel_file.add_sheet('sheet0')
header=[u'号码','日期top1','日期top2','日期top3']
#写入标题行:
for i in range(len(header)):
sheet.write(0,i,header[i])
#开始按行写入数据:
for i in range(len(phonelist)):
sheet.write(i+1,0,phonelist[i])
sheet.write(i+1,1,dic[str(phonelist[i])])
#保存EXCEL:
Excel_file.save("C:/Users/Desktop/100个文件输出xls/"+str(fileName)+".xls")
CSV:
rawdata=pd.read_csv(address,skip_blank_lines=True) #参数为去除空行
if 'start_time' or 'begin_time' in rawdata.columns:
if 'start_time' in rawdata.columns:
start_time=rawdata['start_time']
elif 'begin_time' in rawdata.columns:
start_time=rawdata['begin_time']
txt:
rawdata=open(address,'r')
i=0
a=[] #c存放第一行的列名
for line in rawdata:
if i==1: #默认第二行开始存储通话数据
a=line.split(',') #逗号作为分隔符
for j in range(len(a)): #查找指定列名所在的列下标
if (('-' in str(a[j]))or('/' in str(a[j]))): #判断日期所在列数
date_index=j #保存日期的列下标
elif str(a[j]).isdigit() and len(str(a[j]))>5: #默认全为数字组成的字符串为电话号码
phone_index=j
else:
pass
break
else:
i+=1
i=0
for line in rawdata:#开始转存数据:
if len(line)<10: #跳过空行
continue
data_line=line.split(',') #txt默认以','分隔数据
if i==0:
pass #第一行为列名,跳过
i+=1
else: #从第二行开始保存数据
start_time.append(data_line[date_index])
以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。如有错误或未考虑完全的地方,望不吝赐教。
来源:https://blog.csdn.net/qq_38402294/article/details/110959330


猜你喜欢
- 有时候你会发现Django数据库API带给你的也只有这么多,那你可以为你的数据库写一些自定义SQL查询。 你可以通过导入django.db.
- 本文实例讲述了Python3.4列表、数组操作。分享给大家供大家参考,具体如下:python列表,数组类型要相同,python不需要指定数据
- 本文实例为大家分享了vue无缝滚动组件vue-seamless-scroll的具体实现代码,供大家参考,具体内容如下下载cnpm i -S
- AS 用法:AS在mysql用来给列/表起别名.有时,列的名称是一些表达式,使查询的输出很难理解。要给列一个描述性名称,可以使用列别名。要给
- 本文web服务器使用的为apache。1. 安装apacheyum install -y httpd2. 配置apache修改apache配
- 在Python中可以通过几种方法调用C++的函数,这里介绍使用ctypes的方法。ctypes是Python自带的一个模块,能够直接载入C+
- pytorch里面的maxpool,有一个属性叫ceil_mode,这个属性在api里面的解释是ceil_mode: when True,
- 前言在实际开发中, 有不少的场景需要使用到模糊查询, MongoDB shell 模糊查询很简单:db.collection.find({&
- python实现取余操作的方法:可以利用求模运算符(%)来实现。求模运算符可以将两个数相除得到其余数。我们还可以使用divmod()函数来实
- /// <summary> /// 获得目标
- 方法: 使用urlencode函数urllib.request.urlopen()import urllib.requestimport u
- 迭代器是一种支持next()操作的对象。它包含一组元素,当执行next()操作时,返回其中一个元素;当所有元素都被返回后,生成一个StopI
- 1.open使用open打开文件后一定要记得调用文件对象的close()方法。比如可以用try/finally语句来确保最后能关闭文件。fi
- HTTP_X_FORWARDED_FOR与REMOTE_ADDR的区别.在Request.ServerVariables中并没有HTTP_X
- 背景:不久前,设计实现了京东api的功能,发现如果换了其它快递再重新设计,岂不是会浪费太多的时间,所以选个第三方提供的快递API是最为合理的
- 一、在vs中新建一个工程,然后新建一个源文件二、右击上述图片中的mysql_test工程名,然后在最下方找到属性,并点击三、点击VC++目录
- 本文重点系统分析网页性质结构化的数据解析csv数据保存环境介绍python 3.8pycharm 专业版 >>> 激活码#
- 前言为了参加某个作秀活动,研究了一波如何结合小程序、科大讯飞实现语音录入、识别的实现。科大讯飞开发文档中只给出 Python 的 demo,
- 加载相关库import randomimport seaborn as snsimport matplotlib.pyplot as plt
- 版本链在InnoDB引擎表中,他们的聚簇索引记录中有两个隐藏列:trx_id:用来存储对数据进行修改时的事务idroll_pointer:每