python如何读取.mtx文件
作者:努力干活还不粘人的小妖精 发布时间:2023-11-17 21:26:55
标签:python,读取,mtx
mtx文件是按照稀疏矩阵格式存储的矩阵数据,可以按照以下步骤读取:
1、安装scanpy包
pip install scanpy
2、文件读取
import scanpy as sc
adata = sc.read(filename)
data = adata.X
第一行read之后返回的是annData,第二行通过.X操作得到的是矩阵数据
3、转换为稠密矩阵
data = data.todense()
直接得到的矩阵是稀疏形式的,通过todense函数可转换为稠密矩阵
补充:python读取各种文件方式
Json:
use_time=[]
with open(address,'r') as f: #ubuntu
mobile = json.load(f)
calls = mobile["transactions"][0]["calls"]
for call in calls:
use_time.append(str(call['use_time']))
Excel:
rawdata1=open_workbook(address)
rawdata=rawdata1.sheet_by_index(0)
for i in range(1,rawdata.nrows):
if rawdata.cell(i,date_index).value=="": #跳过空行
continue
else:
if ctype==3: #若为3,则用datetime模块处理日期
date1=rawdata.cell(i,date_index).value
date2 = xldate_as_tuple(date1,0)
date3=datetime(*date2)
if "." in str(rawdata.cell(i,phone_index).value):
phone1=str(rawdata.cell(i,phone_index).value)[:-2]
else:
phone1=str(rawdata.cell(i,phone_index).value)
写EXCEL:
Excel_file = xlwt.Workbook()
sheet = Excel_file.add_sheet('sheet0')
header=[u'号码','日期top1','日期top2','日期top3']
#写入标题行:
for i in range(len(header)):
sheet.write(0,i,header[i])
#开始按行写入数据:
for i in range(len(phonelist)):
sheet.write(i+1,0,phonelist[i])
sheet.write(i+1,1,dic[str(phonelist[i])])
#保存EXCEL:
Excel_file.save("C:/Users/Desktop/100个文件输出xls/"+str(fileName)+".xls")
CSV:
rawdata=pd.read_csv(address,skip_blank_lines=True) #参数为去除空行
if 'start_time' or 'begin_time' in rawdata.columns:
if 'start_time' in rawdata.columns:
start_time=rawdata['start_time']
elif 'begin_time' in rawdata.columns:
start_time=rawdata['begin_time']
txt:
rawdata=open(address,'r')
i=0
a=[] #c存放第一行的列名
for line in rawdata:
if i==1: #默认第二行开始存储通话数据
a=line.split(',') #逗号作为分隔符
for j in range(len(a)): #查找指定列名所在的列下标
if (('-' in str(a[j]))or('/' in str(a[j]))): #判断日期所在列数
date_index=j #保存日期的列下标
elif str(a[j]).isdigit() and len(str(a[j]))>5: #默认全为数字组成的字符串为电话号码
phone_index=j
else:
pass
break
else:
i+=1
i=0
for line in rawdata:#开始转存数据:
if len(line)<10: #跳过空行
continue
data_line=line.split(',') #txt默认以','分隔数据
if i==0:
pass #第一行为列名,跳过
i+=1
else: #从第二行开始保存数据
start_time.append(data_line[date_index])
以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。如有错误或未考虑完全的地方,望不吝赐教。
来源:https://blog.csdn.net/qq_38402294/article/details/110959330
0
投稿
猜你喜欢
- 下面是我写的NumericStepper:谢谢 果果 和 Rimifon , 我对代码进行了完善, 支持自适应小数位数:
- 定义简单的类面向对象是更大的封装,在一个类中封装多个方法,这样通过这个类创建出来的对象,就可以直接调用这些方法了!定义只包含方法的类在pyt
- Pycharm 作为一款针对 Python 的编辑器,配置简单、功能强大、使用起来省时省心,对初学者友好,这也是为什么编程教室一直推荐新手使
- API的应用通常会处理json数据,刚好今天看到了json字符串和python字符串的区别,放一段代码,区别一下子就看出来,的确json 库
- django在使用外键ForeignKey的时候,会自动给当前字段后面添加一个后缀_id。正常来说这样并不会影响使用。除非你要写原生sql,
- map()是一个 Python 内建函数,它允许你不需要使用循环就可以编写简洁的代码。一、Python map() 函数这个map()函数采
- pycharm from lxml import etree标红##原因:没有lxml这个包###解决方法:需要安装xlml包####下载地
- MySQL、SQL Server和mSQL都是绝佳的SQL工具,可惜,在ASP的环境下你却用不着它们来创建实用的SQL语句。不过,你可以利用
- PHP输出JSON格式数据常用框架封装好的方法来输出JSON数据,但是手动去书写的时候却遇到了问题,因为输出的数据类型为字符串类型,导致不能
- 1.图例legend基础语法及用法legend语法参数如下: matplotlib.pyplot.legend(*args, **
- 用于绘制直线的line函数;用于绘制椭圆的ellipse函数;用于绘制矩形的rectangle函数;用于绘制圆的circle函数;用于绘制填
- 全选、全不选、反选这几个功能我们经常会用到,如我们可以用在文章列表管理页面,也可以用在音乐播放页面,使用全选我们可以很方便的进行批量操作,如
- 通过变量ID得到变量的值已知获得变量的id用函数id(),那么它的反函数是什么?答案是:PyObj_FromPtr,据此,写了一个函数di(
- 如题:在python的函数调用中需要记录时间,下面是记录毫秒时间的方法。import datetimeimport timet1 = dat
- python 自定义封装带颜色的logging模块自己在搭建python接口自动化框架 分享一些内容过程中想自己封装一个logger方法 根
- 什么是M2det目标检测算法一起来看看M2det的keras实现吧,顺便训练一下自己的数据。常见的特征提取方法如图所示有SSD形,FPN形,
- 这篇文章主要介绍了如何通过Django使用本地css/js文件,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,
- 1、需要准备工具xftp:上传项目文件本地下载地址:https://www.jb51.net/softs/81853.htmlxshell:
- 利用卷积神经网络训练图像数据分为以下几个步骤1.读取图片文件2.产生用于训练的批次3.定义训练的模型(包括初始化参数,卷积、池化层等参数、网
- 前言在写波段配准相关代码时经常需要用到tif影像的波段合成和分解,虽然可以用ENVI才处理,但是每次都要打开再设置一些参数有些麻烦,所以本着