Python 读取 .gz 文件全过程
作者:努力沉淀 发布时间:2021-11-02 16:01:04
标签:Python,读取,gz文件
Python 读取 .gz 文件
读取.gz 文件需要使用gzip 包,如果没有安装可以自行在终端安装
pip install gzip
import gzip
path = "" #你的文件路径
f = gzip.open(path, 'rb')
for line in f.readlines(): # 按行进行读取
s = line.decode() # 读取之后要进行解码
print(s) # s 为string类型,就是我们读取的文件中的一行
也可以批量读取,批量读取文件使用os包对文件夹中的所有文件进行
import gzip
import os\
path = "" #表示你要打开的文件夹
files = os.listdir(path) #files 是path中存放的所有文件名集合
for file in files:
f = gzip.open(path+file, 'rb')
for line in f.readline():
print(line)
Python 读取gz文件,字符串与字节串的相互转换
首先是字节串转字符串,也就是str:
b = b'some byte array'
str(b, encoding = "utf-8")
#or
bytes.decode(b)
然后是字符串转为字节串:
s = 'some string'
bytes(s, encoding = "utf8")
#or
str.encode(s)
fastq.gz文件读取
with gzip.open(fq,'r') as fastq:
try:
while True:
line1 = next(fastq).decode() # 字节转字符串
line2 = next(fastq).decode()
line3 = next(fastq).decode()
line4 = next(fastq).decode()
except:
pass
来源:https://blog.csdn.net/qq_39129717/article/details/123380595


猜你喜欢
- NumPy广播(Broadcast),广播(Broadcast)是 numpy 对不同形状(shape)的数组进行数值计算的方式, 对数组的
- 内容摘要:本文介绍了使用CSS结合javascript来实现对超链接的类型进行标注,让浏览者明确是zip,doc,pdf或其它格式的文件。这
- Pillow库是一个Python的第三方库。在Python2中,PIL(Python Imaging Library)是一个非常好用的图像处
- 写入已有文件如需写入已有的文件,必须向 open() 函数添加参数。“a” - 追加 - 会追加到文
- 一般情况下只有需要长期运行的项目才会去关注内存的增长情况,即使是很小部分的内存泄露经过长期的运行仍然会产生很大的隐患。python本身也是支
- 除了使用xlrd库或者xlwt库进行对excel表格的操作读与写,而且pandas库同样支持excel的操作;且pandas操作更加简介方便
- MySql通用分页存储过程过程参数p_cloumns varchar(500),p_tables varchar(100),p_where
- 用系统\administrators可以登录,在安全性用户列表中,修改sa属性时系统提示: 属性IsLocked不可用于登录"[s
- 在页面中使用window全局变量main.js中定义:window.xxx=[];在data中定义:data() {? ? return {
- 本文实例代码主要实现的是python遍历文件目录的操作,有三种方法,具体代码如下。#coding:utf-8 # 方法1:递归遍历目录 im
- session_unset() 释放当前在内存中已经创建的所有$_SESSION变量,但不删除session文件以及不释放对应的sessio
- 一、说明压缩和解压缩是日常常用的操作,不管是windows上图形界面的操作,还是linux上用命令来进行压缩解压缩,总的而言都还是比较方便的
- 数据库账号密码加密详解及实例数据库中经常有对数据库账号密码的加密,但是碰到一个问题,在使用UserService对密码进行加密的时候,spr
- 本文实例为大家分享了python地震数据可视化的具体代码,供大家参考,具体内容如下参考源码:seisplot准备工作:在windows10下
- 拉勾网面试题1. 你首先说出三个不同的特殊数,要求必须是个位数,比如3、5、7。2. 让所有学生拍成一队,然后按顺序报数。3. 学生报数时,
- 问题背景:点击用户头像 => 进入用户个人中心,在用户个人中心里点击其他用户的头像,我希望显示被点击用户的个人中心,但只看到了路由参数
- Python For 循环for 循环用于迭代序列(即列表,元组,字典,集合或字符串)。这与其他编程语言中的 for 关键字不太相似,而是更
- os包想要使用os包一样要先导入:import osos包下可以直接调用的函数下面介绍一下os包中可以直接调用的函数:例子:例子:例子:注意
- 平常需要怎么做来维护数据库吗?1. 允许收缩数据库中的每个文件以删除未使用的页。数据和事务日志文件都可以收缩。数据库文件可以作为组或单独地进
- 1.首先到jetbrains下载专业版 https://www.jetbrains.com/pycharm/download/#sectio