Python3压缩和解压缩实现代码
作者:Python探索牛 发布时间:2022-05-04 09:42:19
标签:Python3,压缩,解压缩
一、说明
压缩和解压缩是日常常用的操作,不管是windows上图形界面的操作,还是linux上用命令来进行压缩解压缩,总的而言都还是比较方便的。
但用代码来实现就没做过,近期也得实现代码压缩与解压缩操作,所以就抽时间来研究一下。
二、zip文件压缩和解压缩实现
import os
import zipfile
# 函数功能是zip_file_list所有文件,和zip_dir_list所有目录下的所有文件,被压缩到一个zip_file_name的压缩文件中
def my_zip_function(zip_file_name, zip_file_list=[], zip_dir_list=[]):
# 压缩文件最后需要close,为了方便我们直接用with
with zipfile.ZipFile(zip_file_name, "w") as zip_obj:
# 压缩文件
for tmp_file in zip_file_list:
zip_obj.write(tmp_file)
# 压缩目录
for tmp_dir in zip_dir_list:
# zipfile没有直接压缩目录的功能,要压缩目录只能遍历目录一个一个文件压。
for root, dirs, files in os.walk(tmp_dir):
# 如果想要目录为空时仍将该目录压缩进去,该目录也要压缩一遍;反之请将以下行注释掉
zip_obj.write(root)
for tmp_file in files:
# 拼接文件完整目录,不然只用文件名代码找不到文件
tmp_file_path = os.path.join(root, tmp_file)
zip_obj.write(tmp_file_path)
# 函数功能是遍历压缩文件中的所有文件
def my_traversal_zip_function(zip_file_name):
with zipfile.ZipFile(zip_file_name, "r") as zip_obj:
# 返回结果是一个ZipInfo列表
# 如果在压缩时显示压缩目录,则目录也作为一个单独的ZipInfo呈现在列表中;反之则没有目录的ZipInfo
all_file_list = zip_obj.infolist()
for tmp_file in all_file_list:
print(tmp_file.filename)
# 还可以在不解压的情况下直接读取文件的内容
# 可以通过ZipInfo.is_dir()来区分是文件还是目录
# if not tmp_file.is_dir():
# with zip_obj.open(tmp_file) as zip_fd:
# print(zip_fd.read())
# 函数的功能是将压缩文件直接解压
def my_unzip_function(zip_file_name, path="."):
with zipfile.ZipFile(zip_file_name, "r") as zip_obj:
zip_obj.extractall(path=path)
if __name__ == "__main__":
zip_file_name = "test_zip.zip"
# 自己在测试时要先自行创建好要压缩的文件和目录
zip_file_list = ["test_tar_file1.txt", "test_tar_file2.txt"]
zip_dir_list = ["test_tar_dir"]
my_zip_function(zip_file_name, zip_file_list, zip_dir_list)
my_traversal_zip_function(zip_file_name)
# my_unzip_function(zip_file_name, path=".")
三、tar文件的压缩与解压缩实现
除了直接的.tar文件,还包括.tar.gz/.tar.bz2/.tar.xz
等格式文件的压缩与解压缩实现。
import os
import tarfile
# Python学习交流群:778463939
# 函数功能是tar_file_list所有文件,和tar_dir_list所有目录下的所有文件,被压缩到一个tar_file_name的压缩文件中
def my_tar_function(tar_file_name, tar_file_list=[], tar_dir_list=[], model="w"):
# 本来也应该是tarfile.TarFile(tar_file_name, model)来创建的,但TarFile不支持"r:gz"等扩展形式
# 压缩文件最后需要close,为了方便我们直接用with
with tarfile.open(tar_file_name, model) as tar_obj:
# 压缩文件
for tmp_file in tar_file_list:
tar_obj.add(tmp_file)
# 压缩目录。和zipfile相比tarfile允许直接压缩目录,而不需要去遍历目录一个个文件压
for tmp_dir in tar_dir_list:
tar_obj.add(tmp_dir)
# 函数功能是遍历压缩文件中的所有文件
def my_traversal_tar_function(tar_file_name, model="r"):
with tarfile.open(tar_file_name, model) as tar_obj:
# 返回结果是一个TarInfo列表
all_file_list = tar_obj.getmembers()
for tmp_file in all_file_list:
print(tmp_file.name)
# 还可以在不解压的情况下直接读取文件的内容
# 可以通过TarInfo.isdir()来区分是文件还是目录
# if not tmp_file.isdir():
# # 相当于zip的open,并不会把文件给解压出来
# tar_fd = tar_obj.extractfile(tmp_file)
# print(tar_fd.read())
# 函数的功能是将压缩文件直接解压
def my_untar_function(tar_file_name, path=".", model="r"):
with tarfile.open(tar_file_name, model) as tar_obj:
tar_obj.extractall(path=path)
if __name__ == "__main__":
# 自己在测试时要先自行创建好要压缩的文件和目录
tar_file_list = ["test_tar_file1.txt", "test_tar_file2.txt"]
tar_dir_list = ["test_tar_dir"]
tar_file_name = "test_tar.tar"
# 在.tar基础上,tarfile还支持gz/bz2/xz的压缩,只要在原来打开模式的基础上使用:或|接上压缩方法即可,如"r:gz"
# 特别的,如果是读取文件,可以使用"r:*"来指示尝试以任意格式读取
open_model = "w"
# open_model = "w:gz"
my_tar_function(tar_file_name, tar_file_list, tar_dir_list, model=open_model)
open_model = "r"
# open_model = "r:*"
my_traversal_tar_function(tar_file_name, model=open_model)
# open_model = "r:*"
# my_untar_function(tar_file_name, path=".", model=open_model)
来源:https://www.cnblogs.com/djdjdj123/archive/2021/02/28/14459634.html
0
投稿
猜你喜欢
- 看下面的一组例子:alert(true.toString());alert(false.toString());alert(1.123.to
- 本文实例为大家分享了python实现12306图片验证效果的具体代码,供大家参考,具体内容如下思路:在鼠标点击位置加一个按钮,然后再按钮中的
- A.动态页面第一步:创建转向控制页面,创建网站默认的首页文件(通常为"index.asp"或"default.
- requests是常用的请求库,不管是写爬虫脚本,还是测试接口返回数据等。都是很简单常用的工具。这里就记录一下如何用requests发送js
- 最近在学习python爬虫,使用requests的时候遇到了不少的问题,比如说在requests中如何使用cookies进行登录验证,这可以
- 线性逻辑回归本文用代码实现怎么利用sklearn来进行线性逻辑回归的计算,下面先来看看用到的数据。这是有两行特征的数据,然后第三行是数据的标
- 0. 前言无论在工作中,还是学习中,都会出现这样子的需求,对某张表进行了排序(按时间排序也好,其他字段排序也罢),然后获取前x行的数据,由于
- 近日,被同事问及一个产品列表的做法怎么实现?一个产品列表,每个产品列表后面跟一个button,这些button居右对齐。其实这个效果跟新闻列
- Pyppeteer简介Puppeteer 是 Google 基于 Node.js 开发的一个工具,有了它我们可以通过 JavaScript
- 颜色的变化跟人类的智慧一样,是无穷的,每个阶段都会有流行的色彩,有属于一个时代的颜色!WEB2.0是一个概念,它宣扬,定位了一些东西,以用户
- 年前在重写淘宝旺铺里的会员卡脚本的时候,无意中发现了一个有趣的事情。代码类似:var associative_array = new Arr
- 1.为什么需要创建虚拟环境?虚拟环境是隔离应用确切依赖项的好办法。此类隔离避免了全局 Python 环境中的冲突,有助于进行测试和协作。随着
- 这篇文章主要是想说,“引用只能指向具体对象而不能指向引用”//创建变量testArray 并引用数组 ["1&
- overflow:hidden这个CSS样式是大家常用到的CSS样式,但是大多数人对这个样式的理解仅仅局限于隐藏溢出,而对于清除浮动这个含义
- PyQt5 事件处理机制PyQt为事件处理提供了两种机制:高级的信号与槽机制,以及低级的事件处理机制。信号与槽可以说是对事件处理机制的高级封
- 1) 使用字典dict()循环遍历出一个可迭代对象中的元素,如果字典没有该元素,那么就让该元素作为字典的键,并将该键赋值为1,如果存在就将该
- 前言使用np.savetxt()方法可以将数据保存为txt文件或者是csv文件。1 np.savetxt()存储txt文件1-1 基础参数n
- 前言在 Go 单元测试这个系列的第二部分 数据库的Mock测试 中我们介绍了用 go-sqlmock 给数据库的 CRUD 操作做Mock
- 邹建 2004.4 代码如下:/*--调用示例 exec p_lockinfo1 --*/ alter proc p_lockinfo1
- 1. auth介绍Django 自带一个用户验证系统。它负责处理用户账号、组、权限和基于cookie的用户会话。认证系统由以下部分