Python 如何对文件目录操作
作者:Alan.hsiang 发布时间:2022-10-08 05:40:04
概述
I/O操作不仅包括屏幕输入输出,还包括文件的读取与写入,Python提供了很多必要的方法和功能,进行文件及文件夹的相关操作。本文主要通过两个简单的小例子,简述Python在文件夹及文件的应用,仅供学习分享使用,如有不足之处,还请指正。
涉及知识点
os模块:os 模块提供了非常丰富的方法用来处理文件和目录。
open方法:open方法用于打开一个文件,用于读取和写入。
实例1:获取指定目录下所有的文件大小,并找出最大文件及最小文件
分解步骤:
遍历文件夹下所有的子文件及子文件夹(需要递归),并计算每一个文件的大小
计算所有文件的大小总和
找出最大文件及最小文件
核心代码
定义一个方法get_file_size,获取单个文件的大小,单位有KB和MB两种。关键点如下所示:
os.path.getsize 用于获取指定文件的大小,单位是Byte。
round为四舍五入函数,保留指定位数的小数。
def get_file_size(file_path, KB=False, MB=False):
"""获取文件大小"""
size = os.path.getsize(file_path)
if KB:
size = round(size / 1024, 2)
elif MB:
size = round(size / 1024 * 1024, 2)
else:
size = size
return size
定义一个方法list_files,遍历指定文件目录,并存入字典当中。关键点如下所示:
os.path.isfile 用于判断给定的路径是文件还是文件夹。
os.listdir 用于获取指定目录下所有的文件及文件夹,返回一个列表,但是只是当前文件夹的名称,并不是全路径。
os.path.join 用于拼接两个路径
def list_files(root_dir):
"""遍历文件"""
if os.path.isfile(root_dir): # 如果是文件
size = get_file_size(root_dir, KB=True)
file_dict[root_dir] = size
else:
# 如果是文件夹,则遍历
for f in os.listdir(root_dir):
# 拼接路径
file_path = os.path.join(root_dir, f)
if os.path.isfile(file_path):
# 如果是一个文件
size = get_file_size(file_path, KB=True)
file_dict[file_path] = size
else:
list_files(file_path)
计算总大小和最大文件及最小文件,如下所示:
通过比较字典value的大小,返回对应的key的名称。关键点如下所示:
max_file = max(file_dict, key=lambda x: file_dict[x])
min_file = min(file_dict, key=lambda x: file_dict[x])
if __name__ == '__main__':
list_files(root_dir)
# print( len(file_dict))
# 计算文件目录大小
total_size = 0
# 遍历字典的key
for file in file_dict:
total_size += file_dict[file]
print('total size is : %.2f' % total_size)
# 找最大最小文件
max_file = max(file_dict, key=lambda x: file_dict[x])
min_file = min(file_dict, key=lambda x: file_dict[x])
print('max file is : ', max_file, '\n file size is :', file_dict[max_file])
print('min file is : ', min_file, '\n file size is :', file_dict[min_file])
实例2:将两个文本文件中的内容进行合并,并保存到文件中
两个文件内容,如下图所示:
分解步骤:
读取两个文件中的内容并进行解析出key和value,存入字典当中(两个字典,分别存储两个文件的内容)。
遍历第1个字典,并查找第2个字典当中相同key的值,如不存在,则只显示第1个内容,如存在,则进行合并。
遍历第2个字典,并查找不在第1个字典当中的key的值,进行累加。
将拼接后的列表存入文件当中。
核心代码
定义一个函数read_book,用于读取两个文件的内容。关键点如下所示:
open函数用于打开一个文件,文件编码为UTF-8。
readlines用于读取所有的行,并返回一个列表。
split用于分割字符串为数组。
def read_book():
"""读取内容"""
# 读取一个文件
file1 = open('book1.txt', 'r', encoding='UTF-8')
lines1 = file1.readlines()
file1.close()
for line in lines1:
line = line.strip() # 去空白
content = line.split(',')
book1[content[0]] = content[1]
# 另一种方式,读取另一个文件,不需要close,会自动关闭
with open('book2.txt', 'r', encoding='UTF-8') as file2:
lines2 = file2.readlines()
for line in lines2:
line = line.strip() # 去空白
content = line.split(',')
book2[content[0]] = content[1]
定义一个函数,用于合并内容,并保存。关键点如下所示:
append 用于为数组添加新元素。
dict.keys函数 用于返回所有的key。
join函数用于将数组转换成字符串,并以对应字符分割。
writelines 用于写入所有的行到文件。
with语法,当执行结束时,自动close,并释放资源。
def merge_book():
"""合并内容"""
lines = [] # 定义一个空列表
header = '姓名\t 电话\t 文本\n'
lines.append(header)
# 遍历第一个字典
for key in book1:
line = ''
if key in book2.keys():
line = line + '\t'.join([key, book1[key], book2[key]])
line += '\n'
else:
line = line + '\t'.join([key, book1[key], ' *****'])
line += '\n'
lines.append(line)
# 遍历第2个,将不包含在第1个里面的写入
for key in book2:
line = ''
if key not in book1.keys():
line = line + '\t'.join([key, ' *****', book2[key]])
line += '\n'
lines.append(line)
# 写入book3
with open('book3.txt', 'w', encoding='UTF-8') as f:
f.writelines(lines)
整体调用,如下所示:
if __name__ == '__main__':
# 读取内容
read_book()
# 合并内容
merge_book()
# print(book1)
# print(book2)
最后拼接后生成的文件,如下所示:
通过以上两个例子,可以大致了解文件及目录操作的一些方法及步骤。
来源:https://www.cnblogs.com/hsiang/p/13126403.html
猜你喜欢
- 这边我是需要得到图片在Vgg的5个block里relu后的Feature Map (其余网络只需要替换就可以了)索引可以这样获得vgg =
- 1.安装mockjs和vite-plugin-mocknpm i mockjs vite-plugin-mock --save-dev2.在
- 1. 图信号处理知识图卷积神经网络涉及到图信号处理的相关知识,也是由图信号处理领域的知识推导发展而来,了解图信号处理的知识是理解图卷积神经网
- 系统支持的语言是有类:Language表示;多语言资源对应的类为:LocalizedProperty;当先选择某种语言存储在类中:Gener
- Python能够干嘛?可以做日常任务,比如自动备份你的MP3;可以做网站,很多著名的网站像知乎、YouTube就是Python写的;可以做网
- 前言之前看过一遍的python教程,真的是自己看过一遍,python的程序能看懂,但是很难去实现。比较困难的自己实现一些代码,找工作原因,自
- 一、备份数据库 1、打开SQL企业管理器,在控制台根目录中依次点开Microsoft SQL Server
- PyTorch最近几年可谓大火。相比于TensorFlow,PyTorch对于Python初学者更为友好,更易上手。
- 要用ifnull,而不是isnullisnull是判断是否为null,返回值是1表示null或者0表示不为空ifnull等同于oracle的
- 1.join函数的语法及用法(1)语法:'sep'.join(sep_object)参数说明sep:分割符,可为&l
- 我就废话不多说了,大家还是直接看代码吧~# -*- coding: utf-8 -*-#keras==2.0.5#tensorflow==1
- 滑动验证码介绍本篇涉及到的验证码为滑动验证码,不同于极验证,本验证码难度略低,需要的将滑块拖动到矩形区域右侧即可完成。这类验证码不常见了,官
- 如何使DIV居中,div垂直居中,div水平居中.这个问题在用CSS来设计网页的时候经常会遇到,如果用传统的表格来布局是很简单的,CSS里就
- 本文实例讲述了python使用分治法实现求解最大值的方法。分享给大家供大家参考。具体分析如下:题目:给定一个顺序表,编写一个求出其最大值和最
- 游标(Cursor)是处理数据的一种方法,为了查看或者处理结果集中的数据,游标提供了在结果集中一次以行或者多行前进或向后浏览数据的能力。我们
- 在程序实际应用中,少不了要进行字符串拼接的操作。下面介绍一下Python语言中四种字符串拼接的方式。1. 算术运算符拼接在Python中算术
- 一、无镜像安装 pip install 库名打开命令提示符【win + r】,输入cmd,在命令提示窗口输入pip install 库名,
- 作为一个.net后台开发的程序猿,博客里既然大多都是前端相关的博文。是不是该考虑换方向了,转前端开发得了 ...小小吐槽一下,近期受该不该跳
- 目录一、图解二、json.loads()用法三、json.load()用法四、此外还有一种json.dumps语法实例一、图解json.lo
- 如下所示:fp = open(''test2.txt','w') #打开你要写得文件test2.tx