网络编程
位置:首页>> 网络编程>> Python编程>> Python 读取某个目录下所有的文件实例

Python 读取某个目录下所有的文件实例

作者:嘎里给给  发布时间:2022-08-27 20:04:13 

标签:python,读取,文件

在处理数据的时候,因为没有及时的去重,所以需要重新对生成txt进行去重。

可是一个文件夹下有很多txt,总不可能一个一个去操作,这样效率太低了。这里我们需要用到 os 这个包

关键的代码


<span style="font-size:14px;"># coding=utf-8
#出现了中文乱码的问题,于是我无脑utf-8 。希望后期的学习可以能理解
import os
import os.path
import re
import sys
import codecs
reload(sys)
sys.setdefaultencoding('utf-8')

#这里放着你要操作的文件夹名称
path = 'E:\\get_key\\'

#把e:\get_key\目录下的文件名全部获取保存在files中
files = os.listdir(path.decode('utf-8'))

#用set可以很好的去重,在数据处理的时候经常会被使用到。这里做初始化
datas = set()

for file in files :
#准确获取一个txt的位置,利用字符串的拼接
txt_path = 'E:\\get_key\\'+file.decode('utf-8')
#把结果保存了在contents中
contents = codecs.open(txt_path.decode('utf-8'),'r',encoding='utf-8')

#datas的数据清空
datas.clear()

#把数据add到datas中,可以去重
for content in contents:
 print(content.decode('utf-8'))
 datas.add(content.decode('utf-8'))

#去重后新的文件保存的路径
new_txt_path = 'E:\\get_key3\\' + file.decode('utf-8')
unique_keywords = codecs.open(new_txt_path.decode('utf-8'), 'w', encoding='utf-8')

#把datas里的数据输出到新生成的txt中
for data in datas:
 unique_keywords.write(data+"\n")

#释放资源
unique_keywords.close()</span>

来源:https://blog.csdn.net/MakeContral/article/details/71544107

0
投稿

猜你喜欢

手机版 网络编程 asp之家 www.aspxhome.com