Python 读取某个目录下所有的文件实例
作者:嘎里给给 发布时间:2022-08-27 20:04:13
标签:python,读取,文件
在处理数据的时候,因为没有及时的去重,所以需要重新对生成txt进行去重。
可是一个文件夹下有很多txt,总不可能一个一个去操作,这样效率太低了。这里我们需要用到 os 这个包
关键的代码
<span style="font-size:14px;"># coding=utf-8
#出现了中文乱码的问题,于是我无脑utf-8 。希望后期的学习可以能理解
import os
import os.path
import re
import sys
import codecs
reload(sys)
sys.setdefaultencoding('utf-8')
#这里放着你要操作的文件夹名称
path = 'E:\\get_key\\'
#把e:\get_key\目录下的文件名全部获取保存在files中
files = os.listdir(path.decode('utf-8'))
#用set可以很好的去重,在数据处理的时候经常会被使用到。这里做初始化
datas = set()
for file in files :
#准确获取一个txt的位置,利用字符串的拼接
txt_path = 'E:\\get_key\\'+file.decode('utf-8')
#把结果保存了在contents中
contents = codecs.open(txt_path.decode('utf-8'),'r',encoding='utf-8')
#datas的数据清空
datas.clear()
#把数据add到datas中,可以去重
for content in contents:
print(content.decode('utf-8'))
datas.add(content.decode('utf-8'))
#去重后新的文件保存的路径
new_txt_path = 'E:\\get_key3\\' + file.decode('utf-8')
unique_keywords = codecs.open(new_txt_path.decode('utf-8'), 'w', encoding='utf-8')
#把datas里的数据输出到新生成的txt中
for data in datas:
unique_keywords.write(data+"\n")
#释放资源
unique_keywords.close()</span>
来源:https://blog.csdn.net/MakeContral/article/details/71544107
0
投稿
猜你喜欢
- 背 景:在MySQL中如果是有限的层次,比如我们事先如果可以确定这个树的最大深度, 那么所有节点为根的树的深度均不会超过树的最大深度,则我们
- 本文实例为大家分享了Python管理Windows服务的具体代码,供大家参考,具体内容如下#!/usr/bin/python# encodi
- 1. 文件锁脚本启动前检查特定文件是否存在,不存在就启动并新建文件,脚本结束后删掉特定文件。通过文件的判断来确定脚本是否正在执行。方法实现也
- 本文实例讲述了JS实现向表格行添加新单元格的方法。分享给大家供大家参考。具体如下:下面的JS代码可以想表格中指定id的行插入新的单元格<
- 本文实例讲述了python中@property和property函数常见使用方法。分享给大家供大家参考,具体如下:1、基本的@propert
- 本文实例为大家分享了Vue+Flask实现图片传输功能的具体代码,供大家参考,具体内容如下完整流程:1.图片转为formdata 传输到后端
- 本次爬取网站为opgg,网址为:” http://www.op.gg/champion/statistics”由网站界面可以看出,右侧有英雄
- 对文本类文件(*.txt;*.html;*.doc;等等),图片类文件(*.jpg;*.gif等等)直接点击链接时会在浏览器打开,而无法出现
- 安装环境:python版本2.7.5 ,win7系统安装Djangohttps://www.djangoproject.com/downlo
- 在ASP.NET中使用js时,js获取DOM元素时,经常获取不到,这是因为获取的方法有误,现在介绍一方法,解决如何使用js获取ASP.NET
- 本文实例讲述了Django发送html邮件的方法。分享给大家供大家参考。具体如下:在Django中,发送邮件非常的方便,一直没有时间,今天来
- 1.1. 下载:官网下载zip包,我下载的是64位的:下载地址:https://dev.mysql.com/downloads/mysql/
- 因为需要检测一个一个链接中是否包含了IP地址,在这里需要使用到正则表达式 ,python完美的支持了正则表达式,在这里使用re模块来完成,对
- python对csv文件追加写入列,具体内容如下所示:原始数据[外链图片转存失败(img-zQSQWAyQ-1563597916666)(C
- Python版本 实现了比之前的xxftp更多更完善的功能 1、继续支持多用户 2、继续支持虚拟目录 3、增加支持用户根目录以及映射虚拟目录
- 格式化输出:format()format():把传统的%替换为{}来实现格式化输出1.使用位置参数:就是在字符串中把需要输出的变量值用{}来
- 首先先了解一下,我们的效果实现流程首先登录概述及业务流程和相关技术点录页面的布局创建两个Vue.js文件一个我们来做登录页和注册页登录页面的
- Beautiful Soup 库一般被称为bs4库,支持Python3,是我们写爬虫非常好的第三方库。因用起来十分的简便流畅。所以也被人叫做
- 产生batch数据输入data中每个样本可以有多个特征,和一个标签,最好都是numpy.array格式。datas = [data1, da
- 本文实例讲述了Python3搜索及替换文件中文本的方法。分享给大家供大家参考。具体实现方法如下:# 将文件中的某个字符串改变成另一个 # 下