python实现搜索文本文件内容脚本
作者:warrenjiang 发布时间:2022-01-30 18:51:22
标签:python,搜索,文件
本文介绍用python实现的搜索本地文本文件内容的小程序。从而学习Python I/O方面的知识。代码如下:
import os
#根据文件扩展名判断文件类型
def endWith(s,*endstring):
array = map(s.endswith,endstring)
if True in array:
return True
else:
return False
#将全部已搜索到的关键字列表中的内容保存到result.log文件中
def writeResultLog(allExistsKeywords):
#行分隔符
ls = os.linesep
#结果日志文件名
logfilename = "result.log" #相对路径,文件在.py文件所在的目录中
try:
fobj = open(logfilename,'w')
except IOError,e:
print "*** file open error:",e
else:
fobj.writelines(['%s%s' % (keyword,ls) for keyword in allExistsKeywords])
fobj.close()
#搜索指定关键字是否在指定的文件中存在
def searchFilesContent(dirname):
#从searchkeywords.txt文件中初始化待搜索关键字列表
filename = "searchkeywords.txt" #相对路径,文件在.py文件所在的目录中
#待搜索关键字列表
allSearchKeywords=[]
#遍历文件当前行已搜索到的关键字列表
existsKeywordsThisLine=[]
#全部已搜索到的关键字列表
allExistsKeywords=[]
try:
fobj = open(filename,'r');
except IOError,e:
print "*** file open error:",e
else:
for eachLine in fobj:
allSearchKeywords.append(eachLine.strip('\n')); #使用strip函数去除每行的换行符
fobj.close();
#从excludekeywords.txt文件中初始化要排除的搜索关键字列表
filename = "excludekeywords.txt" #相对路径,文件在.py文件所在的目录中
#要排除的搜索关键字列表
allExcludedKeywords=[]
try:
fobj = open(filename,'r');
except IOError,e:
print "*** file open error:",e
else:
for eachLine in fobj:
allExcludedKeywords.append(eachLine.strip('\n')); #使用strip函数去除每行的换行符
fobj.close();
#从全部已搜索到的关键字列表排除掉不用搜索的关键字
for excluedkw in allExcludedKeywords:
if(excluedkw in allSearchKeywords):
allSearchKeywords.remove(excluedkw);
#遍历打开所有要在其中搜索内容的文件,若待搜索关键字列表为空,则不再继续遍历
for root,dirs,files in os.walk(dirname):
for file in files:
if endWith(file,'.java','.xml','.properties'): #只在扩展名为.java/.xml/.properties文件中搜索
#打开文件
filename = root + os.sep + file #绝对路径
filename = filename.replace("\\","\\\\") #将路径中的单反斜杠替换为双反斜杠,因为单反斜杠可能会导致将路径中的内容进行转义了,replace函数中"\\"表示单反斜杠,"\\\\"表示双反斜杠
try:
fobj = open(filename,'r');
except IOError,e:
print "*** file open error:",e
else:
#遍历文件的每一行
for fileLine in fobj:
#判断当前行是否包含所有搜索关键字
for keyword in allSearchKeywords:
#若包含,并添加到该行已搜索到的关键字列表中
if keyword.upper() in fileLine.upper(): #将搜索关键字和该行文本内容都转换为大写后再进行匹配
existsKeywordsThisLine.append(keyword)
#将这些搜索到的关键字添加到全部已搜索到的关键字列表中,并包含文件名信息
for keyword in existsKeywordsThisLine:
allExistsKeywords.append(keyword+"\t"+filename.replace("\\\\","\\"))
#将这些搜索到的关键字从待搜索关键字列表中移除(后续将不再搜索该关键字)
for keyword in existsKeywordsThisLine:
allSearchKeywords.remove(keyword)
#清空该行已搜索到的关键字列表内容
existsKeywordsThisLine = []
#若所有的关键字都搜索到了,则记录日志文件,并结束搜索工作
if len(allSearchKeywords)==0:
fobj.close();
writeResultLog(allExistsKeywords)
print "DONE!",
return
fobj.close();
#全部文件遍历结束
writeResultLog(allExistsKeywords)
print "DONE!",
#仅当本python模块直接执行时,才执行如下语句,若被别的python模块引入,则不执行
if __name__ == '__main__':
searchFilesContent(r"G:\ccsSmartPipe\SmartPipe\src\java")
1.笔者使用该程序对java项目中的源文件内容进行关键字的搜索。程序入参为该项目本地文件系统路径G:\ccsSmartPipe\SmartPipe\src\java。
2.在配置文件中searchkeywords.txt中输入要搜索的任意多个关键字
3.在配置文件中excludekeywords.txt中输入在searchkeywords.
4.程序执行完成后,即可在result.log日志文件中,查看搜索结果。即每个关键在哪些文件中存在。并给出每个文件的具体路径。
附件:源代码及配置文件
来源:https://blog.csdn.net/warrenjiang/article/details/50277279
0
投稿
猜你喜欢
- 本文实例讲述了python获取文件后缀名及批量更新目录下文件后缀名的方法。分享给大家供大家参考。具体实现方法如下:1. 获取文件后缀名:#!
- 在进行特征工程、划分数据集的工作中,drop()函数都能派上用场。它可以轻松剔除数据、操作列和操作行等。drop()详细的语法如下:删除行是
- 回滚段管理一直是ORACLE数据库管理的一个难题,本文通过实例介绍ORACLE回滚段的概念,用法和规划及问题的解决。 回滚段概述 回滚段用于
- 数在 Python 中,对数的规定比较简单,基本在小学数学水平即可理解。那么,做为零基础学习这,也就从计算小学数学题目开始吧。因为从这里开始
- 读取excel数据需要用到xlrd模块,在命令行运行下面命令进行安装pip install xlrd表格内容大致如下,有若干sheet,每个
- 如何准确地获得一个整数?当然可以,Format就是做这个的“专家”:function NumbersOnlyNoDecimals(
- 这篇博客给大家讲解在django中类似触发器的效果这篇教程分别会讲解插入记录后,删除记录前,删除记录后这三个部分相关环境 python 3.
- 使用 datetime 模块中的 timedelta() 方法将天数添加到日期中,例如 result_1 = date_1 + timede
- 本文实例讲述了Python装饰器基础概念与用法。分享给大家供大家参考,具体如下:装饰器基础前面快速介绍了装饰器的语法,在这里,我们将深入装饰
- python map函数map()函数map()是 Python 内置的高阶函数,它接收一个函数 f 和一个 list,并通过把函数 f 依
- 看一看自己写的类是否能符合这样的标准.要成为高手,我要走的路还很长.摘抄自《OOD 启示录》--Arthur J.Riel(1)所有数据都应
- jQuery的makeArray有其局限性(1.3.4还有bug),我自己实现了一个,不过涉及N多辅助方法。var dom = {},_to
- 使用Qt Creator创建默认的窗体程序后,主窗口QMainWindow有statusBar状态栏,在此状态栏实时显示时间可以使用下面方法
- 切片从list或tuple中取部分元素。list = [1, 2, 3, 4]list[0 : 3] # [1, 2, 3]list[-2
- 一直用pycharm写代码一直用anaconda管理python环境但是今天我居然发现我不会更改pycharm当前的运行环境到我新建的ana
- 前言这次,我们要用Pygame写一个Pong游戏先看看效果:需要的模块:Pygame在python文件同目录下新建resources文件夹,
- 译序:本文译自Smashingmagazine,但是原文讲述的内容有些浅,也不是很完整,前端观察在翻译的前提下,增加了更多的更系统的内容。如
- 本人已经在运维行业工作了将近十年,我最早接触Linux是在大二的样子,那时候只追求易懂,所以就选择了Ubuntu作为学习、使用的对象,它简单
- 本文实例讲述了PHP实现网页内容html标签补全和过滤的方法。分享给大家供大家参考,具体如下:如果你的网页内容的html标签显示不全,有些表
- 前言最近做了一个爬取妹子套图的小功能,小伙伴们似乎很有兴趣,为了还特意组建了一个Python兴趣学习小组,来一起学习。十个python九个爬