python使用技巧-查找文件
作者:zzxiaoma 发布时间:2021-11-10 18:48:21
标准库的fnmatch
库专门用来进行文件名匹配,支持使用通配符进行字符串匹配。
1、fnmatch:判断文件名是否符合特定的模式;
2、fnmatchcase:判断文件名是否符合特定的模式,不区分大小写;
3、filter:返回输入列表中,符合特定模式的文件名列表;
4、translate:将通配符模式转换成正则表达式。
fnmatchcase
函数与fnmatch
函数几乎一样,只是在匹配文件名时会忽略文件名中字母的大小写。
filter
函数与fnmatch
函数比较类似,区别在于fnmatch每次对一个文件名进行匹配判断,filter函数每次对一组文件名进行匹配判断。filter 函数接受文件名列表为第一个参数,文件名模式为第二个参数,然后以列表的形式返回输入列表中所有符合模式的文件名。
import os,fnmatch
names = os.listdir('.')
for name in names:
if fnmatch.fnmatch(name,'*.xlsx'):
print(name)
if fnmatch.fnmatch(name,'[a-z]*'):
print(name)
print(fnmatch.filter(names,"[a-z]*.xlsx"))
目前,我们要获取特定类型的文件列表,都是先通过os.listdir获取文件列表,然后通过使用fnmatch进行文件名模式匹配进行过滤。而在Python中还有更加简单的方式,即使用标准库的glob库。glob的作用相当于os.listdir
加上fnmatch
。使用glob以后,不需要调用os.listdir获取文件列表,直接通过模式匹配即可。
import glob
print(glob.glob('*.xlsx'))
print(glob.glob('[a-z]*'))
前面的例子都是查找某一个目录下的文件并通过模式匹配去选择自己需要的文件类型。在实际工作过程中,更有可能遇到的是查找某个目录及其子目录下的所有文件。例如查找某个目录及其子目录下的图片。可以使用os模块的walk函数。walk函数遍历某个目录及其子目录,对于每一个目录,walk返回一个三元组(dirpath, dirnames,filenames)。其中dirpath
保存的是当前目录,dirnames是当前目录下的子目录列表,filenames
是当前目录下的文件列表。
import os,fnmatch
images = ['*.jpg','*.jpeg','*.png','*.tif','*.tiff']
matches = []
for dirpath,dirnames,filenames in os.walk(os.path.expanduser(r"D:/test")):
for image in images:
for filename in fnmatch.filter(filenames,image):
matches.append(os.path.join(dirpath,filename))
print(matches)
在遍历目录及其子目录时,如果想要忽略掉某一个子目录,可以直接修改三元组中的dirnames
,即从dirnames列表中移除需要忽略掉的目录。
if 'extest' in dirnames:
dirnames.remove('extest')
来源:https://blog.51cto.com/u_3764469/5020275
猜你喜欢
- 前言cookie:在网站中,http请求是无状态的。也就是说即使第一次和服务器连接后并且登录成功后,第二次请求服务器依然不能知道当前请求是哪
- runtime 调度器是个非常有用的东西,关于 runtime 包几个方法:Gosched:让当前线程让出 cpu 以让其它线程运行,它不会
- 求一个算式a=1b=2c=3 print c*(a/b)运行结果总是0,反复检查拆开以后,发现在Python里,整数初整数,只能得
- 下面列出了asp远程网页数据采集程序中经常用到的函数,很实用,特别是正则表达式过滤函数。包括了使用xmlhttp采集远程网页内容,使用ado
- 我们提倡尽可能使用CSS,而且我们常常能做到这一点。现代浏览器有很好的CSS支持-这无疑足够好让你使用CSS来控制布局和版面设计。但是有时候
- return 语句用于退出函数,向调用方返回一个表达式。执行到 return 语句时,会退出函数,return 之后的语句不再执行。如:de
- 这篇论坛文章(赛迪网技术社区)详细讲解了SQL Server海量数据导入的最快方法,更多内容请参考下文:最近做某项目的数据库分析,要实现对海
- python条件语句使用 if 表达式,难度不高,需要注意的是嵌套用法,以及如何设置对应的条件。if 条件判断语句python 语句是按固定
- Go GRPC 入门1,安装包grpcgolang-grpc 包提供了 gRPC 相关的代码库,通过这个库我们可以创建 gRPC 服务或客户
- 前言:并行编程比程序编程困难,除非正常编程需要创建大量数据,计算耗时太长,物理行为模拟困难例子:N体问题物理前提:牛顿定律时间离散运动方程普
- 前端使用input 来写radio,小程序使用radio标签 也可以使用<radio />单标签1.自定义radio样式、wx默
- 1.运行效果如图所示2.实现代码如下<!DOCTYPE html><html><head>
- 增加中间件可以选择普通模式和LUA脚本模式,建议选择普通模式,实际上不需要控制的那么精确。package Middlewaresimport
- 本文实例为大家分享了python实现图片批量压缩程序的具体代码,供大家参考,具体内容如下说明运行环境:Win10 Pycharm
- golang的字符有如下两种:一种是 uint8['ju:nɪt] 类型叫做 byte 型,代表了 ASCII 码的一个字符。另一种
- pygame.mixer是一个用来处理声音的模块,其含义为“混音器”。游戏中对声音的处理一般包括制造声音和播放声音两部分,这里仅学习了播放声
- asp抓取网页。偶要实现实实更新天气预报。利用了XMLHTTP组件,抓取网页的指定部分。很多小偷查询都是使用这个方法来实现的。需要分件htm
- Vue 3.2 引入了语法,这是一种稍微不那么冗长的声明组件的方式。您可以通过向 SFC 的元素添加属性来启用它,然后可以删除组件中的一些样
- 前言在两种python循环语句的使用中,不仅仅是循环条件达到才能跳出循环体。所以,在对python函数进行阐述之前,先对跳出循环的简单语句块
- Python3,开一个线程,间隔1秒把一个递增的数字写入队列,再开一个线程,从队列中取出数字并打印到终端#! /usr/bin/env py