利用Python查看目录中的文件示例详解
作者:RustFisher 发布时间:2023-02-06 14:13:28
标签:python,目录,文件
前言
我们在日常开发中,经常会遇到一些关于文件的操作,例如,实现查看目录内容的功能。类似Linux下的tree命令。统计目录下指定后缀文件的行数。
功能是将目录下所有的文件路径存入list中。可以加入后缀判断功能,搜索指定的后缀名文件。主要利用递归的方法来检索文件。
仿造 tree 功能示例代码
Python2.7
列出目录下所有文件
递归法
import os
def tree_dir(path, c_path='', is_root=True):
"""
Get file list under path. Like 'tree'
:param path Root dir
:param c_path Child dir
:param is_root Current is root dir
"""
res = []
if not os.path.exists(path):
return res
for f in os.listdir(path):
if os.path.isfile(os.path.join(path, f)):
if is_root:
res.append(f)
else:
res.append(os.path.join(c_path, f))
else:
res.extend(tree_dir(os.path.join(path, f), f, is_root=False))
return res
下面是加入后缀判断的方法。在找到文件后,判断一下是否符合后缀要求。不符合要求的文件就跳过。
def tree_dir_sur(path, c_path='', is_root=True, suffix=''):
""" Get file list under path. Like 'tree'
:param path Root dir
:param c_path Child dir
:param is_root Current is root dir
:param suffix Suffix of file
"""
res = []
if not os.path.exists(path) or not os.path.isdir(path):
return res
for f in os.listdir(path):
if os.path.isfile(os.path.join(path, f)) and str(f).endswith(suffix):
if is_root:
res.append(f)
else:
res.append(os.path.join(c_path, f))
else:
res.extend(tree_dir_sur(os.path.join(path, f), f, is_root=False, suffix=suffix))
return res
if __name__ == "__main__":
for p in tree_dir_sur(os.path.join('E:\ws', 'rnote', 'Python_note'), suffix='md'):
print p
统计目录下指定后缀文件的行数
仅适用os中的方法,仅检索目录中固定位置的文件
# -*- coding: utf-8 -*-
import os
def count_by_categories(path):
""" Find all target files and count the lines """
if not os.path.exists(path):
return
c_l_dict = dict() # e.g. {category: lines}
category_list = [cate for cate in os.listdir(path) if
os.path.isdir(os.path.join(path, cate)) and not cate.startswith('.')]
for category_dir in category_list:
line_count = _sum_total_line(os.path.join(path, category_dir), '.md')
if line_count > 0:
c_l_dict[category_dir] = line_count
return c_l_dict
def _sum_total_line(path, endswith='.md'):
""" Get the total lines of target files """
if not os.path.exists(path) or not os.path.isdir(path):
return 0
total_lines = 0
for f in os.listdir(path):
if f.endswith(endswith):
with open(os.path.join(path, f)) as cur_f:
total_lines += len(cur_f.readlines())
return total_lines
if __name__ == '__main__':
note_dir = 'E:/ws/rnote'
ca_l_dict = count_by_categories(note_dir)
all_lines = 0
for k in ca_l_dict.keys():
all_lines += ca_l_dict[k]
print 'all lines:', str(all_lines)
print ca_l_dict
以笔记文件夹为例,分别统计分类目录下文件的总行数,测试输出
all lines: 25433
{'flash_compile_git_note': 334, 'Linux_note': 387, 'Algorithm_note': 3637, 'Comprehensive': 216, 'advice': 137, 'Java_note': 3013, 'Android_note': 11552, 'DesignPattern': 2646, 'Python_note': 787, 'kotlin': 184, 'cpp_note': 279, 'PyQt_note': 439, 'reading': 686, 'backend': 1136}
来源:http://rustfisher.github.io/2017/07/01/Python_note/Python-scan-file/


猜你喜欢
- asp上传的时候出现这种 错误:Server 对象 错误 'ASP 0177 800401f3'Server.CreateO
- 一 例子现在,讲述一个真实的故事!故事一定是伴随着赵忠祥老师的声音开始的,雨季就要来临了,又到了动物们 * 的季节了...还记得,之前发生的作
- 前言因为是国企线上应用的活动大屏,我就不附图了。代码仅供参考。一、vue配置1. 我是用vue-cli 搭建的,大屏项目复杂度不高,vue-
- 装饰器本质上是一个 Python 函数或类,它可以让其他函数或类在不需要做任何代码修改的前提下增加额外功能,装饰器的返回值也是一个函数/类对
- 相比较pandas,numpy并没有很直接的rolling方法,但是numpy 有一个技巧可以让NumPy在C代码内部执行这种循环。这是通过
- 前言在对着产品高举中指怒发心中之愤后,真正能够解决问题的是自身上的改变,有句话说的好:你虽然改变不了全世界,但是你有机会改变你自己。秉承着“
- 1.文本框只能输入数字代码(小数点也不能输入)<input onkeyup="this.value=this.va
- 轮播图功能安装依赖模块图片处理模块pip install pillow上传文件相关配置由于我们需要在后台上传我们的轮播图图片,所以我们需要在
- 1.beautifulsoup4库安装第一步:在控制台输入如下命令,安 * eautifulsoup4库。pip install beauti
- 几个常用装饰器pytest.ini 配置文件 例子:[pytest]addopts = -v -s --html=py_test/scrip
- IF函数IF(expression ,expr_true, expr_false);MySQL的IF()函数,接受三个表达式,如果第一个表达
- 如下所示:BaseException +-- SystemExit +-- KeyboardInterrupt +-- GeneratorE
- 最近迷上了高效处理数据的pandas,其实这个是用来做数据分析的,如果你是做大数据分析和测试的,那么这个是非常的有用的!!但是其实我们平时在
- 目录时间戳相减装饰器timeit模块重复调用 timeit()cProfile性能分析工具时间戳相减在代码执行前后各记录一个时间点,两个时间
- 发送邮件概述:Django中内置了邮件发送功能,发送邮件需要使用SMTP服务,常用的免费服务器有:163、126、QQ注册并登陆163邮箱打
- 问题: pydev使用wx库开发的过程中,import时碰到wx可以识别,但是其它很多函数和变量上面全部是红叉,即无法识别。 解决方法: 1
- 什么是正则表达式?正则表达式(Regular Expression)通常被用来检索、替换那些符合某个模式(规则)的文本。此处的Regular
- 前言前段时间在微博看到一段摸鱼人的倒计时模板,感觉还挺有趣的。于是我用了一小时的时间写了个页面出来 摸鱼办地址 (当然是摸鱼的时间啦)。模板
- SSI是英文Server Side Includes的缩写,翻译成中文就是服务器端包含的意思。从技术角度上说,SSI就是在HTML文件中,可
- 如果网站只开了80端口,你会发现下面的方法是比较有用的,其中用的方法几乎都不是我发现的,文总包括一些注入时的个人经验和技巧方法可以说有4种(