python filecmp.dircmp实现递归比对两个目录的方法
作者:longfeiwlf 发布时间:2021-10-11 10:22:29
标签:filecmp.dircmp,python,递归
使用python filecmp模块的dircmp类可以很方便的比对两个目录,dircmp的用法已经有很多文章介绍,不再赘述。
可以help(filecmp.dircmp)查看帮助信息,其中提到的x.report()、x.report_partial_closure()
,都只能打印两目录一级子目录的比较信息。而x.report_full_closure()
可以递归打印所有子目录的比对信息,但是输出太多,大多数情况下我们可能只关心两目录的不同之处。
help(filecmp.dircmp) 摘选:
| High level usage:
| x = dircmp(dir1, dir2)
| x.report() -> prints a report on the differences between dir1 and dir2
| or
| x.report_partial_closure() -> prints report on differences between dir1
| and dir2, and reports on common immediate subdirectories.
| x.report_full_closure() -> like report_partial_closure,
| but fully recursive.
本文编写的脚本,重点关注并实现两个目标:
1)递归比对两个目录及其所有子目录。
2)仅输出两目录不同之处,包括文件名相同(common_files)但是文件不一致(diff_files),以及左、右目录中独有的文件或子目录。
py脚本compare_dir.py内容如下:
# -*- coding: utf-8 -*-
"""
@desc 使用filecmp.dircmp递归比对两个目录,输出比对结果以及统计信息。
@author longfeiwlf
@date 2020-5-20
"""
from filecmp import dircmp
import sys
# 定义全局变量:
number_different_files = 0 # 文件名相同但不一致的文件数
number_left_only = 0 # 左边目录独有的文件或目录数
number_right_only = 0 # 右边目录独有的文件或目录数
def print_diff(dcmp):
"""递归比对两目录,如果有不同之处,打印出来,同时累加统计计数。"""
global number_different_files
global number_left_only
global number_right_only
for name in dcmp.diff_files:
print("diff_file found: %s/%s" % (dcmp.left, name))
number_different_files += 1
for name_left in dcmp.left_only:
print("left_only found: %s/%s" % (dcmp.left, name_left))
number_left_only += 1
for name_right in dcmp.right_only:
print("right_only found: %s/%s" % (dcmp.right, name_right))
number_right_only += 1
for sub_dcmp in dcmp.subdirs.values():
print_diff(sub_dcmp) # 递归比较子目录
if __name__ == '__main__':
try:
mydcmp = dircmp(sys.argv[1], sys.argv[2])
except IndexError as ie:
print(ie)
print("使用方法:python compare_dir_cn.py 目录1 目录2")
else:
print("\n比对结果详情: ")
print_diff(mydcmp)
if (number_different_files == 0 and number_left_only == 0
and number_right_only == 0):
print("\n两个目录完全一致!")
else:
print("\n比对结果统计:")
print("Total Number of different files is: "
+ str(number_different_files))
print("Total Number of files or directories only in '"
+ sys.argv[1] + "' is: " + str(number_left_only))
print("Total Number of files or directories only in '"
+ sys.argv[2] + "' is: " + str(number_right_only))
compare_dir.py脚本使用举例:
来源:https://blog.csdn.net/longfeizzu/article/details/106233479


猜你喜欢
- 本文实例讲述了Python编程实现生成特定范围内不重复多个随机数的2种方法。分享给大家供大家参考,具体如下:在近期进行的一个实验中,需要将数
- 一、简单配置,获取单个网页上的内容。(1)创建scrapy项目scrapy startproject getblog(2)编辑
- 最近用到了上采样下采样操作,pytorch中使用interpolate可以很轻松的完成def interpolate(input, size
- vue项目无法删除问题今天删除本地的vue项目,一直提示“操作无法完成,因为其中的文件夹或文件已在另一个程序组打开,请关
- SQL Server 2008我们也能从中体验到很多新的特性,但是对于SQL Server 2008安装,还是用图来说话比较好。本文将从SQ
- 本文实例为大家分享了python实现网络五子棋的具体代码,供大家参考,具体内容如下服务器端:import osimport socketim
- 本文实例为大家分享了python实现飞机大战的具体代码,供大家参考,具体内容如下游戏的实现本质是多个图片的快速切换,类似动画一样,达到动态的
- 本文实例讲述了Go语言基础知识。分享给大家供大家参考,具体如下:GO文件目录结构该图是go-windows的目录结构如图,go的程序应该是在
- Python元字典字典(dictionary)是除列表以外python之中最灵活的内置数据结构类型。列表是有序的对象结合,字典是无序的对象集
- 引言目前Python2和Python3存在版本上的不兼容性,这里将列举dict中的问题之一。下面话不多说,来看看详细的介绍:1. Pytho
- 本文实例讲述了Python tkinter模块中类继承的三种方式。分享给大家供大家参考,具体如下:tkinter class继承有三种方式。
- 解释一个机器学习模型是一个困难的任务,因为我们不知道这个模型在那个黑匣子里是如何工作的。解释是必需的,这样我们可以选择最佳的模型,同时也使其
- 本文主要涉及图形验证码的相关功能,主要包括,图形验证码获取、验证码文字存储、验证码生成等。图形验证码接口设计和定义 验证码获取接口
- 工厂模式(Factory Pattern)是什么工厂模式是一种创建型模式,它提供了一种创建对象的最佳方式。在工厂模式中,我们在创建对象时不会
- 1. 前言熟悉 Django 的朋友应该知道,我们可以通过「 inspectdb 」命令将数据库表反向生成 Model 并写入到文件中去比如
- 1.ACCESS查询(query_info):select * from info where stu = name1 and age =
- 使用场景:1) 爬虫设置ip代理池时验证ip是否有效2)进行压测时,进行批量请求等等场景grequests 利用 requests和geve
- 什么情况下用响应缓冲会提高运行速度?例1、脚本引擎与 HTML 之间的切换频繁,对响应流写操作太多,导致性能下降:<table>
- 本文实例讲述了python生成器/yield协程/gevent写简单的图片下载器功能。分享给大家供大家参考,具体如下:1、生成器:'
- Stream Grpc在我们单次投递的数据量很大的时候,比如传输一个二进制文件的时候,数据包过大,会造成瞬时传输压力。或者接收方接收到数据后