Python 实现文件的全备份和差异备份详解
作者:lqh 发布时间:2023-07-16 20:20:36
标签:Python,文件全备份,差异备份
Python实现文件的全备份和差异备份
之前有写利用md5方式来做差异备份,但是这种md5方式来写存在以下问题:
md5sum获取有些软连接的MD5值存在问题
不支持对空目录进行备份,因为md5sum无法获取空目录的md5值
权限的修改md5sum无法判断
解决方案:
利用文件的mtime ctime
mtime(Modified time)是在写入文件时随文件内容的更改而更改的
ctime(Create time)是在写入文件、更改所有者、权限或链接设置时随Inode的内容更改而更改的
废话不多说直接上代码:
#!/usr/bin/env python
import time,os,sys,cPickle
fileInfo = {}
def logger(time,fileName,status,fileNum):
f = open('backup.log','a')
f.write("%s\t%s\t%s\t\t%s\n" % (time,fileName,status,fileNum))
def tar(sDir,dDir,fileNum):
command = "tar zcf %s %s >/dev/null 2>&1" % (dDir + ".tar.gz",sDir)
if os.system(command) == 0:
logger(time.strftime('%F %X'),dDir + ".tar.gz",'success',fileNum)
else:
logger(time.strftime('%F %X'),dDir + ".tar.gz",'failed',fileNum)
def fullBak(path):
fileNum = 0
for root,dirs,files in os.walk(path):
for name in files:
file = os.path.join(root, name)
mtime = os.path.getmtime(file)
ctime = os.path.getctime(file)
fileInfo[file] = (mtime,ctime)
fileNum += 1
f = open(P,'w')
cPickle.dump(fileInfo,f)
f.close()
tar(S,D,fileNum)
def diffBak(path):
for root,dirs,files in os.walk(path):
for name in files:
file = os.path.join(root,name)
mtime = os.path.getmtime(file)
ctime = os.path.getctime(file)
fileInfo[file] = (mtime,ctime)
if os.path.isfile(P) == 0:
f = open(P,'w')
f.close()
if os.stat(P).st_size == 0:
f = open(P,'w')
cPickle.dump(fileInfo,f)
fileNum = len(fileInfo.keys())
f.close()
print fileNum
tar(S,D,fileNum)
else:
f = open(P)
old_fileInfo = cPickle.load(f)
f.close()
difference = dict(set(fileInfo.items())^set(old_fileInfo.items()))
fileNum = len(difference)
print fileNum
difference_file = ' '.join(difference.keys())
print difference_file
tar(difference_file,D,fileNum)
f = open(P,'w')
cPickle.dump(fileInfo,f)
f.close()
def Usage():
print '''
Syntax: python file_bakcup.py pickle_file model source_dir filename_bk
model: 1:Full backup 2:Differential backup
example: python file_backup.py fileinfo.pk 2 /etc etc_$(date +%F)
explain: Automatically add '.tar.gz' suffix
'''
sys.exit()
if len(sys.argv) != 5:
Usage()
P = sys.argv[1]
M = int(sys.argv[2])
S = sys.argv[3]
D = sys.argv[4]
if M == 1:
fullBak(S)
elif M == 2:
diffBak(S)
else:
print "\033[;31mDoes not support this mode\033[0m"
Usage()
测试:
$ python file_backup.py data.pk 1 data data_$(date +%F) #全备份
$ > data/www.linuxeye.com #测试创建文件,修改文件权限
$ chmod 777 data/py/eshop_bk/data.db
$ python file_backup.py data.pk 2 data data_$(date +%F)_1 #备份改变的文件
2
data/py/eshop_bk/data.db data/www.linuxeye.com
感谢阅读,希望能帮助到大家,谢谢大家对本站的支持!


猜你喜欢
- 今天 大白 问了一个关于CSS权重的问题:关于选择器权重的问题 。class的权重是10 标签权重是 1 。比如说 p span{} 权重是
- 自从接触python以后就想着爬pixiv,之前因为梯子有点问题就一直搁置,最近换了个梯子就迫不及待试了下。爬虫无非request获取htm
- 一、解析网站1.1 获取音频地址在喜马拉雅网站上,随便点开一个音频,打开“开发者工具”,再点击播放按钮,可以看到出现了多个请求:经过排查,发
- 在找工作的时候,我们会选择上网查询招聘的信息,或者是通过一些招聘会进行现场面试。但由于信息更新不及时,有一些岗位会出现下架的情况,如果我们不
- Python 处理 xml 文档的方法有很多,除了经典的 sax 和 dom 之外,还有一个 ElementTree。首先 import 之
- <script type="text/javascript">/*<![CDAT
- 突然想到写这个话题,是基于最近在设计产品界面时,年糕一直在给我们灌输设计的品牌概念以及文化内涵要求而产生的,因之前在界面设计中也遇到一些困惑
- 1、JavaScript方法:document.getElementById("id").innerHTML; (1)实
- 使用方式:new downUpData({url:"http://192.168.1.103:8080/test/data.jso
- 在了解了JavaScript1.7的相关更新后,我们再继续关注JavaScript1.8的新特性。在W3C Group带来的JavaScri
- 一,extract方法的使用extract函数主要是对于数据进行提取。场景一般对于DataFrame中的一列中的数据进行提取的场合比较多。例
- Socket 是进程间通信的一种方式,它与其他进程间通信的一个主要不同是:它能实现不同主机间的进程间通信,我们网络上各种各样的服务大多都是基
- 本文实例为大家分享了php实现ajax图片上传的具体代码,供大家参考,具体内容如下html页面代码<!DOCTYPE html>
- 本文以实例形式讲述了Python中replace方法,很有实用价值,具体如下:replace方法主要有两种:last_date = &quo
- 概述基于内容的图像检索技术是采用某种算法来提取图像中的特征,并将特征存储起来,组成图像特征数据库。当需要检索图像时,采用相同的特征提取技术提
- 大家好,我是J哥。在我们的工作中,面临着大量的重复性工作,通过人工方式处理往往耗时耗力易出错。而Python在自动化办公方面具有极大的优势,
- sysbench是一个模块化的、跨平台、多线程基准测试工具,主要用于评估测试各种不同系统参数下的数据库负载情况。关于这个项目的详细介绍请看:
- 本文实例解析Python SqlAlchemy的使用方法,分享给大家供大家参考,具体内容如下1.初始化连接from sqlalchemy i
- 测试靶机为DVWA,适合DVWA暴力破解模块的Low和Medium等级关键代码解释url指定url地址url = &qu
- window对文件夹的操作主要包括移动/剪切/复制,本篇文章主要用jQuery来实现,下面一起来了解一下把。1.先看下效果吧!2.在添加一个