使用Python 统计文件夹内所有pdf页数的小工具
作者:ou.cs 发布时间:2022-07-06 23:21:46
标签:Python,pdf,页数
1.首先安装 PyPDF2 库:
pip install PyPDF2
2.然后保存下面文件(已带注释,具体实现请自己思考)
import os
import PyPDF2
#获取文件夹内所有pdf文件,以及打印文件数量
def GetFileInfo(path, fileType=()):
fileList = []
# root 表示当前正在访问的文件夹路径
# dirs 是 list , 表示该文件夹中所有的目录的名字(不包括子目录)
# files 是 list , 表示内容是该文件夹中所有的文件(不包括子目录)
#(每遍历一次相当于进入下级子目录)
for root, dirs, files in os.walk(path):
for name in files :
fname = os.path.join(root, name)
if fname.endswith(fileType):
fileList.append(fname)
print("总共有%d个PDF文件"%fileList.__len__())
return fileList
def compute_pdfpage(path):
TotalPageNum = 0
fileType = ("PDF","pdf")
fileList = GetFileInfo(path=path, fileType=fileType)
for pdf in fileList:
try:
reader = PyPDF2.PdfFileReader(pdf)
#获取单个文件页数
pageNum = reader.getNumPages()
TotalPageNum += pageNum
except Exception as e:
print("-"*70)
print(pdf + "该文件出现异常,可能是权限问题")
print(e)
print("-"*70)
return TotalPageNum
if __name__ == '__main__':
while True:
path=input('请输入要检测的文件夹路径:\n')
TotalPageNum = compute_pdfpage(path)
print("总共%d页"%TotalPageNum)
3.安装打包工具pyinstaller(只有安装了这个,才能将py文件生成为可以通过双击直接在windows执行的exe文件)
pip install pyinstaller
4.然后在py文件目录下的地址栏输入cmd调出当前路径下的终端。
5.在终端中输入如下命令后回车,-F后面跟的是 你要生成exe可执行文件所对应的py文件。
pyinstaller -F 检测文件夹内所有pdf的小工具.py
6.最终生成3个文件夹,可执行文件在dist文件夹中。
运行效果:
小工具的下载链接
来源:https://blog.csdn.net/weixin_44291381/article/details/114300937
0
投稿
猜你喜欢
- 字符串去除数字间的逗号在西文数字的表示中,很多格式是类似这样:123,456,789。如果得到这样的一个字符串,直接用int转换成整型肯定报
- 这个符合设计标准的三 级向上弹出菜单,纯css代码控制,没有使用javascript脚本,绿色环保,呵呵。兼容性应该更好。截图:<!D
- 一个简单但功能比较完善的自动生成缩略图的函数,可以按需要对图片进行缩放、裁切、锁定宽或高、使用空白填充以下为源码,比较简单,相信很容易看明白
- 本文实例讲述了PHP global全局变量的使用与注意事项。分享给大家供大家参考,具体如下:使用global在方法里面声明外部变量为全局变量
- <% Function FileCounter(counter_file) Dim fs,txt,fi
- 案例:该数据集的是一个关于每个学生成绩的数据集,接下来我们对该数据集进行分析,判断学生是否适合继续深造数据集特征展示1 GRE
- 代码如下: <!-- #include file="../conn.asp" --> <!-- #in
- 这段时间在处理SQL server 2000 SP4补丁打不上的问题上花了不少时间,回头想想应该总结一下:系统说明:dell1800服务器,
- //清空form选择 function clearForm(id){ var formObj = document.getElementBy
- 在做一个在线交流的网站时,有个问题很令我头疼,就是关于实时统计在线用户的问题,客户要求:统计当前在线人数、游客人数、会员人数、在线用户列表,
- 1 文件'''文件存储文件主名.扩展名'''Python中常有的数据文件类型有文本文件、二进
- 最近,在搞这个东西,网上也找不到asp相关的,如果有人很早弄出来了,也不要笑话偶;费了好久,总算搞定;原理:用stream对象预读文件的头两
- 一个封装好的JavaScript拖动类,使用方便:<div id="idDrag" style="bor
- 在学会了SELECT语句的构造和用途之后你就该学习如何使用它了。在你所掌握的数据库工具下,这可能意味着你得按下某个写着“执行”字样的按钮。在
- 利用空闲几天把《JavaScript权威指南》安静的读了一篇。真是一本好书呀!呵呵,这句话见的太多了。好在什么地方呢?听我慢慢道来。从开始接
- 本文实例讲述了php+jQuery实现的 * 导航栏下拉菜单显示效果。分享给大家供大家参考,具体如下:首先看看效果图:1.数据配置文件 db.
- 在项目中遇到一情况让困扰了半天,同一张PNG8图片为何部份图标在IE6中消失呢?当时一度怀疑是cache或hosts问题反反复复开关浏览器结
- overflow:hidden这个CSS样式是大家常用到的CSS样式,但是大多数人对这个样式的理解仅仅局限于隐藏溢出,而对于清除浮动这个含义
- 这篇文章主要介绍了python线程信号量semaphore使用解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价
- 前言不知道大伙有没有看到过这一句话:“中国(疫苗研发)非常困难,因为在中国我们没有办法做第三期临床试验,因为没有病人了。