位置：首页>> 网络编程>> Python编程>> 浅谈Python处理PDF的方法

浅谈Python处理PDF的方法

作者：威行天下　　发布时间：2023-09-17 13:20:49　

标签：python,处理,pdf

处理pdf文档

第一、

从文本中提取文本

第二、

创建PDF

两种方法

#使用PdfFileWriter
import PyPDF2

pdfFiles = []
for filename in os.listdir('.'):
if filename.endswith('.pdf'):
pdfFiles.append(filename)
print(pdfFiles)
pdfWriter = PyPDF2.PdfFileWriter()

pdfFileObj = open(pdfFiles[0],'rb')
pdfReader = PyPDF2.PdfFileReader(pdfFileObj) # 得到PdfFileReader对象
first,end =map(int,input('从多少页到多少页(用空格隔开):').split())
for pageNum in range(first-1,end):
pageObj = pdfReader.getPage(pageNum)
pdfWriter.addPage(pageObj)
pdfOutput = open ('split_pdf.pdf','wb')
pdfWriter.write(pdfOutput)
pdfOutput.close()

#使用PdfFileMerger()
import PyPDF2
merger = PyPDF2.PdfFileMerger()
a = [str(i)+'webbook.pdf'for i in range(0,124)]
for i in a:
print(i)
merger.append(open(i,'rb'))
print("合并完成第"+str(i))
with open('combintion.pdf','wb') as f:
merger.write(f)

来源：http://www.cnblogs.com/powercai/p/7787426.html

0

投稿

猜你喜欢

Python3.8安装tensorflow的简单方法步骤
以下内容是针对安装tensorflow-CPU版本的。tensorflow已经支持Python3.8版本的安装。可以查看自己的Python版
微信小程序开发之数据存储参数传递数据缓存
微信小程序开发内测一个月.数据传递的方式很少.经常遇到页面销毁后回传参数的问题,小程序中并没有类似Android的startActivity
用python写个博客迁移工具
目录前言掘金的成长搬家命令行工具环境配置main.pycookie.jsongithub 地址前言最近不少写博客的朋友跟我反馈博客园的一些文
python GUI库图形界面开发之PyQt5访问系统剪切板QClipboard类详细使用方法与实例
PyQt5访问系统剪切板QClipboard类介绍QClipboard类提供了对系统剪切板的访问，可以在应用程序之间复制和粘贴数据，它的操作
浅谈django channels 路由误导
与django路由有区别他们都有根路由，但是不一样。django的根路由：urlpatterns = [ path('l
pycharm导入第三方库的两种方法(永不报错)
前言在学习python的过程中，我们会使用到各种各样的第三方库，但是如何pip有n种方法，如系统提示如在terminal中pip
win10系统下python3安装及pip换源和使用教程
一、python3的安装建议安装python3，python2在未来将不再维护。python官方下载地址https://www.python
提高JavaScript执行效率的23个实用技巧
本文向大家分享23种JavaScript提高执行效率的小技巧、最佳实践等非常实用的内容。当然JavaScript的实用技巧不止这些，还有很多
Python实现JSON反序列化类对象的示例
我们的网络协议一般是把数据转换成JSON之后再传输。之前在Java里面，实现序列化和反序列化，不管是 jackson ,还是 fastjso
Python如何使用k-means方法将列表中相似的句子归类
前言由于今年暑假在学习一些自然语言处理的东西，发现网上对k-means的讲解不是很清楚，网上大多数代码只是将聚类结果以图片的形式呈现，而不是
解决vue项目中某一页面不想引用公共组件app.vue的问题
Vue 单页面应用把公共组件放在 app.vue 但是我希望某个页面没有这些公共组件怎么办(比如登陆页面)每个页面都有导航栏但是我希望
如何避免asp的SQL的执行效率低
方法一、尽量使用复杂的SQL来代替简单的一堆 SQL.同样的事务，一个复杂的SQL完成的效率高于一堆简单SQL完成的效率。有多个查询时，要善
Python中第三方库Requests库的高级用法详解
一、Requests库的安装利用 pip 安装，如果你安装了pip包（一款Python包管理工具，不知道可以百度哟），或者集成环境，比如Py
自适应网页设计（Responsive Web Design）
随着3G的普及，越来越多的人使用手机上网。移动设备正超过桌面设备，成为访问互联网的最常见终端。于是，网页设计师不得不面对一个难题：如何才能在
MySQL——修改root密码的4种方法(以windows为例)
方法1：用SET PASSWORD命令首先登录MySQL。格式：mysql> set password for 用户名@loca
两个命令把 Vim 打造成 Python IDE的方法
运行下面两个命令，即可把 Vim（含插件）配置成 Python IDE。目前支持 MAC 和 Ubuntu。curl -O https://
python fire库的使用实例教程
一. 介绍fire是python中用于生成命令行界面(Command Line Interfaces, CLIs)的工具，不需要做任何额外的
pandas读取csv文件,分隔符参数sep的实例
在python中读取csv文件时，一般操作如下：import pandas as pdpd.read_csv(filename)该读文件方式
sqlserver 动态创建临时表的语句分享
因此计划先把数据转插入一个临时表，再对临时表的数据进行分析。问题点是如何动态创建临时表。原先Insus.NET使用下面代码实现： DECL
SQL Server误区30日谈第21天数据损坏可以通过重启SQL Server来修复
误区 #21:数据库损坏可以通过重启SQL Server或是Windows,或是附加和分离数据库解决错误 SQL Server中没有任何一

利用Python制作动态排名图的实现代码

Python判断字符串是否为空和null方法实例

Python函数基础实例详解【函数嵌套,命名空间,函数对象,闭包函数等】

Python3爬虫里关于代理的设置总结

Python面向对象的三大特性封装、继承、多态

python实现邮箱发送信息

pycharm软件实现设置自动保存操作

利用Python 实现分布式计算

Python网络编程详解

Matplotlib绘制子图的常见几种方法

Windows10安装失败且没有提示其他信息的故障原因及解决方法

专家一招搞定win7下播放网页视频无声问题

梦幻模拟战海恩如何培养？海恩法师培养指南

明日方舟喧闹法则活动内容是什么-限时活动内容兑换奖励玩法攻略介绍

wps表格怎样修改默认设置

基于ReentrantLock的实现原理讲解

如何让你的Word变成电子书

如何将wps表设置为按笔画排序

腾讯微信独立密码是什么意思微信独立密码有什么用途

Win10打印机无法工作如何修复？

手机版 网络编程 asp之家 www.aspxhome.com