网络编程
位置:首页>> 网络编程>> Python编程>> 浅谈Python处理PDF的方法

浅谈Python处理PDF的方法

作者:威行天下  发布时间:2023-09-17 13:20:49 

标签:python,处理,pdf

处理pdf文档

第一、

从文本中提取文本

浅谈Python处理PDF的方法

第二、

创建PDF

两种方法

浅谈Python处理PDF的方法


#使用PdfFileWriter
import PyPDF2

pdfFiles = []
for filename in os.listdir('.'):
if filename.endswith('.pdf'):
pdfFiles.append(filename)
print(pdfFiles)
pdfWriter = PyPDF2.PdfFileWriter()

pdfFileObj = open(pdfFiles[0],'rb')
pdfReader = PyPDF2.PdfFileReader(pdfFileObj) # 得到PdfFileReader对象
first,end =map(int,input('从多少页到多少页(用空格隔开):').split())
for pageNum in range(first-1,end):
pageObj = pdfReader.getPage(pageNum)
pdfWriter.addPage(pageObj)
pdfOutput = open ('split_pdf.pdf','wb')
pdfWriter.write(pdfOutput)
pdfOutput.close()

浅谈Python处理PDF的方法


#使用PdfFileMerger()
import PyPDF2
merger = PyPDF2.PdfFileMerger()
a = [str(i)+'webbook.pdf'for i in range(0,124)]
for i in a:
print(i)
merger.append(open(i,'rb'))
print("合并完成第"+str(i))
with open('combintion.pdf','wb') as f:
merger.write(f)

来源:http://www.cnblogs.com/powercai/p/7787426.html

0
投稿

猜你喜欢

手机版 网络编程 asp之家 www.aspxhome.com