浅谈Python处理PDF的方法

2020-01-04 16:30:42

字体：大中小

来源：转载

供稿：网友

处理pdf文档

第一、

从文本中提取文本

python,处理,pdf

第二、

创建PDF

两种方法

python,处理,pdf

#使用PdfFileWriterimport PyPDF2 pdfFiles = []for filename in os.listdir('.'):if filename.endswith('.pdf'):pdfFiles.append(filename)print(pdfFiles)pdfWriter = PyPDF2.PdfFileWriter() pdfFileObj = open(pdfFiles[0],'rb')pdfReader = PyPDF2.PdfFileReader(pdfFileObj) # 得到PdfFileReader对象first,end =map(int,input('从多少页到多少页(用空格隔开):').split())for pageNum in range(first-1,end):pageObj = pdfReader.getPage(pageNum)pdfWriter.addPage(pageObj)pdfOutput = open ('split_pdf.pdf','wb')pdfWriter.write(pdfOutput)pdfOutput.close()

python,处理,pdf

#使用PdfFileMerger()import PyPDF2merger = PyPDF2.PdfFileMerger()a = [str(i)+'webbook.pdf'for i in range(0,124)]for i in a:print(i)merger.append(open(i,'rb'))print("合并完成第"+str(i))with open('combintion.pdf','wb') as f:merger.write(f)

总结

以上就是本文关于浅谈Python处理PDF的全部内容，希望对大家有所帮助。有什么问题可以随时留言，小编会及时回复大家的。感谢朋友们对本站的支持！

注：相关教程知识阅读请移步到python教程频道。

上一篇：django开发教程之利用缓存文件进行页面缓存的方法

下一篇：Python3中的列表,元组,字典,字符串相关知识小结