概述
Python处理PDF文件需要安装相应的库:【PyPDF2】库
使用场景
工作中可能会涉及处理pdf文件,PyPDF2就是这样一个库, 使用它可以轻松的处理 pdf 文件,它提供了读、写、分割、合并、文件转换等多种操作。
安装库
使用说明
PyPDF2 官方文档(documentation)
学习网站
博客
# 导入相关类
from PyPDF2 import PdfFileReader, PdfFileWriter
# 定义输入文件和输出文件(路径)
inputFile = 'read.pdf'
outputFile = 'write.pdf'
# 获取一个 PdfFileReader 对象
pdfReader = PdfFileReader(open(inputFile, 'rb'))
# 获取 PDF 的页数
pageCount = pdfReader.getNumPages()
print(pageCount)
# 返回一个 PageObject
page = pdfReader.getPage(i)
# 获取一个 PdfFileWriter 对象
pdfWriter = PdfFileWriter()
# 将一个 PageObject 加入到 PdfFileWriter 中
pdfWriter.addPage(page)
# 输出到文件中
pdfWriter.write(open(outputFile, 'wb'))
GitHub
提供了使用案例,当我们使用的时候再具体查看。