作用:处理PDF文档
1.pdfFileObj = open('meetingminutes.pdf','rb')#打开pdf文档
2.pdfReader = PyPDF2.PdfFileReader(pdfFileObj)#获取pdf文档数据
3.pdfReader.numPages#获取页数
4.pageObj = pdfReader.getPage(0)#获取指定页码的内容,从0开始
5.pageObj.extractText()#返回该页文本的字符串 注:难以做到全部提取
6.pageObj.rotateClockwise(90)#旋转页面。只能旋转90*x度
7.pageObj.mergePage(pdfReader.getPage(1))#将两页重叠
1.pdfReader.isEncrypted#判断文档是否加密
2.pdfReader.decrypt('rosebud')#对加密的文档进行解密
1.pdfwriter = PyPDF2.PdfFileWriter()#新建PdfFileWriter对象
pdfwriter.encrypt('sdsd')#加密
1.无法世界添加内容,只能从其他pdf文档中拷贝过来加入
eg:
import PyPDF2
pdfFile = open('meetingminutes.pdf','rb')#打开一个现有的文档
pdfReader = PyPDF2.PdfFileReader(pdfFile)#获取内容
pdfwriter = PyPDF2.PdfFileWriter()#新建PdfFileWriter对象
for pageNum in range(pdfReader.numPages):#向PdfFileWriter对象中添加内容
pageObj = pdfReader.getPage(pageNum)
pdfwriter.addPage(pageObj)
pdfOutputFile = open('newFile.pdf','wb')#新建一个pdf文档
pdfwriter.write(pdfOutputFile)#向文档中写入内容
pdfOutputFile.close()