1、打算用python做一个电脑端的电子书架,用到了PyMuPDF,这是一个轻量级PDF阅读器和工具包。搜索了网上的资料,大多基于低版本的PyMuPDF,好多API已经不再适用。本次使用的PyMuPDF版本为1.21.1。
2、安装PyMuPDF工具包的方法同其他工具包相同,不再赘述。
3、转换pdf文件的首页为图片
import fitz # 加载PyMuPDF工具包
class Tool_PDF():
def getCover(fileName, pngName):
doc1 = fitz.open(fileName) # 打开PDF文件
page = doc1.load_page(0) # 读取首页数据
pix = page.get_pixmap(colorspace='rgb', alpha=False, dpi=50) # 扫描为像素模式
pix.save(pngName) # 转换为图片
4、提取文档首页结果