第一步安装pdf2image
pip install pdf2image
官网
https://pypi.org/project/pdf2image/
Windows:需要下载poppler ,
下载链接
https://github.com/oschwartz10612/poppler-windows/releases/
mac:
brew install poppler
用法
import pdf2image
from pdf2image import convert_from_path
f_name = "11.pdf"
convert_from_path(
pdf_path=f_name, # 要转换的pdf的路径
dpi=200, # dpi中的图像质量(默认200)
output_folder='./Musics', # 将生成的图像写入文件夹(而不是直接写入内存)#注意中文名的目录可能会出问题
first_page=1, # 要处理的第一页
last_page=1, # 停止前要处理的最后一页
fmt="png", # 输出图像格式
jpegopt=None, # jpeg选项“quality”、“progressive”和“optimize”(仅适用于jpeg格式)
thread_count=4, # 允许生成多少线程进行处理
userpw=None, # PDF密码
use_cropbox=False, # 使用cropbox而不是mediabox
strict=False, # 当抛出语法错误时,它将作为异常引发
transparent=False, # 以透明背景而不是白色背景输出。
single_file=False, # 使用pdftoppm/pdftocairo中的-singlefile选项
poppler_path="D:/codegithub/poppler-23.01.0/Library/bin", # 查找poppler二进制文件的路径
grayscale=False, # 输出灰度图像
size=None, # 结果图像的大小,使用枕头(宽度、高度)标准
paths_only=False, # 不加载图像,而是返回路径(需要output_文件夹)
use_pdftocairo=False, # 用pdftocairo而不是pdftoppm,可能有助于提高性能
timeout=None, # 超时
)