使用pdf2image库
安装方法:pdf2image库的安装方法建议参考官方说明
Python pdf2image包_程序模块 - PyPI - Python中文网
或参考
pdf2image报错,pdf2image完整安装_额滴肾啊的博客-CSDN博客
from pdf2image import convert_from_path
f_name='2021录取统计艺术类.pdf'
convert_from_path(
pdf_path=f_name, # 要转换的pdf的路径
dpi=200, # dpi中的图像质量(默认200)
output_folder='./imagefolder', # 将生成的图像写入文件夹(而不是直接写入内存)#注意中文名的目录可能会出问题
first_page=None, # 要处理的第一页
last_page=None, # 停止前要处理的最后一页
fmt="png", # 输出图像格式
jpegopt=None, # jpeg选项“quality”、“progressive”和“optimize”(仅适用于jpeg格式)
thread_count=4, # 允许生成多少线程进行处理
userpw=None, # PDF密码
use_cropbox=False, # 使用cropbox而不是mediabox
strict=False, # 当抛出语法错误时,它将作为异常引发
transparent=False, # 以透明背景而不是白色背景输出。
single_file=False, # 使用pdftoppm/pdftocairo中的-singlefile选项
poppler_path=None, # 查找poppler二进制文件的路径
grayscale=False, # 输出灰度图像
size=None, # 结果图像的大小,使用枕头(宽度、高度)标准
paths_only=False, # 不加载图像,而是返回路径(需要output_文件夹)
use_pdftocairo=False, # 用pdftocairo而不是pdftoppm,可能有助于提高性能
timeout=None, # 超时
)