python pdf2image库使用

第一步安装pdf2image

pip install pdf2image

官网

https://pypi.org/project/pdf2image/

Windows:需要下载poppler ,

下载链接

https://github.com/oschwartz10612/poppler-windows/releases/

mac:

brew install poppler

用法

import pdf2image
from pdf2image import convert_from_path

f_name = "11.pdf"

convert_from_path(
    pdf_path=f_name,  # 要转换的pdf的路径
    dpi=200,  # dpi中的图像质量(默认200)
    output_folder='./Musics',  # 将生成的图像写入文件夹(而不是直接写入内存)#注意中文名的目录可能会出问题
    first_page=1,  # 要处理的第一页
    last_page=1,  # 停止前要处理的最后一页
    fmt="png",  # 输出图像格式
    jpegopt=None,  # jpeg选项“quality”、“progressive”和“optimize”(仅适用于jpeg格式)
    thread_count=4,  # 允许生成多少线程进行处理
    userpw=None,  # PDF密码
    use_cropbox=False,  # 使用cropbox而不是mediabox
    strict=False,  # 当抛出语法错误时,它将作为异常引发
    transparent=False,  # 以透明背景而不是白色背景输出。
    single_file=False,  # 使用pdftoppm/pdftocairo中的-singlefile选项
    poppler_path="D:/codegithub/poppler-23.01.0/Library/bin",  # 查找poppler二进制文件的路径
    grayscale=False,  # 输出灰度图像
    size=None,  # 结果图像的大小,使用枕头(宽度、高度)标准
    paths_only=False,  # 不加载图像,而是返回路径(需要output_文件夹)
    use_pdftocairo=False,  # 用pdftocairo而不是pdftoppm,可能有助于提高性能
    timeout=None,  # 超时
)

你可能感兴趣的:(python,开发语言,pdf2image)