Python实现HTML转PDF

导入第三方库

import os
import pdfkit

下载wkhtmltopdf.exe,并确定绝对路径

path_to_wkhtmltopdf = r'E:\脚本\HTML_to_PDF\wkhtmltopdf\bin\wkhtmltopdf.exe' # wkhtmltopdf.exe绝对路径

读取文件夹中HTML文件

# 读取文件夹中HTML文件
pdf_list=[]
def search_file(dirPath, suffix):
    dirs = os.listdir(dirPath)
    for currentFile in dirs:
        absPath = dirPath + '/' + currentFile
        if os.path.isdir(absPath):
            search_file(absPath, suffix)
        elif currentFile.split('.')[-1] == suffix:  # 文件后缀名相同,则打印该文件的绝对路径
            pdf_list.append(absPath)
            # print(absPath)
if __name__ == "__main__":
    dirPath = 'E:\脚本\HTML_to_PDF\xxxxx' # 文件存储绝对路径
    suffix = 'html'
    search_file(dirPath, suffix)

选择文件HTML file

# 选择文件HTML file
for i in range(len(pdf_list)):
    path_to_file = pdf_list[i]
    # 替换html后缀
    pdf_list[i] = pdf_list[i].replace('.html', '')
    # 使用wkhtmltopdf.exe
    config = pdfkit.configuration(wkhtmltopdf=path_to_wkhtmltopdf)
    # 转换
    pdfkit.from_file(path_to_file, output_path=f'{pdf_list[i]}.pdf', configuration=config)
    print(f"{pdf_list[i]}已转换")

完成转换并存储

关于多个PDF合并,请移步至合并链接

http://t.csdn.cn/lGhTa

你可能感兴趣的:(Python工具构造,pdf,python,学习方法,html)