使用python将PDF转word

实现功能,将程序所在当前路径下的所有PDF文件转化为word

import os
from pdf2docx import Converter

# 获取当前路径
current_path = os.getcwd()

# 遍历当前路径下的所有文件和文件夹
for file_name in os.listdir(current_path):
    # 检查文件是否为 PDF 文件
    if file_name.endswith(".pdf"):
        # 构建输入和输出文件路径
        pdf_file_path = os.path.join(current_path, file_name)
        docx_file_path = os.path.join(current_path, os.path.splitext(file_name)[0] + ".docx")
        
        # 创建 Converter 对象并将 PDF 转换为 DOCX
        cv = Converter(pdf_file_path)
        cv.convert(docx_file_path, start=0, end=None)
        cv.close()

        print(f"已将 {file_name} 转换为 {os.path.basename(docx_file_path)}")

上述代码中使用了 os 模块来获取当前路径及构建文件路径,使用了 pdf2docx 模块来进行 PDF 到 DOCX 的转换。通过遍历当前路径下的所有文件和文件夹,并判断是否是 PDF 文件,将其转换为 DOCX 文件。

可以使用以下命令进行安装pdf2docx 模块:

pip install pdf2docx

运行上述代码后,将会在当前路径下生成与每个 PDF 文件对应的 DOCX 文件。

 

可执行程序(可直接运行)可从资源中直接下载使用

 

你可能感兴趣的:(python,python,pdf,word)