利用python代码实现批量pdf文件转word文件

目录

前言

使用步骤

1.下载所需库

2.引入库

3.设定文件所在地址

4.遍历转换

总结


前言

        在工作和学习中,我们可能会遇到需要将大量pdf文件转成word文件的情况,本文将介绍如何用python代码实现这项操作。


使用步骤

1.下载所需库

在cmd命令提示符中输入下载命令:

pip install pdf2docx

2.引入库

代码如下:

import os
from pdf2docx import Converter

3.设定文件所在地址

代码如下:

file_path = "E:/cjia_code/report"

4.遍历转换

代码如下:

# 遍历所有文件
for file in os.listdir(file_path):
    # 获取文件后缀
    suff_name = os.path.splitext(file)[1]
 
    # 过滤非pdf格式文件
    if suff_name == '.pdf':
        # 获取文件名称
        file_name = os.path.splitext(file)[0]

        # pdf文件名称
        pdf_name = file_path + '//' + file
        # 要转换的docx文件名称
        docx_name = file_path + '//' + file_name + '.docx'

        # 加载pdf文档
        cv = Converter(pdf_name)
        cv.convert(docx_name)
        cv.close()

全部代码如下:

import os
from pdf2docx import Converter

# 设定文件地址
file_path = "E:/cjia_code/report"

# 遍历所有文件
for file in os.listdir(file_path):
    # 获取文件后缀
    suff_name = os.path.splitext(file)[1]
 
    # 过滤非pdf格式文件
    if suff_name == '.pdf':
        # 获取文件名称
        file_name = os.path.splitext(file)[0]

        # pdf文件名称
        pdf_name = file_path + '//' + file
        # 要转换的docx文件名称
        docx_name = file_path + '//' + file_name + '.docx'

        # 加载pdf文档
        cv = Converter(pdf_name)
        cv.convert(docx_name)
        cv.close()

总结

        以上就是今天要讲的内容,本文介绍了如何用代码将pdf文件批量转换为docx文件,希望能给读者带来一些帮助。

你可能感兴趣的:(python,numpy,开发语言)