pdf转word代码

安装pip install -i https://pypi.doubanio.com/simple/ python-docx

工程结构如下:

pdf转word代码_第1张图片

代码如下:

#!/usr/bin/env python
# -*- coding: utf-8 -*-


import os
from pdf2docx import Converter
from loguru import logger
# 获取到当前路径
path = os.getcwd()
#  获取到当前所有为pdf的文件
def get_filelist():
    Filelist = []

    for home, dirs, files in os.walk(path):

        for filename in files:
            # 文件名列表,包含完整路径
            if ".pdf" in filename:
                # print(filename)
                Filelist.append(os.path.join(home, filename))
            else:
                pass

    return Filelist


def main():

    Filelist = get_filelist()
    for file in Filelist:
        pdf_file = file

        docx_file = ".".join(pdf_file.split(".")[:-1]) + ".docx"

        logger.debug("原始的pdf文件为-------%s" % pdf_file)

        cv = Converter(pdf_file)
        cv.convert(docx_file)  # 默认参数start=0, end=None
        logger.debug("转换之后的docx文件为-------%s" % docx_file)
        cv.close()


if __name__ == "__main__":
    main()

转换过程

pdf转word代码_第2张图片

文档展示:

pdf转word代码_第3张图片

pdf转word代码_第4张图片

参考自:实用小工具-----python3 pdf2docx轻松搞定pdf转word_python pdf2word_Jan_My31的博客-CSDN博客

你可能感兴趣的:(开发工具使用技巧,pdf,word)