逐梦苍穹

python实现图片式PDF转可搜索word文档[OCR](已打包exe文件)

1、介绍

1.1、痛点

1.2、程序介绍

2、安装方式

2.1、必要环节

2.2、脚本安装

2.2.1、不太推荐的方式

2.2.2、节约内存的方式

2.3、⭐完整版安装

3、使用

3.1、最终文件目录

3.2、主程序

3.2.1、绝对路径

3.2.2、是否为书籍

3.2.3、⭐截取区域

3.2.4、⭐进程数

3.3、运行完成

3.4、保存路径

4、代码详解

4.1、思路

4.2、交互

4.3、提取图片

4.4、裁剪图片

4.5、删除不必要的内容

4.5、⭐OCR处理

4.5.1、处理裁剪后的图片

4.5.2、写入文件

5、⭐完整源代码

作者介绍：双非本科大三网络工程专业在读，阿里云专家博主，专注于Java领域学习，擅长web应用开发、数据结构和算法，初步涉猎Python人工智能开发和前端开发。
主页：@逐梦苍穹

所属专栏：项目
您的一键三连，是我创作的最大动力

1、介绍

程序下载：

链接：https://pan.baidu.com/s/1kK1cBRwPMgnWBP2L43rs9Q?pwd=1234

提取码：1234

1.1、痛点

这是一个处理图片式PDF文件转换为可搜索的文字式word文档的程序，该程序是为了解决如下痛点：

①各软件的识别付费

②网页在线转换有大小限制

③开源的程序识别准确率略有不足(这个是比较有名的开源软件umi-ocr，准确率能达到百分之95)

1.2、程序介绍

这个程序最终是打包成了exe可执行程序(后面会详细讲解)，没有做GUI图形化界面，用户和程序的交互在命令行窗口执行。

这个项目涉及的技术点包括：

文件操作：使用Python的os和shutil模块进行文件夹和文件的创建、删除和操作。这些模块提供了对文件系统的访问和操作，允许您在项目中进行文件和文件夹的管理。
图像处理：使用OpenCV和PIL库进行图像的裁剪、保存和处理。OpenCV是一个广泛用于计算机视觉任务的开源计算机视觉库，而PIL（Python Imaging Library）则提供了处理图像的基本功能，例如打开、保存、裁剪和调整图像大小。
PDF处理：使用PyMuPDF（fitz）库进行PDF文档的处理和图像提取。PyMuPDF是一个用于处理PDF文件的Python库，可以用于提取PDF中的文本、图像等内容，并对PDF文档进行各种操作。
并发编程：使用Python的线程和线程池进行并发处理，加快图像处理和OCR识别速度。线程和线程池允许程序在同一时间执行多个任务，提高了程序的效率，尤其在需要处理大量图像或进行OCR识别时尤为重要。
OCR识别：使用cnocr库进行中文OCR识别，并将识别结果写入Word文档。cnocr是一个用于中文OCR识别的Python库，能够对中文文本进行识别，这对于处理包含中文的文档或图像非常有用。
用户输入处理：使用Python的input函数接收用户输入，根据用户输入执行不同的处理逻辑。这样可以使程序更加灵活，能够根据用户需求进行不同的操作。
异常处理：使用try-except结构进行异常处理，确保程序在出现异常时能够正常处理并给出相应提示。这有助于提高程序的稳定性和可靠性，尤其在处理文件和网络请求时非常重要。

这个项目主要用于将PDF文档中的图片提取出来，并对提取的图片进行裁剪、OCR识别，最后将识别结果写入Word文档。通过结合多种技术，实现了从PDF文档到图像处理再到文本识别的全流程自动化。

2、安装方式

这个程序一共有两种安装方式。

无论哪种安装方式，都是即装即用，也就是说，当年不需要的时候，把这个程序所在的文件夹整个删除即可，不会有残留。

需要的内容都存入百度网盘了。下载对应的zip压缩包解压即可。

OCR-program-transition-all.zip是完整版，直接就可以用！

OCR-program-transition-empty-bat.zip是脚本安装版，需要用户按照指引来操作，才可使用。

推荐使用完整版

2.1、必要环节

这个程序有两个依赖项，需要手动安装！(也在网盘内)。即：

安装过程一路默认即可。

安装后：

2.2、脚本安装

目录结构如下：

2.2.1、不太推荐的方式

这个项目需要依赖到C++的一些库，根据报错信息，是建议直接安装C++编译器Visual Studio：

虽然能做到完全解决这个报错，但是很大的缺点是：这玩意太大了……

2.2.2、节约内存的方式

这种方式，能不能成功，看点运气…

第一步：先安装上文提到的两个exe文件

第二步：运行“初始化脚本-1”文件

第三步：运行“初始化脚本-2”文件，此文件运行过程会非常久，因为这是在该文件夹下面安装项目所需依赖环境。不出意外的话，第三步安装到最后一个的时候，会报错，提示缺少C++ 14.0。

第四步：此时需要点开上文提到的两个装好的程序，右键，选择修改：

点击修复：

然后重启。

第五步：重启后，重复第三步到第五步的操作(此时第三步的运行速度会很快了)，连续操作超过三次，就…建议直接下载完整版吧…（这地方有点玄学，不是百分百能解决…程序作者本人整了三天了！程序就像捉摸不透的人一样，有时成功有时失败）

2.3、⭐完整版安装

完整版的目录，即是下文的最终文件目录。完整版则非常简单，下载-解压-运行主程序一气呵成。

请看下文分解。

3、使用

3.1、最终文件目录

3.2、主程序

找到主程序：

双击运行，按照交互窗口填写对应的内容(如果长时间没有响应，请按一下空格键即可)：

3.2.1、绝对路径

目标文档，鼠标右键，点击安全，即可看见绝对路径：

3.2.2、是否为书籍

作者认为，如果是书籍的话，最好把文档前面的"封面+目录"以及末尾倒数几页的"致谢"内容去除，以提高正确率和可阅读性。该程序不识别格式，所以这样能最大化得到文字信息。

3.2.3、⭐截取区域

如果这是一个电子书的PDF文档，为了识别文字的结果更加准确，方便读者搜索查阅内容，作者认为可以把每一页书的顶部区域的标注去掉，例如这种区域：

这种区域与正文内容无关，可以去掉。

那么如何确定好去掉区域的所占比例呢？下面细说：

使用微信截图功能，确定这个图片的“最大高度”，再确定截取区域的“高度”，二者相除，即可得到比例，图解如下：

3.2.4、⭐进程数

进程数决定了这个多线程程序的执行速度，但也不是数字填的越高越好。

下面给出几个数值参考：

游戏本->20线程

全能本->10-18线程

轻薄本->建议12线程以下

3.3、运行完成

运行完成的结果显示：转换后的文字列表内容+提示信息：

3.4、保存路径

程序运行完成后，默认的保存路径为PDF文件的同目录下。

4、代码详解

4.1、思路

需求是图片式PDF识别转换为文字式可搜索word:

第一步：告诉用户这个产品->介绍

第二步：用户输入图片式PDF的路径(需要的是绝对路径)

第三步：该PDF文档是否是书籍，是：删除非正文的页面(封面、目录、结尾)->在后续步骤执行删除；否，不执行删除操作

第四步：询问是否需要截取图片区域(是，输入截取的比例；否，截取比例制为0)->立即执行->提取到新的文件夹

第五步：用户输入本次运行过程中用到的进程数(游戏本可以输入20，全能本10-15，其他建议10甚至是8以下)

第六步：删除不要的图片区域

第七步：开始处理，把结果写入到PDF同路径下删除过程性文件

第八步：删除过程性文件,把处理结果和处理后的文件路径告诉用户

4.2、交互

4.3、提取图片

提取图片式PDF文件的每一页，保存到一个临时图片文件夹下面：

4.4、裁剪图片

4.5、删除不必要的内容

4.5、⭐OCR处理

4.5.1、处理裁剪后的图片

4.5.2、写入文件

5、⭐完整源代码

代码即注释：

# -*- coding: utf-8 -*-
# @Author:逐梦苍穹
# @Time: 2024/1/18 1:23
import os
import cv2
import fitz
import shutil
import GetImageWithPdf as getImage_xzl
import CutImageWithFolder as cutImage_xzl
import DeleteImage as deleteImage_xzl
import OCR_main as OCR_MAIN_xzl
import threading
from concurrent.futures import ThreadPoolExecutor, as_completed
from cnocr import CnOcr
from tqdm import tqdm
from PIL import Image
import write_word_OCR as write_word_OCR_xzl
from docx import Document


def mkdir(folder_path):
    os.makedirs(folder_path, exist_ok=True)


def get_max_folder_number(folder_path):
    image_files = [f for f in os.listdir(folder_path) if f.lower().endswith(('.png', '.jpg', '.jpeg', '.gif', '.bmp'))]
    return len(image_files)


def crop_top_and_save(args):
    i, image_path, output_path, crop_percentage = args
    image = cv2.imread(image_path)
    height = image.shape[0]
    crop_pixels = int(height * crop_percentage)
    cropped_image = image[crop_pixels:, :]
    cv2.imwrite(output_path, cropped_image)
    print(f"Image {i + 1} cropped and saved: {output_path}")


def startCutImage(input_folder, output_folder, crop_percentage, max_workers_input):
    mkdir(output_folder)
    max_folder_number = get_max_folder_number(input_folder)
    with ThreadPoolExecutor(max_workers=max_workers_input) as executor:
        args_list = [
            (i, os.path.join(input_folder, f'{i + 1}.jpg'), os.path.join(output_folder, f'{i + 1}.jpg'), crop_percentage)
            for i in range(max_folder_number)
        ]
        executor.map(crop_top_and_save, args_list)


def get_max_folder_number(folder_path):
    image_files = [f for f in os.listdir(folder_path) if f.lower().endswith(('.png', '.jpg', '.jpeg', '.gif', '.bmp'))]
    return len(image_files)


def delete_images(folder_path, start_index, end_index):
    for i in range(start_index, end_index + 1):
        imageStr = str(i) + ".jpg"
        file_path = os.path.join(folder_path, imageStr)
        os.remove(file_path)
        print(f"Deleted: {file_path}")


def startDeleteImage(folder_path, end_index, back_start_index_input):
    max_folder_number = get_max_folder_number(folder_path)
    if max_folder_number > 0:
        start_index = 1
        back_start_index = max_folder_number - back_start_index_input + 1
        back_end_index = max_folder_number
        delete_images(folder_path, start_index, end_index)
        delete_images(folder_path, back_start_index, back_end_index)
    else:
        print("No valid image files found.")


def convert_page_to_image(pdf_path, output_folder, page_number):
    pdf_document = fitz.open(pdf_path)
    page = pdf_document[page_number]
    image_list = page.get_images(full=True)
    for img_index, img_info in enumerate(image_list):
        image_index = img_info[0]
        base_image = pdf_document.extract_image(image_index)
        image_bytes = base_image["image"]
        image_filename = os.path.join(output_folder, f"{page_number + 1}.jpg")
        with open(image_filename, "wb") as image_file:
            image_file.write(image_bytes)
    pdf_document.close()


def pdf_to_images(pdf_path, output_folder, num_workers):
    if not os.path.exists(output_folder):
        os.makedirs(output_folder)
    pdf_document = fitz.open(pdf_path)
    total_pages = pdf_document.page_count
    with ThreadPoolExecutor(max_workers=num_workers) as executor:
        futures = [executor.submit(convert_page_to_image, pdf_path, output_folder, page_number)
                   for page_number in range(total_pages)]
        for future in tqdm(futures, desc="Converting pages", total=total_pages):
            future.result()


def get_max_folder_number(folder_path):
    image_files = [f for f in os.listdir(folder_path) if f.lower().endswith(('.png', '.jpg', '.jpeg', '.gif', '.bmp'))]
    return len(image_files)


def ocr_and_append(image_str, startList, event, lock):
    pagelist = []
    image_number = int(os.path.basename(image_str).split('.')[0])
    image = Image.open(image_str)
    ocr = CnOcr(debug=False)
    res = ocr.ocr(image)
    for j in range(len(res)):
        pagelist.append(res[j]['text'])
    with lock:
        startList[image_number - 11] = pagelist
    print(f"Image {image_number} OCR completed.")
    event.set()


def process_images_with_ocr(start, end, startList, event, max_workers_input, lock):
    with ThreadPoolExecutor(max_workers=max_workers_input) as executor:
        futures = [executor.submit(ocr_and_append, f'output-image-cut/{i}.jpg', startList, event, lock) for i in
                   tqdm(range(start, end + 1), desc="OCR Processing")]
        for future in as_completed(futures):
            future.result()


def startOCR(file_folder, test_end_index, word_file_output_path, max_workers_input):
    max_folder_number = get_max_folder_number(file_folder)
    start = 1 + test_end_index
    end = test_end_index + max_folder_number
    startList = [''] * max_folder_number
    lock = threading.Lock()
    event = threading.Event()
    process_images_with_ocr(start, end, startList, event, max_workers_input, lock)
    event.wait()
    print(len(startList))
    for i in startList:
        print(len(i))
    print(startList)
    write_word_OCR_xzl.startWriteWordFile(word_file_output_path, startList)


def startWriteWordFile(word_file_path, listPages):
    doc = Document()
    for i in listPages:
        write_list_to_word(word_file_path, i, doc)
        doc.add_page_break()
    doc.save(word_file_path)


def write_list_to_word(word_file, my_list, doc):
    endList = []
    for item in my_list:
        item = item.strip()
        if len(item) < 10:
            if endList != None and len(endList) > 0:
                doc.add_paragraph("".join(endList))
                endList = []
            doc.add_paragraph(item)
        else:
            endList.append(item)
            if item == my_list[-1]:
                doc.add_paragraph("".join(endList))
                endList = []


def main():
    try:
        crop_percentage = 0.0
        end_index = 0
        back_start_index_input = 0
        print("==========================")
        print("这是一个OCR识别程序，作者CSDN@逐梦苍穹，该程序不做商用请切记！")
        print("==========================")
        pdf_file_path = str(input("请输入PDF文件的绝对路径："))
        print("该PDF文档是否是书籍?")
        isBookPdf = int(input("(是，请输入1；否，请输入0):"))
        if isBookPdf == 1:
            print("输入要删除非正文的页面(封面、目录、结尾)")
            end_index = int(input("需要删除该文档的前几页: "))
            back_start_index_input = int(input("需要删除该文档的倒数前几页: "))
        print("询问是否需要截取图片区域?")
        isCutImage = int(input("(是，请输入1；否，请输入0):"))
        if isCutImage == 1:
            crop_percentage = float(input("请输入截取图片区域的纵向比例："))
        max_workers = int(input("请输入本次运行过程中想要使用的进程数："))
        if max_workers <= 0:
            max_workers = 1
    except Exception as e:
        print("参数有误,报错信息如下：", e)
    try:
        getImage_xzl.pdf_to_images(pdf_file_path, 'output-image', max_workers)
        if isCutImage == 1:
            cutImage_xzl.startCutImage('output-image', 'output-image-cut', crop_percentage, max_workers)
        if isBookPdf == 1:
            deleteImage_xzl.startDeleteImage('output-image-cut', end_index, back_start_index_input)
        file_name = os.path.splitext(os.path.basename(pdf_file_path))[0]
        directory_path = os.path.dirname(pdf_file_path)
        word_file_path = directory_path + '\\' + file_name + '(OCR_XZL).docx'
        OCR_MAIN_xzl.startOCR(r'output-image-cut', end_index, word_file_path, max_workers)
    except Exception as e:
        print("处理过程出错，报错信息如下：", e)
    try:
        delete_path_1 = r"output-image"
        delete_path_2 = r"output-image-cut"
        shutil.rmtree(delete_path_1)
        shutil.rmtree(delete_path_2)
        print(f"Folder '{delete_path_1}' successfully removed.")
        print(f"Folder '{delete_path_2}' successfully removed.")
        print("OCR处理完成！")
    except Exception as e:
        print("删除过程性文件出错，原因如下：", e)


if __name__ == '__main__':
    main()

【iSAQB软件架构】模板型视图描述小马哥编程 iSAQB软件架构架构分布式云计算系统架构
在描述软件架构，特别是架构视图时，使用标准结构或布局是有意义的。这为读者提供了很高的识别价值。将描述与相应的目标群体相匹配也很重要。询问您的利益相关者，对于他们自己的特定任务，需要描述哪些方面。在描述架构视图时，经验法则是尽可能少地使用形式主义，但要使用必要的量。一个项目不应该仅仅因为只有在处理了每个小细节时架构图才被接受而大幅偏离计划。作为架构师，您应该抵制教条主义行事的诱惑。对于文档范围的一个
AIGC视觉生成革命：文生图、图生图与视频生成垂直模型发展全景报告（2025） Liudef06小白 AIGC 人工智能 AI作画语言模型
一、引言：从实验工具到产业引擎的跃迁人工智能生成内容（AIGC）技术正经历从文本向多模态的范式转移。2023-2025年间，文生图、图生图与视频生成垂直模型逐步跨越技术奇点，从实验室玩具进化为工业化生产力工具。这一进程的核心驱动力在于架构创新、数据优化与场景深耕的三重突破：扩散模型与Transformer的融合催生了更高保真度的图像生成；十亿级多模态数据训练解决了复杂语义理解难题；而面向影视、电商
iOS 出海 App 安全加固指南：无源码环境下的 IPA 加固与防破解方法
随着越来越多国内开发团队将iOSApp推向海外市场，如何在交付和分发环节保护应用安全成为出海过程中的重要议题。尤其是App进入多个海外应用商店或通过第三方渠道发行时，容易被当地黑产或竞争对手进行逆向分析，从而暴露内部API、核心业务流程等敏感信息。然而，很多出海App项目采用外包或快速孵化模式，交付阶段常常只拿到ipa成品文件而非完整源码。此时，如何在不改动源码的情况下对成品ipa完成安全加固，成
python笔记-Selenium谷歌浏览器驱动下载 hero.zhong python 笔记 selenium
Selenium谷歌浏览器驱动下载地址：https://googlechromelabs.github.io/chrome-for-testing/#stable下面是遇到的问题：python网络爬虫技术中使用谷歌浏览器代码，报错：OSError:[WinError193]%1不是有效的Win32应用程序：遇到错误OSError:[WinError193]%1不是有效的Win32应用程序通常意味着
2022项目实训“异步分布式联邦学习”第五周报告
一、本周工作进度我在本周的工作进度主要集中于两个技术要点——即Axios和WebSocket。这两种技术方法有着本质上的不同，因而具体实现出来之后的效果也有所不同，下面将会分别说明。1.Axios（Ajax封装）首先要谈的内容是Axios，Axios是一个基于promise的HTTP库，是目前前端最流行的ajax请求库。Axios的优势在于，相比传统的Ajax本身是针对MVC的编程，Axios更加
Elasticsearch 启动失败？从日志分析到最终解决（磁盘空间不足案例） Leaton Lee elasticsearch 大数据搜索引擎
问题背景最近在本地运行一个SpringBoot项目时，突然遇到Elasticsearch(ES)连接超时的问题：org.springframework.beans.factory.UnsatisfiedDependencyException:Errorcreatingbeanwithname'awardController':Unsatisfieddependencyexpressedthroug
网络编程底层通信（socket） En^_^Joy python应用网络 python
文章目录一、socket函数介绍二、TCP/IP服务端/客户端三、UDP/IP服务端/客户端四、多线程服务器（threading）五、网络编程常见问题（地址复用、粘包、数据长度）网络编程指通过计算机网络实现程序间通信的技术。Python提供了丰富的库支持各种网络协议和编程模式套接字是网络通信的基本操作单元，是应用层与TCP/IP协议族通信的中间软件抽象层。它提供了一组接口，允许不同主机或同一主机的
以下是基于 C# 的面向对象设计，抽象出公共接口和协议实现 zhxup606 通讯协议 c#开发语言
以下是基于C#的面向对象设计，抽象出公共接口和协议实现，涵盖SerialPortProtocol、TcpProtocol、HttpProtocol、WebSocketProtocol、ModbusProtocol和MQTTProtocol。每个协议实现为单独的项目，公共接口定义在独立项目中，使用异步编程模式（async/await）确保高效和稳定，代码结构易于扩展。以下内容包含详细的代码示例、注释
[论文阅读] 人工智能 | 读懂Meta-Fair：让LLM摆脱偏见的自动化测试新方法张较瘦_ 前沿技术论文阅读人工智能
读懂Meta-Fair：让LLM摆脱偏见的自动化测试新方法论文标题：Meta-Fair:AI-AssistedFairnessTestingofLargeLanguageModelsarXiv:2507.02533Meta-Fair:AI-AssistedFairnessTestingofLargeLanguageModelsMiguelRomero-Arjona,JoséA.Parejo,Jua
python unicode汉字转成各种进制，以及进制互相转换丧尽天良的良！ python python
例如，汉字：“五”的unicode编码为：4e94，使用二进制的结果为：100111010010100，转换为十进制是：20116对应转换如下：
Python办公—Excel嵌入图片提取&重命名(包含重复图片) 小庄-Python办公 Python办公自动化 python excel Excel图片获取 Excel批量获取嵌入图片 Excel嵌入图片
目录专栏导读背景解决方案1、背景介绍2、库的介绍①：openpyxl3、库的安装4、核心代码5、完整代码总结专栏导读欢迎来到Python办公自动化专栏—Python处理办公问题，解放您的双手️‍博客主页：请点击——>一晌小贪欢的博客主页求关注该系列文章专栏：请点击——>Python办公自动化专栏求订阅此外还有爬虫专栏：请点击——>Python爬虫基础专栏求订阅此外还有python基础专栏：请点击—
Word 怎么让段落对齐，行与行之间宽一点？冰糖心书房 Word word
我们来分两步解决：段落对齐和调整行距。这两个功能都集中在Word顶部的【开始】选项卡里的【段落】区域。第一步：让段落对齐“对齐”指的是段落的左右边缘如何排列。通常有四种方式。操作方法：将鼠标光标点在你想修改的那个段落里的任意位置。（你不需要选中整个段落，Word很聪明，知道你想对整个段落操作）。在【开始】选项卡的【段落】区域，你会看到四个对齐按钮，它们的图标很形象：左对齐(Ctrl+L):所有行的
Python 是如何执行我的代码的？冰糖心书房 Python python java linux
理解Python如何执行你的代码，可以帮助我们解释很多“为什么”——为什么会有.pyc文件？为什么Python相对较慢？多线程为什么不能利用多核？我们可以用一个“厨师做菜”的比喻来理解整个过程，然后再深入技术细节。一、比喻：厨师（Python）根据菜谱（你的代码）做菜想象一下，你是一位顾客，写了一份非常精确的菜谱（你的.py文件）交给一位名叫CPython的大厨（最常见的Python解释器）。第一
探索Cachier：Python函数的持久化缓存利器胡同琥Randolph
探索Cachier：Python函数的持久化缓存利器cachierPersistent,stale-free,localandcross-machinecachingforPythonfunctions.项目地址:https://gitcode.com/gh_mirrors/ca/cachier在Python开发的世界中，性能优化和资源管理是永恒的话题。今天，我们要介绍的是一个强大的开源项目——C
Pyramda：Python 中的函数式编程利器惠悦颖
Pyramda：Python中的函数式编程利器pyramdaPythonpackagesupportingheavyfunctionalprogrammingthroughcurrying.TranslationoftheRamdalibraryfromjavascripttopython.项目地址:https://gitcode.com/gh_mirrors/py/pyramdaPyramda是
[特殊字符] Excel 读取收件人 + Outlook 批量发送带附件邮件 —— Python 自动化实战 happydog007 python自动化办公 excel outlook python
许多公司定期需要将不同部门或客户的报告发送给指定人员。手动操作容易出错、耗时且繁琐。今天这篇文章教你如何利用Python实现：从Excel中读取“收件人+抄送人+附件文件路径”；使用win32com.client调用Outlook自动生成并发送邮件；✅附加模板正文，并保持批量发送规范无需手工操作。从Excel中读取部门、收件人与附件路径fromopenpyxlimportload_workbook
[特殊字符] Python 实战 | 批量统计中文文档词频并导出 Excel happydog007 python自动化办公 python 开发语言
本文展示如何用Python脚本：批量读取文件夹中的多篇中文文档；用jieba分词并统计词频（过滤停用词与单字符）；将各文档词频输出为对应Excel文件；是文本分析、内容审查、报告编写中的实用技巧。Step1：批量加载文件夹中文本文件路径importospath='主要业务'files=[os.path.join(path,f)forfinos.listdir(path)]使用标准库os.listd
探索开源虚拟 Excel 函数模块：Python 中的 Excel 功能利器
在数据处理和分析的领域中，Excel一直是一款备受青睐的工具，它提供了丰富多样的函数，帮助用户高效地完成各种数据操作。而现在，我（董翔）开发一个基于Python的虚拟Excel函数模块，它将Excel的强大功能带到了Python的世界里，让你在Python环境中也能轻松使用类似Excel的函数。这个模块我已经在GitHub上发布，项目链接为：https://github.com/dxiang-wi
java项目打包成 Docker 镜像几种方式 reiraoy eureka 云原生
1.准备工作安装Docker：确保本地或服务器上已安装Docker。创建SpringBoot项目：假设你已经有一个SpringBoot项目。2.使用docker-maven-plugin打包Docker镜像（1）在pom.xml中添加插件 com.spotify docker-maven-plugin 1.2.2 ${projec
基于springboot的商业辅助决策系统的设计与实现 qq 79856539 javaweb spring boot 后端 java
一、项目介绍商业辅助决策系统实现的功能包括收入信息管理与支出信息管理，员工销售订单信息管理，员工薪资管理，员工管理，公告管理等功能。该系统采用了Mysql数据库，Java语言，SpringBoot框架等技术进行编程实现。商业辅助决策系统可以提高收支信息和销售订单信息管理问题的解决效率，优化收支信息和销售订单信息处理流程，保证收支信息和销售订单信息数据的安全，它是一个非常可靠，非常安全的应用程序。关
Ch55xduino 项目使用教程
Ch55xduino项目使用教程ch55xduino项目地址:https://gitcode.com/gh_mirrors/ch/ch55xduino1.项目介绍Ch55xduino是一个为CH55X系列微控制器提供的Arduino编程接口。CH55X是一系列低成本的MCS51USB微控制器，Ch55xduino项目旨在简化这些设备的编程环境设置，使用户能够像使用ArduinoIDE一样轻松地编写
深度 |AI高质量数据集交易爆发式增长数智前沿数字化转型人工智能数据集
AI产业从通用模型向行业垂直应用快速融合下沉的阶段演进，人工智能三大基本要素之一数据，面临的高质量数据不足问题却凸显。财联社记者最新从业内获悉，目前各大模型企业迫切希望获得更多更好的高质量数据集，需求集中于头部企业行业知识底座构建，人工智能高质量数据集的需求量、交易量激增，已成为数据流通最活跃的领域。不过，高质量数据集的建设、流通环节均面临诸多问题，目前数据交易所并非模型语料最主要的采购途径。需求
轻量化分布式AGI架构：基于区块链构建终端神经元节点的互联网智脑探客木木夕分布式 agi 人工智能架构区块链
在2025年的技术发展背景下，轻量化分布式AGI架构正成为人工智能领域的重要突破方向。通过将终端设备转化为神经元节点，结合区块链技术构建去中心化的互联网智脑，不仅能够突破传统AGI开发的算力瓶颈，还能实现数据安全共享与价值分配。**这一架构将重塑人工智能的发展范式，使AGI能力从中心化实验室扩散至全球终端设备网络，最终形成一个去中心化、自演进、高可用的互联网级智能系统**。研究显示，通过知识密度提
写测试太烦？Copilot + Jest 让你 3 分钟搞定单元测试
网罗开发（小红书、快手、视频号同名）大家好，我是展菲，目前在上市企业从事人工智能项目研发管理工作，平时热衷于分享各种编程领域的软硬技能知识以及前沿技术，包括iOS、前端、HarmonyOS、Java、Python等方向。在移动端开发、鸿蒙开发、物联网、嵌入式、云原生、开源等领域有深厚造诣。图书作者：《ESP32-C3物联网工程开发实战》图书作者：《SwiftUI入门，进阶与实战》超级个体：CO
60天python训练营打卡day46
学习目标：60天python训练营打卡学习内容：DAY46通道注意力(SE注意力)知识点回顾：1.不同CNN层的特征图：不同通道的特征图2.什么是注意力：注意力家族，类似于动物园，都是不同的模块，好不好试了才知道。3.通道注意力：模型的定义和插入的位置4.通道注意力后的特征图和热力图学习时间：2025.06.29@浙大疏锦行
trae的使用
trae的使用下载地址：https://www.trae.com.cn/home直接在官网下载安装即可可以从VScode和cursor当中导入配置（插件·设置·快捷键等等）需要登陆后才能正常使用（国内版本的可以通过手机号登录）登录打开后的页面：左边大框架可以在本软件里打开文件或是克隆github的项目到本地右边是选择trae的模式：有两种：chat和Builderchat模式和Builder模式下
2025 API 开发管理工具 Apipost 与 Apifox 全维度对比
在当今数字化转型的浪潮下，API开发与管理对于各类项目的成功实施至关重要。Apipost和Apifox两款API开发管理工具，各自有着独特的功能特性。本文将从多个维度对它们进行深入对比，为研发、测试人员提供全面的参考。一、API设计在大型企业级项目中，API设计的复杂性和定制性要求极高。以金融行业为例，不同法人行的业务规则差异巨大，从账户管理到交易处理，每个环节都需要精确且个性化的API设计。Ap
python规划 t_hj python
-----------动态内容与反爬策略----------动态页面处理Selenium：自动化浏览器（点击、滚动、表单提交）Playwright（更现代的替代方案）API逆向工程分析Ajax请求（ChromeDevTools）直接调用API接口（如知乎热榜API）反爬应对User-Agent轮换、IP代理（免费/付费代理池）验证码处理（简单验证码用OCR，复杂验证码需打码平台）请求频率控制（ti
程序员在线接单微风粼粼 eclipse java tomcat jvm dubbo python 后端
十年Java全栈工程师在线接单Java程序代做，兼职接单，系统代做，二次开发，网站开发部署，项目合作，商业项目承包全栈开发，支持定制各种管理系统、小程序商用或个人使用等项目都接服务二:Java调试安装，idea，eclipse，项目运行，开发环境配置，工具安装，代码讲解，代码调试，代码运行，代码部署，项目调试，项目部署运行，javaweb，ssm，springboot,vue，项目设计，小程序功能
Python 训练营打卡 Day 46 2401_86382089 Python打卡 python
通道注意力一、什么是注意力注意力机制是一种让模型学会「选择性关注重要信息」的特征提取器，就像人类视觉会自动忽略背景，聚焦于图片中的主体（如猫、汽车）。transformer中的叫做自注意力机制，他是一种自己学习自己的机制，他可以自动学习到图片中的主体，并忽略背景。我们现在说的很多模块，比如通道注意力、空间注意力、通道注意力等等，都是基于自注意力机制的。从数学角度看，注意力机制是对输入特征进行加权求
Algorithm 香水浓 java Algorithm
冒泡排序 public static void sort(Integer[] param) { for (int i = param.length - 1; i > 0; i--) { for (int j = 0; j < i; j++) { int current = param[j]; int next = param[j + 1];
mongoDB 复杂查询表达式开窍的石头 mongodb
1:count Pg: db.user.find().count(); 统计多少条数据 2:不等于$ne Pg: db.user.find({_id:{$ne:3}},{name:1,sex:1,_id:0}); 查询id不等于3的数据。 3：大于$gt $gte(大于等于) &n
Jboss Java heap space异常解决方法, jboss OutOfMemoryError : PermGen space 0624chenhong jvm jboss
转自 http://blog.csdn.net/zou274/article/details/5552630 解决办法： window->preferences->java->installed jres->edit jre 把default vm arguments 的参数设为-Xms64m -Xmx512m ----------------
文件上传下载解析相对路径不懂事的小屁孩文件上传
有点坑吧，弄这么一个简单的东西弄了一天多，身边还有大神指导着，网上各种百度着。下面总结一下遇到的问题：文件上传，在页面上传的时候，不要想着去操作绝对路径，浏览器会对客户端的信息进行保护，避免用户信息收到攻击。在上传图片，或者文件时，使用form表单来操作。前台通过form表单传输一个流到后台，而不是ajax传递参数到后台，代码如下: <form action=&
怎么实现qq空间批量点赞换个号韩国红果果 qq
纯粹为了好玩！！逻辑很简单 1 打开浏览器console；输入以下代码。先上添加赞的代码 var tools={}; //添加所有赞 function init(){ document.body.scrollTop=10000; setTimeout(function(){document.body.scrollTop=0;},2000);//加
判断是否为中文灵静志远中文
方法一： public class Zhidao { public static void main(String args[]) { String s = "sdf灭礌 kjl d{';\fdsjlk是"; int n=0; for(int i=0; i<s.length(); i++) { n = (int)s.charAt(i); if((
一个电话面试后总结 a-john 面试
今天，接了一个电话面试，对于还是初学者的我来说，紧张了半天。面试的问题分了层次，对于一类问题，由简到难。自己觉得回答不好的地方作了一下总结：在谈到集合类的时候，举几个常用的集合类，想都没想，直接说了list,map。然后对list和map分别举几个类型： list方面：ArrayList,LinkedList。在谈到他们的区别时，愣住了
MSSQL中Escape转义的使用 aijuans MSSQL
IF OBJECT_ID('tempdb..#ABC') is not null drop table tempdb..#ABC create table #ABC ( PATHNAME NVARCHAR(50) ) insert into #ABC SELECT N'/ABCDEFGHI' UNION ALL SELECT N'/ABCDGAFGASASSDFA' UNION ALL
一个简单的存储过程 asialee mysql 存储过程构造数据批量插入
今天要批量的生成一批测试数据，其中中间有部分数据是变化的，本来想写个程序来生成的，后来想到存储过程就可以搞定，所以随手写了一个，记录在此： DELIMITER $$ DROP PROCEDURE IF EXISTS inse
annot convert from HomeFragment_1 to Fragment 百合不是茶 android 导包错误
创建了几个类继承Fragment, 需要将创建的类存储在ArrayList<Fragment>中; 出现不能将new 出来的对象放到队列中,原因很简单; 创建类时引入包是:import android.app.Fragment; 创建队列和对象时使用的包是:import android.support.v4.ap
Weblogic10两种修改端口的方法 bijian1013 weblogic 端口号配置管理 config.xml
一.进入控制台进行修改 1.进入控制台: http://127.0.0.1:7001/console 2.展开左边树菜单域结构->环境->服务器-->点击AdminServer(管理) &
mysql 操作指令征客丶 mysql
一、连接mysql 进入 mysql 的安装目录； $ bin/mysql -p [host IP 如果是登录本地的mysql 可以不写 -p 直接 -u] -u [userName] -p 输入密码，回车，接连；二、权限操作［如果你很了解mysql数据库后，你可以直接去修改系统表，然后用 mysql> flush privileges; 指令让权限生效］ 1、赋权 mys
【Hive一】Hive入门 bit1129 hive
Hive安装与配置 Hive的运行需要依赖于Hadoop，因此需要首先安装Hadoop2.5.2，并且Hive的启动前需要首先启动Hadoop。 Hive安装和配置的步骤 1. 从如下地址下载Hive0.14.0 http://mirror.bit.edu.cn/apache/hive/ 2.解压hive，在系统变
ajax 三种提交请求的方法 BlueSkator Ajax jqery
1、ajax 提交请求 $.ajax({ type:"post", url : "${ctx}/front/Hotel/getAllHotelByAjax.do", dataType : "json", success : function(result) { try { for(v
mongodb开发环境下的搭建入门 braveCS 运维
linux下安装mongodb 1）官网下载mongodb-linux-x86_64-rhel62-3.0.4.gz 2）linux 解压 gzip -d mongodb-linux-x86_64-rhel62-3.0.4.gz; mv mongodb-linux-x86_64-rhel62-3.0.4 mongodb-linux-x86_64-rhel62-
编程之美-最短摘要的生成 bylijinnan java 数据结构算法编程之美
import java.util.HashMap; import java.util.Map; import java.util.Map.Entry; public class ShortestAbstract { /** * 编程之美最短摘要的生成 * 扫描过程始终保持一个[pBegin,pEnd]的range,初始化确保[pBegin,pEnd]的ran
json数据解析及typeof chengxuyuancsdn js typeof json解析
// json格式 var people='{"authors": [{"firstName": "AAA","lastName": "BBB"},' +' {"firstName": "CCC&
流程系统设计的层次和目标 comsci 设计模式数据结构 sql 框架脚本
流程系统设计的层次和目标
RMAN List和report 命令 daizj oracle list report rman
LIST 命令使用RMAN LIST 命令显示有关资料档案库中记录的备份集、代理副本和映像副本的信息。使用此命令可列出： • RMAN 资料档案库中状态不是AVAILABLE 的备份和副本 • 可用的且可以用于还原操作的数据文件备份和副本 • 备份集和副本，其中包含指定数据文件列表或指定表空间的备份 • 包含指定名称或范围的所有归档日志备份的备份集和副本 • 由标记、完成时间、可
二叉树:红黑树 dieslrae 二叉树
红黑树是一种自平衡的二叉树,它的查找,插入,删除操作时间复杂度皆为O(logN),不会出现普通二叉搜索树在最差情况时时间复杂度会变为O(N)的问题. 红黑树必须遵循红黑规则,规则如下 1、每个节点不是红就是黑。 2、根总是黑的 &
C语言homework3，7个小题目的代码 dcj3sjt126com c
1、打印100以内的所有奇数。 # include <stdio.h> int main(void) { int i; for (i=1; i<=100; i++) { if (i%2 != 0) printf("%d ", i); } return 0; } 2、从键盘上输入10个整数，
自定义按钮, 图片在上, 文字在下, 居中显示 dcj3sjt126com 自定义
#import <UIKit/UIKit.h> @interface MyButton : UIButton -(void)setFrame:(CGRect)frame ImageName:(NSString*)imageName Target:(id)target Action:(SEL)action Title:(NSString*)title Font:(CGFloa
MySQL查询语句练习题，测试足够用了 flyvszhb sql mysql
http://blog.sina.com.cn/s/blog_767d65530101861c.html 1.创建student和score表 CREATE TABLE student ( id INT(10) NOT NULL UNIQUE PRIMARY KEY , name VARCHAR
转：MyBatis Generator 详解 happyqing mybatis
MyBatis Generator 详解 http://blog.csdn.net/isea533/article/details/42102297 MyBatis Generator详解 http://git.oschina.net/free/Mybatis_Utils/blob/master/MybatisGeneator/MybatisGeneator.
让程序员少走弯路的14个忠告 jingjing0907 工作计划学习
无论是谁，在刚进入某个领域之时，有再大的雄心壮志也敌不过眼前的迷茫：不知道应该怎么做，不知道应该做什么。下面是一名软件开发人员所学到的经验，希望能对大家有所帮助 1.不要害怕在工作中学习。只要有电脑，就可以通过电子阅读器阅读报纸和大多数书籍。如果你只是做好自己的本职工作以及分配的任务，那是学不到很多东西的。如果你盲目地要求更多的工作，也是不可能提升自己的。放
nginx和NetScaler区别流浪鱼 nginx
NetScaler是一个完整的包含操作系统和应用交付功能的产品，Nginx并不包含操作系统，在处理连接方面，需要依赖于操作系统，所以在并发连接数方面和防DoS攻击方面，Nginx不具备优势。 2.易用性方面差别也比较大。Nginx对管理员的水平要求比较高，参数比较多，不确定性给运营带来隐患。在NetScaler常见的配置如健康检查，HA等，在Nginx上的配置的实现相对复杂。 3.策略灵活度方
第11章动画效果（下） onestopweb 动画
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
FAQ - SAP BW BO roadmap blueoxygen BO BW
http://www.sdn.sap.com/irj/boc/business-objects-for-sap-faq Besides, I care that how to integrate tightly. By the way, for BW consultants, please just focus on Query Designer which i
关于java堆内存溢出的几种情况 tomcat_oracle java jvm jdk thread
【情况一】：　　 java.lang.OutOfMemoryError: Java heap space：这种是java堆内存不够，一个原因是真不够，另一个原因是程序中有死循环；　　如果是java堆内存不够的话，可以通过调整JVM下面的配置来解决：　　<jvm-arg>-Xms3062m</jvm-arg> 　　<jvm-arg>-Xmx
Manifest.permission_group权限组阿尔萨斯 Permission
结构继承关系 public static final class Manifest.permission_group extends Object java.lang.Object android. Manifest.permission_group 常量 ACCOUNTS 直接通过统计管理器访问管理的统计 COST_MONEY可以用来让用户花钱但不需要通过与他们直接牵涉的权限 D

python实现图片式PDF转可搜索word文档[OCR](已打包exe文件)

1、介绍

1.1、痛点

1.2、程序介绍

2、安装方式

2.1、必要环节

2.2、脚本安装

2.2.1、不太推荐的方式

2.2.2、节约内存的方式

2.3、⭐完整版安装

3、使用

3.1、最终文件目录

3.2、主程序

3.2.1、绝对路径

3.2.2、是否为书籍

3.2.3、⭐截取区域

3.2.4、⭐进程数

3.3、运行完成

3.4、保存路径

4、代码详解

4.1、思路

4.2、交互

4.3、提取图片

4.4、裁剪图片

4.5、删除不必要的内容

4.5、⭐OCR处理

4.5.1、处理裁剪后的图片

4.5.2、写入文件

5、⭐完整源代码

你可能感兴趣的:(项目,python,pdf,word,人工智能)