【推荐】15k的star,5分钟本地化部署,一款由ChatGPT开发PDF文件处理神器,功能强大,你想要的都有。

【推荐】15k的star,5分钟本地化部署,一款由ChatGPT开发PDF文件处理神器,功能强大,你想要的都有。

文章目录

    • 【推荐】15k的star,5分钟本地化部署,一款由ChatGPT开发PDF文件处理神器,功能强大,你想要的都有。
      • 推荐3个理由
      • 官网
      • 特点
      • 功能
        • 页面操作
        • 转换操作
        • 安全性和权限
        • 其他操作
      • 安装
        • 第1种:`docker run`
        • 第2种: `docker compose`
      • 访问
      • 我是老码农

大家好!我是老码农。

《码农说》公众号的第13篇文章我们暖暖来袭。

今天分享主题:一款最初由100%ChatGPT开发的PDF处理应用程序,Stirling-PDF

工具的源代码,我已经下载好了,公众号内回复:0108即可下载,不想下载的直接按照资料部署即可。

推荐3个理由

理由1:部署非常简单,如果基于Docker部署,5分钟搞定。因为是本地化部署,不用担心数据安全问题;

  • 网络上各种在线PDF处理工具不付费大都功能受限,用起来很不爽;
  • 文中记述了详细的部署过程。

理由2:体验ChatGPT的强大之处;工具用好了,能让我们有更多的时间摸鱼,太牛掰了;

理由3:基于主流的技术架构,我们可以方便进行二次开发;

  • Spring Boot + Thymeleaf
  • PDFBox
  • LibreOffice for advanced conversions
  • OcrMyPdf
  • HTML, CSS, JavaScript
  • Docker
  • PDF.js
  • PDF-LIB.js

官网

  • Stirling-PDF
    • https://github.com/Stirling-Tools/Stirling-PDF

特点

  • 本地部署基于Web页面的PDF操作工具;
  • 本地可基于Docker部署;
  • 可以对PDF文件执行各种操作,如拆分、合并、转换、重组、添加图像、旋转、压缩等;
  • 支持黑暗模式;
  • 并行文件处理和下载;
  • 可选的登录和身份验证支持。

功能

页面操作
  • 查看和修改PDF-使用自定义查看排序和搜索功能查看多页PDF。加上页面上的编辑功能,如注释、绘制和添加文本和图像。

  • 用于合并/拆分/旋转/移动PDF及其页面的完整交互式GUI。

  • 将多个PDF合并到一个结果文件中。

  • 按指码将PDF拆分为多个文件,或将所有页面提取为单个文件。

  • 将PDF页面重新组织为不同的顺序。

  • 以90度为增量旋转PDF。

  • 删除页面。

  • 多页布局(将PDF格式设置为多页页面)。

  • 按设置%缩放页面内容大小。

  • 裁剪PDF。

  • 。。。

转换操作
  • 将PDF转换为图像和从图像转换PDF。

  • 将任何常用文件转换为PDF(使用LibreOffice)。

  • 将PDF转换为Word/Powerpoint/其他(使用LibreOffice)。

  • 将HTML转换为PDF。

安全性和权限
  • 添加和删除密码。

  • 更改/设置PDF权限。

  • 添加水印。

  • 认证/签署PDF。

其他操作
  • 添加/生成/写入签名。

  • 检测并删除空白页。

  • 比较2个PDF并显示文本差异。

  • 将图像添加到PDF中。

  • 压缩PDF以减小其文件大小(使用OCRMyPDF)。

  • 从PDF中提取图像。

  • 从扫描中提取图像。

  • 添加页码。

安装

下面提供了2种安装方式,实际都是用Docker启动容器。推荐大家用Docker安装。

第1种:docker run
  • Step1: 创建数据卷

    docker volume create s_pdf_trainingData
    

    继续执行下面命令

    docker volume create s_pdf_extraConfigs
    

    继续执行下面命令

    docker volume create s_pdf_logs
    
  • Step2:运行docker run, 启动容器

    docker run -d -p 8686:8080 -v s_pdf_trainingData:/usr/share/tesseract-ocr/5/tessdata -v s_pdf_extraConfigs:/configs -v s_pdf_logs:/logs -e DOCKER_ENABLE_SECURITY=false --name stirling-pdf  frooodle/s-pdf:latest
    
第2种: docker compose
  • Step1: 编写脚本,脚本文件名compose.yaml

    version: '3.3'
    services:
      stirling-pdf:
        image: frooodle/s-pdf:latest
        ports:
          - '8686:8080'
        volumes:
          - s_pdf_trainingData:/usr/share/tesseract-ocr/5/tessdata 
          - s_pdf_extraConfigs:/configs
          - s_pdf_logs:/logs/
    #      - /location/of/customFiles:/customFiles/
        environment:
          - DOCKER_ENABLE_SECURITY=false
    volumes:
      s_pdf_trainingData:
      s_pdf_extraConfigs:
      s_pdf_logs:
    
  • Step2: 编写一个执行脚本

    • Window上:run.bat,该文件和compose.yml放在同一目录下,文件内容如下

      docker compose up -d
      
    • Linux Or macOS上:run.sh, 该文件和compose.yml也放在同一目录下,文件内容如下

      #!/bin/bash
      docker compose up -d
      

      然后修改该文件可执行权限

      chmod +x run.sh
      
  • Step3:参照下面说明,执行完脚本,启动容器即可。

    • Windows上,直接双击run.bat即可启动;

    • Linux Or MacOS上,执行下面的脚本,启动容器。

      ./run.sh
      

访问

  • Step1:打开浏览器,输入http://localhost:8686/

    默认是英文的,下图画框部分是提供的功能。

    【推荐】15k的star,5分钟本地化部署,一款由ChatGPT开发PDF文件处理神器,功能强大,你想要的都有。_第1张图片

  • Step2:改成中文,如下图操作即可

    【推荐】15k的star,5分钟本地化部署,一款由ChatGPT开发PDF文件处理神器,功能强大,你想要的都有。_第2张图片

  • Step3:修改完语言后,界面如下,提供的功能很全

    【推荐】15k的star,5分钟本地化部署,一款由ChatGPT开发PDF文件处理神器,功能强大,你想要的都有。_第3张图片

  • Step4: 更多的功能,大家安装后自己体验吧。

我是老码农

大家好!我是老码农。今天就分享到这里。

关注《码农说》,期待未来能与更多的同学有深入的交流,一同学习技术,共同成长。

你可能感兴趣的:(最强工具,pdf,转换工具,chatgpt,二次开发)