Code_Noting

百度OCR文字识别接口对接

import java.awt.image.BufferedImage;
import java.io.BufferedReader;
import java.io.File;
import java.io.IOException;
import java.io.InputStreamReader;
import java.net.HttpURLConnection;
import java.net.URL;
import java.net.URLEncoder;
import java.util.List;
import java.util.Map;

import javax.imageio.ImageIO;

import nc.bs.logging.Logger;
import nc.bs.os.outside.TGOutsideUtils;

import org.apache.pdfbox.pdmodel.PDDocument;
import org.apache.pdfbox.rendering.PDFRenderer;
import org.springframework.web.multipart.MultipartFile;

import com.alibaba.fastjson.JSON;
import com.alibaba.fastjson.JSONObject;
import com.baidu.ai.aip.utils.Base64Util;
import com.baidu.ai.aip.utils.FileUtil;
import com.baidu.ai.aip.utils.HttpUtil;

public class BaiduOCRTest {
	public static void main(String[] args) {
		File imagfile = null;
		String result = null;
		try {
			String filepath = "f:/111.pdf";
			String url = "https://aip.baidubce.com/rest/2.0/solution/v1/iocr/recognise/finance";

			// 注意这里仅为了简化编码每一次请求都去获取access_token，线上环境access_token有过期时间，
			// 客户端可自行缓存，过期后重新获取。
			// String accessToken =
			// "24.11e2f516b3dd260b2427251fa610cb83.2592000.1629255151.282335-24426393";
			String accessToken = getAuth();

			int begin = filepath.indexOf(".");
			int last = filepath.length();
			String fileType = filepath.substring(begin, last);
			if (fileType.endsWith(".pdf")) {// PDF格式文件
				try {
					File file = new File(filepath);
					PDDocument doc = PDDocument.load(file);
					PDFRenderer renderer = new PDFRenderer(doc);
					int pageCount = doc.getNumberOfPages();
					for (int i = 0; i < pageCount; i++) {
						// 方式1,第二个参数是设置缩放比(即像素)
						// BufferedImage image = renderer.renderImageWithDPI(i,
						// 296);
						// 方式2,第二个参数是设置缩放比(即像素)
						BufferedImage images = renderer.renderImage(i, 1.25f); // 第二个参数越大生成图片分辨率越高，转换时间也就越长
						imagfile = new File("d:/icepdf_a" + i + ".jpg");
						ImageIO.write(images, "PNG", imagfile);
					}
					doc.close(); // 关闭文件,不然该pdf文件会一直被占用。
					MultipartFile newFile = FileUtil.getUtils()
							.fileToMultipartFile(imagfile);
					byte[] imgData1 = newFile.getBytes();
					String imgStr1 = Base64Util.encode(imgData1);
					String imgParam = URLEncoder.encode(imgStr1, "UTF-8");

					String param = "image=" + imgParam
							+ "&templateSign=mixed_receipt";

					result = HttpUtil.post(url, accessToken, param);
				} catch (IOException e) {
					e.printStackTrace();
				}

			} else if (fileType.endsWith(".jpg") || fileType.endsWith(".jpeg")
					|| fileType.endsWith("png") || fileType.endsWith(".bmp")) {// 图片格式
				imagfile = new File(filepath);
				MultipartFile newFile = FileUtil.getUtils()
						.fileToMultipartFile(imagfile);
				byte[] imgData1 = newFile.getBytes();
				String imgStr1 = Base64Util.encode(imgData1);
				String imgParam = URLEncoder.encode(imgStr1, "UTF-8");

				String param = "image=" + imgParam
						+ "&templateSign=mixed_receipt";

				result = HttpUtil.post(url, accessToken, param);
			}
		} catch (Exception e) {
			// TODO 自动生成的 catch 块
			e.printStackTrace();
		} finally {
			if (imagfile != null) {
				imagfile.delete();
			}
		}
	}

	private static String getAuth() throws Exception {
		// 官网获取的 API Key 更新为你注册的
		String clientId = "API Key";
		// 官网获取的 Secret Key 更新为你注册的
		String clientSecret = "Secret Key";
		return getAuth(clientId, clientSecret);
	}

	/**
	 * 获取API访问token 该token有一定的有效期，需要自行管理，当失效时需重新获取.
	 * 
	 * @param ak
	 *            - 百度云官网获取的 API Key
	 * @param sk
	 *            - 百度云官网获取的 Securet Key
	 * @return assess_token 示例：
	 *         "24.460da4889caad24cccdb1fea17221975.2592000.1491995545.282335-1234567"
	 * @throws Exception
	 */
	private static String getAuth(String ak, String sk) throws Exception {
		// 获取token地址
		String authHost = "https://aip.baidubce.com/oauth/2.0/token?";
		String getAccessTokenUrl = authHost
		// 1. grant_type为固定参数
				+ "grant_type=client_credentials"
				// 2. 官网获取的 API Key
				+ "&client_id=" + ak
				// 3. 官网获取的 Secret Key
				+ "&client_secret=" + sk;
		try {
			URL realUrl = new URL(getAccessTokenUrl);
			// 打开和URL之间的连接
			HttpURLConnection connection = (HttpURLConnection) realUrl
					.openConnection();
			connection.setRequestMethod("GET");
			connection.connect();
			// 获取所有响应头字段
			Map> map = connection.getHeaderFields();
			// 遍历所有的响应头字段
			for (String key : map.keySet()) {
				System.err.println(key + "--->" + map.get(key));
			}
			// 定义 BufferedReader输入流来读取URL的响应
			BufferedReader in = new BufferedReader(new InputStreamReader(
					connection.getInputStream()));
			String result = "";
			String line;
			while ((line = in.readLine()) != null) {
				result += line;
			}
			/**
			 * 返回结果示例
			 */
			System.err.println("result:" + result);
			org.json.JSONObject jsonObject = new org.json.JSONObject(result);
			String access_token = jsonObject.getString("access_token");
			return access_token;
		} catch (Exception e) {
			Logger.error("调用百度OCR获取token失败！" + e.getMessage(), e);
			throw new Exception("调用百度OCR获取token失败！" + e.getMessage(), e);
		}
	}
}

注：百度OCR文字识别接口，涉及将PDF文件转为图片；主类中使用到的工具类，都是百度提供的，如：Base64Util，FileUtil，HttpUtil，具体代码如下

FileUtil:

package com.baidu.ai.aip.utils;

import java.io.*;

import org.apache.commons.fileupload.FileItem;
import org.apache.commons.fileupload.FileItemFactory;
import org.apache.commons.fileupload.disk.DiskFileItemFactory;
import org.springframework.web.multipart.MultipartFile;
import org.springframework.web.multipart.commons.CommonsMultipartFile;

/**
 * 文件读取工具类
 */
public class FileUtil {

	static FileUtil utils;

	public static FileUtil getUtils() {
		if (utils == null) {
			utils = new FileUtil();
		}
		return utils;
	}

	public MultipartFile fileToMultipartFile(File file) {
		FileItem fileItem = createFileItem(file);
		MultipartFile multipartFile = new CommonsMultipartFile(fileItem);
		return multipartFile;
	}

	private static FileItem createFileItem(File file) {
		FileItemFactory factory = new DiskFileItemFactory(16, null);
		FileItem item = factory.createItem("textField", "text/plain", true,
				file.getName());
		int bytesRead = 0;
		byte[] buffer = new byte[8192];
		try {
			FileInputStream fis = new FileInputStream(file);
			OutputStream os = item.getOutputStream();
			while ((bytesRead = fis.read(buffer, 0, 8192)) != -1) {
				os.write(buffer, 0, bytesRead);
			}
			os.close();
			fis.close();
		} catch (IOException e) {
			e.printStackTrace();
		}
		return item;
	}

	/**
	 * 读取文件内容，作为字符串返回
	 */
	public static String readFileAsString(String filePath) throws IOException {
		File file = new File(filePath);
		if (!file.exists()) {
			throw new FileNotFoundException(filePath);
		}

		if (file.length() > 1024 * 1024 * 1024) {
			throw new IOException("File is too large");
		}

		StringBuilder sb = new StringBuilder((int) (file.length()));
		// 创建字节输入流
		FileInputStream fis = new FileInputStream(filePath);
		// 创建一个长度为10240的Buffer
		byte[] bbuf = new byte[10240];
		// 用于保存实际读取的字节数
		int hasRead = 0;
		while ((hasRead = fis.read(bbuf)) > 0) {
			sb.append(new String(bbuf, 0, hasRead));
		}
		fis.close();
		return sb.toString();
	}

	/**
	 * 根据文件路径读取byte[] 数组
	 */
	public static byte[] readFileByBytes(String filePath) throws IOException {
		File file = new File(filePath);
		if (!file.exists()) {
			throw new FileNotFoundException(filePath);
		} else {
			ByteArrayOutputStream bos = new ByteArrayOutputStream(
					(int) file.length());
			BufferedInputStream in = null;

			try {
				in = new BufferedInputStream(new FileInputStream(file));
				short bufSize = 1024;
				byte[] buffer = new byte[bufSize];
				int len1;
				while (-1 != (len1 = in.read(buffer, 0, bufSize))) {
					bos.write(buffer, 0, len1);
				}

				byte[] var7 = bos.toByteArray();
				return var7;
			} finally {
				try {
					if (in != null) {
						in.close();
					}
				} catch (IOException var14) {
					var14.printStackTrace();
				}

				bos.close();
			}
		}
	}
}

Base65Util:

package com.baidu.ai.aip.utils;

/**
 * Base64 工具类
 */
public class Base64Util {
    private static final char last2byte = (char) Integer.parseInt("00000011", 2);
    private static final char last4byte = (char) Integer.parseInt("00001111", 2);
    private static final char last6byte = (char) Integer.parseInt("00111111", 2);
    private static final char lead6byte = (char) Integer.parseInt("11111100", 2);
    private static final char lead4byte = (char) Integer.parseInt("11110000", 2);
    private static final char lead2byte = (char) Integer.parseInt("11000000", 2);
    private static final char[] encodeTable = new char[]{'A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I', 'J', 'K', 'L', 'M', 'N', 'O', 'P', 'Q', 'R', 'S', 'T', 'U', 'V', 'W', 'X', 'Y', 'Z', 'a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'j', 'k', 'l', 'm', 'n', 'o', 'p', 'q', 'r', 's', 't', 'u', 'v', 'w', 'x', 'y', 'z', '0', '1', '2', '3', '4', '5', '6', '7', '8', '9', '+', '/'};

    public Base64Util() {
    }

    public static String encode(byte[] from) {
        StringBuilder to = new StringBuilder((int) ((double) from.length * 1.34D) + 3);
        int num = 0;
        char currentByte = 0;

        int i;
        for (i = 0; i < from.length; ++i) {
            for (num %= 8; num < 8; num += 6) {
                switch (num) {
                    case 0:
                        currentByte = (char) (from[i] & lead6byte);
                        currentByte = (char) (currentByte >>> 2);
                    case 1:
                    case 3:
                    case 5:
                    default:
                        break;
                    case 2:
                        currentByte = (char) (from[i] & last6byte);
                        break;
                    case 4:
                        currentByte = (char) (from[i] & last4byte);
                        currentByte = (char) (currentByte << 2);
                        if (i + 1 < from.length) {
                            currentByte = (char) (currentByte | (from[i + 1] & lead2byte) >>> 6);
                        }
                        break;
                    case 6:
                        currentByte = (char) (from[i] & last2byte);
                        currentByte = (char) (currentByte << 4);
                        if (i + 1 < from.length) {
                            currentByte = (char) (currentByte | (from[i + 1] & lead4byte) >>> 4);
                        }
                }

                to.append(encodeTable[currentByte]);
            }
        }

        if (to.length() % 4 != 0) {
            for (i = 4 - to.length() % 4; i > 0; --i) {
                to.append("=");
            }
        }

        return to.toString();
    }
}

HttpUtil:

package com.baidu.ai.aip.utils;

import java.io.BufferedReader;
import java.io.DataOutputStream;
import java.io.InputStreamReader;
import java.net.HttpURLConnection;
import java.net.URL;
import java.util.List;
import java.util.Map;

/**
 * http 工具类
 */
public class HttpUtil {

    public static String post(String requestUrl, String accessToken, String params)
            throws Exception {
        String contentType = "application/x-www-form-urlencoded";
        return HttpUtil.post(requestUrl, accessToken, contentType, params);
    }

    public static String post(String requestUrl, String accessToken, String contentType, String params)
            throws Exception {
        String encoding = "UTF-8";
        if (requestUrl.contains("nlp")) {
            encoding = "GBK";
        }
        return HttpUtil.post(requestUrl, accessToken, contentType, params, encoding);
    }

    public static String post(String requestUrl, String accessToken, String contentType, String params, String encoding)
            throws Exception {
        String url = requestUrl + "?access_token=" + accessToken;
        return HttpUtil.postGeneralUrl(url, contentType, params, encoding);
    }

    public static String postGeneralUrl(String generalUrl, String contentType, String params, String encoding)
            throws Exception {
        URL url = new URL(generalUrl);
        // 打开和URL之间的连接
        HttpURLConnection connection = (HttpURLConnection) url.openConnection();
        connection.setRequestMethod("POST");
        // 设置通用的请求属性
        connection.setRequestProperty("Content-Type", contentType);
        connection.setRequestProperty("Connection", "Keep-Alive");
        connection.setUseCaches(false);
        connection.setDoOutput(true);
        connection.setDoInput(true);

        // 得到请求的输出流对象
        DataOutputStream out = new DataOutputStream(connection.getOutputStream());
        out.write(params.getBytes(encoding));
        out.flush();
        out.close();

        // 建立实际的连接
        connection.connect();
        // 获取所有响应头字段
        Map> headers = connection.getHeaderFields();
        // 遍历所有的响应头字段
        for (String key : headers.keySet()) {
            System.err.println(key + "--->" + headers.get(key));
        }
        // 定义 BufferedReader输入流来读取URL的响应
        BufferedReader in = null;
        in = new BufferedReader(
                new InputStreamReader(connection.getInputStream(), encoding));
        String result = "";
        String getLine;
        while ((getLine = in.readLine()) != null) {
            result += getLine;
        }
        in.close();
        System.err.println("result:" + result);
        return result;
    }
}

Excel处理控件Aspose.Cells教程：Java 在 Excel 中插入和删除行和列
Aspose.Cells是Excel电子表格编程API，可加快电子表格的管理和处理任务，支持构建能够生成，修改，转换，呈现和打印电子表格的跨平台应用程序。同时不依赖于MicrosoftExcel或任何MicrosoftOfficeInterop组件，AsposeAPI支持旗下产品覆盖文档、图表、PDF、条码、OCR、CAD、HTML、电子邮件等各个文档管理领域，为全球.NET、Java、C++等1
C# WPF自定义窗口 XMJ2002 wpf
C#WPF自定义窗口书接上文，我们已经实现了如何利用百度智能云实现文字OCR功能，WPF制作文字OCR软件(一)：本地图片OCR识别，最后整体的效果是要呈现在一个窗口上的，而WPF的默认窗口并不能符合我们的需求，能够自己定义的内容少，所以这篇文章将介绍如何自定义窗口。整体实现效果如下：一、自定义标题栏首先需要在窗口定义的时候加上WindowStyle="None"AllowsTransparenc
[SQLSERVER][SQL]监控SQlserver存储过程 awonw sqlserver sqlserver sql 数据库
USE[master]GO/******Object:StoredProcedure[dbo].[sp_who_run_plus]ScriptDate:2021-09-1016:51:26******/SETANSI_NULLSONGOSETQUOTED_IDENTIFIERONGOCREATEPROC[dbo].[sp_who_run_plus]ASBEGINSELECTDB_NAME(er.[
Python+dddocr自动化突破多缺口滑块验证技术详解
Python+dddocr自动化突破多缺口滑块验证技术详解在当今互联网环境中，滑块验证已成为阻挡自动化程序的主要防线之一。本文将通过Python+dddocr实现一套完整的自动化解决方案，突破多缺口滑块验证，内容涵盖技术原理、实现细节和实战技巧。一、多缺口滑块验证的技术原理多缺口滑块验证是传统滑块验证的升级版，通过设置多个干扰项增加识别难度：验证机制图像生成验证逻辑背景图缺口碎片缺口匹配行为分析添
python代码判断两棵二叉树是否相同 Data+Science+Insight 数据结构 leetcode 算法 python 二叉树
python代码判断两棵二叉树是否相同给定两个二叉树，编写一个函数来校验它们是否相同。如果两个树在结构上相同，并且结点具有相同的值，则认为它们是相同的。判断两个二叉树是否是相同的，相同的依据是二叉树结构相同二叉树对应节点值相同#二叉树基础类#ABinaryTreenodeclassNode:#Utilitytocreatenewnodedef__init__(self,val):self.val=
OpenVINO™2025部署PaddleOCR模型 OpenVINO 中文社区经验分享
PaddleOCR模型下载OpenVINO™2025支持直接加载paddle的模型。所以可以直接先从官网直接下载PaddleOCRv5.0的模型：文本检测模型下载地址#DownloadandunzipPP-OCRv5_server_detpre-trainedmodelhttps://paddle-model-ecology.bj.bcebos.com/paddlex/official_infer
内存泄漏系列专题分析之二十二：句柄/文件描述符fd泄漏实例分析一起搞IT吧内存泄漏和内存占用拆解系列专题相机图像处理 android
【关注我，后续持续新增专题博文，谢谢！！！】上一篇我们讲了：这一篇我们开始讲：内存泄漏系列专题分析之二十二：句柄/文件描述符fd泄漏实例分析目录一、背景二、：句柄fd文件描述符内存泄漏分析思路2.1：闭源库libcvp2.socrash分析Camxhal异常日志2.2：内存分配失败，接着看kernelKMD日志2.3：crash的根因是拿不到fd2.4：分析getfdfail2.5：重新复现并分析
基于 opencv+yolov8+easyocr的车牌追踪识别（ECUT）Edward-tan 人工智能--CV python进阶全栈开发 opencv yolov8 ocr python
（本项目所有代码打包至我的资源中，大家可在我的文章底部选择下载）目录需求实现效果学习视频大致思路代码实现资源下载需求通过车辆识别技术，识别视频中每个车辆及其车牌号，车辆应进行追踪，避免重复计数量。实现效果车牌识别学习视频使用Python、Yolov8和EasyOCR自动识别车牌计算机视觉教程_哔哩哔哩_bilibili大致思路通过opencv将视频转换为帧，对帧应用车辆识别模型，并使用model.
RapidOCR4j项目学习 cmdch2017 学习
https://rapidai.github.io/RapidOCRDocs/install_usage/api/RapidOCR/#_1功能实现多平台OCR识别：支持Windows、Linux、macOS（包括Intel和ARM架构）多种图片输入方式：支持图片路径（Path）、BufferedImage、byte[]、OpenCV的Mat四种输入类型模型推理：通过ONNXRuntime加载和推理
Openssl生成RSA证书，Java实现公钥证书加密，私钥证书解密 RonTech Java 算法 Security RSA 证书加密公钥加密私钥解密 API数据加密
1、证书生成过程生成RSA私钥：genrsa-outprivate_key.pem1024把RSA私钥转换成PKCS8格式pkcs8-topk8-informPEM-inprivate_key.pem-outformPEM–nocrypt生成RSA公钥rsa-inprivate_key.pem-pubout-outrsa_public_key.pem生成供Java使用的私钥pkcs8_privat
Python处理滑块缺口验证码以及字母数字验证码识别
该功能主要运用到的模块有：re、cv2、ddddocr、matplotlib等字母数字识别该识别可以直接下载第三方工具包ddddocr进行处理使用Python的包管理工具来安装ddddocr及其所需的依赖库pipinstallddddocr具体实现，分别处理保存在本地的图片已经base64格式的图片importddddocr#识别本地图片defalphanumericProcessing(img_
PaddleOCR + Flask 构建 Web OCR 服务实战随风九天服务 flask 前端 ocr PaddleOCR
1、前言随着图像识别技术的发展，OCR（光学字符识别）已经成为很多应用场景中的基础能力。PaddleOCR是百度开源的一个高性能OCR工具库，支持中英文、多语言、轻量级部署等特性。而Flask是一个轻量级的PythonWeb框架，非常适合快速构建RESTfulAPI或小型Web应用。本文将带你一步步使用PaddleOCR+Flask搭建一个完整的WebOCR服务，实现图片上传→文字识别→返回结构化
Python OCR库：自动化测试验证码识别神器！测试界霄霄软件测试 python ocr 开发语言功能测试软件测试自动化测试职场和发展
↵在接口自动化工作中，经常需要处理文字识别的任务，而OCR（OpticalCharacterRecognition，光学字符识别）库能够帮助我们将图像中的文字提取出来。Python中有几个常用的OCR库，包括pyocr、pytesseract和python-tesseract、EasyOCR。本文将对它们进行比较，并提供一些示例代码来演示它们在实际接口自动化工作中的应用。1、pyocrPyOCR是
【Python】超实用的ddddocr库-一个基于深度学习的OCR（光学字符识别）工具库穿山甲yyds ocr
一、Ddddocr简介ddddocr（DeepDouble-DigitalDigitsOCR）是一个基于深度学习的OCR（OpticalCharacterRecognition，光学字符识别）库，用于从图像中提取文本，尤其擅长处理验证码、票据、表单数据提取、文档自动化处理等场景。主要用户已下三种：自动化测试：自动填写网页验证码，提升测试效率。数据采集：从截图或文档中提取结构化文本。安全验证：辅助处
Termux：Android 上的本地开发环境和终端模拟器林泽炯
Termux：Android上的本地开发环境和终端模拟器termux-create-packagePythonscripttocreateTermuxpackageseasily.项目地址:https://gitcode.com/gh_mirrors/te/termux-create-package扩展，它提供了额外的功能，如自动启动服务、发送广播接收器等。技术分析Termux基于Android的
Python文字识别自动化处理库之pytesseract使用详解
概要在当今数字化时代，文字识别技术扮演着越来越重要的角色。Pythonpytesseract库是一个强大的工具，能够帮助开发者轻松实现图像中文字的识别。本文将深入探讨pytesseract库的原理、功能、使用方法以及实际应用场景，并提供丰富的示例代码，让读者更全面地了解这个工具库。什么是Pythonpytesseract库？Pythonpytesseract库是TesseractOCR引擎的Pyt
Predic‘ng Early-Onset Colorectal Cancer with Large Language Models UnknownBody LLM Daily 语言模型人工智能自然语言处理
文章主要内容总结研究背景与目的：早发性结直肠癌（EoCRC，年龄<45岁）发病率逐年上升，但现有筛查指南推荐年龄为45岁，导致年轻患者确诊时多为晚期。研究旨在利用电子健康记录（EHR）数据，通过机器学习（ML）和大型语言模型（LLM）预测EoCRC，以实现早期干预。数据与方法：回顾性分析美国多个医疗系统的1,953例CRC患者，收集确诊前6个月的患者状况、实验室结果和观察数据。对比10种ML模型（
百度飞桨（PaddlePaddle）案例分享：基于 PaddleOCR 的图像文字提取系统 univerbright 百度 paddlepaddle 人工智能 paddleocr 图像文字提取
一、案例背景在实际教学、办公及政务系统中，纸质材料（如手写作文、表格、试卷等）仍广泛存在。为提升信息处理效率，采用OCR（OpticalCharacterRecognition）技术将图像中的文字提取为可编辑文本已成为刚需。本项目基于开源深度学习库PaddleOCR，构建了一个轻量级的图像文字识别工具，能够自动识别图像中的中文文本，并提供置信度评估和可视化支持。该工具特别适用于作业扫描图像中的内容
使用 C++/OpenCV 构建中文 OCR 系统：实现账单、发票及 PDF 读取
使用C++/OpenCV构建中文OCR系统：实现账单、发票及PDF读取在当今数字化浪潮中，自动从文档中提取信息至关重要，尤其是在处理大量账单、发票和PDF文件时。光学字符识别（OCR）技术是实现这一目标的核心。本文将详细介绍如何利用C++和强大的计算机视觉库OpenCV，构建一个专门用于读取中文账单、发票和PDF的OCR系统。核心技术栈我们的系统将主要围绕以下核心技术构建：C++:作为主要的编程语
各有优势！Neocrm销售易与纷享销客产品对比新讯网大数据
Neocrm销售易与纷享销客是国产CRM领域的头部厂商，以下是它们的产品对比：技术架构Neocrm销售易：基于Salesforce先进的元数据架构深度改造，充分继承了全球领先CRM的技术精髓，确保系统稳定性和可扩展性。与腾讯云深度合作，享受腾讯云强大的基础设施支持和安全保障。企业微信集成紧密，为企业提供一体化办公体验。专注核心业务场景优化，确保关键功能的高性能表现。Java高代码开发平台专业性强，
下载链接记录 chde2Wang 我
下载歌曲：https://www.gequbao.com/music/79500pdf转word：下载文件|iLovePDF识别文字：CatOCR:易飞文字识别,免费在线图片转文字
SubtitleOCR：高速硬字幕提取工具俞毓滢
SubtitleOCR：高速硬字幕提取工具SubtitleOCR快如闪电的硬字幕提取工具。仅需苹果M1芯片或英伟达3060显卡即可达到10倍速提取。Averyfasttoolforvideohardcodesubtitleextraction项目地址:https://gitcode.com/gh_mirrors/su/SubtitleOCR项目介绍在数字化时代，视频内容处理的需求日益增长，尤其是字
paddleocr 和 pytesseract 使用记录 tnan2522 python 基础高级其他 python
paddleocr和pytesseract都是常见的ocr模块，不同的是，paddleocr是百度开源的一个ocr识别库，pytesseract基于TesseractOCR引擎封装的pythonocr库，在基础使用过程中，发现paddleocr比pytesseract要慢，而且内存占用更大，在识别中会持续缓存内存，直到占用到某个大小后，后续识别的图片才不会占用内存paddleocrimportco
InputStream重复读取导致文件损坏问题解决方案
问题描述具体场景在文档分割处理中，当同时开启OCR识别和资源提取时出现图片无法正常访问的问题。问题现象上传状态：显示成功，返回文件地址✅OCR功能：文字识别正常✅图片访问：文件链接无法打开，图片损坏❌单独功能：仅开启OCR或仅开启上传都正常✅根本原因文件流被重复读取，导致上传的是空文件或不完整文件技术原理深入分析InputStream的单向消费特性InputStreamstream=fileInf
pp-ocrv5中的改进-跨阶段特征融合（CSP-PAN）以及在 Neck 部分引入 CSP-PAN后为何就能解决小文本漏检问题？
好的，我们来详细解析一下PP-OCRv5中的**跨阶段特征融合（CSP-PAN）**改进，以及它如何有效解决小文本漏检问题。背景：PP-OCR的Neck部分与PAN在PP-OCRv3及之前的版本中，Neck部分使用的是标准的**PAN（PathAggregationNetwork）**结构。PAN是目标检测中用于融合不同尺度特征图的主流方法之一，其核心思想是：自顶向下（Top-down）：将深层（
OCCT基础类库介绍：Modeling Algorithm - Boolean Operations 安意诚Matrix OCCT 3d 学习开源
BooleanOperationsBooleanoperationsareusedtocreatenewshapesfromthecombinationsoftwogroupsofshapes.OperationResultFuseAllpointsinS1orS2CommonAllpointsinS1andS2CutS1byS2AllpointsinS1andnotinS2布尔运算布尔运算用于通
Python中如何使用pytesseract和PIL库? 让你五行代码 Python大数据 python 人工智能开发语言
Tesseraet是一个命令行工具，安装后只能通过tsseraet命令在Python的外部运行，而不能通过import语句引人使用。为了解决上述问题，Python提供了支持Tssraec-OCR引擎的Python版本的库pytesseract。安装pytesseract需要遵守如下要求：(1)Python的版本必须是python2.5+或python3.x。(2)安装Python的图像处理库PIL
Python 验证码识别(使用pytesseract库) 深海蓝山的博客 Python python pytesseract Tesseract 验证码识别
文章目录摘要1、安装Tesseract-OCR2、在python中使用安装依赖3、本地图片识别4、结合playwright动态识别网站验证码摘要 python中使用pytesseract库进行ocr识别，需要安装Tesseract-OCR，通过指定pytesseract.tesseract_cmd路径，可以将esseract-OCR集成到pytho程序中，避免客户端电脑的依赖。1、安装Tesse
C++/OpenCV 图像预处理与 PaddleOCR 结合进行高效字符识别 whoarethenext c++opencv 开发语言
C++/OpenCV图像预处理与PaddleOCR结合进行高效字符识别在许多实际应用场景中，直接从原始图片中提取文字的准确率可能不尽人意。图像中的噪声、光照不均、角度倾斜等问题都会严重干扰OCR(OpticalCharacterRecognition)引擎的识别效果。本文将详细介绍如何利用C++和强大的计算机视觉库OpenCV对图像进行预处理，然后将处理后的图像送入PaddleOCR的C++预测库
RAGFlow是一个基于深度文档理解的开源RAG引擎 lyh1344 深度优先
RAGFlow概述RAGFlow是一款基于深度文档理解的开源RAG（检索增强生成）引擎，专注于处理复杂文档结构并提供精准的语义检索与生成能力。其核心优势在于结合多模态文档解析和智能分段技术，优化传统RAG流程中的信息提取与答案生成效果。核心特性深度文档理解支持PDF、PPT、Word、Excel等格式的解析，通过OCR、表格识别、布局分析等技术提取文本、图表及结构化数据，解决传统RAG中非文本内容
LeetCode[位运算] - #137 Single Number II Cwind java Algorithm LeetCode 题解位运算
原题链接：#137 Single Number II 要求：给定一个整型数组，其中除了一个元素之外，每个元素都出现三次。找出这个元素注意：算法的时间复杂度应为O(n)，最好不使用额外的内存空间难度：中等分析：与#136类似，都是考察位运算。不过出现两次的可以使用异或运算的特性 n XOR n = 0, n XOR 0 = n，即某一
《JavaScript语言精粹》笔记 aijuans JavaScript
0、JavaScript的简单数据类型包括数字、字符创、布尔值（true/false）、null和undefined值，其它值都是对象。 1、JavaScript只有一个数字类型，它在内部被表示为64位的浮点数。没有分离出整数，所以1和1.0的值相同。 2、NaN是一个数值，表示一个不能产生正常结果的运算结果。NaN不等于任何值，包括它本身。可以用函数isNaN(number)检测NaN,但是
你应该更新的Java知识之常用程序库 Kai_Ge java
在很多人眼中，Java 已经是一门垂垂老矣的语言，但并不妨碍 Java 世界依然在前进。如果你曾离开 Java，云游于其它世界，或是每日只在遗留代码中挣扎，或许是时候抬起头，看看老 Java 中的新东西。 Guava Guava[gwɑ:və]，一句话，只要你做Java项目，就应该用Guava（Github）。 guava 是 Google 出品的一套 Java 核心库，在我看来，它甚至应该
HttpClient 120153216 httpclient
/** * 可以传对象的请求转发，对象已流形式放入HTTP中 */ public static Object doPost(Map<String,Object> parmMap,String url) { Object object = null; HttpClient hc = new HttpClient(); String fullURL
Django model字段类型清单 2002wmj django
Django 通过 models 实现数据库的创建、修改、删除等操作，本文为模型中一般常用的类型的清单，便于查询和使用： AutoField：一个自动递增的整型字段，添加记录时它会自动增长。你通常不需要直接使用这个字段；如果你不指定主键的话，系统会自动添加一个主键字段到你的model。(参阅自动主键字段) BooleanField：布尔字段,管理工具里会自动将其描述为checkbox。 Cha
在SQLSERVER中查找消耗CPU最多的SQL 357029540 SQL Server
返回消耗CPU数目最多的10条语句 SELECT TOP 10 total_worker_time/execution_count AS avg_cpu_cost, plan_handle, execution_count, (SELECT SUBSTRING(text, statement_start_of
Myeclipse项目无法部署，Undefined exploded archive location 7454103 eclipse MyEclipse
做个备忘！错误信息为： Undefined exploded archive location 原因：在工程转移过程中，导致工程的配置文件出错；解决方法：
GMT时间格式转换 adminjun GMT 时间转换
普通的时间转换问题我这里就不再罗嗦了，我想大家应该都会那种低级的转换问题吧，现在我向大家总结一下如何转换GMT时间格式，这种格式的转换方法网上还不是很多，所以有必要总结一下，也算给有需要的朋友一个小小的帮助啦。 1、可以使用 SimpleDateFormat SimpleDateFormat EEE-三位星期 d-天 MMM-月 yyyy-四位年
Oracle数据库新装连接串问题 aijuans oracle数据库
割接新装了数据库，客户端登陆无问题，apache/cgi-bin程序有问题，sqlnet.log日志如下： Fatal NI connect error 12170. VERSION INFORMATION: TNS for Linux: Version 10.2.0.4.0 - Product
回顾java数组复制 ayaoxinchao java 数组
在写这篇文章之前，也看了一些别人写的，基本上都是大同小异。文章是对java数组复制基础知识的回顾，算是作为学习笔记，供以后自己翻阅。首先，简单想一下这个问题：为什么要复制数组？我的个人理解：在我们在利用一个数组时，在每一次使用，我们都希望它的值是初始值。这时我们就要对数组进行复制，以达到原始数组值的安全性。java数组复制大致分为3种方式：①for循环方式 ②clone方式 ③arrayCopy方
java web会话监听并使用spring注入 bewithme Java Web
在java web应用中，当你想在建立会话或移除会话时，让系统做某些事情，比如说，统计在线用户，每当有用户登录时，或退出时，那么可以用下面这个监听器来监听。 import java.util.ArrayList; import java.ut
NoSQL数据库之Redis数据库管理(Redis的常用命令及高级应用) bijian1013 redis 数据库 NoSQL
一 .Redis常用命令 Redis提供了丰富的命令对数据库和各种数据库类型进行操作，这些命令可以在Linux终端使用。 a.键值相关命令 b.服务器相关命令 1.键值相关命令 &
java枚举序列化问题 bingyingao java 枚举序列化
对象在网络中传输离不开序列化和反序列化。而如果序列化的对象中有枚举值就要特别注意一些发布兼容问题: 1.加一个枚举值新机器代码读分布式缓存中老对象，没有问题，不会抛异常。老机器代码读分布式缓存中新对像，反序列化会中断，所以在所有机器发布完成之前要避免出现新对象，或者提前让老机器拥有新增枚举的jar。 2.删一个枚举值新机器代码读分布式缓存中老对象，反序列
【Spark七十八】Spark Kyro序列化 bit1129 spark
当使用SparkContext的saveAsObjectFile方法将对象序列化到文件，以及通过objectFile方法将对象从文件反序列出来的时候，Spark默认使用Java的序列化以及反序列化机制，通常情况下，这种序列化机制是很低效的，Spark支持使用Kyro作为对象的序列化和反序列化机制，序列化的速度比java更快，但是使用Kyro时要注意，Kyro目前还是有些bug。 Spark
Hybridizing OO and Functional Design bookjovi erlang haskell
推荐博文： Tell Above, and Ask Below - Hybridizing OO and Functional Design 文章中把OO和FP讲的深入透彻，里面把smalltalk和haskell作为典型的两种编程范式代表语言，此点本人极为同意，smalltalk可以说是最能体现OO设计的面向对象语言，smalltalk的作者Alan kay也是OO的最早先驱，
Java-Collections Framework学习与总结-HashMap BrokenDreams Collections
开发中常常会用到这样一种数据结构，根据一个关键字，找到所需的信息。这个过程有点像查字典，拿到一个key，去字典表中查找对应的value。Java1.0版本提供了这样的类java.util.Dictionary(抽象类)，基本上支持字典表的操作。后来引入了Map接口，更好的描述的这种数据结构。 &nb
读《研磨设计模式》-代码笔记-职责链模式-Chain Of Responsibility bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * 业务逻辑：项目经理只能处理500以下的费用申请，部门经理是1000，总经理不设限。简单起见，只同意“Tom”的申请 * bylijinnan */ abstract class Handler { /*
Android中启动外部程序 cherishLC android
1、启动外部程序引用自： http://blog.csdn.net/linxcool/article/details/7692374 //方法一 Intent intent=new Intent(); //包名包名+类名（全路径） intent.setClassName("com.linxcool", "com.linxcool.PlaneActi
summary_keep_rate coollyj SUM
BEGIN /*DECLARE minDate varchar(20) ; DECLARE maxDate varchar(20) ;*/ DECLARE stkDate varchar(20) ; DECLARE done int default -1; /* 游标中注册服务器地址 */ DE
hadoop hdfs 添加数据目录出错 daizj hadoop hdfs 扩容
由于原来配置的hadoop data目录快要用满了，故准备修改配置文件增加数据目录，以便扩容，但由于疏忽，把core-site.xml, hdfs-site.xml配置文件dfs.datanode.data.dir 配置项增加了配置目录，但未创建实际目录，重启datanode服务时，报如下错误： 2014-11-18 08:51:39,128 WARN org.apache.hadoop.h
grep 目录级联查找 dongwei_6688 grep
在Mac或者Linux下使用grep进行文件内容查找时，如果给定的目标搜索路径是当前目录，那么它默认只搜索当前目录下的文件，而不会搜索其下面子目录中的文件内容，如果想级联搜索下级目录，需要使用一个“-r”参数： grep -n -r "GET" . 上面的命令将会找出当前目录“.”及当前目录中所有下级目录
yii 修改模块使用的布局文件 dcj3sjt126com yii layouts
方法一：yii模块默认使用系统当前的主题布局文件，如果在主配置文件中配置了主题比如: 'theme'=>'mythm', 那么yii的模块就使用 protected/themes/mythm/views/layouts 下的布局文件；如果未配置主题，那么 yii的模块就使用 protected/views/layouts 下的布局文件，总之默认不是使用自身目录 pr
设计模式之单例模式 come_for_dream 设计模式单例模式懒汉式饿汉式双重检验锁失败无序写入
今天该来的面试还没来，这个店估计不会来电话了，安静下来写写博客也不错，没事翻了翻小易哥的博客甚至与大牛们之间的差距，基础知识不扎实建起来的楼再高也只能是危楼罢了，陈下心回归基础把以前学过的东西总结一下。 *********************************
8、数组豆豆咖啡二维数组数组一维数组
一、概念数组是同一种类型数据的集合。其实数组就是一个容器。二、好处可以自动给数组中的元素从0开始编号，方便操作这些元素三、格式 //一维数组 1,元素类型[] 变量名 = new 元素类型[元素的个数] int[] arr =
Decode Ways hcx2013 decode
A message containing letters from A-Z is being encoded to numbers using the following mapping: 'A' -> 1 'B' -> 2 ... 'Z' -> 26 Given an encoded message containing digits, det
Spring4.1新特性——异步调度和事件机制的异常处理 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
squid3(高命中率)缓存服务器配置 liyonghui160com
系统:centos 5.x 需要的软件:squid-3.0.STABLE25.tar.gz 1.下载squid wget http://www.squid-cache.org/Versions/v3/3.0/squid-3.0.STABLE25.tar.gz tar zxf squid-3.0.STABLE25.tar.gz &&
避免Java应用中NullPointerException的技巧和最佳实践 pda158 java
1) 从已知的String对象中调用equals()和equalsIgnoreCase()方法，而非未知对象。　　总是从已知的非空String对象中调用equals()方法。因为equals()方法是对称的，调用a.equals(b)和调用b.equals(a)是完全相同的，这也是为什么程序员对于对象a和b这么不上心。如果调用者是空指针，这种调用可能导致一个空指针异常 Object unk
如何在Swift语言中创建http请求 shoothao http swift
概述：本文通过实例从同步和异步两种方式上回答了”如何在Swift语言中创建http请求“的问题。如果你对Objective-C比较了解的话，对于如何创建http请求你一定驾轻就熟了，而新语言Swift与其相比只有语法上的区别。但是，对才接触到这个崭新平台的初学者来说，他们仍然想知道“如何在Swift语言中创建http请求？”。在这里,我将作出一些建议来回答上述问题。常见的
Spring事务的传播方式 uule spring事务
传播方式：新建事务 required required_new - 挂起当前非事务方式运行 supports &nbs

百度OCR文字识别接口对接

注：百度OCR文字识别接口，涉及将PDF文件转为图片；主类中使用到的工具类，都是百度提供的，如：Base64Util，FileUtil，HttpUtil，具体代码如下

FileUtil:

Base65Util:

HttpUtil:

你可能感兴趣的:(ocr)