AIBOOM

如何用百度大脑文字识别技术，快速集成实用小工具

一、总体概述

本文主要介绍了由本人开发的、基于百度AI的云猫OCR软件的主要功能，性能评价及核心代码解读。因为是几个帖子合并成一个，所以篇幅较长，希望各位能耐心看完，当然也可以各取所需。

本文主要分为以下几个部分：
第一部分是云猫OCR软件介绍。由开发者本人亲自介绍软件的主要功能。对标ABBYY等OCR软件，云猫OCR的功能更全面，使用更简单，关键的是云猫OCR目前是完全免费给大家用的。当然因为是试用版，可能存在一些bug，大家使用的时候不要乱按就行。云猫展示版本的下载地址见帖子： https://ai.baidu.com/forum/topic/show/955975
第二部分是云猫OCR基于百度OCR的具体实现方式说明。同时也会对软件的部分核心代码进行展示，便于大家进行参考做出更有创意的产品。
第三部分是云猫OCR使用说明及效果评测。但因为云猫OCR是2017年底左右开发的，所以用的不是百度OCR最新接口功能，如果云猫能得到大家的支持，我可以考虑开发新版接入更多百度最新的AI接口，希望大家能多多捧场。
本文的最后部分是附录，附上了我基于百度OCR进行开发的代码解读，使用的是最新的百度手写体识别接口，也一并打包给大家参考。

第一部分云猫OCR的软件介绍

一、云猫OCR简介

云猫OCR是基于百度云OCR算法，由进击的狐狸进行开发的一款软件。本软件由C#语言进行开发，运行在Windows平台上。主要调用的接口是通用文字识别、通用文字识别（高精度）和表格识别等。

二、云猫OCR目前实现的主要功能：

1.批量图片文字识别，可以预览图片，可以对识别结果进行自动换行和缩进，可以控制QPS并发（QPS功能因为百度云的timeout问题而暂时搁置）；

2.批量表格图片识别，支持自动打开识别结果，用户也可以选择直接打开保存目录；

3.PDF转图片，在我的笔记本（配置为I7处理器/8G内存/128G SSD硬盘）的硬件环境下，PDF转图片程序模块占用的内存不超过400M，同时可以在2分钟左右的时间内转换超过500页内容的PDF文件。支持一键打开转换结果文件夹。

4.云猫软件支持换肤功能，目前有两套皮肤；

5.可以设置API Key和Secret Key；

6.支持中途停止识别；

7.支持把设置改变后对同一张图片进行重新识别；

8.支持多种语言；

9.其他功能，比如识别统计信息、控制字体大小、右键把识别结果另存为rtf文件、全选和复制识别结果等等；

三、演示帖子链接

http://ai.baidu.com/forum/topic/show/492371

四、云猫OCR演示视频链接

https://v.qq.com/x/page/r0564n4a87e.html

建议大家用1.2x或者1.5x倍速观看，因为本人的声速有点慢。

第二部分云猫OCR基于百度OCR的具体实现方式说明

一、概述

云猫OCR是基于百度AI，在Windows平台运行的一款软件。我是用C#语言在Visual Studio2017集成开发环境中进行开发的，开发方式是SDK包开发。在开发中，我们需要参考百度的技术文档。

百度云文字识别技术文档地址：

https://cloud.baidu.com/doc/OCR/index.html

二、准备工作

首先，我们需要下载最新的百度文字识别的SDK包。

C# SDK包的下载地址如下：

http://ai.baidu.com/sdk#ocr

下载完毕后解压缩，最新的包在文件夹net45里面。

打开Visual Studio2017开发环境，选择新建项目，因为我打算用控制台项目讲解，因此要选择新建项目——C#控制台项目。建好项目之后，需要在项目中引用上面下载的SDK包。

三、核心代码讲解

（一）调用百度OCR函数识别图片文字，返回的格式为Json

代码如下：

using System;

using Newtonsoft.Json;

using Newtonsoft.Json.Linq;

using System.IO;

using System.Drawing;

using System.Collections.Generic;

using System.Linq;

namespace myOCRDemo

{

class Program

{

public static void GeneralBasicDemo()

{

// 设置APPID/AK/SK

var API_KEY = "你的 Api Key";

var SECRET_KEY = "你的 Secret Key";

//创建对象

var client = new Baidu.Aip.Ocr.Ocr(API_KEY, SECRET_KEY);

client.Timeout = 60000; // 修改超时时间

var image = File.ReadAllBytes("图片文件路径");

// 调用通用文字识别, 图片参数为本地图片，可能会抛出网络等异常，请使用try/catch捕获

var result = client.GeneralBasic(image);

Console.WriteLine(result);

}

static void Main(string[] args)

{

GeneralBasicDemo();

Console.Read();

}

注意，具体开发的时候要把上面的API Key和Secret Key分别改为你自己的，至于怎么申请和查看这两个Key，可以参考我写的评测篇帖子。帖子链接如下：

http://ai.baidu.com/forum/topic/show/955989

另外不要忘了把图片文件路径改为你自己的图片路径。下面是识别的结果示例：

原图如下：

（二）解析Json格式，把识别结果转变为更为直观的文本类型

代码如下：

using System;

using Newtonsoft.Json;

using Newtonsoft.Json.Linq;

using System.IO;

using System.Drawing;

using System.Collections.Generic;

using System.Linq;

namespace myOCRDemo

{

class Program

{

public static void GeneralBasicDemo()

{

// 设置APPID/AK/SK

var API_KEY = "你的Akey";

var SECRET_KEY = "你的SKey";

//创建对象

var client = new Baidu.Aip.Ocr.Ocr(API_KEY, SECRET_KEY);

client.Timeout = 60000; // 修改超时时间

var image = File.ReadAllBytes(@"你的图片路径");

// 调用通用文字识别, 图片参数为本地图片，可能会抛出网络等异常，请使用try/catch捕获

var result = client.GeneralBasic(image);

//解析Json的代码

JObject jo = (JObject)JsonConvert.DeserializeObject(result.ToString());

int num = (int)jo["words_result_num"];

string[] words = new string[num];

for (int i = 0; i < num; i++)

words[i] = jo["words_result"][i]["words"].ToString();

//返回值

string txtOCR = null;

for (int i = 0; i < num; i++)

txtOCR += words[i] + "\n";

//显示结果

Console.WriteLine(txtOCR);

}

static void Main(string[] args)

{

GeneralBasicDemo();

Console.Read();

}

程序运行结果如下：

这样就比较符合人类的阅读习惯了，上面这段代码也是核心的基础代码，可以通过这些核心的代码去做一些优化，比如自动换行、自动缩进、根据语言习惯自动改变标点符号等等。

（三）表格识别

百度的表格文字识别的编程较为麻烦，主要分成两步：第一步是提交表格文字识别请求，获得requestId；第二步是根据requestId获取表格文字识别的结果，默认是Excel文件格式，Json结果会返回一段下载地址。

我的程序除了上面这两步以外，还添加了自动下载Excel文件到本地电脑的代码，供各位参考。另外要注意的是，提交识别请求和获得识别结果这两步之间，程序必须设置延时，否则不能获得下载的URL 。经过实际测试，延时为3秒以上较为合适，3秒以下可能会出错。

代码如下：

///

/// 表格文字识别

///

public static void myTableRecognitionRequestDemo()

{

// 设置APPID/AK/SK

var API_KEY = "你的API Key";

var SECRET_KEY = "你的Secret Key";

//创建对象

var client = new Baidu.Aip.Ocr.Ocr(API_KEY, SECRET_KEY);

client.Timeout = 60000; // 修改超时时间

var image = File.ReadAllBytes(@"F:\表格图片1.jpg");//这里要改成你的表格图片路径

// 调用表格文字识别，可能会抛出网络等异常，请使用try/catch捕获

var result = client.TableRecognitionRequest(image);

//解析Json

JObject jo = (JObject)JsonConvert.DeserializeObject(result.ToString());

string requestId = jo["result"][0]["request_id"].ToString();

Console.WriteLine("获得requestId："+requestId);

//延时3秒，这句是必须的

System.Threading.Thread.Sleep(3000);

//获取表格识别结果

//有时会得不到链接，需要多尝试几次

var resultExcel = client.TableRecognitionGetResult(requestId);

Console.WriteLine("获得的表格识别结果如下：");

Console.WriteLine(resultExcel);

//解析Json，获得链接

JObject joResult = (JObject)JsonConvert.DeserializeObject(resultExcel.ToString());

string excelURL = joResult["result"]["result_data"].ToString();

Console.WriteLine("获得的Excel文件下载地址是：\n" + excelURL);

//自动下载Excel文件到电脑

WebClient df = new WebClient();

df.DownloadFile(excelURL, @"F:\识别结果.xls");//这里要改成你的下载文件路径

Console.WriteLine("下载完毕");

}

作者使用的测试用图片：

表格文字识别结果截图：

尾记：本文的示例代码都是最新的代码，跟百度SDK文档里面的代码是一致的，而云猫OCR是2017年末就已经写好的了，代码有些陈旧，所以没直接贴源代码了。

代码篇的原帖子地址：

http://ai.baidu.com/forum/topic/show/956037

第三部分云猫OCR的使用说明及效果评测

一、概述

笔者是在2017年接触百度云服务平台的，在这里我也称之为百度AI 。笔者根据百度AI提供的函数接口，自行编程实现了一款OCR软件——云猫OCR。云猫OCR大部分的代码开发是在2017年底前完成的，之所以雪藏到现在，是因为笔者的一些私人事务（小孩出生等）——我是利用业余时间进行软件开发的，所以中断了大概一年多的时间，现在才有空继续这个项目。

评测篇的原帖子地址：

http://ai.baidu.com/forum/topic/show/955989

二、评测的具体内容

（一）准备工作

在使用云猫OCR之前，我们必须先去百度云官网进行注册账号，有了账号以后，我们还要去具体的云服务项目下申请API Key和Secret Key ，一般这两个Key是用户各人保管的，不能随便透露给外人。因为百度云现在已经正式收费，而用户每人每天的免费调用次数都是有限的，提高限额需要支付费用，用户使用百度云AI接口的依据主要就是这两个Key，所以我们要保管好。下面是简单的准备工作图片说明：

（二）正式使用云猫OCR

用户有了百度云API Key和Secret Key之后，就可以正式使用云猫OCR了。具体使用步骤如下：

（三）评测的具体内容

首先介绍一下云猫OCR调用的百度AI的主要接口，首先是通用文字识别（带位置版），其次是通用文字识别（带位置高精度版），最后是表格文字识别，下面依次介绍这三种识别。

1. 通用文字识别（带位置版）和通用文字识别（带位置高精度版）的混合使用

如上图所示，用户可以选择多种语言（包括德语、法语、西班牙语等等），选择好后点击文字识别即可。因为百度云提供的高精度文字识别接口只支持中英文，而通用的文字识别支持除中英文以外的多种语言，所以笔者在编写软件中，这两种接口是混合使用的，具体怎么混合使用请看代码篇。一般情况下，高精度的文字识别效果比通用的好，但也比较耗时。

本软件支持识别的文字结果在本机保存为文件，具体如下图操作：

保存的文件是rtf格式，可以用WPS或者Office Word打开。下面再给出一次性识别20张图片的统计结果图示：

从上图可以看出，百度云的文字识别结果速度还是不错的，识别速度是平均大概2-3秒一张图。

2. 表格文字识别

表格文字识别的主要步骤如下图所示：

识别的结果软件会自动保存为Excel文件并打开，如图：

从上图可以看出，表格文字识别的速度比普通文字识别要慢一些，大概需要5-6秒。

评测总结：百度OCR对于印刷体的识别还是不错的，比起以前的OCR软件来说，百度OCR可以说是革命性的进步。当然，它也有自己的短板。比如手写体的识别，笔者还没有评测，但百度云通用文字高精度接口对手写体的识别是较差的。再比如QPS并发，我的理解是可以提高OCR文字识别的速度，对于大量的图片文字识别来说尤其是重要，可以节省大量时间。但遗憾的是，百度云对并发好像做的不太好，程序不一定支持QPS并发，这个缺点我们也是希望百度后面能够有所改正。

附录：

C#编程实现手写识别

一、概述

本人是用C#编程，调用百度API接口实现手写体识别的，参考了百度的产品文档。

文档地址：https://cloud.baidu.com/doc/OCR/index.html

二、代码及解说

本人的源代码大部分是来自百度的产品文档，但其中也遇到了一些麻烦。比如文字识别的编码问题，百度的代码给出的编码是Default，但在我的机器上这样做会显示乱码。经过查找资料，我把编码改成UTF8，乱码的问题才得到解决。

作者的所有源代码如下：

using System;

using System.Collections.Generic;

using System.Linq;

using System.Text;

using System.Threading.Tasks;

using System.Net.Http;

using Newtonsoft.Json;

using Newtonsoft.Json.Linq;

using System.IO;

using System.Drawing;

using System.Web;

using System.Net;

namespace myHandwrite

{

public static class FileUtils

{

///

/// 转base64编码

///

public static String getFileBase64(String fileName)

{

FileStream filestream = new FileStream(fileName, FileMode.Open);

byte[] arr = new byte[filestream.Length];

filestream.Read(arr, 0, (int)filestream.Length);

string baser64 = Convert.ToBase64String(arr);

filestream.Close();

return baser64;

}

class Program

{

// 调用getAccessToken()获取的 access_token建议根据expires_in 时间设置缓存

// 返回token示例

public static String TOKEN = "24.adda70c11b9786206253ddb70affdc46.2592000.1493524354.282335-1234567";

// 百度云中开通对应服务应用的 API Key 建议开通应用的时候多选服务

private static String clientId = "这里改成你的API Key";

// 百度云中开通对应服务应用的 Secret Key

private static String clientSecret = "这里改成你的Secret Key";

///

/// 获取token的函数

///

public static String getAccessToken()

{

String authHost = "https://aip.baidubce.com/oauth/2.0/token";

HttpClient client = new HttpClient();

List> paraList = new List>();

paraList.Add(new KeyValuePair("grant_type", "client_credentials"));

paraList.Add(new KeyValuePair("client_id", clientId));

paraList.Add(new KeyValuePair("client_secret", clientSecret));

HttpResponseMessage response = client.PostAsync(authHost, new FormUrlEncodedContent(paraList)).Result;

String result = response.Content.ReadAsStringAsync().Result;

//Console.WriteLine(result);

//自己加的代码

JObject jo = (JObject)JsonConvert.DeserializeObject(result.ToString());

string myToken = jo["access_token"].ToString();

Console.WriteLine("获得的Token是：" + myToken);

return myToken;

}

///

/// 手写体文字识别

///

public static string myHandwriting(string token,string filename)

{

//string token = "#####调用鉴权接口获取的token#####";

// 图片的base64编码

string strbaser64 = FileUtils.getFileBase64(filename);

string host = "https://aip.baidubce.com/rest/2.0/ocr/v1/handwriting?access_token=" + token;

Encoding encoding = Encoding.Default;

HttpWebRequest request = (HttpWebRequest)WebRequest.Create(host);

request.Method = "post";

request.ContentType = "application/x-www-form-urlencoded";

request.KeepAlive = true;

//这里加上了一些参数

String str = "recognize_granularity=big&image=" + HttpUtility.UrlEncode(strbaser64);

byte[] buffer = encoding.GetBytes(str);

request.ContentLength = buffer.Length;

request.GetRequestStream().Write(buffer, 0, buffer.Length);

HttpWebResponse response = (HttpWebResponse)request.GetResponse();

//显示结果是乱码，尝试改变编码，经过测试需要改成UTF8编码

StreamReader reader = new StreamReader(response.GetResponseStream(), Encoding.UTF8);

string result = reader.ReadToEnd();

Console.WriteLine("手写文字识别:");

//Console.WriteLine(result);

//解析Json的代码

JObject jo = (JObject)JsonConvert.DeserializeObject(result.ToString());

int num = (int)jo["words_result_num"];

string[] words = new string[num];

for (int i = 0; i < num; i++)

words[i] = jo["words_result"][i]["words"].ToString();

//返回值

string txtOCR = null;

for (int i = 0; i < num; i++)

txtOCR += words[i] + "\n";

//显示结果

Console.WriteLine(txtOCR);

return txtOCR;

}

static void Main(string[] args)

{

//这里要改成你的图片路径

string filename = @"F:\手写体5.jpg";

string token = getAccessToken();

myHandwriting(token,filename);

Console.Read();

}

注意，上面的代码中需要各位改成自己的Akey和Skey，另外要改一下图片路径。如果返回的是乱码，还需要改一下编码。

识别的结果如下：

程序用的图片文件如下：

作者：kohakuarc

你可能感兴趣的:(如何用百度大脑文字识别技术，快速集成实用小工具)

QQ群采集助手，精准引流必备神器 2401_87347160 其他经验分享
功能概述微信群查找与筛选工具是一款专为微信用户设计的辅助工具，它通过关键词搜索功能，帮助用户快速找到相关的微信群，并提供筛选是否需要验证的群组的功能。主要功能关键词搜索：用户可以输入关键词，工具将自动查找包含该关键词的微信群。筛选功能：工具提供筛选机制，用户可以选择是否只显示需要验证或不需要验证的群组。精准引流：通过上述功能，用户可以更精准地找到目标群组，进行有效的引流操作。3.设备需求该工具可以
UI学习——cell的复用和自定义cell Magnetic_h ui 学习
目录cell的复用手动（非注册）自动（注册）自定义cellcell的复用在iOS开发中，单元格复用是一种提高表格（UITableView）和集合视图（UICollectionView）滚动性能的技术。当一个UITableViewCell或UICollectionViewCell首次需要显示时，如果没有可复用的单元格，则视图会创建一个新的单元格。一旦这个单元格滚动出屏幕，它就不会被销毁。相反，它被添
element实现动态路由+面包屑软件技术NINI vue案例 vue.js 前端
el-breadcrumb是ElementUI组件库中的一个面包屑导航组件，它用于显示当前页面的路径，帮助用户快速理解和导航到应用的各个部分。在Vue.js项目中，如果你已经安装了ElementUI，就可以很方便地使用el-breadcrumb组件。以下是一个基本的使用示例：安装ElementUI（如果你还没有安装的话）:你可以通过npm或yarn来安装ElementUI。bash复制代码npmi
理解Gunicorn：Python WSGI服务器的基石范范0825 ipython linux 运维
理解Gunicorn：PythonWSGI服务器的基石介绍Gunicorn，全称GreenUnicorn，是一个为PythonWSGI（WebServerGatewayInterface）应用设计的高效、轻量级HTTP服务器。作为PythonWeb应用部署的常用工具，Gunicorn以其高性能和易用性著称。本文将介绍Gunicorn的基本概念、安装和配置，帮助初学者快速上手。1.什么是Gunico
学点心理知识，呵护孩子健康静候花开_7090
昨天听了华中师范大学教育管理学系副教授张玲老师的《哪里才是学生心理健康的最后庇护所，超越教育与技术的思考》的讲座。今天又重新学习了一遍，收获匪浅。张玲博士也注意到了当今社会上的孩子由于心理问题导致的自残、自杀及伤害他人等恶性事件。她向我们普及了一个重要的命题，她说心理健康的一些基本命题，我们与我们通常的一些教育命题是不同的，她还举了几个例子，让我们明白我们原来以为的健康并非心理学上的健康。比如如果
Cell Insight | 单细胞测序技术又一新发现，可用于HIV-1和Mtb共感染个体诊断尐尐呅
结核病是艾滋病合并其他疾病中导致患者死亡的主要原因。其中结核病由结核分枝杆菌（Mycobacteriumtuberculosis,Mtb）感染引起，获得性免疫缺陷综合症（艾滋病）由人免疫缺陷病毒（Humanimmunodeficiencyvirustype1,HIV-1）感染引起。国家感染性疾病临床医学研究中心/深圳市第三人民医院张国良团队携手深圳华大生命科学研究院吴靓团队，共同研究得出单细胞测序
店群合一模式下的社区团购新发展——结合链动 2+1 模式、AI 智能名片与 S2B2C 商城小程序源码说私域人工智能小程序
摘要：本文探讨了店群合一的社区团购平台在当今商业环境中的重要性和优势。通过分析店群合一模式如何将互联网社群与线下终端紧密结合，阐述了链动2+1模式、AI智能名片和S2B2C商城小程序源码在这一模式中的应用价值。这些创新元素的结合为社区团购带来了新的机遇，提升了用户信任感、拓展了营销渠道，并实现了线上线下的完美融合。一、引言随着互联网技术的不断发展，社区团购作为一种新兴的商业模式，在满足消费者日常需
ArcGIS栅格计算器常见公式（赋值、0和空值的转换、补充栅格空值）研学随笔 arcgis 经验分享
我们在使用ArcGIS时通常经常用到栅格计算器，今天主要给大家介绍我日常中经常用到的几个公式，供大家参考学习。将特定值（-9999）赋值为0，例如-9999.Con("raster"==-9999,0,"raster")2.给空值赋予特定的值（如0）Con(IsNull("raster"),0,"raster")3.将特定的栅格值(如1)赋值为空值，其他保留原值SetNull("raster"==
腾讯云技术深度探索：构建高效云原生微服务架构我的运维人生云原生架构腾讯云运维开发技术共享
腾讯云技术深度探索：构建高效云原生微服务架构在当今快速发展的技术环境中，云原生技术已成为企业数字化转型的关键驱动力。腾讯云作为行业领先的云服务提供商，不断推出创新的产品和技术，助力企业构建高效、可扩展的云原生微服务架构。本文将深入探讨腾讯云在微服务领域的最新进展，并通过一个实际案例展示如何在腾讯云平台上构建云原生应用。腾讯云微服务架构概览腾讯云微服务架构基于云原生理念，旨在帮助企业快速实现应用的容
PHP环境搭建详细教程好看资源平台前端 php
PHP是一个流行的服务器端脚本语言，广泛用于Web开发。为了使PHP能够在本地或服务器上运行，我们需要搭建一个合适的PHP环境。本教程将结合最新资料，介绍在不同操作系统上搭建PHP开发环境的多种方法，包括Windows、macOS和Linux系统的安装步骤，以及本地和Docker环境的配置。1.PHP环境搭建概述PHP环境的搭建主要分为以下几类：集成开发环境：例如XAMPP、WAMP、MAMP，这
下载github patch到本地小米人er 我的博客 git patch
以下是几种从GitHub上下载以.patch结尾的补丁文件的方法：通过浏览器直接下载打开包含该.patch文件的GitHub仓库。在仓库的文件列表中找到对应的.patch文件。点击该文件，浏览器会显示文件的内容，在页面的右上角通常会有一个“Raw”按钮，点击它可以获取原始文件内容。然后在浏览器中使用快捷键（如Ctrl+S或者Command+S）将原始文件保存到本地，选择保存的文件名并确保后缀为.p
DIV+CSS+JavaScript技术制作网页（旅游主题网页设计与制作）云南大理 STU学生网页设计网页设计期末网页作业 html静态网页 html5期末大作业网页设计 web大作业
️精彩专栏推荐作者主页:【进入主页—获取更多源码】web前端期末大作业：【HTML5网页期末作业(1000套)】程序员有趣的告白方式：【HTML七夕情人节表白网页制作(110套)】文章目录二、网站介绍三、网站效果▶️1.视频演示2.图片演示四、网站代码HTML结构代码CSS样式代码五、更多源码二、网站介绍网站布局方面：计划采用目前主流的、能兼容各大主流浏览器、显示效果稳定的浮动网页布局结构。网站程
2020-04-12每天三百字之连接与替代冷眼看潮
不知道是不是好为人师，有时候还真想和别人分享一下我对某些现象的看法或者解释。人类社会不断发展进步的过程，就是不断连接与替代的过程。人类发现了火并应用火以后，告别了茹毛饮血的野兽般的原始生活（火烧、烹饪替代了生食）人类用石器代替了完全手工，工具的使用使人类进步一大步。类似这样的替代还有很多，随着科技的发展，有更多的原始的事物被替代，代之以更高效、更先进的技术。在近现代，汽车替代了马车，高速公路和铁路
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
使用Faiss进行高效相似度搜索 llzwxh888 faiss python
在现代AI应用中，快速和高效的相似度搜索是至关重要的。Faiss（FacebookAISimilaritySearch）是一个专门用于快速相似度搜索和聚类的库，特别适用于高维向量。本文将介绍如何使用Faiss来进行相似度搜索，并结合Python代码演示其基本用法。什么是Faiss？Faiss是一个由FacebookAIResearch团队开发的开源库，主要用于高维向量的相似性搜索和聚类。Faiss
使用LLaVa和Ollama实现多模态RAG示例 llzwxh888 python 人工智能开发语言
本文将详细介绍如何使用LLaVa和Ollama实现多模态RAG（检索增强生成），通过提取图像中的结构化数据、生成图像字幕等功能来展示这一技术的强大之处。安装环境首先，您需要安装以下依赖包：!pipinstallllama-index-multi-modal-llms-ollama!pipinstallllama-index-readers-file!pipinstallunstructured!p
python是什么意思中文-在python中%是什么意思编程大乐趣
Python中%有两种：1、数值运算：%代表取模，返回除法的余数。如：>>>7%212、%操作符（字符串格式化，stringformatting），说明如下：%[(name)][flags][width].[precision]typecode(name)为命名flags可以有+，-，''或0。+表示右对齐。-表示左对齐。''为一个空格，表示在正数的左侧填充一个空格，从而与负数对齐。0表示使用0填
利用LangChain的StackExchange组件实现智能问答系统 nseejrukjhad langchain microsoft 数据库 python
利用LangChain的StackExchange组件实现智能问答系统引言在当今的软件开发世界中，StackOverflow已经成为程序员解决问题的首选平台之一。而LangChain作为一个强大的AI应用开发框架，提供了StackExchange组件，使我们能够轻松地将StackOverflow的海量知识库集成到我们的应用中。本文将详细介绍如何使用LangChain的StackExchange组件
关于城市旅游的HTML网页设计——(旅游风景云南 5页)HTML+CSS+JavaScript 二挡起步 web前端期末大作业 javascript html css 旅游风景
⛵源码获取文末联系✈Web前端开发技术描述网页设计题材，DIV+CSS布局制作,HTML+CSS网页设计期末课程大作业|游景点介绍|旅游风景区|家乡介绍|等网站的设计与制作|HTML期末大学生网页设计作业，Web大学生网页HTML：结构CSS：样式在操作方面上运用了html5和css3，采用了div+css结构、表单、超链接、浮动、绝对定位、相对定位、字体样式、引用视频等基础知识JavaScrip
HTML网页设计制作大作业（div+css）云南我的家乡旅游景点带文字滚动二挡起步 web前端期末大作业 web设计网页规划与设计 html css javascript dreamweaver 前端
Web前端开发技术描述网页设计题材，DIV+CSS布局制作,HTML+CSS网页设计期末课程大作业游景点介绍|旅游风景区|家乡介绍|等网站的设计与制作HTML期末大学生网页设计作业HTML：结构CSS：样式在操作方面上运用了html5和css3，采用了div+css结构、表单、超链接、浮动、绝对定位、相对定位、字体样式、引用视频等基础知识JavaScript：做与用户的交互行为文章目录前端学习路线
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
Python快速入门 —— 第三节：类与对象孤华暗香 Python快速入门 python 开发语言
第三节：类与对象目标：了解面向对象编程的基础概念，并学会如何定义类和创建对象。内容：类与对象：定义类：class关键字。类的构造函数：__init__()。类的属性和方法。对象的创建与使用。示例：classStudent:def__init__(self,name,age,major):self.name&#
MongoDB Oplog 窗口喝醉酒的小白 MongoDB 运维
在MongoDB中，oplog（操作日志）是一个特殊的日志系统，用于记录对数据库的所有写操作。oplog允许副本集成员（通常是从节点）应用主节点上已经执行的操作，从而保持数据的一致性。它是MongoDB副本集实现数据复制的基础。MongoDBOplog窗口oplog窗口是指在MongoDB副本集中，从节点可以用来同步数据的时间范围。这个窗口通常由以下因素决定：Oplog大小：oplog的大小是有限
libyuv之linux编译 jaronho Linux linux 运维服务器
文章目录一、下载源码二、编译源码三、注意事项1、银河麒麟系统（aarch64）（1）解决armv8-a+dotprod+i8mm指令集支持问题（2）解决armv9-a+sve2指令集支持问题一、下载源码到GitHub网站下载https://github.com/lemenkov/libyuv源码，或者用直接用git克隆到本地，如：gitclonehttps://github.com/lemenko
Faiss Tips：高效向量搜索与聚类的利器焦习娜Samantha
FaissTips：高效向量搜索与聚类的利器faiss_tipsSomeusefultipsforfaiss项目地址:https://gitcode.com/gh_mirrors/fa/faiss_tips项目介绍Faiss是由FacebookAIResearch开发的一个用于高效相似性搜索和密集向量聚类的库。它支持多种硬件平台，包括CPU和GPU，能够在海量数据集上实现快速的近似最近邻搜索（AN
CX8836：小体积大功率升降压方案推荐（附Demo设计指南）诚芯微科技社交电子
CX8836是一颗同步四开关单向升降压控制器，在4.5V-40V宽输入电压范围内稳定工作，持续负载电流10A，能够在输入高于或低于输出电压时稳定调节输出电压，可适用于USBPD快充、车载充电器、HUB、汽车启停系统、工业PC电源等多种升降压应用场合，为大功率TYPE-CPD车载充电器提供最优解决方案。提供CX8836Demo测试、CX8836样品申请及CX8836方案开发技术支持。CX8836同升
Python 实现图片裁剪（附代码） | Python工具剑客阿良_ALiang
前言本文提供将图片按照自定义尺寸进行裁剪的工具方法，一如既往的实用主义。环境依赖ffmpeg环境安装，可以参考我的另一篇文章：windowsffmpeg安装部署_阿良的博客-CSDN博客本文主要使用到的不是ffmpeg，而是ffprobe也在上面这篇文章中的zip包中。ffmpy安装：pipinstallffmpy-ihttps://pypi.douban.com/simple代码不废话了，上代码
2020-12-16 长寿富贵
9：56不知今天哪位亲来说说话呀？成萌：尽尽皆是道。道道皆相同。不解呀？成萌：郁郁不得志，混混过日子。哦……说谁的呀？成萌：说自己呀……还能说谁呢？那如何办呢？成萌：回头……如何回头？成萌：回见心源。如何回见心源？成萌：不追不随诸相迁，如如不动在心田。啊？成萌：慢慢守心吧。
【华为OD技术面试真题 - 技术面】- python八股文真题题库（4) 算法大师华为od 面试 python
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选**1.Python中的`with`**用途和功能自动资源管理示例：文件操作上下文管理协议示例代码工作流程解析优点2.\_\_new\_\_和**\_\_init\_\_**区别__new____init__区别总结3.**切片（Slicing）操作**基本切片语法
【华为OD技术面试真题 - 技术面】-测试八股文真题题库（1）算法大师华为od 面试 python 算法前端
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选1.黑盒测试和白盒测试的区别2.假设我们公司现在开发一个类似于微信的软件1.0版本，现在要你测试这个功能：打开聊天窗口，输入文本，限制字数在200字以内。问你怎么提取测试点。功能测试性能测试安全性测试可用性测试跨平台兼容性测试网络环境测试3.接口测试的工具你了解哪些
统一思想认识永夜-极光思想
1.统一思想认识的基础,才能有的放矢原因: 总有一种描述事物的方式最贴近本质,最容易让人理解. 如何让教育更轻松,在于找到最适合学生的方式. 难点在于,如何模拟对方的思维基础选择合适的方式. &
Joda Time使用笔记 bylijinnan java joda time
Joda Time的介绍可以参考这篇文章： http://www.ibm.com/developerworks/cn/java/j-jodatime.html 工作中也常常用到Joda Time，为了避免每次使用都查API，记录一下常用的用法： /** * DateTime变化（增减） */ @Tes
FileUtils API eksliang FileUtils FileUtils API
转载请出自出处：http://eksliang.iteye.com/blog/2217374 一、概述这是一个Java操作文件的常用库，是Apache对java的IO包的封装，这里面有两个非常核心的类FilenameUtils跟FileUtils，其中FilenameUtils是对文件名操作的封装;FileUtils是文件封装，开发中对文件的操作，几乎都可以在这个框架里面找到。非常的好用。
各种新兴技术不懂事的小屁孩技术
1:gradle Gradle 是以 Groovy 语言为基础，面向Java应用为主。基于DSL（领域特定语言）语法的自动化构建工具。现在构建系统常用到maven工具，现在有更容易上手的gradle，搭建java环境: http://www.ibm.com/developerworks/cn/opensource/os-cn-gradle/ 搭建android环境： http://m
tomcat6的https双向认证酷的飞上天空 tomcat6
1.生成服务器端证书 keytool -genkey -keyalg RSA -dname "cn=localhost,ou=sango,o=none,l=china,st=beijing,c=cn" -alias server -keypass password -keystore server.jks -storepass password -validity 36
托管虚拟桌面市场势不可挡蓝儿唯美
用户还需要冗余的数据中心，dinCloud的高级副总裁兼首席营销官Ali Din指出。该公司转售一个MSP可以让用户登录并管理和提供服务的用于DaaS的云自动化控制台，提供服务或者MSP也可以自己来控制。在某些情况下，MSP会在dinCloud的云服务上进行服务分层，如监控和补丁管理。 MSP的利润空间将根据其参与的程度而有所不同，Din说。 “我们有一些合作伙伴负责将我们推荐给客户作为个
spring学习——xml文件的配置 a-john spring
在Spring的学习中，对于其xml文件的配置是必不可少的。在Spring的多种装配Bean的方式中，采用XML配置也是最常见的。以下是一个简单的XML配置文件： <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.or
HDU 4342 History repeat itself 模拟 aijuans 模拟
来源：http://acm.hdu.edu.cn/showproblem.php?pid=4342 题意：首先让求第几个非平方数，然后求从1到该数之间的每个sqrt(i)的下取整的和。思路：一个简单的模拟题目，但是由于数据范围大，需要用__int64。我们可以首先把平方数筛选出来，假如让求第n个非平方数的话，看n前面有多少个平方数，假设有x个，则第n个非平方数就是n+x。注意两种特殊情况，即
java中最常用jar包的用途 asia007 java
java中最常用jar包的用途 jar包用途axis.jarSOAP引擎包commons-discovery-0.2.jar用来发现、查找和实现可插入式接口，提供一些一般类实例化、单件的生命周期管理的常用方法.jaxrpc.jarAxis运行所需要的组件包saaj.jar创建到端点的点到点连接的方法、创建并处理SOAP消息和附件的方法，以及接收和处理SOAP错误的方法. w
ajax获取Struts框架中的json编码异常和Struts中的主控制器异常的解决办法百合不是茶 js json编码返回异常
一:ajax获取自定义Struts框架中的json编码出现以下问题: 1,强制flush输出 json编码打印在首页 2, 不强制flush js会解析json 打印出来的是错误的jsp页面却没有跳转到错误页面 3, ajax中的dataType的json 改为text 会
JUnit使用的设计模式 bijian1013 java 设计模式 JUnit
JUnit源代码涉及使用了大量设计模式 1、模板方法模式（Template Method）定义一个操作中的算法骨架，而将一些步骤延伸到子类中去，使得子类可以不改变一个算法的结构，即可重新定义该算法的某些特定步骤。这里需要复用的是算法的结构，也就是步骤，而步骤的实现可以在子类中完成。
Linux常用命令（摘录） sunjing crond chkconfig
chkconfig --list 查看linux所有服务 chkconfig --add servicename 添加linux服务 netstat -apn | grep 8080 查看端口占用 env 查看所有环境变量 echo $JAVA_HOME 查看JAVA_HOME环境变量安装编译器 yum install -y gcc
【Hadoop一】Hadoop伪集群环境搭建 bit1129 hadoop
结合网上多份文档，不断反复的修正hadoop启动和运行过程中出现的问题，终于把Hadoop2.5.2伪分布式安装起来，跑通了wordcount例子。Hadoop的安装复杂性的体现之一是，Hadoop的安装文档非常多，但是能一个文档走下来的少之又少，尤其是Hadoop不同版本的配置差异非常的大。Hadoop2.5.2于前两天发布，但是它的配置跟2.5.0，2.5.1没有分别。 &nb
Anychart图表系列五之事件监听白糖_ chart
创建图表事件监听非常简单：首先是通过addEventListener('监听类型',js监听方法)添加事件监听，然后在js监听方法中定义具体监听逻辑。以钻取操作为例，当用户点击图表某一个point的时候弹出point的name和value，代码如下： <script> //创建AnyChart var chart = new AnyChart(); //添加钻取操作&quo
Web前端相关段子 braveCS web前端
Web标准：结构、样式和行为分离使用语义化标签 0）标签的语义：使用有良好语义的标签，能够很好地实现自我解释，方便搜索引擎理解网页结构，抓取重要内容。去样式后也会根据浏览器的默认样式很好的组织网页内容，具有很好的可读性，从而实现对特殊终端的兼容。 1）div和span是没有语义的：只是分别用作块级元素和行内元素的区域分隔符。当页面内标签无法满足设计需求时，才会适当添加div
编程之美-24点游戏 bylijinnan 编程之美
import java.util.ArrayList; import java.util.Arrays; import java.util.HashSet; import java.util.List; import java.util.Random; import java.util.Set; public class PointGame { /**编程之美
主页面子页面传值总结 chengxuyuancsdn 总结
1、showModalDialog returnValue是javascript中html的window对象的属性,目的是返回窗口值,当用window.showModalDialog函数打开一个IE的模式窗口时,用于返回窗口的值主界面 var sonValue=window.showModalDialog("son.jsp"); 子界面 window.retu
[网络与经济]互联网+的含义 comsci 互联网+
互联网+后面是一个人的名字 = 网络控制系统互联网+你的名字 = 网络个人数据库每日提示:如果人觉得不舒服,千万不要外出到处走动,就呆在床上,玩玩手游,更不能够去开车,现在交通状况不
oracle 创建视图 with check option daizj 视图 view oralce
我们来看下面的例子： create or replace view testview as select empno,ename from emp where ename like ‘M%’ with check option; 这里我们创建了一个视图，并使用了with check option来限制了视图。然后我们来看一下视图包含的结果： select * from testv
ToastPlugin插件在cordova3.3下使用 dibov Cordova
自己开发的Todos应用，想实现“ 再按一次返回键退出程序 ”的功能，采用网上的ToastPlugins插件，发现代码或文章基本都是老版本，运行问题比较多。折腾了好久才弄好。下面吧基于cordova3.3下的ToastPlugins相关代码共享。 ToastPlugin.java package&nbs
C语言22个系统函数 dcj3sjt126com c function
C语言系统函数一、数学函数下列函数存放在math.h头文件中Double floor(double num) 求出不大于num的最大数。Double fmod(x, y) 求整数x/y的余数。Double frexp(num, exp); double num; int *exp; 将num分为数字部分（尾数）x和以2位的指数部分n，即num=x*2n，指数n存放在exp指向的变量中，返回x。D
开发一个类的流程 dcj3sjt126com 开发
本人近日根据自己的开发经验总结了一个类的开发流程。这个流程适用于单独开发的构件，并不适用于对一个项目中的系统对象开发。开发出的类可以存入私人类库，供以后复用。以下是开发流程： 1. 明确类的功能，抽象出类的大概结构 2. 初步设想类的接口 3. 类名设计（驼峰式命名） 4. 属性设置(权限设置) 判断某些变量是否有必要作为成员属
java 并发 shuizhaosi888 java 并发
能够写出高伸缩性的并发是一门艺术在JAVA SE5中新增了3个包 java.util.concurrent java.util.concurrent.atomic java.util.concurrent.locks 在java的内存模型中，类的实例字段、静态字段和构成数组的对象元素都会被多个线程所共享，局部变量与方法参数都是线程私有的，不会被共享。
Spring Security（11）——匿名认证 234390216 Spring Security ROLE_ANNOYMOUS 匿名
匿名认证目录 1.1 配置 1.2 AuthenticationTrustResolver 对于匿名访问的用户，Spring Security支持为其建立一个匿名的AnonymousAuthenticat
NODEJS项目实践0.2[ express,ajax通信...] 逐行分析JS源代码 Ajax nodejs express
一、前言通过上节学习，我们已经 ubuntu系统搭建了一个可以访问的nodejs系统，并做了nginx转发。本节原要做web端服务及 mongodb的存取，但写着写着，web端就
在Struts2 的Action中怎样获取表单提交上来的多个checkbox的值 lhbthanks java html struts checkbox
第一种方法：获取结果String类型在 Action 中获得的是一个 String 型数据，每一个被选中的 checkbox 的 value 被拼接在一起，每个值之间以逗号隔开(,)。所以在 Action 中定义一个跟 checkbox 的 name 同名的属性来接收这些被选中的 checkbox 的 value 即可。以下是实现的代码：前台 HTML 代码：
003.Kafka基本概念 nweiren hadoop kafka
Kafka基本概念：Topic、Partition、Message、Producer、Broker、Consumer。 Topic：消息源（Message）的分类。 Partition： Topic物理上的分组，一
Linux环境下安装JDK roadrunners jdk linux
1、准备工作创建JDK的安装目录： mkdir -p /usr/java/ 下载JDK，找到适合自己系统的JDK版本进行下载： http://www.oracle.com/technetwork/java/javase/downloads/index.html 把JDK安装包下载到/usr/java/目录，然后进行解压： tar -zxvf jre-7
Linux忘记root密码的解决思路 tomcat_oracle linux
1：使用同版本的linux启动系统，chroot到忘记密码的根分区passwd改密码　　2：grub启动菜单中加入init=/bin/bash进入系统，不过这时挂载的是只读分区。根据系统的分区情况进一步判断. 　　3: grub启动菜单中加入 single以单用户进入系统. 　　4:用以上方法mount到根分区把/etc/passwd中的root密码去除　　例如: 　　ro
跨浏览器 HTML5 postMessage 方法以及 message 事件模拟实现 xueyou jsonp jquery 框架 UI html5
postMessage 是 HTML5 新方法，它可以实现跨域窗口之间通讯。到目前为止，只有 IE8+, Firefox 3, Opera 9, Chrome 3和 Safari 4 支持，而本篇文章主要讲述 postMessage 方法与 message 事件跨浏览器实现。postMessage 方法 JSONP 技术不一样，前者是前端擅长跨域文档数据即时通讯，后者擅长针对跨域服务端数据通讯，p