wisdombrave

Paoding Analyzer 庖丁解牛分词

Paoding Analyzer
庖丁解牛

je分词用lucene.中文分词庖丁解牛

一般使用
使用评估
参考资料
下载
开始使用
分词策略

效果体验
在命令行模式下执行analyzer.bat(windows)或analyzer.sh(linux)即可0
u       显示帮助
E:\Paoding-Analysis>analyzer.bat ?
u       分词对话
多次输入或粘贴不同的文字内容，查看分词效果，如：
E:\Paoding-Analysis>analyzer.bat
paoding> |
此时使用者可以在光标所在所在位置(|)输入或粘贴待分词的内容(以分号结束)，按下Enter键换行，analyzer.bat便可以输出分词结果。
paoding> 中文分词;
1:      中文/分词/
        分词器net.paoding.analysis.analyzer.PaodingAnalyzer
        内容长度 4字符，分 2个词
        分词耗时 0ms
--------------------------------------------------
分词完毕后，又会进入以上对话模式。
键入:e或:q退出会话 (包括:符号) 。
键入:?显示帮助(包括:符号) 。

u 对文件进行分词
analyzer.bat允许对指定的文件进行分词体验。文件以路径名给出可以使绝对地址、相对当前目录的地址，或以classpath:为前缀的类路径地址。示例如下:
paoding> :-f E:/content.txt
paoding> :-f E:/content.txt -c gbk
paoding> :-f E:/content.txt -c gbk -m max

开始使用
第一步：安装词典
将程序存储在某个目录下，这个目录称为安装目录！
将程序拷贝到安装目录称为安装程序！
增加、删除、修改程序称为自定制程序！

第二步：配置词典系统环境变量
庖丁中文分词需要一套词典，使用者安装辞典后，应该设置系统环境变量PAODING_DIC_HOME指向词典安装目录。
在windows下，通过“我的电脑”属性之“高级”选项卡，然后在进入“环境变量”编辑区，新建环境变量，设置“变量名”为PAODING_DIC_HOME；“变量值”为E:/data/paoding/dic
工程中使用分词，dic文件包copy到 web-info/classes 下面！

第三步：将庖丁JAR类库导入工程
将paoding-analysis.jar添加到工程。
至此，便可以在应用代码中使用庖丁提供的中文分析器了。

提醒：以下示例代码中的IDNEX_PATH表示索引库地址，读者运行以下代码前，应该赋与一个不重要的地址，比如/data/paoding/test_index 或E:/paoding_test_index，以免一时疏忽将重要数据丢失。

package net.paoding.analysis;

import net.paoding.analysis.analyzer.PaodingAnalyzer;

import org.apache.lucene.analysis.Analyzer;
import org.apache.lucene.analysis.TokenStream;
import org.apache.lucene.document.Document;
import org.apache.lucene.document.Field;
import org.apache.lucene.index.IndexReader;
import org.apache.lucene.index.IndexWriter;
import org.apache.lucene.index.TermPositionVector;
import org.apache.lucene.queryParser.QueryParser;
import org.apache.lucene.search.Hits;
import org.apache.lucene.search.IndexSearcher;
import org.apache.lucene.search.Query;
import org.apache.lucene.search.Searcher;
import org.apache.lucene.search.highlight.Formatter;
import org.apache.lucene.search.highlight.Highlighter;
import org.apache.lucene.search.highlight.QueryScorer;
import org.apache.lucene.search.highlight.TokenGroup;
import org.apache.lucene.search.highlight.TokenSources;

/**
 * 创建索引库
 * @author Administrator
 *
 */
public class CreateIndexLibTest {
	public static void main(String[] args) throws Exception {
		
		/** 创建分词 */
		// 词典目录
		String path = "D:\\Java\\paoding_analyzer\\dic";
		// 庖丁解牛中文分词器
		Analyzer analyzer = new PaodingAnalyzer();
		// 索引书写器
		IndexWriter writer = new IndexWriter(path, analyzer, true);
		// 文档
		Document doc = new Document();
		// 字段
		Field field = new Field(
				"content", 									// name
				"你好，世界!", 								// value
				Field.Store.YES,							// store
				Field.Index.TOKENIZED, 						// index
				Field.TermVector.WITH_POSITIONS_OFFSETS);	// termVector
		doc.add(field);				// 文档添加字段
		writer.addDocument(doc);	// 索引书写器添加文档
		writer.close();
		System.out.println("Indexed success!");
		 
		/** 搜索关键词 */
		// 索引读取器
		IndexReader reader = IndexReader.open(path);
		// 查询解析器
		QueryParser parser = new QueryParser("content", analyzer);
		Query query = parser.parse("你好");	// 解析
		// 搜索器
		Searcher searcher = new IndexSearcher(reader);
		// 命中
		Hits hits = searcher.search(query);
		if (hits.length() == 0) {
		    System.out.println("hits.length=0");
		}
		
		/** 高亮显示搜索的关键词 */	
		Document doc2 = hits.doc(0);
		//高亮处理
		String text = doc2.get("content");
		// 条件位置载体
		TermPositionVector tpv = (TermPositionVector) reader.getTermFreqVector(// 获得条件次数载体
		                0, "content");
		// 记号流
		TokenStream ts = TokenSources.getTokenStream(tpv);
		// 格式化器
		Formatter formatter = new Formatter() {
			// 高亮条件
		    public String highlightTerm(String srcText, TokenGroup g) {
		        if (g.getTotalScore() <= 0) {
		            return srcText;
		        }
		        return "" + srcText + "";
		    }
		};
		// 高亮器
		Highlighter highlighter = new Highlighter(
				formatter, 
				new QueryScorer(query));	// 查询记录员
		// 获得最好的片段
		String result = highlighter.getBestFragments(ts, text, 5, "…");
		System.out.println("result:\n\t" + result);
		reader.close();

	}
}

package net.paoding.analysis;

import java.io.StringReader;

import junit.framework.TestCase;
import net.paoding.analysis.analyzer.PaodingAnalyzer;

import org.apache.lucene.analysis.Token;
import org.apache.lucene.analysis.TokenStream;
/**
 * 解析器单元测试(JUnit)
 * @author Administrator
 *
 */
public class AnalyzerTest extends TestCase {

	protected PaodingAnalyzer analyzer = new PaodingAnalyzer();

	protected StringBuilder sb = new StringBuilder();

	/**
	 * 解剖分词
	 * @param input
	 * @return
	 */
	protected String dissect(String input) {
		try {
			TokenStream ts = analyzer.tokenStream("", new StringReader(input));
			Token token;
			sb.setLength(0);
			while ((token = ts.next()) != null) {
				sb.append(token.termText()).append('/');
			}
			if (sb.length() > 0) {
				sb.setLength(sb.length() - 1);
			}
			System.out.println(sb.toString());
			return sb.toString();
		} catch (Exception e) {
			e.printStackTrace();
			return "error";
		}
	}

	/**
	 * 断言值: 预测的分词
	 * 结果值：词典中的分词
	 * 解剖关键字 "a",返回"",表示在词典分词策略中字母(a)不是一个分词
	 * 断言结果为Green bar 表示，返回的结果与断言中的结果相同。
	 */
	public void test000() {
		String result = dissect("a");
		assertEquals("", result);		// (断言值,结果值)
	}

	/**
	 *
	 */
	public void test001() {
		String result = dissect("空格 a 空格");
		assertEquals("空格/空格", result);
	}

	/**
	 *
	 */
	public void test002() {
		String result = dissect("A座");
		assertEquals("a座", result);
	}
	
	/**
	 *
	 */
	public void test003() {
		String result = dissect("u盘");
		assertEquals("u盘", result);
	}

	public void test004() {
		String result = dissect("刚买的u盘的容量");
		assertEquals("刚/买的/u盘/容量", result);	// 中文分词效果
	}
	
	public void test005() {
		String result = dissect("K歌之王很好听");
		assertEquals("k歌之王/很好/好听", result);
	}
	// --------------------------------------------------------------
	// 仅包含词语的句子分词策略
	// --------------------------------------------------------------

	/**
	 * 句子全由词典词语组成，但词语之间没有包含、交叉关系
	 */
	public void test100() {
		String result = dissect("台北中文国际");
		assertEquals("台北/中文/国际", result);
	}

	/**
	 * 句子全由词典词语组成，但词语之间有包含关系
	 */
	public void test101() {
		String result = dissect("北京首都机场");
		assertEquals("北京/首都/机场", result);
	}

	/**
	 * 句子全由词典词语组成，但词语之间有交叉关系
	 */
	public void test102() {
		String result = dissect("东西已经拍卖了");
		assertEquals("东西/已经/拍卖/卖了", result);
	}

	/**
	 * 句子全由词典词语组成，但词语之间有包含、交叉等复杂关系
	 */
	public void test103() {
		String result = dissect("羽毛球拍");
		assertEquals("羽毛/羽毛球/球拍", result);
	}

	// --------------------------------------------------------------
	// noise(噪音)词汇和单字的分词策略
	// --------------------------------------------------------------

	/**
	 * 词语之间有一个noise字(的)
	 */
	public void test200() {
		String result = dissect("足球的魅力");
		assertEquals("足球/魅力", result);
	}

	/**
	 * 词语之间有一个noise词语(因之)
	 */
	public void test201() {
		String result = dissect("主人因之生气");
		assertEquals("主人/生气", result);
	}

	/**
	 * 词语前后分别有单字和双字的noise词语(与,有关)
	 */
	public void test202() {
		String result = dissect("与谋杀有关");
		assertEquals("谋杀", result);
	}

	/**
	 * 前有noise词语(哪怕)，后面跟随了连续的noise单字(了,你)
	 */
	public void test203() {
		String result = dissect("哪怕朋友背叛了你");
		assertEquals("朋友/背叛", result);
	}

	/**
	 * 前后连续的noise词汇(虽然,某些)，词语中有noise单字(很)
	 */
	public void test204() {
		String result = dissect("虽然某些动物很凶恶");
		assertEquals("动物/凶恶", result);
	}

	// --------------------------------------------------------------
	// 词典没有收录的字符串的分词策略
	// --------------------------------------------------------------

	
	/**
	 * 仅1个字的非词汇串(东,西,南,北)
	 */
	public void test300() {
		String result = dissect("东&&西&&南&&北");
		assertEquals("东/西/南/北", result);
	}

	
	/**
	 * 仅两个字的非词汇串(古哥,谷歌,收狗,搜狗)
	 */
	public void test302() {
		String result = dissect("古哥&&谷歌&&收狗&&搜狗");
		assertEquals("古哥/谷歌/收狗/搜狗", result);
	}
	
	/**
	 * 多个字的非词汇串
	 */
	public void test303() {
		String result = dissect("这是鸟语：玉鱼遇欲雨");
		assertEquals("这是/鸟语/玉鱼/鱼遇/遇欲/欲雨", result);
	}
	
	/**
	 * 两个词语之间有一个非词汇的字(真)
	 */
	public void test304() {
		String result = dissect("朋友真背叛了你了!");
		assertEquals("朋友/真/背叛", result);
	}
	
	/**
	 * 两个词语之间有一个非词汇的字符串(盒蟹)
	 */
	public void test305() {
		String result = dissect("建设盒蟹社会");
		assertEquals("建设/盒蟹/社会", result);
	}
	
	/**
	 * 两个词语之间有多个非词汇的字符串(盒少蟹)
	 */
	public void test306() {
		String result = dissect("建设盒少蟹社会");
		assertEquals("建设/盒少/少蟹/社会", result);
	}

	// --------------------------------------------------------------
	// 不包含小数点的汉字数字
	// --------------------------------------------------------------


	/**
	 * 单个汉字数字
	 */
	public void test400() {
		String result = dissect("二");
		assertEquals("2", result);
	}

	/**
	 * 两个汉字数字
	 */
	public void test61() {
		String result = dissect("五六");
		assertEquals("56", result);
	}

	/**
	 * 多个汉字数字
	 */
	public void test62() {
		String result = dissect("三四五六");
		assertEquals("3456", result);
	}

	/**
	 * 十三
	 */
	public void test63() {
		String result = dissect("十三");
		assertEquals("13", result);
	}

	/**
	 * 二千
	 */
	public void test65() {
		String result = dissect("二千");
		assertEquals("2000", result);
	}

	/**
	 * 两千
	 */
	public void test651() {
		String result = dissect("两千");
		assertEquals("2000", result);
	}
	/**
	 * 两千
	 */
	public void test6511() {
		String result = dissect("两千个");
		assertEquals("2000/个", result);
	}

	/**
	 * 2千
	 */
	public void test652() {
		String result = dissect("2千");
		assertEquals("2000", result);
	}
	
	/**
	 * 
	 */
	public void test653() {
		String result = dissect("3千万");
		assertEquals("30000000", result);
	}
	
	/**
	 * 
	 */
	public void test654() {
		String result = dissect("3千万个案例");
		assertEquals("30000000/个/案例", result);
	}


	/**
	 * 
	 */
	public void test64() {
		String result = dissect("千万");
		assertEquals("千万", result);
	}

	public void test66() {
		String result = dissect("两两");
		assertEquals("两两", result);
	}

	public void test67() {
		String result = dissect("二二");
		assertEquals("22", result);
	}

	public void test68() {
		String result = dissect("2.2两");
		assertEquals("2.2/两", result);
	}

	public void test69() {
		String result = dissect("二两");
		assertEquals("2/两", result);
	}


	public void test690() {
		String result = dissect("2两");
		assertEquals("2/两", result);
	}

	public void test691() {
		String result = dissect("2千克");
		assertEquals("2000/克", result);
	}

	public void test692() {
		String result = dissect("2公斤");
		assertEquals("2/公斤", result);
	}

	public void test693() {
		String result = dissect("2世纪");
		assertEquals("2/世纪", result);
	}

	public void test7() {
		String result = dissect("哪怕二");
		assertEquals("2", result);
	}

}

redis-shake v4全量增量同步redis数据 nangonghen redis redis 数据库缓存 redis-shake
1概述RedisShake是一个用于处理和迁移Redis数据的工具，github地址是https://github.com/tair-opensource/RedisShake。它提供以下特性：1）Redis兼容性：RedisShake兼容从2.8到7.2的Redis版本，并支持各种部署方式，包括单机，主从，哨兵和集群。2）云服务兼容性：RedisShake与主流云服务提供商提供的流行Redis-
sox处理mp3_sox :音频文件转换命令 weixin_39615741 sox处理mp3
在开发呼叫中心的过程中要播放语音，要把自己录制的语音的wav格式转换为gsm格式，asterisk中也支持wav格式，但是不清楚为什么wav文件大一些就无法播放，所以只有转换为gsm格式。命令：sox00.wav-r8000-c100.gsmresample-ql下面的是在网上找到的一篇文章文章来源Sox是最为著名的OpenSource声音文件格式转换工具。已经被广泛移植到Dos、windows、
OpenCV高阶操作富士达幸运星 opencv 人工智能计算机视觉
在图像处理与计算机视觉领域，OpenCV（OpenSourceComputerVisionLibrary）无疑是最为强大且广泛使用的工具之一。从基础的图像读取、1.图片的上下，采样下采样（Downsampling）下采样通常用于减小图像的尺寸，从而减少图像中的像素数。这个过程可以通过多种方法实现，但最常见的是通过图像金字塔中的pyrDown函数（在OpenCV中）或其他类似的滤波器（如平均池化、最
Awesome TensorFlow weixin_30594001 人工智能移动开发大数据
AwesomeTensorFlowAcuratedlistofawesomeTensorFlowexperiments,libraries,andprojects.Inspiredbyawesome-machine-learning.WhatisTensorFlow?TensorFlowisanopensourcesoftwarelibraryfornumericalcomputationusin
Ubuntu+Qt+SDL2+FFmpeg DarcyZhou
此文档用于Ubuntu系统中搭建FFmpeg的开发环境。Qt作为开发软件，SDL2是一套开放源代码的跨平台多媒体开发库。1.安装Qt（1）下载版本：qt-opensource-linux-x64-5.9.8.runimage.png（2）安装给文件添加可执行权限：sudochmod-R777qt-opensource-linux-x64-5.9.8.run开始安装：安装过程中选择全部安装即可。（需
工具知识 | Linux 常用命令参考手册 TrustZone_Hcoco 工具技能知识点学习 linux 运维服务器
目录文件查看文件内容headtailcatnlmore创建touchmkdirmktemp删除rmrmdir查找文件findlocatelspwdwcchattrpastestatgrepsedcdcpmvopensourcetreelnfilesortuniqsplitvim系统管理nohupwatchpingwhichshutdownrebootuptimecrontabatunameifco
【Python第三方库】OpenCV库实用指南墨辰JC Python opencv python 人工智能学习
文章目录前言安装OpenCV读取图像图像基本操作获取图像信息裁剪图像图像缩放图像转换为灰度图图像模糊处理边缘检测图像翻转图像保存视频相关操作方法讲解读取视频从摄像头读取视频前言OpenCV（OpenSourceComputerVisionLibrary）作为一个强大的计算机视觉库，提供了丰富的图像处理和计算机视觉功能，尤其在图像识别、对象检测、视频分析等领域有着广泛的应用。本文将带领读者使用Pyt
Google 释出 Android 15 源代码 CIb0la 系统安全运维程序人生
Google向AndroidOpenSourceProject(AOSP)释出了Android15源代码。Android15将在未来几周内推送给Pixel手机，未来几个月推送给三星、摩托罗拉、一加和小米等厂商的兼容手机。Android15的新特性包括：简化passkey的登陆，防盗检测，改进大屏幕设备的多任务处理，应用访问限制，增强了屏幕阅读器TalkBack，集成GeminiAI用于图像的音频描
OpenCV3最常用的基本操作 HeoLis
OpenCV介绍OpenCV的全称是OpenSourceComputerVisionLibrary，是一个跨平台的计算机视觉库。OpenCV是由英特尔公司发起并参与开发，以BSD许可证授权发行，可以在商业和研究领域中免费使用。OpenCV可用于开发实时的图像处理、计算机视觉以及模式识别程序。该程序库也可以使用英特尔公司的IPP进行加速处理。以上是维基百科关于OpenCV的介绍，简单来说它就是处理图
PostgreSQL 数组类型使用详解捞起月亮的渔民丁 postgresql 数据库
PostgreSQL数组类型使用详解PostgreSQL数组类型使用详解可能大家对PostgreSQL这个关系型数据库不太熟悉，因为大部分人最熟悉的，公司用的最多的是MySQL我们先对PostgreSQL数据库（下面简称PG）简单的介绍一下，以后有机会，再单独写一篇专门介绍pgSql的文章TheWorld’sMostAdvancedOpenSourceRelationalDatabase这是PG官
Conda创建环境失败：000和404错误柚柚柚柚柚 conda
一、首先下载Anaconda1.打开网址Indexof/anaconda/archive/|清华大学开源软件镜像站|TsinghuaOpenSourceMirror，滑到最底部，下载Anaconda3-5.3.1-Linux-x86_64.sh。2.使用winscp拖动本地的Anaconda3-5.3.1-Linux-x86_64.sh到服务器的个人工作目录下。二、安装Anaconda软件，创建虚
webmin安装_如何在Ubuntu 18.04上安装Webmin cunchi4221 数据库 java linux python ubuntu
webmin安装AreyouaversetorunningcommandsonaterminalandinsteadprefermanagingyourLinuxsystemfromaGraphicalinterface?Webminisafreeandopensourceweb-basedcontrolpanelthatgivesuserstheabilitytocheckthesystem’s
探索开放5G核心网络新纪元：免费的free5GC 宗嫣惠
探索开放5G核心网络新纪元：免费的free5GCfree5gcOpensource5Gcorenetworkbaseon3GPPR15项目地址:https://gitcode.com/gh_mirrors/fr/free5gcfree5GC是一个致力于实现第五代移动通信（5G）核心网的开源项目。它的目标是构建符合3GPPRelease15及更高版本标准的5G核心网络。项目介绍作为自由且开放源码的解
2020/2/27 Linux 介绍成威_7991
Linux是操作系统，通常企业使用，免费，开源，字符界面。输入方式：command方式：(命令指令）键盘操作特点快捷简单效率高。系统稳定基本不重启。Linux的历史自由软件之父Richard.M.Stallman1984年发起GNU组织开发了copyleft:代表无版权。opensourcefree：源代码开放。GPL:通用版许可证协议。Linux之父LinusTorvalds1991年开发了Li
Plane Mobile 开源项目教程高慈鹃Faye
PlaneMobile开源项目教程plane-mobileMobileAppofPlane.OpenSourceJIRA,LinearandHeightAlternative.Planehelpsyoutrackyourissues,epics,andproductroadmapsinthesimplestwaypossible.项目地址:https://gitcode.com/gh_mirror
机器视觉-1 常用的机器视觉开发库 dingkm666 机器视觉机器学习
机器视觉-1常用的机器视觉开发库前言：工欲善其事必先利其器，选择一个合适的视觉开发库是在机器视觉领域的发展的重要基础。1.OpenCV（OpenSourceComputerVisionLibrary）简介:OpenCV是最著名和最广泛使用的开源计算机视觉库之一。由Intel于1999年开发，目前由OpenCV.org维护，支持C++、Python、Java和MATLAB等多种编程语言。功能:图像处
深度学习-OpenCV运用（3）红米煮粥深度学习 opencv 人工智能
文章目录一、简介二、OpenCV运用1.图片扩充2.图像阈值处理3.添加椒盐噪声三、总结一、简介深度学习（DeepLearning）与OpenCV（OpenSourceComputerVisionLibrary）的结合为计算机视觉领域带来了强大的解决方案。OpenCV是一个开源的计算机视觉和机器学习软件库，它提供了大量的视觉处理算法，包括但不限于图像和视频处理、特征检测、对象识别等。二、OpenC
Android CTS兼容性测试工具介绍闲暇部落 android
参考官方文档：兼容性测试套件|AndroidOpenSourceProject参考文章：Android---一篇带你搞懂CTS_androidcts-CSDN博客
Liunx入门 weixin_30252709 awk 操作系统
Linux是遵循GPL协议的unix-like操作系统。(opensource)。软件可移植性强。以下的基本知识和命令在ubuntu14.04测试可行：设置开机启动项：开机自动启动chromium-browsercd/etc/profile.dsudomkdirchromium.shsudochmod-R644chromium.sh向其中添加：nohupchromium-browser&>>/ho
Java导出分类到Excel 筱顾大men java excel 开发语言 easyexcel
需求在一般需求中点击导出按钮可以把所有的分类导出到Excel文件中。技术方案使用EasyExcel实现Excel的导出操作。https://github.com/alibaba/easyexcelhttps://easyexcel.opensource.alibaba.com/docs/current/quickstart/write#%E7%A4%BA%E4%BE%8B%E4%BB%A3%E7%
python用scrapy爬虫豆瓣_python爬虫框架scrapy 豆瓣实战 weixin_39745724
Scrapy官方介绍是Anopensourceandcollaborativeframeworkforextractingthedatayouneedfromwebsites.Inafast,simple,yetextensibleway.意思就是一个开源和协作框架，用于以快速，简单，可扩展的方式从网站中提取所需的数据。环境准备本文项目使用环境及工具如下python3scrapymongodbpy
适用于 Visual Studio 的 C++ 万能头 Xi-Xu visual studio c++算法
您可以通过star我固定的GitHub存储库来支持我，谢谢！以下是我的一些GitHub存储库，很有可能对您有用：ProxyEverything-OpenSource(PE-OS)QRGenerator-OpenSource(QG-OS)用于在VisualStudio上预编译的C++包含。此文件是GCC13.1.0中文件的修改版本，与VisualStudio兼容。修改由本文作者完成。修改版本是根据G
PROMETHEUS 2: An Open Source Language Model Specialized in Evaluating Other Language Models UnknownBody LLM Daily LLM Evaluation prometheus 开源语言模型自然语言处理
本文是LLM系列文章，针对《PROMETHEUS2:AnOpenSourceLanguageModelSpecializedinEvaluatingOtherLanguageModels》的翻译。PROMETHEUS2：一个专门用于评估其他语言模型的开源语言模型摘要1引言2相关工作3方法4实验设置5实验结果6讨论7结论摘要GPT-4等专有LM通常用于评估各种LM的响应质量。然而，包括透明度、可控性
Python本地安装whl文件详解与高级pip命令技巧杨超越luckly python php 大数据 pyqt numpy
有些情况我们pip一下包的时候会报错，可能因为延时或许其他不兼容的情况，这时候我们可以通过去网上下载该包的原文件，进行本地物理pip，在安装网上下载的whl之前，先明白不同后缀的差异；whl下载网址：清华大学开源软件镜像站|TsinghuaOpenSourceMirror在Python的生态环境中，.whl文件（全称为wheel文件）是一种预编译的二进制包，用于分发和安装Python库。whl的不
opencv处理图片（实战指南）富士达幸运星 opencv 人工智能计算机视觉
一、OpenCV简介OpenCV（OpenSourceComputerVisionLibrary）是一个开源的计算机视觉和机器学习软件库。它拥有众多的图像处理和计算机视觉功能，包括各种常用的图像处理技术，如滤波、边缘检测、特征提取等。OpenCV支持多种编程语言，如C++、Python、Java等，这使得它成为图像处理领域广泛使用的工具之一。二、实战演练1.图像读取与显示使用cv2.imread(
OpenCV（一个C++人工智能领域重要开源基础库）简介愚梦者 OpenCV 人工智能人工智能 opencv c++图像处理计算机视觉开源
返回：OpenCV系列文章目录（持续更新中......）上一篇：OpenCV4.9.0配置选项参考下一篇：OpenCV4.9.0开源计算机视觉库安装概述引言：OpenCV（全称OpenSourceComputerVisionLibrary）是一个基于开放源代码发行的跨平台计算机视觉库，可以用来进行图像处理、计算机视觉和机器学习等领域的开发。该库由英特尔公司于1999年开始开发，最初是为了加速处理器
docker-ce安装蚁景网络安全 docker eureka 容器
安装docker-ce使用清华镜像源加速安装docker-ce原文：docker-ce|镜像站使用帮助|清华大学开源软件镜像站|TsinghuaOpenSourceMirror#方法一exportDOWNLOAD_URL="https://mirrors.tuna.tsinghua.edu.cn/docker-ce"#如果使用curl，执行如下命令curl-fsSLhttps://get.dock
Headscale组网教程 leiax00 工具 DOC
Headscale组网教程Tailscale基础教程：Headscale的部署方法和使用教程GitHub-gurucomputing/headscale-ui:AwebfrontendfortheheadscaleTailscale-compatiblecoordinationserverGitHub-juanfont/headscale:Anopensource,self-hostedimple
Mac 离线安装Qt5 熊明之 mac c++
如果使用brewinstallqt发生不明原因报错，可以尝试离线下载qt！！！1下载QT1.1.打开链接：https://download.qt.io/archive/qt/在这个链接上，可以看到不同版本的QT，我们选择稳定5.9/点开后，选择5.9.8版本，可以看到不同版本的QT，选择Mac本QTqt-opensource-mac-x64-5.9.8.dmg；下载后安装；1.2首次使用qt会出现
OpenCV：开源计算机视觉的魔力之门 mikes zhang 计算机视觉
在当今这个信息爆炸的时代，图像和视频已经成为我们获取和传递信息的主要方式之一。从社交媒体上的照片分享，到安防监控、自动驾驶等领域的图像识别与处理，计算机视觉技术正日益改变着我们的生活。而在这场技术革命中，OpenCV（OpenSourceComputerVisionLibrary）这一开源计算机视觉库扮演着举足轻重的角色。本文将带你走进OpenCV的世界，一探其究竟。一、OpenCV简介OpenC
Java实现的基于模板的网页结构化信息精准抽取组件：HtmlExtractor yangshangchuan 信息抽取 HtmlExtractor 精准抽取信息采集
HtmlExtractor是一个Java实现的基于模板的网页结构化信息精准抽取组件，本身并不包含爬虫功能，但可被爬虫或其他程序调用以便更精准地对网页结构化信息进行抽取。 HtmlExtractor是为大规模分布式环境设计的，采用主从架构，主节点负责维护抽取规则，从节点向主节点请求抽取规则，当抽取规则发生变化，主节点主动通知从节点，从而能实现抽取规则变化之后的实时动态生效。如
java编程思想 -- 多态百合不是茶 java 多态详解
一: 向上转型和向下转型面向对象中的转型只会发生在有继承关系的子类和父类中（接口的实现也包括在这里）。父类：人子类：男人向上转型： Person p = new Man() ; //向上转型不需要强制类型转化向下转型： Man man =
[自动数据处理]稳扎稳打,逐步形成自有ADP系统体系 comsci dp
对于国内的IT行业来讲,虽然我们已经有了"两弹一星",在局部领域形成了自己独有的技术特征,并初步摆脱了国外的控制...但是前面的路还很长.... 首先是我们的自动数据处理系统还无法处理很多高级工程...中等规模的拓扑分析系统也没有完成,更加复杂的
storm 自定义日志文件商人shang storm cluster logback
Storm中的日志级级别默认为INFO，并且，日志文件是根据worker号来进行区分的，这样，同一个log文件中的信息不一定是一个业务的，这样就会有以下两个需求出现： 1. 想要进行一些调试信息的输出 2. 调试信息或者业务日志信息想要输出到一些固定的文件中不要怕，不要烦恼，其实Storm已经提供了这样的支持，可以通过自定义logback 下的 cluster.xml 来输
Extjs3 SpringMVC使用 @RequestBody 标签问题记录 21jhf
springMVC使用 @RequestBody(required = false) UserVO userInfo 传递json对象数据，往往会出现http 415，400,500等错误，总结一下需要使用ajax提交json数据才行，ajax提交使用proxy，参数为jsonData，不能为params；另外，需要设置Content-type属性为json，代码如下：（由于使用了父类aaa
一些排错方法文强chu 方法
1、java.lang.IllegalStateException: Class invariant violation at org.apache.log4j.LogManager.getLoggerRepository(LogManager.java:199)at org.apache.log4j.LogManager.getLogger(LogManager.java:228) at o
Swing中文件恢复我觉得很难小桔子 swing
我那个草了！老大怎么回事，怎么做项目评估的？只会说相信你可以做的，试一下，有的是时间！用java开发一个图文处理工具，类似word，任意位置插入、拖动、删除图片以及文本等。文本框、流程图等，数据保存数据库，其余可保存pdf格式。ok,姐姐千辛万苦，
php 文件操作 aichenglong PHP 读取文件写入文件
1 写入文件 @$fp=fopen("$DOCUMENT_ROOT/order.txt", "ab"); if(!$fp){ echo "open file error" ; exit; } $outputstring="date:"." \t tire:".$tire."
MySQL的btree索引和hash索引的区别 AILIKES 数据结构 mysql 算法
Hash 索引结构的特殊性，其检索效率非常高，索引的检索可以一次定位，不像B-Tree 索引需要从根节点到枝节点，最后才能访问到页节点这样多次的IO访问，所以 Hash 索引的查询效率要远高于 B-Tree 索引。可能很多人又有疑问了，既然 Hash 索引的效率要比 B-Tree 高很多，为什么大家不都用 Hash 索引而还要使用 B-Tree 索引呢
JAVA的抽象--- 接口 --实现百合不是茶
抽象接口实现接口 //抽象类 ,方法 //定义一个公共抽象的类 ,并在类中定义一个抽象的方法体抽象的定义使用abstract abstract class A 定义一个抽象类例如： //定义一个基类 public abstract class A{ //抽象类不能用来实例化，只能用来继承 //
JS变量作用域实例 bijian1013 作用域
<script> var scope='hello'; function a(){ console.log(scope); //undefined var scope='world'; console.log(scope); //world console.log(b);
TDD实践（二） bijian1013 java TDD
实践题目：分解质因数 Step1：单元测试： package com.bijian.study.factor.test; import java.util.Arrays; import junit.framework.Assert; import org.junit.Before; import org.junit.Test; import com.bijian.
[MongoDB学习笔记一]MongoDB主从复制 bit1129 mongodb
MongoDB称为分布式数据库，主要原因是1.基于副本集的数据备份， 2.基于切片的数据扩容。副本集解决数据的读写性能问题，切片解决了MongoDB的数据扩容问题。事实上，MongoDB提供了主从复制和副本复制两种备份方式，在MongoDB的主从复制和副本复制集群环境中，只有一台作为主服务器，另外一台或者多台服务器作为从服务器。本文介绍MongoDB的主从复制模式，需要指明
【HBase五】Java API操作HBase bit1129 hbase
import java.io.IOException; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.hbase.HBaseConfiguration; import org.apache.hadoop.hbase.HColumnDescriptor; import org.apache.ha
python调用zabbix api接口实时展示数据 ronin47
zabbix api接口来进行展示。经过思考之后，计划获取如下内容： 1、获得认证密钥 2、获取zabbix所有的主机组 3、获取单个组下的所有主机 4、获取某个主机下的所有监控项
jsp取得绝对路径 byalias 绝对路径
在JavaWeb开发中，常使用绝对路径的方式来引入JavaScript和CSS文件，这样可以避免因为目录变动导致引入文件找不到的情况，常用的做法如下：一、使用${pageContext.request.contextPath} 　　代码” ${pageContext.request.contextPath}”的作用是取出部署的应用程序名，这样不管如何部署，所用路径都是正确的。
Java定时任务调度：用ExecutorService取代Timer bylijinnan java
《Java并发编程实战》一书提到的用ExecutorService取代Java Timer有几个理由，我认为其中最重要的理由是：如果TimerTask抛出未检查的异常，Timer将会产生无法预料的行为。Timer线程并不捕获异常，所以 TimerTask抛出的未检查的异常会终止timer线程。这种情况下，Timer也不会再重新恢复线程的执行了;它错误的认为整个Timer都被取消了。此时，已经被
SQL 优化原则 chicony sql
一、问题的提出　在应用系统开发初期，由于开发数据库数据比较少，对于查询SQL语句，复杂视图的的编写等体会不出SQL语句各种写法的性能优劣，但是如果将应用系统提交实际应用后，随着数据库中数据的增加，系统的响应速度就成为目前系统需要解决的最主要的问题之一。系统优化中一个很重要的方面就是SQL语句的优化。对于海量数据，劣质SQL语句和优质SQL语句之间的速度差别可以达到上百倍，可见对于一个系统
java 线程弹球小游戏 CrazyMizzz java 游戏
最近java学到线程，于是做了一个线程弹球的小游戏，不过还没完善这里是提纲 1.线程弹球游戏实现 1.实现界面需要使用哪些API类 JFrame JPanel JButton FlowLayout Graphics2D Thread Color ActionListener ActionEvent MouseListener Mouse
hadoop jps出现process information unavailable提示解决办法 daizj hadoop jps
hadoop jps出现process information unavailable提示解决办法 jps时出现如下信息： 3019 -- process information unavailable3053 -- process information unavailable2985 -- process information unavailable2917 --
PHP图片水印缩放类实现 dcj3sjt126com PHP
<?php class Image{ private $path; function __construct($path='./'){ $this->path=rtrim($path,'/').'/'; } //水印函数，参数：背景图，水印图，位置，前缀,TMD透明度 public function water($b,$l,$pos
IOS控件学习：UILabel常用属性与用法 dcj3sjt126com ios UILabel
参考网站： http://shijue.me/show_text/521c396a8ddf876566000007 http://www.tuicool.com/articles/zquENb http://blog.csdn.net/a451493485/article/details/9454695 http://wiki.eoe.cn/page/iOS_pptl_artile_281
完全手动建立maven骨架 eksliang java eclipse Web
建一个 JAVA 项目： mvn archetype:create -DgroupId=com.demo -DartifactId=App [-Dversion=0.0.1-SNAPSHOT] [-Dpackaging=jar] 建一个 web 项目： mvn archetype:create -DgroupId=com.demo -DartifactId=web-a
配置清单 gengzg 配置
1、修改grub启动的内核版本 vi /boot/grub/grub.conf 将default 0改为1 拷贝mt7601Usta.ko到/lib文件夹拷贝RT2870STA.dat到 /etc/Wireless/RT2870STA/文件夹拷贝wifiscan到bin文件夹，chmod 775 /bin/wifiscan 拷贝wifiget.sh到bin文件夹，chm
Windows端口被占用处理方法 huqiji windows
以下文章主要以80端口号为例，如果想知道其他的端口号也可以使用该方法..........................1、在windows下如何查看80端口占用情况?是被哪个进程占用?如何终止等. 这里主要是用到windows下的DOS工具,点击"开始"--"运行",输入&
开源ckplayer 网页播放器，跨平台(html5, mobile)，flv, f4v, mp4, rtmp协议. webm, ogg, m3u8 ！天梯梦 mobile
CKplayer，其全称为超酷flv播放器，它是一款用于网页上播放视频的软件，支持的格式有：http协议上的flv,f4v,mp4格式，同时支持rtmp视频流格式播放，此播放器的特点在于用户可以自己定义播放器的风格，诸如播放/暂停按钮，静音按钮，全屏按钮都是以外部图片接口形式调用，用户根据自己的需要制作出播放器风格所需要使用的各个按钮图片然后替换掉原始风格里相应的图片就可以制作出自己的风格了，
简单工厂设计模式 hm4123660 java 工厂设计模式简单工厂模式
简单工厂模式（Simple Factory Pattern）属于类的创新型模式，又叫静态工厂方法模式。是通过专门定义一个类来负责创建其他类的实例，被创建的实例通常都具有共同的父类。简单工厂模式是由一个工厂对象决定创建出哪一种产品类的实例。简单工厂模式是工厂模式家族中最简单实用的模式，可以理解为是不同工厂模式的一个特殊实现。
maven笔记 zhb8015 maven
跳过测试阶段： mvn package -DskipTests 临时性跳过测试代码的编译： mvn package -Dmaven.test.skip=true maven.test.skip同时控制maven-compiler-plugin和maven-surefire-plugin两个插件的行为，即跳过编译，又跳过测试。指定测试类 mvn test
非mapreduce生成Hfile，然后导入hbase当中 Stark_Summer map hbase reduce Hfile path实例
最近一个群友的boss让研究hbase，让hbase的入库速度达到5w+/s，这可愁死了，4台个人电脑组成的集群，多线程入库调了好久，速度也才1w左右，都没有达到理想的那种速度，然后就想到了这种方式，但是网上多是用mapreduce来实现入库，而现在的需求是实时入库，不生成文件了，所以就只能自己用代码实现了，但是网上查了很多资料都没有查到，最后在一个网友的指引下，看了源码，最后找到了生成Hfile
jsp web tomcat 编码问题王新春 tomcat jsp pageEncode
今天配置jsp项目在tomcat上，windows上正常，而linux上显示乱码，最后定位原因为tomcat 的server.xml 文件的配置，添加 URIEncoding 属性： <Connector port="8080" protocol="HTTP/1.1" connectionTi

Paoding Analyzer 庖丁 解牛 分词

你可能感兴趣的:(OPENSOURCE)

Paoding Analyzer 庖丁解牛分词