wisdombrave

Paoding Analyzer 庖丁解牛分词

Paoding Analyzer
庖丁解牛

je分词用lucene.中文分词庖丁解牛

一般使用
使用评估
参考资料
下载
开始使用
分词策略

效果体验
在命令行模式下执行analyzer.bat(windows)或analyzer.sh(linux)即可0
u       显示帮助
E:\Paoding-Analysis>analyzer.bat ?
u       分词对话
多次输入或粘贴不同的文字内容，查看分词效果，如：
E:\Paoding-Analysis>analyzer.bat
paoding> |
此时使用者可以在光标所在所在位置(|)输入或粘贴待分词的内容(以分号结束)，按下Enter键换行，analyzer.bat便可以输出分词结果。
paoding> 中文分词;
1:      中文/分词/
        分词器net.paoding.analysis.analyzer.PaodingAnalyzer
        内容长度 4字符，分 2个词
        分词耗时 0ms
--------------------------------------------------
分词完毕后，又会进入以上对话模式。
键入:e或:q退出会话 (包括:符号) 。
键入:?显示帮助(包括:符号) 。

u 对文件进行分词
analyzer.bat允许对指定的文件进行分词体验。文件以路径名给出可以使绝对地址、相对当前目录的地址，或以classpath:为前缀的类路径地址。示例如下:
paoding> :-f E:/content.txt
paoding> :-f E:/content.txt -c gbk
paoding> :-f E:/content.txt -c gbk -m max

开始使用
第一步：安装词典
将程序存储在某个目录下，这个目录称为安装目录！
将程序拷贝到安装目录称为安装程序！
增加、删除、修改程序称为自定制程序！

第二步：配置词典系统环境变量
庖丁中文分词需要一套词典，使用者安装辞典后，应该设置系统环境变量PAODING_DIC_HOME指向词典安装目录。
在windows下，通过“我的电脑”属性之“高级”选项卡，然后在进入“环境变量”编辑区，新建环境变量，设置“变量名”为PAODING_DIC_HOME；“变量值”为E:/data/paoding/dic
工程中使用分词，dic文件包copy到 web-info/classes 下面！

第三步：将庖丁JAR类库导入工程
将paoding-analysis.jar添加到工程。
至此，便可以在应用代码中使用庖丁提供的中文分析器了。

提醒：以下示例代码中的IDNEX_PATH表示索引库地址，读者运行以下代码前，应该赋与一个不重要的地址，比如/data/paoding/test_index 或E:/paoding_test_index，以免一时疏忽将重要数据丢失。

package net.paoding.analysis;

import net.paoding.analysis.analyzer.PaodingAnalyzer;

import org.apache.lucene.analysis.Analyzer;
import org.apache.lucene.analysis.TokenStream;
import org.apache.lucene.document.Document;
import org.apache.lucene.document.Field;
import org.apache.lucene.index.IndexReader;
import org.apache.lucene.index.IndexWriter;
import org.apache.lucene.index.TermPositionVector;
import org.apache.lucene.queryParser.QueryParser;
import org.apache.lucene.search.Hits;
import org.apache.lucene.search.IndexSearcher;
import org.apache.lucene.search.Query;
import org.apache.lucene.search.Searcher;
import org.apache.lucene.search.highlight.Formatter;
import org.apache.lucene.search.highlight.Highlighter;
import org.apache.lucene.search.highlight.QueryScorer;
import org.apache.lucene.search.highlight.TokenGroup;
import org.apache.lucene.search.highlight.TokenSources;

/**
 * 创建索引库
 * @author Administrator
 *
 */
public class CreateIndexLibTest {
	public static void main(String[] args) throws Exception {
		
		/** 创建分词 */
		// 词典目录
		String path = "D:\\Java\\paoding_analyzer\\dic";
		// 庖丁解牛中文分词器
		Analyzer analyzer = new PaodingAnalyzer();
		// 索引书写器
		IndexWriter writer = new IndexWriter(path, analyzer, true);
		// 文档
		Document doc = new Document();
		// 字段
		Field field = new Field(
				"content", 									// name
				"你好，世界!", 								// value
				Field.Store.YES,							// store
				Field.Index.TOKENIZED, 						// index
				Field.TermVector.WITH_POSITIONS_OFFSETS);	// termVector
		doc.add(field);				// 文档添加字段
		writer.addDocument(doc);	// 索引书写器添加文档
		writer.close();
		System.out.println("Indexed success!");
		 
		/** 搜索关键词 */
		// 索引读取器
		IndexReader reader = IndexReader.open(path);
		// 查询解析器
		QueryParser parser = new QueryParser("content", analyzer);
		Query query = parser.parse("你好");	// 解析
		// 搜索器
		Searcher searcher = new IndexSearcher(reader);
		// 命中
		Hits hits = searcher.search(query);
		if (hits.length() == 0) {
		    System.out.println("hits.length=0");
		}
		
		/** 高亮显示搜索的关键词 */	
		Document doc2 = hits.doc(0);
		//高亮处理
		String text = doc2.get("content");
		// 条件位置载体
		TermPositionVector tpv = (TermPositionVector) reader.getTermFreqVector(// 获得条件次数载体
		                0, "content");
		// 记号流
		TokenStream ts = TokenSources.getTokenStream(tpv);
		// 格式化器
		Formatter formatter = new Formatter() {
			// 高亮条件
		    public String highlightTerm(String srcText, TokenGroup g) {
		        if (g.getTotalScore() <= 0) {
		            return srcText;
		        }
		        return "<b>" + srcText + "</b>";
		    }
		};
		// 高亮器
		Highlighter highlighter = new Highlighter(
				formatter, 
				new QueryScorer(query));	// 查询记录员
		// 获得最好的片段
		String result = highlighter.getBestFragments(ts, text, 5, "…");
		System.out.println("result:\n\t" + result);
		reader.close();

	}
}

package net.paoding.analysis;

import java.io.StringReader;

import junit.framework.TestCase;
import net.paoding.analysis.analyzer.PaodingAnalyzer;

import org.apache.lucene.analysis.Token;
import org.apache.lucene.analysis.TokenStream;
/**
 * 解析器单元测试(JUnit)
 * @author Administrator
 *
 */
public class AnalyzerTest extends TestCase {

	protected PaodingAnalyzer analyzer = new PaodingAnalyzer();

	protected StringBuilder sb = new StringBuilder();

	/**
	 * 解剖分词
	 * @param input
	 * @return
	 */
	protected String dissect(String input) {
		try {
			TokenStream ts = analyzer.tokenStream("", new StringReader(input));
			Token token;
			sb.setLength(0);
			while ((token = ts.next()) != null) {
				sb.append(token.termText()).append('/');
			}
			if (sb.length() > 0) {
				sb.setLength(sb.length() - 1);
			}
			System.out.println(sb.toString());
			return sb.toString();
		} catch (Exception e) {
			e.printStackTrace();
			return "error";
		}
	}

	/**
	 * 断言值: 预测的分词
	 * 结果值：词典中的分词
	 * 解剖关键字 "a",返回"",表示在词典分词策略中字母(a)不是一个分词
	 * 断言结果为Green bar 表示，返回的结果与断言中的结果相同。
	 */
	public void test000() {
		String result = dissect("a");
		assertEquals("", result);		// (断言值,结果值)
	}

	/**
	 *
	 */
	public void test001() {
		String result = dissect("空格 a 空格");
		assertEquals("空格/空格", result);
	}

	/**
	 *
	 */
	public void test002() {
		String result = dissect("A座");
		assertEquals("a座", result);
	}
	
	/**
	 *
	 */
	public void test003() {
		String result = dissect("u盘");
		assertEquals("u盘", result);
	}

	public void test004() {
		String result = dissect("刚买的u盘的容量");
		assertEquals("刚/买的/u盘/容量", result);	// 中文分词效果
	}
	
	public void test005() {
		String result = dissect("K歌之王很好听");
		assertEquals("k歌之王/很好/好听", result);
	}
	// --------------------------------------------------------------
	// 仅包含词语的句子分词策略
	// --------------------------------------------------------------

	/**
	 * 句子全由词典词语组成，但词语之间没有包含、交叉关系
	 */
	public void test100() {
		String result = dissect("台北中文国际");
		assertEquals("台北/中文/国际", result);
	}

	/**
	 * 句子全由词典词语组成，但词语之间有包含关系
	 */
	public void test101() {
		String result = dissect("北京首都机场");
		assertEquals("北京/首都/机场", result);
	}

	/**
	 * 句子全由词典词语组成，但词语之间有交叉关系
	 */
	public void test102() {
		String result = dissect("东西已经拍卖了");
		assertEquals("东西/已经/拍卖/卖了", result);
	}

	/**
	 * 句子全由词典词语组成，但词语之间有包含、交叉等复杂关系
	 */
	public void test103() {
		String result = dissect("羽毛球拍");
		assertEquals("羽毛/羽毛球/球拍", result);
	}

	// --------------------------------------------------------------
	// noise(噪音)词汇和单字的分词策略
	// --------------------------------------------------------------

	/**
	 * 词语之间有一个noise字(的)
	 */
	public void test200() {
		String result = dissect("足球的魅力");
		assertEquals("足球/魅力", result);
	}

	/**
	 * 词语之间有一个noise词语(因之)
	 */
	public void test201() {
		String result = dissect("主人因之生气");
		assertEquals("主人/生气", result);
	}

	/**
	 * 词语前后分别有单字和双字的noise词语(与,有关)
	 */
	public void test202() {
		String result = dissect("与谋杀有关");
		assertEquals("谋杀", result);
	}

	/**
	 * 前有noise词语(哪怕)，后面跟随了连续的noise单字(了,你)
	 */
	public void test203() {
		String result = dissect("哪怕朋友背叛了你");
		assertEquals("朋友/背叛", result);
	}

	/**
	 * 前后连续的noise词汇(虽然,某些)，词语中有noise单字(很)
	 */
	public void test204() {
		String result = dissect("虽然某些动物很凶恶");
		assertEquals("动物/凶恶", result);
	}

	// --------------------------------------------------------------
	// 词典没有收录的字符串的分词策略
	// --------------------------------------------------------------

	
	/**
	 * 仅1个字的非词汇串(东,西,南,北)
	 */
	public void test300() {
		String result = dissect("东&&西&&南&&北");
		assertEquals("东/西/南/北", result);
	}

	
	/**
	 * 仅两个字的非词汇串(古哥,谷歌,收狗,搜狗)
	 */
	public void test302() {
		String result = dissect("古哥&&谷歌&&收狗&&搜狗");
		assertEquals("古哥/谷歌/收狗/搜狗", result);
	}
	
	/**
	 * 多个字的非词汇串
	 */
	public void test303() {
		String result = dissect("这是鸟语：玉鱼遇欲雨");
		assertEquals("这是/鸟语/玉鱼/鱼遇/遇欲/欲雨", result);
	}
	
	/**
	 * 两个词语之间有一个非词汇的字(真)
	 */
	public void test304() {
		String result = dissect("朋友真背叛了你了!");
		assertEquals("朋友/真/背叛", result);
	}
	
	/**
	 * 两个词语之间有一个非词汇的字符串(盒蟹)
	 */
	public void test305() {
		String result = dissect("建设盒蟹社会");
		assertEquals("建设/盒蟹/社会", result);
	}
	
	/**
	 * 两个词语之间有多个非词汇的字符串(盒少蟹)
	 */
	public void test306() {
		String result = dissect("建设盒少蟹社会");
		assertEquals("建设/盒少/少蟹/社会", result);
	}

	// --------------------------------------------------------------
	// 不包含小数点的汉字数字
	// --------------------------------------------------------------


	/**
	 * 单个汉字数字
	 */
	public void test400() {
		String result = dissect("二");
		assertEquals("2", result);
	}

	/**
	 * 两个汉字数字
	 */
	public void test61() {
		String result = dissect("五六");
		assertEquals("56", result);
	}

	/**
	 * 多个汉字数字
	 */
	public void test62() {
		String result = dissect("三四五六");
		assertEquals("3456", result);
	}

	/**
	 * 十三
	 */
	public void test63() {
		String result = dissect("十三");
		assertEquals("13", result);
	}

	/**
	 * 二千
	 */
	public void test65() {
		String result = dissect("二千");
		assertEquals("2000", result);
	}

	/**
	 * 两千
	 */
	public void test651() {
		String result = dissect("两千");
		assertEquals("2000", result);
	}
	/**
	 * 两千
	 */
	public void test6511() {
		String result = dissect("两千个");
		assertEquals("2000/个", result);
	}

	/**
	 * 2千
	 */
	public void test652() {
		String result = dissect("2千");
		assertEquals("2000", result);
	}
	
	/**
	 * 
	 */
	public void test653() {
		String result = dissect("3千万");
		assertEquals("30000000", result);
	}
	
	/**
	 * 
	 */
	public void test654() {
		String result = dissect("3千万个案例");
		assertEquals("30000000/个/案例", result);
	}


	/**
	 * 
	 */
	public void test64() {
		String result = dissect("千万");
		assertEquals("千万", result);
	}

	public void test66() {
		String result = dissect("两两");
		assertEquals("两两", result);
	}

	public void test67() {
		String result = dissect("二二");
		assertEquals("22", result);
	}

	public void test68() {
		String result = dissect("2.2两");
		assertEquals("2.2/两", result);
	}

	public void test69() {
		String result = dissect("二两");
		assertEquals("2/两", result);
	}


	public void test690() {
		String result = dissect("2两");
		assertEquals("2/两", result);
	}

	public void test691() {
		String result = dissect("2千克");
		assertEquals("2000/克", result);
	}

	public void test692() {
		String result = dissect("2公斤");
		assertEquals("2/公斤", result);
	}

	public void test693() {
		String result = dissect("2世纪");
		assertEquals("2/世纪", result);
	}

	public void test7() {
		String result = dissect("哪怕二");
		assertEquals("2", result);
	}

}

批处理脚本基础知识快速掌握感叹号的豆浆 c++
一、批处理脚本概述定义批处理脚本是一种基于命令行的自动化脚本语言，通过.bat或.cmd文件保存，由Windows系统的cmd.exe解释器执行。核心作用自动化重复性任务（如文件操作、系统配置）批量处理文件（搜索、复制、删除）集成命令行工具（如ping、netstat）简单的系统管理（服务控制、注册表操作）执行环境原生支持：WindowsCMD.EXEPowerShell兼容：可通过&或call调
批处理脚本NTP服务Windows操作系统时间同步设置感叹号的豆浆 windows 自然语言处理
脚本如下：///创建时间同步服务@echooff@echooff&&@chcp65001>nulsetlocalenabledelayedexpansion::设置版本号set"o=cls&echo"&set“z=&&echo.&echo按任意键或等待15秒后自动退出本界面&&timeout/t15&&exit”modeconlines=10cols=60&&netsession1>NUL2>NU
脚本编译vs工程_使用msbuild miffy888
MSBuild是在.NET2.0中引入的针对VisualStudio的构建系统。它可以执行构建脚本，完成各种Task──最主要的是把.NET项目编译成可执行文件或者DLL。从技术角度来说，制作EXE或者DLL的重要工作是由编译器（csc，vbc等等）完成的。MSBuild会从内部调用编译器，并完成其他必要的工作（例如拷贝引用──CopyLocal，执行构建前后的准备及清理工作等）。为什么要用脚本编
零基础怎么开始学网络安全（非常详细）零基础入门到精通，收藏这一篇就够了程序员羊羊 web安全安全网络 php 学习
一、学习建议1.了解基础概念：开始之前，了解网络安全的基本概念和术语是很重要的。你可以查找网络安全入门教程或在线课程，了解网络安全领域的基本概念，如黑客、漏洞、攻击类型等。2.网络基础知识：学习计算机网络基础知识，了解网络通信原理，不同网络协议（如TCP/IP）的工作方式，以及网络拓扑结构等。3.操作系统知识：了解常见的操作系统，特别是Windows和Linux。掌握基本的命令行操作和系统管理技能
Linux篇1-初识Linux 逃跑的机械工 Linux linux
1.Linux能干什么Linux能够进行各种语言的开发工作，基本主要以后端语言为主C++，JAVA,python;Linux能进行各种指令操作，从而完成各种的文件相关的管理工作2.Linux基本指令2.1ls指令在Linux中，以.开头的文件，叫做隐藏文件；ls-a显示隐藏文件隐藏文件：Linux配置文件，可以隐藏起来，防止误操作，起到保护作用；ls-l列出文件的详细信息-d将目录象文件一样显示，
C语言每日一练——day_9 Run_Teenage C语言入门练习题 c语言开发语言
引言针对初学者，每日练习几个题，快速上手C语言。第九天。（连续更新中）采用在线OJ的形式什么是在线OJ？在线判题系统（英语：OnlineJudge，缩写OJ）是一种在编程竞赛中用来测试参赛程序的在线系统，也可以用于平时的练习。详细内容可以看一下这篇博客：关于C/C++语言的初学者在哪刷题，怎么刷题-CSDN博客https://blog.csdn.net/2401_88433210/article/
C语言每日一练——day_6 Run_Teenage C语言入门练习题 c语言开发语言
引言针对初学者，每日练习几个题，快速上手C语言。第六天。（连续更新中）采用在线OJ的形式什么是在线OJ？在线判题系统（英语：OnlineJudge，缩写OJ）是一种在编程竞赛中用来测试参赛程序的在线系统，也可以用于平时的练习。详细内容可以看一下这篇博客：关于C/C++语言的初学者在哪刷题，怎么刷题-CSDN博客https://blog.csdn.net/2401_88433210/article/
C语言每日一练——day_8 Run_Teenage C语言入门练习题 c语言开发语言
引言针对初学者，每日练习几个题，快速上手C语言。第八天。（连续更新中）采用在线OJ的形式什么是在线OJ？在线判题系统（英语：OnlineJudge，缩写OJ）是一种在编程竞赛中用来测试参赛程序的在线系统，也可以用于平时的练习。详细内容可以看一下这篇博客：关于C/C++语言的初学者在哪刷题，怎么刷题-CSDN博客https://blog.csdn.net/2401_88433210/article/
C#实战：使用ZXing.NET库轻松生成二维码与条形码墨瑾轩一起学学C#【一】c#.net 开发语言
下面我将详细介绍C#中用于生成二维码和条形码的库——ZXing.NET，并附带一份详细的代码示例，其中每行代码均配有注释以解释其功能。ZXing.NET是基于开源项目ZXing（ZebraCrossing）的.NET移植版，它提供了生成和解析多种一维条形码和二维二维码的功能。准备工作首先，确保您已通过NuGet包管理器在项目中安装了ZXing.NET库。在VisualStudio中，可以通过以下步
Linux GDB print pretty 小米人er 我的博客 linux gdb
在GDB（GNU调试器）中，setprintprettyon是一个用于格式化结构体和联合体输出的命令。它的核心作用是让GDB在打印复杂数据类型（如结构体、联合体或类）时，以更易读的缩进和换行格式显示内容，而不是将所有字段挤在一行。以下是详细解释：1.命令的作用默认行为：默认情况下，GDB打印结构体或联合体时，所有字段会显示在一行中，例如：(gdb)pmy_struct$1={field1=42,f
mkcert 极简安装及使用步骤学亮编程手记 Linux ssl
1.安装mkcertmacOSbrewinstallmkcertLinuxsudoaptinstalllibnss3-toolscurl-JLO"https://dl.filippo.io/mkcert/latest?for=linux/amd64"chmod+xmkcert-v*-linux-amd64sudomvmkcert-v*-linux-amd64/usr/local/bin/mkcer
一款适用于 Windows 、Mac 和 Linux 的屏幕录制与截图软件。 Mbblovey 开发语言开源软件电脑 java
Screenrec是一款适用于Windows、Mac和Linux的屏幕录制与截图软件。软件本身可以免费使用，只需要登录即可使用全部功能。当咱们打开软件后，电脑右边就会出现一个小漂浮窗。点击上方的图标就能一键开启视频录制、截屏等功能。Screenrec很有意思的是可以在开始录制屏幕的同时录制咱们的网络摄像头视频和麦克风音频。在录制完成后大家可能会发现右下角软件会给大家发出一个提醒。这就是它的另一个特
Linux安装Anaconda和Jupyter 硬水果糖人工智能 Linux linux jupyter 运维
一、了解Anaconda和Jupyter引言：Anaconda是一个流行的开源数据科学平台，广泛用于数据分析、机器学习、人工智能等领域。它是一个集成了大量科学计算和数据科学工具的Python和R编程语言环境。Anaconda的主要目标是简化数据科学和机器学习的开发流程，提供一个易于安装和管理的环境。而预装了大量常用的Python和R库，这些库涵盖了数据科学的各个方面，包括：数据分析：Pandas、
glm-4v-9b 踩坑（4-bit量化，bitsandbytes 异常） phynikesi pytorch glm-4v-9b踩坑 bitsandbytes异常
前言本文只分享了自己在体验glm-4v-9b过程中遇到的问题，没有涉及对模型本身以及更多问题的分析，大家可先看问题描述，再决定是否看下去。实验平台：linux系统，RTXA4000。嫌麻烦的可以直接到文未看结论。问题描述16g显卡难以加载模型bitsandbytes异常，模型无法运行加载问题本人设备有限，引用一下别人完整加载模型的数据，大约18.9g。用16g显卡直接报OOM，用8-bit加载还是
高通成都linux engineer intern 一面面经 han_xue_feng java
题解|#KNN算法#在*******里有个叫《题解--2024华南理工校赛.pdf》的文件高通成都linuxengineerintern一面面经两个面试官共25min就结束了，面试氛围还可以，问的很快。1.自我介绍2.问对高通了解多少3.对牛客鼠人传（第四十四集，2024/4/22）刷题：尝试补昨天D，题解看了半天似懂非懂，遂放弃改天再补。做题老是把复杂的问题想简单，简单的问题想复京东物流管理培训
python中datetime模块 a1111111111ss python python
参考大佬cmzsteven双手奉上大佬的网址https://blog.csdn.net/cmzsteven/article/details/64906245datetime模块中包含如下类：2、通过year,month,day三个数据描述符可以进行访问：date对象由year年份、month月份及day日期三部分构成：date（year，month，day)>>>a=datetime.date.t
uni-app——计时器和界面交互API 阿常11 uni-app移动应用开发 uni-app
API基本概要概念说明API（应用程序接口）是预先定义的方法集合，用于实现特定功能。在uni-app中，通过全局对象uni调用API，例如uni.getSystemInfoSync获取设备信息。API分类与调用规则事件监听型以on开头，如uni.onNetworkStatusChange监听网络变化。数据操作型获取数据：以get开头，如uni.getStorage读取本地缓存。设置数据：以set开
高级java每日一道面试题-2025年3月06日-微服务篇[Eureka篇]-Eureka Server和Eureka Client关系? java我跟你拼了 java每日一道面试题 java 微服务 eureka
如果有遗漏,评论区告诉我进行补充面试官:EurekaServer和EurekaClient关系?我回答:在微服务架构中，Eureka作为Netflix开源的服务发现组件，由EurekaServer（服务端）和EurekaClient（客户端）两大部分组成。这两者通过紧密协作实现服务的注册、发现与健康管理，是确保微服务间通信顺畅的关键。以下是对EurekaServer和EurekaClient关系的
基于oracle linux的 DBI/DBD 标准化安装文档(三) oracle
一、安装DBIDBI(DatabaseInterface)是perl连接数据库的接口。其是perl连接数据库的最优方法，他支持包括Orcale,Sybase,mysql,db2等绝大多数的数据库，下面将简要介绍其安装方法。1.1解压tar-zxvfDBI-1.616_901.tar.gz1.2安装依赖yuminstallperl-ExtUtils-CBuilderperl-ExtUtils-Mak
linux find 命令超全完整指南疑犯 linux 服务器 find命令
linuxfind命令超全完整指南一、基础语法与工作逻辑find[起始路径][表达式][操作]起始路径：指定搜索根目录，默认为当前目录.。支持多路径（如find/etc/var）表达式：定义搜索条件（如文件名、类型、时间等）。操作：对匹配文件执行命令（如删除、压缩等）。二、核心查找条件详解1.按名称查找精确匹配：-name"文件名"find/home-name"example.txt"#精确查找文
数据中台（二）数据中台相关技术栈 Yuan_CSDF #数据中台
1.平台搭建1.1.Amabari+HDP1.2.CM+CDH2.相关的技术栈数据存储：HDFS，HBase，Kudu等数据计算：MapReduce,Spark,Flink交互式查询：Impala,Presto在线实时分析：ClickHouse，Kylin，Doris，Druid，Kudu等资源调度：YARN，Mesos，Kubernetes任务调度：Oozie，Azakaban，AirFlow，
PDF转图片 JAVA JAVA派派 java PDF
前言以下是一个使用ApachePDFBox将PDF文件转换为图片的封装方法。这个方法将会把PDF的每一页转换为一张图片，并保存到指定的目录中。1.添加依赖首先，你需要在项目中添加PDFBox的依赖。如果你使用的是Maven，可以在pom.xml中添加以下依赖：org.apache.pdfboxpdfbox2.0.292.转换方法importorg.apache.pdfbox.pdmodel.PDD
USB摄像头数据获取——libuvc jbjhzstsl linux
优点：跨平台支持：libuvc是一个跨平台的库，可以在不同的操作系统上使用，包括Linux、Windows和macOS等。简单易用：libuvc提供了一套简单易用的API，使得使用摄像头设备变得更加简便，尤其适合快速开发原型和简单应用。封装性好：libuvc封装了许多底层细节，如视频格式转换、缓冲区管理等，简化了开发过程。缺点：功能有限：相对于V4L2，libuvc提供的功能相对有限，可能无法满足
Redis客户端jedis与lettuce的区别风雨无阻1203 Redis Java 研发文档 redis 缓存 Lettuce Jedis
什么是Lettuce与JedisLettuce是一个高级Redis客户端，用于线程安全的同步、异步和反应式访问。它支持高级的Redis特性，如Sentinel、集群、流水线、自动重新连接和redis数据模型等。Lettuce是完全非阻塞的，基于Netty事件驱动的通信层，其方法将返回具有可观察的类型，可在流或异步编程环境中使用。Jedis是基于Java语言的Redis的客户端，Jedis=Java
Redis两种客户端：lettuce和Jedis的区别 Darren i redis spring
springboot2的spring-boot-starter-data-redis中，默认使用的是lettuce作为redis客户端，它与jedis的主要区别如下：Jedis是同步的，不支持异步，Jedis客户端实例不是线程安全的，需要每个线程一个Jedis实例，所以一般通过连接池来使用JedisJedis常用APILettuce是基于Netty框架的事件驱动的Redis客户端，其方法调用是异步
Linux:kubeadm⽅式部署k8s集群陈婷婷1 linux kubernetes 运维服务器容器
1.kubeadm创建环境k8s-master192.168.150.11k8s-node1192.168.150.12k8s-node2192.168.150.13三台节点都安装docker#Step1:安装必要的一些系统工具sudoyuminstall-yyum-utilsdevice-mapper-persistent-datalvm2#Step2:添加软件源信息sudoyum-config
《Linux运维总结：基于银河麒麟V10+ARM64架构部署多机elasticsearch7.17.21分布式集群+单机kibana7.17.21二进制版ssl集群》东城绝神《Linux运维实战总结》运维 linux elasticsearch ssl
总结：整理不易，如果对你有帮助，可否点赞关注一下？更多详细内容请参考：Linux运维实战总结一、背景elasticsearch是一个分布式、实时、高性能的搜索和分析引擎，它广泛应用于企业级搜索、日志分析、实时数据处理等领域。随着elasticsearch的广泛应用，安全性变得越来越重要。这里将从安全策略和访问控制两方面来部署elasticsearch集群安全策略涉及到数据安全、访问安全和操作安全等
Rocky Linux安装部署Elasticsearch（ELK日志服务器）_rockylinux elk 2401_83739411 程序员服务器 linux elasticsearch
一、Elasticsearch的简介Elasticsearch是一个强大的开源搜索和分析引擎，可用于实时处理和查询大量数据。它具有高性能、可扩展性和分布式特性，支持全文搜索、聚合分析、地理空间搜索等功能，是构建实时应用和大规模数据分析平台的首选工具。二、RockyLinux系统安装链接：VMwareWorkstation下载安装（含秘钥）链接：VMwareWorkstation创建虚拟机链接：Ro
宇树科技纯技能要求总结极梦网络无忧杂谈科技
一、嵌入式开发与硬件设计核心技能嵌入式开发：精通C/C++，熟悉STM32、ARM开发熟悉LinuxBSP开发及驱动框架（SPI/UART/USB/FLASH/Camera/GPS/LCD）掌握主流平台（英伟达、全志、瑞芯微等）硬件设计：精通数字/模拟电路设计，熟悉PCB绘制工具（Altium等）掌握MOS驱动电路、变压器设计及EMC优化熟悉制板/贴片流程及焊接扩展技能电机控制：熟悉有感FOC算法
linux网络编程(二) Zhuai-行淮 linux网络编程 linux 网络服务器
day14多路IO转接：select：poll：相比select相差不多intpoll(structpollfd*fds,nfds_tnfds,inttimeout);-----fds：监听的文件描述符【数组】------structpollfd{intfd：待监听的文件描述符shortevents：待监听的文件描述符对应的监听事件取值：POLLIN、POLLOUT、POLLERR可读事件：POL
VMware Workstation 11 或者 VMware Player 7安装MAC OS X 10.10 Yosemite iwindyforest vmware mac os 10.10 workstation player
最近尝试了下VMware下安装MacOS 系统，安装过程中发现网上可供参考的文章都是VMware Workstation 10以下， MacOS X 10.9以下的文章，只能提供大概的思路，但是实际安装起来由于版本问题，走了不少弯路，所以我尝试写以下总结，希望能给有兴趣安装OSX的人提供一点帮助。写在前面的话：其实安装好后发现，由于我的th
关于《基于模型驱动的B/S在线开发平台》源代码开源的疑虑？ deathwknight JavaScript java 框架
本人从学习Java开发到现在已有10年整，从一个要自学 java买成javascript的小菜鸟，成长为只会java和javascript语言的老菜鸟（个人邮箱：[email protected]）一路走来，跌跌撞撞。用自己的三年多业余时间，瞎搞一个小东西（基于模型驱动的B/S在线开发平台，非MVC框架、非代码生成）。希望与大家一起分享，同时有许些疑虑，希望有人可以交流下平台
如何把maven项目转成web项目 Kai_Ge maven MyEclipse
创建Web工程，使用eclipse ee创建maven web工程 1.右键项目,选择Project Facets,点击Convert to faceted from 2.更改Dynamic Web Module的Version为2.5.(3.0为Java7的,Tomcat6不支持). 如果提示错误,可能需要在Java Compiler设置Compiler compl
主管？？？ Array_06 工作
转载：http://www.blogjava.net/fastzch/archive/2010/11/25/339054.html 很久以前跟同事参加的培训，同事整理得很详细，必须得转！前段时间，公司有组织中高阶主管及其培养干部进行了为期三天的管理训练培训。三天的课程下来，虽然内容较多，因对老师三天来的课程内容深有感触，故借着整理学习心得的机会，将三天来的培训课程做了一个
python内置函数大全 2002wmj python
最近一直在看python的document，打算在基础方面重点看一下python的keyword、Build-in Function、Build-in Constants、Build-in Types、Build-in Exception这四个方面，其实在看的时候发现整个《The Python Standard Library》章节都是很不错的，其中描述了很多不错的主题。先把Build-in Fu
JSP页面通过JQUERY合并行 357029540 JavaScript jquery
在写程序的过程中我们难免会遇到在页面上合并单元行的情况，如图所示如果对于会的同学可能很简单，但是对没有思路的同学来说还是比较麻烦的，提供一下用JQUERY实现的参考代码 function mergeCell(){ var trs = $("#table tr"); &nb
Java基础冰天百华 java基础
学习函数式编程 package base; import java.text.DecimalFormat; public class Main { public static void main(String[] args) { // Integer a = 4; // Double aa = (double)a / 100000; // Decimal
unix时间戳相互转换 adminjun 转换 unix 时间戳
如何在不同编程语言中获取现在的Unix时间戳(Unix timestamp)？ Java time JavaScript Math.round(new Date().getTime()/1000) getTime()返回数值的单位是毫秒 Microsoft .NET / C# epoch = (DateTime.Now.ToUniversalTime().Ticks - 62135
作为一个合格程序员该做的事 aijuans 程序员
作为一个合格程序员每天该做的事 1、总结自己一天任务的完成情况最好的方式是写工作日志，把自己今天完成了什么事情，遇见了什么问题都记录下来，日后翻看好处多多 2、考虑自己明天应该做的主要工作把明天要做的事情列出来，并按照优先级排列，第二天应该把自己效率最高的时间分配给最重要的工作 3、考虑自己一天工作中失误的地方，并想出避免下一次再犯的方法出错不要紧，最重
由html5视频播放引发的总结 ayaoxinchao html5 视频 video
前言项目中存在视频播放的功能，前期设计是以flash播放器播放视频的。但是现在由于需要兼容苹果的设备，必须采用html5的方式来播放视频。我就出于兴趣对html5播放视频做了简单的了解，不了解不知道，水真是很深。本文所记录的知识一些浅尝辄止的知识，说起来很惭愧。视频结构本该直接介绍html5的<video>的，但鉴于本人对视频
解决httpclient访问自签名https报javax.net.ssl.SSLHandshakeException: sun.security.validat bewithme httpclient
如果你构建了一个https协议的站点，而此站点的安全证书并不是合法的第三方证书颁发机构所签发，那么你用httpclient去访问此站点会报如下错误 javax.net.ssl.SSLHandshakeException: sun.security.validator.ValidatorException: PKIX path bu
Jedis连接池的入门级使用 bijian1013 redis redis数据库 jedis
Jedis连接池操作步骤如下： a.获取Jedis实例需要从JedisPool中获取； b.用完Jedis实例需要返还给JedisPool； c.如果Jedis在使用过程中出错，则也需要还给JedisPool； packag
变与不变 bingyingao 不变变亲情永恒
变与不变周末骑车转到了五年前租住的小区，曾经最爱吃的西北面馆、江西水饺、手工拉面早已不在，各种店铺都换了好几茬，这些是变的。三年前还很流行的一款手机在今天看起来已经落后的不像样子。三年前还运行的好好的一家公司，今天也已经不复存在。一座座高楼拔地而起，
【Scala十】Scala核心四：集合框架之List bit1129 scala
Spark的RDD作为一个分布式不可变的数据集合，它提供的转换操作，很多是借鉴于Scala的集合框架提供的一些函数，因此，有必要对Scala的集合进行详细的了解 1. 泛型集合都是协变的，对于List而言，如果B是A的子类，那么List[B]也是List[A]的子类，即可以把List[B]的实例赋值给List[A]变量 2. 给变量赋值(注意val关键字，a，b
Nested Functions in C bookjovi c closure
Nested Functions 又称closure，属于functional language中的概念，一直以为C中是不支持closure的，现在看来我错了，不过C标准中是不支持的，而GCC支持。既然GCC支持了closure，那么 lexical scoping自然也支持了，同时在C中label也是可以在nested functions中自由跳转的
Java-Collections Framework学习与总结-WeakHashMap BrokenDreams Collections
总结这个类之前，首先看一下Java引用的相关知识。Java的引用分为四种：强引用、软引用、弱引用和虚引用。强引用：就是常见的代码中的引用，如Object o = new Object();存在强引用的对象不会被垃圾收集
读《研磨设计模式》-代码笔记-解释器模式-Interpret bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * 解释器（Interpreter）模式的意图是可以按照自己定义的组合规则集合来组合可执行对象 * * 代码示例实现XML里面1.读取单个元素的值 2.读取单个属性的值 * 多
After Effects操作&快捷键 cherishLC After Effects
1、快捷键官方文档中文版：https://helpx.adobe.com/cn/after-effects/using/keyboard-shortcuts-reference.html 英文版：https://helpx.adobe.com/after-effects/using/keyboard-shortcuts-reference.html 2、常用快捷键
Maven 常用命令 crabdave maven
Maven 常用命令 mvn archetype:generate mvn install mvn clean mvn clean complie mvn clean test mvn clean install mvn clean package mvn test mvn package mvn site mvn dependency:res
shell bad substitution daizj shell 脚本
#!/bin/sh /data/script/common/run_cmd.exp 192.168.13.168 "impala-shell -islave4 -q 'insert OVERWRITE table imeis.${tableName} select ${selectFields}, ds, fnv_hash(concat(cast(ds as string), im
Java SE 第二讲（原生数据类型 Primitive Data Type） dcj3sjt126com java
Java SE 第二讲： 1. Windows: notepad, editplus, ultraedit, gvim Linux: vi, vim, gedit 2. Java 中的数据类型分为两大类： 1）原生数据类型（Primitive Data Type） 2）引用类型（对象类型）（R
CGridView中实现批量删除 dcj3sjt126com PHP yii
1，CGridView中的columns添加 array( 'selectableRows' => 2, 'footer' => '<button type="button" onclick="GetCheckbox();" style=&
Java中泛型的各种使用 dyy_gusi java 泛型
Java中的泛型的使用：1.普通的泛型使用在使用类的时候后面的<>中的类型就是我们确定的类型。 public class MyClass1<T> {//此处定义的泛型是T private T var; public T getVar() { return var; } public void setVa
Web开发技术十年发展历程 gcq511120594 Web 浏览器数据挖掘
回顾web开发技术这十年发展历程： Ajax 03年的时候我上六年级，那时候网吧刚在小县城的角落萌生。传奇，大话西游第一代网游一时风靡。我抱着试一试的心态给了网吧老板两块钱想申请个号玩玩，然后接下来的一个小时我一直在，注，册，账，号。彼时网吧用的512k的带宽，注册的时候，填了一堆信息，提交，页面跳转，嘣，”您填写的信息有误，请重填”。然后跳转回注册页面，以此循环。我现在时常想，如果当时a
openSession()与getCurrentSession()区别： hetongfei java DAO Hibernate
来自 http://blog.csdn.net/dy511/article/details/6166134 1.getCurrentSession创建的session会和绑定到当前线程,而openSession不会。 2. getCurrentSession创建的线程会在事务回滚或事物提交后自动关闭,而openSession必须手动关闭。这里getCurrentSession本地事务(本地
第一章安装Nginx+Lua开发环境 jinnianshilongnian nginx lua openresty
首先我们选择使用OpenResty，其是由Nginx核心加很多第三方模块组成，其最大的亮点是默认集成了Lua开发环境，使得Nginx可以作为一个Web Server使用。借助于Nginx的事件驱动模型和非阻塞IO，可以实现高性能的Web应用程序。而且OpenResty提供了大量组件如Mysql、Redis、Memcached等等，使在Nginx上开发Web应用更方便更简单。目前在京东如实时价格、秒
HSQLDB In-Process方式访问内存数据库 liyonghui160com
HSQLDB一大特色就是能够在内存中建立数据库，当然它也能将这些内存数据库保存到文件中以便实现真正的持久化。先睹为快！下面是一个In-Process方式访问内存数据库的代码示例：下面代码需要引入hsqldb.jar包（hsqldb-2.2.8） import java.s
Java线程的5个使用技巧 pda158 java 数据结构
Java线程有哪些不太为人所知的技巧与用法？　　萝卜白菜各有所爱。像我就喜欢Java。学无止境，这也是我喜欢它的一个原因。日常工作中你所用到的工具，通常都有些你从来没有了解过的东西，比方说某个方法或者是一些有趣的用法。比如说线程。没错，就是线程。或者确切说是Thread这个类。当我们在构建高可扩展性系统的时候，通常会面临各种各样的并发编程的问题，不过我们现在所要讲的可能会略有不同。
开发资源大整合：编程语言篇——JavaScript（1） shoothao JavaScript
概述：本系列的资源整合来自于github中各个领域的大牛，来收藏你感兴趣的东西吧。程序包管理器管理javascript库并提供对这些库的快速使用与打包的服务。 Bower - 用于web的程序包管理。 component - 用于客户端的程序包管理，构建更好的web应用程序。 spm - 全新的静态的文件包管
避免使用终结函数 vahoa.ma java jvm C++
终结函数（finalizer）通常是不可预测的，常常也是很危险的，一般情况下不是必要的。使用终结函数会导致不稳定的行为、更差的性能，以及带来移植性问题。不要把终结函数当做C++中的析构函数（destructors）的对应物。我自己总结了一下这一条的综合性结论是这样的： 1）在涉及使用资源，使用完毕后要释放资源的情形下，首先要用一个显示的方

Paoding Analyzer 庖丁 解牛 分词

你可能感兴趣的:(apache,.net,linux,JUnit,Lucene)

Paoding Analyzer 庖丁解牛分词