风zi

JAVA调用NLPIR(中科院汉语分词系统)的使用

介绍

最近在查找关于中文分词解析方面的开源工具，最开始找到了腾讯的文智与百度的自然语言，这两个平台都是对外提供HTTP接口调用需要把数据传输过去返回解析结果。
使用这种方式会有两种隐患：1.要确定网络情况；2.数据保密性；
在此基础上找到了NLPIR分词系统，下面来介绍一下使用方式，这里使用NLPIR的基础上完成二次开发。

环境

jdk1.7-64/win7-64/myeclipse8.5

NLPIR官网下载地址

NLPIR官方网址：http://ictclas.nlpir.org/ 提供有在线演示效果，并且官网有下载地址，NLPIR下载地址托管在github平台 https://github.com/NLPIR-team/NLPIR

下载一个NLPIR-master.zip的压缩包，这个下面有几个文件夹分别存放着各种功能

主要文件介绍：
License:存放需要调动每个功能的用户信息
NLPIR SDK：基于二次开发插件
NLPIR-Parser：NLPIR客户端使用
LicenseClient：用户注册信息

分词接口使用

打开上面所叙述的NLPIR SDK文件夹
NLPIR-master\NLPIR SDK\NLPIR-ICTCLAS

projects:下各种语言基于二次开发的插件与资料，直接下载里面提供的官方示例，只需修改个人NLPIR.user文件直接使用
官方示例：https://github.com/NLPIR-team/NLPIR-ICTCLAS

下载后直接导入eclipse中

注意：添加jre后直接Main方法运行NLPIRTest.java，但是会报错

lib\Data\NLPIR.user Not valid license or your license expired! Please feel free to contact pipy_zhang@msn.com! 
data_train\4-1_01
Exception in thread "main" java.lang.Error: Invalid memory access
	at com.sun.jna.Native.invokePointer(Native Method)
	at com.sun.jna.Function.invokePointer(Function.java:470)
	at com.sun.jna.Function.invokeString(Function.java:651)
	at com.sun.jna.Function.invoke(Function.java:395)
	at com.sun.jna.Function.invoke(Function.java:315)
	at com.sun.jna.Library$Handler.invoke(Library.java:212)
	at com.sun.proxy.$Proxy0.NLPIR_ParagraphProcess(Unknown Source)
	at com.lingjoin.nlpir.NLPIR.paragraphProcess(NLPIR.java:45)
	at com.lingjoin.nlpir.test.NLPIRTest.main(NLPIRTest.java:42)

异常是由于官方工程示例中的lib\Data\NLPIR.user 无法使用，需要使用自己本地中的NLPIR.user文件，
NLPIR.user地址：
1.NLPIR-master\License\license for a month\NLPIR-ICTCLAS分词系统授权\NLPIR.user
2.NLPIR-master\NLPIR SDK\NLPIR-ICTCLAS\Data\NLPIR.user
这两个文件均可

再次运行即可NLPIRTest.java正常使用

示例代码说明

调取接口方法说明

package com.lingjoin.nlpir;

import com.sun.jna.Library;
import com.sun.jna.Native;

public interface CNLPIRLibrary extends Library {

	//根据当前计算机环境决定使用resources下的NLPIR.dll插件，我这里是win7-64
	CNLPIRLibrary Instance = (CNLPIRLibrary) Native.loadLibrary("NLPIR", CNLPIRLibrary.class);
	
	/**
	 * 初始化
	 * @param sDataPath Data目录所在路径
	 * @param encoding 编码，0是GBK，1是UTF8
	 * @param sLicenceCode 为空即可
	 * @return
	 */
	public boolean NLPIR_Init(String sDataPath, int encoding, String sLicenceCode);

	/**
	 * 分词接口，主要调用此接口解析字符串完成分词
	 * @param sParagraph 待分词串
	 * @param bPOSTagged 是否带词性
	 * @return
	 */
	public String NLPIR_ParagraphProcess(String sParagraph, int bPOSTagged);

	public int NLPIR_GetParagraphProcessAWordCount(String para);

	public String NLPIR_FinerSegment(String lenWords);

	public int NLPIR_ImportUserDict(String dictFileName, boolean bOverwrite);

	public int NLPIR_ImportKeyBlackList(String sFilename);

	public String NLPIR_GetWordPOS(String sWords);

	public boolean NLPIR_IsWord(String word);

	public String NLPIR_WordFreqStat(String sText);

	public String NLPIR_FileWordFreqStat(String sFilename);

	public String NLPIR_GetEngWordOrign(String sWord);

	public double NLPIR_GetUniProb(String word);
	
    //对TXT文件内容进行分词
    public double NLPIR_FileProcess(String sSourceFilename,String sResultFilename, int bPOStagged);
    //从字符串中提取关键词 
    public String NLPIR_GetKeyWords(String sLine, int nMaxKeyLimit,boolean bWeightOut);
    //从TXT文件中提取关键词 
    public String NLPIR_GetFileKeyWords(String sLine, int nMaxKeyLimit,boolean bWeightOut);
    //添加单条用户词典
    public int NLPIR_AddUserWord(String sWord);
    //删除单条用户词典
    public int NLPIR_DelUsrWord(String sWord);
    //从TXT文件中导入用户词典
    public int NLPIR_ImportUserDict(String sFilename);
    //将用户词典保存至硬盘
	public boolean NLPIR_SaveTheUsrDic();
    //从字符串中获取新词
    public String NLPIR_GetNewWords(String sLine, int nMaxKeyLimit, boolean bWeightOut);
    //从TXT文件中获取新词
    public String NLPIR_GetFileNewWords(String sTextFile,int nMaxKeyLimit, boolean bWeightOut);
    //获取一个字符串的指纹值
    public long NLPIR_FingerPrint(String sLine);
    //设置要使用的POS map
    public int NLPIR_SetPOSmap(int nPOSmap);
    //获取报错日志
    public String NLPIR_GetLastErrorMsg();
    //退出
    public void NLPIR_Exit();    
}

NLPIR方法二次封装

package com.lingjoin.nlpir;
/**
 * NLPIR方法二次封装
 * @author Pan
 */
public class NLPIR {
	//初始化状态
	public static boolean InitState=false;
	//初始化方法
	public static boolean init(String argu){
	    int	charsetType=1;
	    InitState=CNLPIRLibrary.Instance .NLPIR_Init(argu,charsetType,"0");
		if(InitState){
			return InitState;
		}else{
			System.out.println(CNLPIRLibrary.Instance.NLPIR_GetLastErrorMsg());
			return false;
		}
	}
	public static boolean Init(){		
		int charsetType=1;
		String  argu="";
	    InitState=CNLPIRLibrary.Instance .NLPIR_Init(argu,charsetType,"0");
		if(InitState){
			return InitState;
		}else{
			System.out.println(CNLPIRLibrary.Instance.NLPIR_GetLastErrorMsg());
			return false;
		}
	}
	/**
	 * NLPIR分词方法
	 * @param sSrc 待分词字符串
	 * @param bPOSTagged 分词标注集序号
	 * 0----为无标注分词结果集，	 
	 * 1---- ICT_POS_MAP_FIRST  计算所一级标注集
	 * 2-----ICT_POS_MAP_SECOND  计算所二级标注集
	 * 3-----PKU_POS_MAP_SECOND   北大二级标注集	
	 *	4-----PKU_POS_MAP_FIRST 	  北大一级标注集
	 * @return
	 */
	public static String paragraphProcess(String sSrc, int bPOSTagged){
		String result=null;
		try{
			result=CNLPIRLibrary.Instance.NLPIR_ParagraphProcess(sSrc, bPOSTagged);
		}catch(Exception e){
			System.out.println(CNLPIRLibrary.Instance.NLPIR_GetLastErrorMsg());
		}
		return result;
	}
	
	public static int getParagraphProcessAWordCount(String para){
		if(!InitState){
			return 0;
		}else
			return CNLPIRLibrary.Instance.NLPIR_GetParagraphProcessAWordCount(para);
	}
	
	public static String finerSegment(String lenWords){
		if(!InitState){
			return null;
		}else
			return CNLPIRLibrary.Instance.NLPIR_FinerSegment(lenWords);
	}
	
	public static long fingerPrint(String sLine){
		if(!InitState){
			return 0;
		}else
			return CNLPIRLibrary.Instance.NLPIR_FingerPrint(sLine);
	}
	
	public static boolean isWord(String word){
		if(!InitState){
			return false;
		}else
			return CNLPIRLibrary.Instance.NLPIR_IsWord(word);
	}
	
	public static String wordFreqStat(String sText){
		if(!InitState){
			return null;
		}else
			return CNLPIRLibrary.Instance.NLPIR_WordFreqStat(sText);
	}
	
	public static String getEngWordOrign(String sWord){
		if(!InitState){
			return null;
		}else
			return CNLPIRLibrary.Instance.NLPIR_GetEngWordOrign(sWord);
	}
	
	public static double getUniProb(String word){
		if(!InitState){
			return 0.0;
		}else
			return CNLPIRLibrary.Instance.NLPIR_GetUniProb(word);
	}
	
	public static String getWordPos(String str){
		String result="";
		String pos="";
		if(!InitState){
			System.out.println("请先初始化分词！");
			return null;
		}
		try{
		    pos=CNLPIRLibrary.Instance.NLPIR_GetWordPOS(str);
		    //System.out.println(pos);
		    if(!pos.contains("#")) return "un";
		    String[] p=pos.split("#");
		    if(p.length>1){
		    	for(int i=0;i<p.length;i++){
		    		if(i==0) result+=p[i].split("/")[1]+"#";
		    		else if(i==p.length-1) result+=p[i].split("/")[1];
		    		else result+=p[i].split("/")[1]+"#";
		    	}
		    	return result;
		    }else{
		    	result=pos.split("/")[1];
		    }
		}catch(Exception e){
			System.out.println("参数解析失败！");
		}
		return result;	
	}
	/**
	 * 添加用户词典
	 * @param fileDict
	 */
	public static int importUserDict(String fileDict){
		if(!InitState){
			return 0;
		}
		return CNLPIRLibrary.Instance.NLPIR_ImportUserDict(fileDict,true);
	}
	
	public static int NLPIR_ImportKeyBlackList(String sFilename){
		if(!InitState){
			return 0;
		}else
			return CNLPIRLibrary.Instance.NLPIR_ImportKeyBlackList(sFilename);
	}
	/**
	 * 添加用户词
	 * @param word
	 * @return
	 */
	public static boolean addUserWord(String word){
		if(!InitState){
			System.out.println("请先初始化分词！");
			return false ;
		}
		int addState= CNLPIRLibrary.Instance.NLPIR_AddUserWord(word);
		if(addState==0)
			return false;
		else 
			return true;
	}
	/**
	 * 保存用户词典
	 */
	public static boolean saveUserWord(){
		return CNLPIRLibrary.Instance.NLPIR_SaveTheUsrDic();
	}
	
	public static boolean deleteUserWord(String word){
		if(!InitState){
			System.out.println("请先初始化分词！");
			return false ;
		}
		int delState=CNLPIRLibrary.Instance.NLPIR_DelUsrWord(word);
		if(delState==-1){
			System.out.print("The word :"+word+"not exsit!");
			return false;
		}else
			return true;
	}
	
	public static String getLastErrorMsg(){
		return CNLPIRLibrary.Instance.NLPIR_GetLastErrorMsg();
	}
	
	/**
	 * 退出
	 */
	public static void Exit(){
		if(!InitState){
			System.out.println("未初始化分词！无需执行退出操作!");
		}
		CNLPIRLibrary.Instance.NLPIR_Exit();
	}
	
	public static void main(String[] args) throws Exception {
		NLPIR.init("lib");
		System.out.println(NLPIR.isWord("中国"));
	}
}

NLPIRTest测试

package com.lingjoin.nlpir.test;

import java.io.File;
import java.io.FileWriter;
import java.io.RandomAccessFile;
import java.util.ArrayList;
import java.util.List;

import com.lingjoin.nlpir.NLPIR;

public class NLPIRTest {

	/**
	 * 存放某个路径下的所有文件地址
	 */
	List<String> files=new ArrayList<String>();
	
	/**
	 * 当前文件夹下的所有文件路径获取
	 * @param filePath	文件夹地址
	 */
	public void getAllfiles(File filePath){
		File[] fsFiles=filePath.listFiles();
		for(File f:fsFiles){
			if(f.isFile()&&!f.getName().equals(".DS_Store")) files.add(f.getPath());
			if(f.isDirectory()) this.getAllfiles(f);
		}
	}
	/**
	 * 加载本地文件中的字符串至内存中
	 * @param file	文件地址
	 * @return		文件中字符串
	 * @throws Exception
	 */
	public String getContent(File file)throws Exception{
		RandomAccessFile f=new RandomAccessFile(file, "r");
		byte[] b=new byte[(int) file.length()];
		f.read(b);
		f.close();
		String c=new String(b,"GBK").replaceAll("\\s", "");
		return c;
	}
	
	public static void main(String[] args)throws Exception{
		//1.初始化
		NLPIR.init("lib");
		//NLPIR.importUserDict("");
		//2.字符串分词后存放地址
		FileWriter fw=new FileWriter(new File("seg.txt"));
		//3.待分词文件地址
		String fPath="data_train";
		NLPIRTest test=new NLPIRTest();
		//4.加载待分词文件地址
		test.getAllfiles(new File(fPath));
		//5.遍历解析待分析文件
		for(String f:test.files){
			System.out.println(f);
			//6.加载文件内容至内存中
			String con=test.getContent(new File(f));
			//7.分词处理，存放结果
			fw.write(new File(f).getName()+"\t"+NLPIR.paragraphProcess(con, 1).replaceAll(" ", "\t")+"\n");
		}
		fw.flush();
		fw.close();
	}
}

加载当前工程data_train文件夹下的文件字符内容至内存中调用分词接口将解析后的结果存入seg.txt文件

NLPIR-ICTCLAS-master\data_train\4-1_01 文件

新华社照片，枣庄（山东），2016年8月30日 
    山东枣庄出现“鱼鳞云” 
    这是8月30日在山东省枣庄市山亭区翼云湖畔拍摄的“鱼鳞云”。 
    当日清晨，山东省枣庄市山亭区上空出现大面积“鱼鳞云”，在初秋蓝天的映衬下，美不胜收。 
    新华社发（李宗宪 摄）

解析后的内容

新华社/nt	照片/n	，/wd	枣庄/ns	（/wkz	山东/ns	）/wky	，/wd	2016年/t	8月/t	30日/t	山东/ns	枣庄/ns	出现/v	“/wyz	鱼鳞/n	云/vg	”/wyy	这/rzv	是/vshi	8月/t	30日/t	在/p	山东省/ns	枣庄市/ns	山亭区/ns	翼/ng	云/vg	湖畔/n	拍摄/v	的/ude1	“/wyz	鱼鳞/n	云/vg	”/wyy	。/wj	当日/t	清晨/t	，/wd	山东省/ns	枣庄市/ns	山亭区/ns	上空/s	出现/v	大/a	面积/n	“/wyz	鱼鳞/n	云/vg	”/wyy	，/wd	在/p	初秋/t	蓝天/n	的/ude1	映衬/vn	下/f	，/wd	美不胜收/vl	。/wj	新华社/nt	发/v	（/wkz	李宗宪/nr	摄/vg	）/wky

自定义字符串测试结果

	@Test
	public void test(){
		NLPIR.init("lib");
		String con = "当日清晨，山东省枣庄市山亭区上空出现大面积“鱼鳞云”，在初秋蓝天的映衬下，美不胜收。 ";
		String paragraphProcess = NLPIR.paragraphProcess(con, 1);
		System.out.println("解析后的内容："+paragraphProcess);
/**
 * 解析后的内容：当日/t 清晨/t ，/wd 山东省/ns 枣庄市/ns 山亭区/ns 上空/s 出现/v 大/a 面积/n “/wyz 鱼鳞/n 云/vg ”/wyy ，/wd 在/p 初秋/t 蓝天/n 的/ude1 映衬/vn 下/f ，/wd 美不胜收/vl 。/wj 
 */
		
	}

参考博客：
接口调用：https://blog.csdn.net/SUN_song520/article/details/51996844
错误解决：https://blog.csdn.net/wangjinyang_123/article/details/50417557

我所有的资料都是在官网下载的，这里就不上传工程了。

QQ群采集助手，精准引流必备神器 2401_87347160 其他经验分享
功能概述微信群查找与筛选工具是一款专为微信用户设计的辅助工具，它通过关键词搜索功能，帮助用户快速找到相关的微信群，并提供筛选是否需要验证的群组的功能。主要功能关键词搜索：用户可以输入关键词，工具将自动查找包含该关键词的微信群。筛选功能：工具提供筛选机制，用户可以选择是否只显示需要验证或不需要验证的群组。精准引流：通过上述功能，用户可以更精准地找到目标群组，进行有效的引流操作。3.设备需求该工具可以
C语言如何定义宏函数？小九格物 c语言
在C语言中，宏函数是通过预处理器定义的，它在编译之前替换代码中的宏调用。宏函数可以模拟函数的行为，但它们不是真正的函数，因为它们在编译时不会进行类型检查，也不会分配存储空间。宏函数的定义通常使用#define指令，后面跟着宏的名称和参数列表，以及宏展开后的代码。宏函数的定义方式：1.基本宏函数：这是最简单的宏函数形式，它直接定义一个表达式。#defineSQUARE(x)((x)*(x))2.带参
理解Gunicorn：Python WSGI服务器的基石范范0825 ipython linux 运维
理解Gunicorn：PythonWSGI服务器的基石介绍Gunicorn，全称GreenUnicorn，是一个为PythonWSGI（WebServerGatewayInterface）应用设计的高效、轻量级HTTP服务器。作为PythonWeb应用部署的常用工具，Gunicorn以其高性能和易用性著称。本文将介绍Gunicorn的基本概念、安装和配置，帮助初学者快速上手。1.什么是Gunico
Linux下QT开发的动态库界面弹出操作（SDL2） 13jjyao QT类 qt 开发语言 sdl2 linux
需求：操作系统为linux，开发框架为qt，做成需带界面的qt动态库，调用方为java等非qt程序难点：调用方为java等非qt程序，也就是说调用方肯定不带QApplication::exec()，缺少了这个，QTimer等事件和QT创建的窗口将不能弹出(包括opencv也是不能弹出)；这与qt调用本身qt库是有本质的区别的思路：1.调用方缺QApplication::exec()，那么我们在接口
Python教程：一文了解使用Python处理XPath 旦莫 Python进阶 python 开发语言
目录1.环境准备1.1安装lxml1.2验证安装2.XPath基础2.1什么是XPath？2.2XPath语法2.3示例XML文档3.使用lxml解析XML3.1解析XML文档3.2查看解析结果4.XPath查询4.1基本路径查询4.2使用属性查询4.3查询多个节点5.XPath的高级用法5.1使用逻辑运算符5.2使用函数6.实战案例6.1从网页抓取数据6.1.1安装Requests库6.1.2代
Google earth studio 简介陟彼高冈yu 旅游
GoogleEarthStudio是一个基于Web的动画工具，专为创作使用GoogleEarth数据的动画和视频而设计。它利用了GoogleEarth强大的三维地图和卫星影像数据库，使用户能够轻松地创建逼真的地球动画、航拍视频和动态地图可视化。网址为https://www.google.com/earth/studio/。GoogleEarthStudio是一个基于Web的动画工具，专为创作使用G
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
直返最高等级与直返APP：无需邀请码的返利新体验古楼
随着互联网的普及和电商的兴起，直返模式逐渐成为一种流行的商业模式。在这种模式下，消费者通过购买产品或服务，获得一定的返利，并可以分享给更多的人。其中，直返最高等级和直返APP是直返模式中的重要概念和工具。本文将详细介绍直返最高等级的概念、直返APP的使用以及与邀请码的关系。【高省】APP（高佣金领导者）是一个自用省钱佣金高，分享推广赚钱多的平台，百度有几百万篇报道，运行三年，稳定可靠。高省APP，
2020-04-12每天三百字之连接与替代冷眼看潮
不知道是不是好为人师，有时候还真想和别人分享一下我对某些现象的看法或者解释。人类社会不断发展进步的过程，就是不断连接与替代的过程。人类发现了火并应用火以后，告别了茹毛饮血的野兽般的原始生活（火烧、烹饪替代了生食）人类用石器代替了完全手工，工具的使用使人类进步一大步。类似这样的替代还有很多，随着科技的发展，有更多的原始的事物被替代，代之以更高效、更先进的技术。在近现代，汽车替代了马车，高速公路和铁路
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
python是什么意思中文-在python中%是什么意思编程大乐趣
Python中%有两种：1、数值运算：%代表取模，返回除法的余数。如：>>>7%212、%操作符（字符串格式化，stringformatting），说明如下：%[(name)][flags][width].[precision]typecode(name)为命名flags可以有+，-，''或0。+表示右对齐。-表示左对齐。''为一个空格，表示在正数的左侧填充一个空格，从而与负数对齐。0表示使用0填
利用Requests Toolkit轻松完成HTTP请求 nseejrukjhad http 网络协议网络 python
RequestsToolkit的力量：轻松构建HTTP请求Agent在现代软件开发中，API请求是与外部服务交互的核心。RequestsToolkit提供了一种便捷的方式，帮助开发者构建自动化的HTTP请求Agent。本文旨在详细介绍RequestsToolkit的设置、使用和潜在挑战。引言RequestsToolkit是一个强大的工具包，可用于构建执行HTTP请求的智能代理。这对于想要自动化与外
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
GitHub上克隆项目 bigbig猩猩 github
从GitHub上克隆项目是一个简单且直接的过程，它允许你将远程仓库中的项目复制到你的本地计算机上，以便进行进一步的开发、测试或学习。以下是一个详细的步骤指南，帮助你从GitHub上克隆项目。一、准备工作1.安装Git在克隆GitHub项目之前，你需要在你的计算机上安装Git工具。Git是一个开源的分布式版本控制系统，用于跟踪和管理代码变更。你可以从Git的官方网站（https://git-scm.
Day17笔记-高阶函数 ~在杰难逃~ Python 笔记 python 开发语言 pycharm 数据分析
高阶函数【重点掌握】函数的本质：函数是一个变量，函数名是一个变量名，一个函数可以作为另一个函数的参数或返回值使用如果A函数作为B函数的参数，B函数调用完成之后，会得到一个结果，则B函数被称为高阶函数常用的高阶函数：map(),reduce(),filter(),sorted()1.map()map(func,iterable)，返回值是一个iterator【容器，迭代器】func:函数iterab
python八股文面试题分享及解析(1) Shawn________ python
#1.'''a=1b=2不用中间变量交换a和b'''#1.a=1b=2a,b=b,aprint(a)print(b)结果：21#2.ll=[]foriinrange(3):ll.append({'num':i})print(11)结果:#[{'num':0},{'num':1},{'num':2}]#3.kk=[]a={'num':0}foriinrange(3):#0,12#可变类型，不仅仅改变
【目标检测数据集】卡车数据集1073张VOC+YOLO格式熬夜写代码的平头哥∰ 目标检测 YOLO 人工智能
数据集格式：PascalVOC格式+YOLO格式(不包含分割路径的txt文件，仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)图片数量(jpg文件个数)：1073标注数量(xml文件个数)：1073标注数量(txt文件个数)：1073标注类别数：1标注类别名称:["truck"]每个类别标注的框数：truck框数=1120总框数：1120使用标注工具：labelImg标注
【JS】执行时长(100分) |思路参考+代码解析（C++） l939035548 JS 算法数据结构 c++
题目为了充分发挥GPU算力，需要尽可能多的将任务交给GPU执行，现在有一个任务数组，数组元素表示在这1秒内新增的任务个数且每秒都有新增任务。假设GPU最多一次执行n个任务，一次执行耗时1秒，在保证GPU不空闲情况下，最少需要多长时间执行完成。题目输入第一个参数为GPU一次最多执行的任务个数，取值范围[1,10000]第二个参数为任务数组长度，取值范围[1,10000]第三个参数为任务数组，数字范围
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
pyecharts——绘制柱形图折线图 2224070247 信息可视化 python java 数据可视化
一、pyecharts概述自2013年6月百度EFE(ExcellentFrontEnd）数据可视化团队研发的ECharts1.0发布到GitHub网站以来，ECharts一直备受业界权威的关注并获得广泛好评，成为目前成熟且流行的数据可视化图表工具，被应用到诸多数据可视化的开发领域。Python作为数据分析领域最受欢迎的语言，也加入ECharts的使用行列，并研发出方便Python开发者使用的数据
node.js学习小猿L node.js node.js 学习 vim
node.js学习实操及笔记温故node.js，node.js学习实操过程及笔记~node.js学习视频node.js官网node.js中文网实操笔记githubcsdn笔记为什么学node.js可以让别人访问我们编写的网页为后续的框架学习打下基础，三大框架vuereactangular离不开node.jsnode.js是什么官网：node.js是一个开源的、跨平台的运行JavaScript的运行
钢筋长度超限检测检数据集VOC+YOLO格式215张1类别 futureflsl 数据集 YOLO 深度学习机器学习
数据集格式：PascalVOC格式+YOLO格式(不包含分割路径的txt文件，仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)图片数量(jpg文件个数)：215标注数量(xml文件个数)：215标注数量(txt文件个数)：215标注类别数：1标注类别名称:["iron"]每个类别标注的框数：iron框数=215总框数：215使用标注工具：labelImg标注规则：对类别进
CX8903：Ebike自行车仪表电源方案开发,Ebike智能仪表电源芯片诚芯微科技社交电子
CX8903：电动Ebike自行车仪表电源方案开发,Ebike智能仪表电源芯片推荐。电动助力自行车EBIKE凭借其环保、健康、低噪、和便捷等特点，成为了越来越受欢迎的骑行便利交通工具。提供电动Ebike自行车仪表电源方案开发、E-BIKE电动助力自行车仪表供电电源解决方案。CX8903采用100V高压制造工艺（芯片最高耐压可到100V以上），SOP-8L贴片封装，CX8903内置100V/90mΩ
Python 实现图片裁剪（附代码） | Python工具剑客阿良_ALiang
前言本文提供将图片按照自定义尺寸进行裁剪的工具方法，一如既往的实用主义。环境依赖ffmpeg环境安装，可以参考我的另一篇文章：windowsffmpeg安装部署_阿良的博客-CSDN博客本文主要使用到的不是ffmpeg，而是ffprobe也在上面这篇文章中的zip包中。ffmpy安装：pipinstallffmpy-ihttps://pypi.douban.com/simple代码不废话了，上代码
【华为OD技术面试真题 - 技术面】- python八股文真题题库（4) 算法大师华为od 面试 python
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选**1.Python中的`with`**用途和功能自动资源管理示例：文件操作上下文管理协议示例代码工作流程解析优点2.\_\_new\_\_和**\_\_init\_\_**区别__new____init__区别总结3.**切片（Slicing）操作**基本切片语法
【华为OD技术面试真题 - 技术面】-测试八股文真题题库（1）算法大师华为od 面试 python 算法前端
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选1.黑盒测试和白盒测试的区别2.假设我们公司现在开发一个类似于微信的软件1.0版本，现在要你测试这个功能：打开聊天窗口，输入文本，限制字数在200字以内。问你怎么提取测试点。功能测试性能测试安全性测试可用性测试跨平台兼容性测试网络环境测试3.接口测试的工具你了解哪些
第六集如何安装CentOS7.0，3分钟学会centos7安装教程 date分享
从光盘引导系统按回车键继续进入引导程序安装界面，选择语言这里选择简体中文版点击继续选择桌面安装下面给系统分区选择磁盘，点击完成选择基本分区，点击加号swap分区,大小填内存的两倍在选择根分区，使用所有可用的磁盘空间选择文件系统ext4点击完成，点击开始安装设置root密码，点击完成设置普通用户和密码，点击完成整个过程持续八分钟左右根据个人配置不同，时间长短不同好，现在点击重启系统进入重启状态点击本
Python爬虫解析工具之xpath使用详解 eqa11 python 爬虫开发语言
文章目录Python爬虫解析工具之xpath使用详解一、引言二、环境准备1、插件安装2、依赖库安装三、xpath语法详解1、路径表达式2、通配符3、谓语4、常用函数四、xpath在Python代码中的使用1、文档树的创建2、使用xpath表达式3、获取元素内容和属性五、总结Python爬虫解析工具之xpath使用详解一、引言在Python爬虫开发中，数据提取是一个至关重要的环节。xpath作为一门
基于CODESYS的多轴运动控制程序框架：逻辑与运动控制分离，快速开发灵活操作 GPJnCrbBdl python 开发语言
基于codesys开发的多轴运动控制程序框架，将逻辑与运动控制分离，将单轴控制封装成功能块，对该功能块的操作包含了所有的单轴控制（归零、点动、相对定位、绝对定位、设置当前位置、伺服模式切换等等）。程序框架由主程序按照状态调用分归零模式、手动模式、自动模式、故障模式，程序状态的跳转都已完成，只需要根据不同的工艺要求完成所需的动作即可。变量的声明、地址的规划都严格按照C++的标准定义，能帮助开发者快速
mac电脑命令行获取电量小米人er 我的博客 macos 命令行
在macOS上，有几个命令行工具可以用来获取电量信息，最常用的是pmset命令。你可以通过以下方式来查看电池状态和电量信息：查看电池状态：pmset-gbatt这个命令会返回类似下面的输出：Nowdrawingfrom'BatteryPower'-InternalBattery-0(id=1234567)95%;discharging;4:02remainingpresent:true输出中包括电
Enum 枚举 120153216 enum 枚举
原文地址：http://www.cnblogs.com/Kavlez/p/4268601.html Enumeration 于Java 1.5增加的enum type...enum type是由一组固定的常量组成的类型，比如四个季节、扑克花色。在出现enum type之前，通常用一组int常量表示枚举类型。比如这样： public static final int APPLE_FUJI = 0
Java8简明教程 bijian1013 java jdk1.8
Java 8已于2014年3月18日正式发布了，新版本带来了诸多改进，包括Lambda表达式、Streams、日期时间API等等。本文就带你领略Java 8的全新特性。一.允许在接口中有默认方法实现 Java 8 允许我们使用default关键字，为接口声明添
Oracle表维护快速备份删除数据 cuisuqiang oracle 索引快速备份删除
我知道oracle表分区，不过那是数据库设计阶段的事情，目前是远水解不了近渴。当前的数据库表，要求保留一个月数据，且表存在大量录入更新，不存在程序删除。为了解决频繁查询和更新的瓶颈，我在oracle内根据需要创建了索引。但是随着数据量的增加，一个半月数据就要超千万，此时就算有索引，对高并发的查询和更新来说，让然有所拖累。为了解决这个问题，我一般一个月会进行一次数据库维护，主要工作就是备
java多态内存分析麦田的设计者 java 内存分析多态原理接口和抽象类
“ 时针如果可以回头，熟悉那张脸，重温嬉戏这乐园，墙壁的松脱涂鸦已经褪色才明白存在的价值归于记忆。街角小店尚存在吗？这大时代会不会牵挂，过去现在花开怎么会等待。但有种意外不管痛不痛都有伤害，光阴远远离开，那笑声徘徊与脑海。但这一秒可笑不再可爱，当天心
Xshell实现Windows上传文件到Linux主机被触发 windows
经常有这样的需求，我们在Windows下载的软件包，如何上传到远程Linux主机上？还有如何从Linux主机下载软件包到Windows下；之前我的做法现在看来好笨好繁琐，不过也达到了目的，笨人有本方法嘛；我是怎么操作的： 1、打开一台本地Linux虚拟机，使用mount 挂载Windows的共享文件夹到Linux上，然后拷贝数据到Linux虚拟机里面；（经常第一步都不顺利，无法挂载Windo
类的加载ClassLoader 肆无忌惮_ ClassLoader
类加载器ClassLoader是用来将java的类加载到虚拟机中，类加载器负责读取class字节文件到内存中，并将它转为Class的对象（类对象），通过此实例的 newInstance()方法就可以创建出该类的一个对象。其中重要的方法为findClass(String name)。如何写一个自己的类加载器呢？首先写一个便于测试的类Student
html5写的玫瑰花知了ing html5
<html> <head> <title>I Love You!</title> <meta charset="utf-8" /> </head> <body> <canvas id="c"></canvas>
google的ConcurrentLinkedHashmap源代码解析矮蛋蛋 LRU
原文地址： http://janeky.iteye.com/blog/1534352 简述 ConcurrentLinkedHashMap 是google团队提供的一个容器。它有什么用呢？其实它本身是对 ConcurrentHashMap的封装，可以用来实现一个基于LRU策略的缓存。详细介绍可以参见 http://code.google.com/p/concurrentlinke
webservice获取访问服务的ip地址 alleni123 webservice
1. 首先注入javax.xml.ws.WebServiceContext, @Resource private WebServiceContext context; 2. 在方法中获取交换请求的对象。 javax.xml.ws.handler.MessageContext mc=context.getMessageContext(); com.sun.net.http
菜鸟的java基础提升之道——————>是否值得拥有百合不是茶
1，c++，java是面向对象编程的语言，将万事万物都看成是对象；java做一件事情关注的是人物，java是c++继承过来的，java没有直接更改地址的权限但是可以通过引用来传值操作地址，java也没有c++中繁琐的操作，java以其优越的可移植型，平台的安全型，高效性赢得了广泛的认同，全世界越来越多的人去学习java，我也是其中的一员 java组成：
通过修改Linux服务自动启动指定应用程序 bijian1013 linux
Linux中修改系统服务的命令是chkconfig (check config)，命令的详细解释如下: chkconfig 功能说明：检查，设置系统的各种服务。语　　法：chkconfig [ -- add][ -- del][ -- list][系统服务] 或 chkconfig [ -- level <</SPAN>
spring拦截器的一个简单实例 bijian1013 java spring 拦截器 Interceptor
Purview接口 package aop; public interface Purview { void checkLogin(); } Purview接口的实现类PurviesImpl.java package aop; public class PurviewImpl implements Purview { public void check
[Velocity二]自定义Velocity指令 bit1129 velocity
什么是Velocity指令在Velocity中，#set,#if, #foreach, #elseif, #parse等，以#开头的称之为指令，Velocity内置的这些指令可以用来做赋值，条件判断，循环控制等脚本语言必备的逻辑控制等语句，Velocity的指令是可扩展的，即用户可以根据实际的需要自定义Velocity指令自定义指令(Directive)的一般步骤 &nbs
【Hive十】Programming Hive学习笔记 bit1129 programming
第二章 Getting Started 1.Hive最大的局限性是什么？一是不支持行级别的增删改(insert, delete, update)二是查询性能非常差(基于Hadoop MapReduce）,不适合延迟小的交互式任务三是不支持事务2. Hive MetaStore是干什么的？Hive persists table schemas and other system metadata.
nginx有选择性进行限制 ronin47 nginx 动静　限制
http { limit_conn_zone $binary_remote_addr zone=addr:10m; limit_req_zone $binary_remote_addr zone=one:10m rate=5r/s;... server {... location ~.*\.(gif|png|css|js|icon)$ {
java-4.-在二元树中找出和为某一值的所有路径 . bylijinnan java
/* * 0.use a TwoWayLinkedList to store the path.when the node can't be path,you should/can delete it. * 1.curSum==exceptedSum:if the lastNode is TreeNode,printPath();delete the node otherwise
Netty学习笔记 bylijinnan java netty
本文是阅读以下两篇文章时： http://seeallhearall.blogspot.com/2012/05/netty-tutorial-part-1-introduction-to.html http://seeallhearall.blogspot.com/2012/06/netty-tutorial-part-15-on-channel.html 我的一些笔记 ===
js获取项目路径 cngolon js
//js获取项目根路径，如： http://localhost:8083/uimcardprj function getRootPath(){ //获取当前网址，如： http://localhost:8083/uimcardprj/share/meun.jsp var curWwwPath=window.document.locati
oracle 的性能优化 cuishikuan oracle SQL Server
在网上搜索了一些Oracle性能优化的文章，为了更加深层次的巩固[边写边记]，也为了可以随时查看，所以发表这篇文章。 1.ORACLE采用自下而上的顺序解析WHERE子句，根据这个原理，表之间的连接必须写在其他WHERE条件之前，那些可以过滤掉最大数量记录的条件必须写在WHERE子句的末尾。（这点本人曾经做过实例验证过，的确如此哦！
Shell变量和数组使用详解 daizj linux shell 变量数组
Shell 变量定义变量时，变量名不加美元符号（$，PHP语言中变量需要），如： your_name="w3cschool.cc" 注意，变量名和等号之间不能有空格，这可能和你熟悉的所有编程语言都不一样。同时，变量名的命名须遵循如下规则：首个字符必须为字母（a-z，A-Z）。中间不能有空格，可以使用下划线（_）。不能使用标点符号。不能使用ba
编程中的一些概念，KISS、DRY、MVC、OOP、REST dcj3sjt126com REST
KISS、DRY、MVC、OOP、REST （1）KISS是指Keep It Simple,Stupid（摘自wikipedia），指设计时要坚持简约原则，避免不必要的复杂化。（2）DRY是指Don't Repeat Yourself（摘自wikipedia），特指在程序设计以及计算中避免重复代码，因为这样会降低灵活性、简洁性，并且可能导致代码之间的矛盾。（3）OOP 即Object-Orie
[Android]设置Activity为全屏显示的两种方法 dcj3sjt126com Activity
1. 方法1：AndroidManifest.xml 里，Activity的 android:theme 指定为" @android:style/Theme.NoTitleBar.Fullscreen" 示例: <application
solrcloud 部署方式比较 eksliang solrCloud
solrcloud 的部署其实有两种方式可选，那么我们在实践开发中应该怎样选择呢？第一种：当启动solr服务器时，内嵌的启动一个Zookeeper服务器，然后将这些内嵌的Zookeeper服务器组成一个集群。第二种：将Zookeeper服务器独立的配置一个集群，然后将solr交给Zookeeper进行管理谈谈第一种：每启动一个solr服务器就内嵌的启动一个Zoo
Java synchronized关键字详解 gqdy365 synchronized
转载自：http://www.cnblogs.com/mengdd/archive/2013/02/16/2913806.html 多线程的同步机制对资源进行加锁，使得在同一个时间，只有一个线程可以进行操作，同步用以解决多个线程同时访问时可能出现的问题。同步机制可以使用synchronized关键字实现。当synchronized关键字修饰一个方法的时候，该方法叫做同步方法。当s
js实现登录时记住用户名 hw1287789687 记住我记住密码 cookie 记住用户名记住账号
在页面中如何获取cookie值呢? 如果是JSP的话,可以通过servlet的对象request 获取cookie,可以参考:http://hw1287789687.iteye.com/blog/2050040 如果要求登录页面是html呢?html页面中如何获取cookie呢? 直接上代码了页面:loginInput.html 代码: <!DOCTYPE html PUB
开发者必备的 Chrome 扩展 justjavac chrome
Firebug：不用多介绍了吧https://chrome.google.com/webstore/detail/bmagokdooijbeehmkpknfglimnifench ChromeSnifferPlus：Chrome 探测器，可以探测正在使用的开源软件或者 js 类库https://chrome.google.com/webstore/detail/chrome-sniffer-pl
算法机试题李亚飞 java 算法机试题
在面试机试时，遇到一个算法题，当时没能写出来，最后是同学帮忙解决的。这道题大致意思是：输入一个数，比如4,。这时会输出： &n
正确配置Linux系统ulimit值字符串 ulimit
在Linux下面部署应用的时候，有时候会遇上Socket/File: Can’t open so many files的问题；这个值也会影响服务器的最大并发数，其实Linux是有文件句柄限制的，而且Linux默认不是很高，一般都是1024，生产服务器用其实很容易就达到这个数量。下面说的是，如何通过正解配置来改正这个系统默认值。因为这个问题是我配置Nginx+php5时遇到了，所以我将这篇归纳进
hibernate调用返回游标的存储过程 Supanccy2013 java DAO oracle Hibernate jdbc
注：原创作品，转载请注明出处。上篇博文介绍的是hibernate调用返回单值的存储过程，本片博文说的是hibernate调用返回游标的存储过程。此此扁博文的存储过程的功能相当于是jdbc调用select 的作用。 1，创建oracle中的包，并在该包中创建的游标类型。 ---创建oracle的程
Spring 4.2新特性-更简单的Application Event wiselyman application
1.1 Application Event Spring 4.1的写法请参考10点睛Spring4.1-Application Event 请对比10点睛Spring4.1-Application Event 使用一个@EventListener取代了实现ApplicationListener接口,使耦合度降低; 1.2 示例包依赖 <p

JAVA调用NLPIR(中科院汉语分词系统)的使用

介绍

环境

NLPIR官网下载地址

分词接口使用

示例代码说明

你可能感兴趣的:(中文解析工具调用)