E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
nlpir
PW06常见PYTHON中文分词工具
常见的python中文分词工具哈工大LTP、jieba和
NLPIR
哈工大LTPLTP为用户提供了一系列中文自然语言处理工具,用户可以使用这些工具对于中文文本进行分词、词性标注、句法分析等等工作。
冬季男孩
·
2018-07-03 21:37
Alpha冲刺-第三天
刘丹,李玉莹:实现主播管理功能曹莹雯,尹楠:调用
NLPIR
/ICTCLAS分词系统的JavaAPI尝试对弹幕进行分词王静雅:管理员管理的实现遇到的问题简单的正则不能过滤色情,不文明用语等。
开拓者研发团队
·
2018-06-20 20:00
分词工具的调查与使用——以jieba和
NLPIR
为例
经过一定的搜索和了解,目前市场上存在有较多种分词工具,比较热门的几种如
NLPIR
(又名ICTCLA
YuriTard
·
2018-05-26 19:59
python-简单爬虫及相关数据处理(统计出文章出现次数最多的50个词)
我用的是
nlpir
的分词系统:作了处理之后,把所有词存进一list里面。之后,创建一个字典,并且遍历list,将
bensonrachel
·
2018-05-18 23:38
python
asp.net中引用
NLPIR
-ICTCLAS2014 分词系统时碰到的问题及解决方案
这几天在尝试中科院计算所的
NLPIR
-ICTCLAS2014分词系统搬到自己的asp.net网站里面,然后碰到了挺多问题(O_O)。。
comeonbabe_
·
2018-05-16 17:53
ASP.NET
python 常用中文分词工具
最近在做微博的文本处理,在分词工具的选择上,分别选择了:jieba\
NLPIR
\LTP这三种分词工具,在这里分享下~1.jieba分词:#-*-coding:UTF-8-*-importosimportcodecsimportjiebaseg_list
TFknight
·
2018-04-13 15:48
python
学习笔记CB004:提问、检索、回答、
NLPIR
聊天机器人,提问、检索、回答。提问,查询关键词生成、答案类型确定、句法和语义分析。查询关键词生成,提问提取关键词,中心词关联扩展词。答案类型确定,确定提问类型。句法和语义分析,问题深层含义剖析。检索,搜索,根据查询关键词信息检索,返回句子或段落。答案抽取,分析和推理检索句子或段落,抽取提问一致实体,根据概率最大对候选答案排序。海量文本知识表示,网络文本资源获取、机器学习方法、大规模语义计算和推理、
利炳根
·
2018-02-24 00:00
机器学习
自然语言处理
聊天机器人
NLPIR
技术助力中文智能数据挖掘
随着数据技术的飞速发展以及广泛应用,许多企业和部门建立了自身的数据管理系统,经过长年努力,已经积累了越来越多的数据。于是,人们开始渴望通过对这些庞大的数据分析得到更多的有助于决策的信息。虽然,目前的数据系统可以高效率地实现数据的录入、查询、统计等功能,但由于数据量庞大以及数据库系统中分析方法的严重缺乏,使得它无法发现数据中隐藏的相互联系,更无法根据当前和历史的数据去预测未来的发展趋势。因此,出现了
ljrj12345
·
2017-11-13 16:00
nlpir
技术
中文
Windows上pyltp的安装及使用
前言最近在做电影评论中人名识别的相关工作,对这一块思考了很久,因为评论中的人名称呼不一,“一人多名”是很普遍的,前期使用了hanlp的HMM模型、CRF模型匹配出的“nr”都是比较正常的人名,后期使用了
nlpir
DilicelSten
·
2017-11-01 20:01
Python
pyltp
[读书笔记] 《中文自然语言处理》
Chapter1中文分词中科院计算所NLPIRhttp://ictclas.
nlpir
.org/
nlpir
/ansj分词器https://github.com/NLPchina/ansj_seg哈工大的
LeYOUNGER
·
2017-08-08 15:36
机器学习
自然语言处理
中文情感分析语料库
数据集1:情感挖掘的酒店评论语料URL:http://www.
nlpir
.
noter16
·
2017-07-19 10:33
NLP
语料库
自然语言处理入门(4)——中文分词原理及分词工具介绍
本文首先介绍下中文分词的基本原理,然后介绍下国内比较流行的中文分词工具,如jieba、SnowNLP、THULAC、
NLPIR
,上述分词工具都已经在github上开源,后续也会附上github链接,以供参考
飞鸟2010
·
2017-06-30 10:22
自然语言处理
Python 任意中文文本生成词云 最终版本
前叙利用下面的代码你将可以将任意中文文本生成词云,其分词部分由jieba,
NLPIR
2016两个部分组成,生成词语由worldcloud负责,默认会自动发现文本中的20个新词并添加到词库中,当然你也可以手动添加或者通过
Font Tian
·
2017-06-10 15:49
#
【自然语言处理】
基础
#
【自然语言处理】
可视化
剑指汉语自然语言处理
中科院分词系统(
NLPIR
)JAVA简易教程
下载地址:http://ictclas.
nlpir
.org/downloads,下载最新的
NLPIR
/ICTCLAS分词系统下载包授权文件下载地址:https://github.com/
NLPIR
-team
Font Tian
·
2017-06-06 15:28
#
【自然语言处理】
基础
剑指汉语自然语言处理
git-如何在git上下载单个文件夹
上下载单个文件夹需要工具:TortoiseSVN操作举例:例如,你只需要“NLPIRSDK”中“classify”文件夹下的代码,先打开classify,其URL为:“https://github.com/
NLPIR
-team
大玉莞尔
·
2017-05-04 00:00
git
涓枃鍒嗚瘝椤圭洰鎬荤粨
缂栧啓锛岀畻娉曞熀浜庛�婂熀浜庡灞傞殣椹ā鍨嬬殑姹夎璇嶆硶鍒嗘瀽鐮旂┒銆嬨�傚叾涓紑婧愮増鏈负FreeICTCLAS,鏈�鏂癆PI璋冪敤鐗堟湰涓篘LPIR/ICTCLAS2014鍒嗚瘝绯荤粺(
NLPIR
stonelin3935
·
2017-01-05 11:34
NLPIR
+Hadoop
最近在学习过程中,需要对文本进行分词,而且数据量比较大,在Windows上使用
NLPIR
处理小文件基本上没有问题(可以看这里),看
NLPIR
的开发文档是支持分布式的,因而考虑在Linux上实现hadoop
monkey131499
·
2016-11-08 14:19
Hadoop
Java
好吧我终于开始记笔记了
所谓多视角特征融合,是指将词特征、内容规则、结构规则三类特征融合用于分类分词特征采用
nlpir
分词工具,只保留代表句子主干的名词、动词、形容词内容规则采用六条规则:文本长度是否存在链接是否存在数字词最大重复数
sjz_hahalala479
·
2016-09-18 09:08
分词
垃圾过滤
好吧我终于开始记笔记了
所谓多视角特征融合,是指将词特征、内容规则、结构规则三类特征融合用于分类分词特征采用
nlpir
分词工具,只保留代表句子主干的名词、动词、形容词内容规则采用六条规则:文本长度是否存在链接是否存在数字词最大重复数
sjz_hahalala479
·
2016-09-18 09:00
NLPIR
/ICTCLAS 2015 分词系统使用
近期使用了中科院分词系统
NLPIR
/ICTCLAS2016。在2014版本以及之前称为ICTCLAS,之后的版本都更名为
NLPIR
。新版简介如下:词法分析是自然语言处理的基础与关键。
Gatherfly
·
2016-08-25 12:50
自然语言处理
NLPIR
汉语分词系统 (PyNLPIR) 学习手札
1关于
NLPIR
最近在做一些NLP相关的任务,其中一个关键的子任务就是如何对汉语进行分词?关于分词的方式,有很多很多,也是很多学习者的练手任务(比如我们当时的期末作业就有这个)。
MebiuW
·
2016-08-17 17:57
机器学习
NLPIR
Not valid license or your license expired!
最近发现
NLPIR
的分词突然无法运行,然后出现下面的错误: Notvalidlicenseoryourlicenseexpired!
arrow8071
·
2016-07-29 11:00
算法
机器学习
NLP
nlpir
的使用
NLPIR
的下载地址:http://ictclas.
nlpir
.org/downloadsGitHub的地址:https://github.com/
NLPIR
-team/
NLPIR
两个版本有一些不同,本文将分别讲解如何利用
arrow8071
·
2016-07-29 11:57
nlp
VS2013
NLPIR
分词系统的使用及文本框多行显示
1.资源视图下新建资源Dialog,并为对话框添加类,设置类名为
NLPIR
_Dlg。
BCDnotCBD
·
2016-07-20 17:42
C++
【python问题解决】RuntimeError:
NLPIR
function '
NLPIR
_Init' failed
1、实验过程:在pycharm中新建项目textmining,在项目下新建文件夹File,将pynlpir文件夹添加到该文件夹后,运行分词测试程序:#!/usr/bin/envpython#-*-coding:utf-8-*-"""功能:测试PyNLPIR包时间:2016年7月13日13:02:37"""importpynlpirpynlpir.open()s='欢迎科研人员、技术工程师、企事业单
Junkichan
·
2016-07-14 13:01
Python实战
自然语言处理
NLPIR
PyNLPIR
Python调用
NLPIR
/ICTCLAS进行文本分词
文本分词主要通过Python调用中科院计算所汉语词法分析系统
NLPIR
/ICT
Junkichan
·
2016-07-11 18:50
Python实战
自然语言处理
NLPIR
Python对中文字符的处理(utf-8/ gbk/ unicode)
分词系统:
NLPIR
因为不同的编译环境默认的汉字编码可能不一样,我的环境是OSX10.11+Pycharm+python2.7文件第一行永远默认#coding:utf-8数据集我用的是“tc-corpus-train
chixujohnny
·
2016-06-29 15:09
Python学习
Python对中文字符的处理(utf-8/ gbk/ unicode)
分词系统:
NLPIR
因为不同的编译环境默认的汉字编码可能不一样,我的环境是OSX10.11+Pycharm+python2.7文件第一行永远默认#coding:utf-8数据集我用的是“tc-corpus-train
chixujohnny
·
2016-06-29 15:00
python
unicode
编码
utf-8
汉字编码
NLPIR
分词之N-最短路径
N-最短路径是中科院分词工具
NLPIR
进行分词用到的一个重要算法,张华平、刘群老师在论文《基于N-最短路径方法的中文词语粗分模型》中做了比较详细的介绍。
shijing_0214
·
2016-05-24 22:00
N-最短路径
中文文本预处理--主题模型
国内常用的分词工具有北理工张华平老师的
NLPIR
分词包和百度工程师开发的jieba分词,名字很有意思。两者
u010533386
·
2016-05-18 05:00
正则表达式
中文分词
繁简转化
中文提取
关于
NLPIR
应用在KETTLE中的探索
一:什么是
NLPIR
?
NLPIR
汉语分词系统(自然语言处理与信息检索共享平台),主要功能包括中文分词;词性标注;命名实体识别;用户词典功能;支持GBK编码、UTF8编码、BIG5编码。
kingstudy
·
2016-05-09 14:00
推荐一些在线效率工具汇总(数据分析,舆情监测、图片语义识别等)
大部分是免费的,相当有用的: 1.数据分析相关 1、在线词频、语义、情感分析工具: 图悦:http://www.picdata.cn/ http://ictclas.
nlpir
.org
小y
·
2016-04-22 11:00
本体编辑和知识获取软件--protege汉化版
下载地址:https://github.com/
NLPIR
-team/
NLPIR
/tree/mas
大数据09
·
2016-04-18 16:00
哈工大LTP和中科院
NLPIR
中文分词比较
1.LTP有自动分句功能,
NLPIR
没有分句功能;LTP的分句是根据中文标点里的句号、问号、感叹号、分号、省略号。2.
NLPIR
分词有两种方式,分词结果完全一致。
竹聿Simon
·
2016-04-17 18:35
NLPIR
LTP
哈工大
中科院
中文分词
中文分词
NLPIR
汉语分词系统在VS中使用
首先去官网下载
NLPIR
(ICTCALS)包。 点我下载 由于笔者在项目中需要用到mysql数据库,而笔者数据库是64位的,所以,笔者这里下载了32位的
NLPIR
下载包后,又下载了64位的补充包。
yy64578537
·
2016-04-15 19:00
C++
Studio
Visual
nlpir
Python与自然语言处理(二)基于Gensim的Word2Vec
NLPIR
是一个汉语分词系统,挺感谢张华平博士,便利了我们的文本处理工作。下载地址:http://ictclas.
nlpir
.org/newsdownlo
monkey131499
·
2016-04-12 10:29
Java
NLP
Python与自然语言处理(二)基于Gensim的Word2Vec
NLPIR
是一个汉语分词系统,挺感谢张华平博士,便利了我们的文本处理工作。下载地址:http://ictclas.
nlpir
.org/newsdownlo
monkey131499
·
2016-04-12 10:00
java
python
自然语言处理
nlpir
word2vec
针对中科院java接口的使用方法和问题
.解压后会看到如下几个文件夹 3.把java工程导入eclipse中,点击import,再选择existing project into workspace4.导入sample文件下的JnaTest_
NLPIR
qq_30232405
·
2016-04-09 16:00
java
中科院
中科院分词工具java接口
根据给出的语料库,训练n-gram模型。根据训练出的模型,判断测试集中每个句子是不是语法合法的句子
2-Gram的训练:先是将下载好的汉语分词工具
NLPIR
导入eclipse中,注意在使用这个分词工具的时候必须将Data包更新为最新,不然会初始化失败。
hongtao_fan
·
2016-03-21 13:26
NLPIR
(ICTCLAS2016)对词频统计功能
功能:利用
NLPIR
(ICTCLAS2016)进行中文分词,并进行词频统计。
竹聿Simon
·
2016-03-16 19:29
Java
中文分词
NLPIR
(ICTCLAS2016)对文本进行分词
功能:利用
NLPIR
对文本进行分词,并将分词结果导出为文本。
竹聿Simon
·
2016-03-15 21:02
Java
中文分词
NLPIR
(ICTCLAS2016)分词系统添加用户词典功能
备注:win764位系统,netbeans编程基本代码框架参见我的另一篇文章:
NLPIR
分词功能代码实现:packagecwordseg;importjava.io.UnsupportedEncodingException
竹聿Simon
·
2016-03-15 20:53
Java
中文分词
NLPIR
(ICTCLAS2016)提取关键词功能
NLPIR
提取关键词功能:备注:win764位系统,netbeans编程基本代码框架参见我的另一篇文章:
NLPIR
分词功能代码实现:packagecwordseg;importjava.io.UnsupportedEncodingException
竹聿Simon
·
2016-03-15 14:40
Java
java调用
NLPIR
(ICTCLAS2016)实现分词功能
备注:win764位系统,netbeans编程
NLPIR
分词系统,前身是2000年发布的ICTCLAS,2009年更为现名。张华平博士打造。
竹聿Simon
·
2016-03-15 13:18
Java
中文分词
《懒人Shell脚本》之二——语料库的格式化输出
(参考:http://www.
nlpir
.org/?action-viewnews-itemid-103),网上也有提供更多种分类的。分词网上比较NB的
wojiushiwo987
·
2016-03-04 22:00
解决
NLPIR
(中科院分词) License 过期问题
因为学习需要,使用到了中文分词技术,网上搜索一番,最终选择了名气比较大的中科院分词器(
NLPIR
/ICTCLAS)。
loyopp
·
2016-02-26 11:11
NLPIR
License
中科院分词
Other
thread
is
unde
Not
valid
license
or
分词授权过期
机器学习
分词
java中jar包内的类访问jar包内部的资源文件的路径问题
在如下项目结构树中,项目根目录为
nlpir
,如果我们要在src下的某个package的某个java文件中访问blackWhite文件夹中的文件
mm_bit
·
2015-12-21 16:53
java
java
基础
Java中文分词工具AnsjSeg使用
对于Java语言,有许多可选的分词工具,如中科院计算所的
NLPIR
(原ICTCLASS)、盘古分词、IKAnalyzer、PaodingAnalyzer,其中,试用过ICTCLASS及其后续版本,刚开始感觉不错
qq_26562641
·
2015-12-17 15:00
MongoDB
://www.mongodb.org/dr/fastdl.mongodb.org/linux/mongodb-linux-i686-2.4.3.tgz/download 2. http://www.
nlpir
.org
·
2015-11-13 10:36
mongodb
【原创】中文分词系统 ICTCLAS2015 的JAVA封装和多线程执行(附代码)
首先ICTCLAS2015的传送门(http://ictclas.
nlpir
.org/),其对中文分词做的比较透彻,而且有一定的可调式性。
·
2015-11-12 10:29
java
上一页
1
2
3
4
5
6
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他