E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
LTP
NLP之分词jieba、HanLP、中科院nlpir
目前主流的分词有jieba、哈工大
LTP
、中科院计算所NLPIR、清华大学THULAC和FoolNLTK、HanLPjieba分词目前是最主流的python中文分词组件,包括精确模式,在jieba分词中需要加载自定义词库
chenxinvhai89
·
2019-06-21 15:09
NLP
中文分词工具比较 6大中文分词器测试(哈工大
LTP
、中科院计算所NLPIR、清华大学THULAC和jieba、FoolNLTK、HanLP)
https://blog.csdn.net/shuihupo/article/details/81540433
澜吉未央
·
2019-06-19 15:05
史上最全中文分词工具整理
阅读更多一.中文分词二.准确率评测:THULAC:与代表性分词软件的性能对比我们选择
LTP
-3.2.0、ICTCLAS(2015版)、jieba(C++版)等国内具代表性的分词软件与THULAC做性能比较
adnb34g
·
2019-06-03 10:00
史上最全中文分词工具整理
一.中文分词二.准确率评测:THULAC:与代表性分词软件的性能对比我们选择
LTP
-3.2.0、ICTCLAS(2015版)、jieba(C++版)等国内具代表性的分词软件与THULAC做性能比较。
adnb34g
·
2019-06-03 10:00
中文分词
hanlp分词
结巴分词
自然语言处理
自然语言处理(三)——句法分析与依存句法分析
更多内容请至南木博客主页查看哦文章目录一、StanfordCoreNLP对英文进行处理二、StanfordCoreNLP对中文进行处理三、
LTP
对中文进行处理四、结论附录·本文所使用工具代码与中英文文本下载微信公众号一
南木Sir
·
2019-05-24 21:07
自然语言处理
南木的下午茶
NLP基础实验③:中文分词-jiaba
中文分词有很多种,常见的比如有中科院计算所NLPIR、哈工大
LTP
、清华大学THULAC、斯坦福分词器、Hanlp分词器、jieba分词、IKAnalyzer等。
NLP_victor
·
2019-05-14 21:44
中文分词
NLP实战
使用
ltp
4j碰到Can't find dependent libraries报错信息的问题解决
项目中使用了哈工大的自然语言处理模块
ltp
4j,使用idea工具集成到项目中之后,在本机运行没有问题,一切正常。
cooldream2009
·
2019-05-08 10:44
java
知识图谱
第一章 中文语言的机器处理
文章目录1.搭建NLTK环境1.1操作系统1.2Python开发环境1.3安装常用Python应用程序2.整合中文分词模块2.1安装LtpPython组件2.2使用
Ltp
3.4进行中文分词2.3使用结巴分词模块
从零开始的智障生活
·
2019-04-10 14:56
Anacnda+Pycharm 安装本地 .whl文件
问题描述:需要使用
LTP
项目提供的PYLTP包首先无法直接通过condainstallpyltp安装,使用condasearchpyltp显示没有包可用。
White_Hou
·
2019-04-08 20:12
杂论
Python
句法分析工具
LTP
HanLP
参考:http://cslt.riit.tsinghua.edu.cn/mediawiki/images/e/e5/%E5%8F%A5%E6%B3%95%E5%B7%A5%E5%85%B7%E5%88%86%E6%9E%90.pdfhttp://pyltp.readthedocs.io/zh_CN/latest/api.htmlhttps://pypi.python.org/pypi/pyltph
lanlantian123
·
2019-02-27 16:29
hanlp和jieba等六大中文分工具的测试对比
阅读更多本篇文章测试的哈工大
LTP
、中科院计算所NLPIR、清华大学THULAC和jieba、FoolNLTK、HanLP这六大中文分词工具是由水...琥珀完成的。
adnb34g
·
2019-02-26 13:00
hanlp和jieba等六大中文分工具的测试对比
本篇文章测试的哈工大
LTP
、中科院计算所NLPIR、清华大学THULAC和jieba、FoolNLTK、HanLP这六大中文分词工具是由水...琥珀完成的。
adnb34g
·
2019-02-25 10:54
jieba分词
hanlp分词
thulac
中文分词
自然语言处理
hanlp和jieba等六大中文分工具的测试对比
本篇文章测试的哈工大
LTP
、中科院计算所NLPIR、清华大学THULAC和jieba、FoolNLTK、HanLP这六大中文分词工具是由水...琥珀完成的。
adnb34g
·
2019-02-25 10:47
自然语言处理
NLP入门(六)pyltp的介绍与使用
pyltp的简介 语言技术平台(
LTP
)经过哈工大社会计算与信息检索研究中心11年的持续研发和推广,是国内外最具影响力的中文处理基础平台。
山阴少年
·
2019-01-31 18:00
NLP入门(六)pyltp的介绍与使用
pyltp的简介 语言技术平台(
LTP
)经过哈工大社会计算与信息检索研究中心11年的持续研发和推广,是国内外最具影响力的中文处理基础平台。
jclian91
·
2019-01-31 00:00
nlp
结巴分词与
ltp
分词算法的比较:对于新词的识别
ltp
分词方法远高于结巴分词
frompyltpimportSegmentorimportjiebamodel_path="E:/
ltp
3_4/cws.model"content="我毕业于清华大学,我朋友的名字叫戴掵莉,我哥们的名字叫付先军
妹妹爱技术
·
2019-01-28 15:30
Python
jieba
ltp
机器学习
人工智能
自然语言处理
分词算法比较
人工智能
机器学习
LTP
与jieba词性标注对比
词性标注对比¶
LTP
使用的是863词性标注集,其各个词性含义如下表。
野路子的数据科学
·
2018-12-12 16:46
LTP
与jieba词性标注对比
词性标注对比¶
LTP
使用的是863词性标注集,其各个词性含义如下表。
野路子的数据科学
·
2018-12-12 16:46
目前常用的自然语言处理开源项目/开发包大汇总
阅读更多中文主要有:NLTK,FoolNLTK,HanLP(java版本),pyhanlp(python版本),Ansj,THULAC,结巴分词,FNLP,哈工大
LTP
,中科院ICTCLAS分词,GATE
adnb34g
·
2018-11-26 10:00
python
目前常用的自然语言处理开源项目/开发包大汇总
阅读更多中文主要有:NLTK,FoolNLTK,HanLP(java版本),pyhanlp(python版本),Ansj,THULAC,结巴分词,FNLP,哈工大
LTP
,中科院ICTCLAS分词,GATE
adnb34g
·
2018-11-26 10:00
python
LTP
和THULAC的安装与分词工具的使用
LTP
分词工具使用说明:提前准备:1.
LTP
项目文件:
ltp
-3.4.0.tar.gz2.
LTP
模型文件:
ltp
_data_v3.4.0.zip分别将上述文件进行解压:执行命令:tar-zxv-fltp
LZH_12345
·
2018-11-22 14:19
nlp
Mac下载安装nlp处理工具pyltp及其python实现
目录一、操作环境二、编译安装pyltp三、填充pyltp中的空
ltp
文件夹四、python处理NLP问题还需调用模型文件pyltp是哈工大出品的NLP处理工具,是
LTP
的Python封装。
风弦鹤
·
2018-11-05 01:05
Python
自然语言处理
python调用Hanlp做命名实体识别以及词性标注
之前需要做一个中文命名实体识别的api,看完了一些相关论文以后觉得短时间内自己实现不大现实,于是找了一些开源工具,其中哈工大的
LTP
效果是很好的,但是免费使用限流量,需要给钱才行;NLPIR的pynlpir
lanlantian123
·
2018-11-02 16:38
解决Segmentor: Model not loaded!
https://blog.csdn.net/qq_32005671/article/details/73770536一开始的时候按照上述不行然后MODELDIR="D:/work/nltk_data/
ltp
_data_v3.4.0
candy134834
·
2018-11-01 09:03
异常集合
python将字符串以utf-8格式保存在txt文件中的方法
如下所示:#
ltp
_data字符串写进777.txt1、defsave(filename,contents):fh=open(filename,'w',encoding='utf-8')fh.write
哈哈儿_
·
2018-10-30 14:10
哈工大【
LTP
】
哈工大【
LTP
】LTPLTP制定了基于XML的语言处理结果表示,并在此基础上提供了一整套自底向上的中文语言处理模块,以及基于动态链接库(DynamicLinkLibrary,DLL)的应用程序接口、可视化工具
codebrid
·
2018-10-27 16:23
随记
自然语言处理
hanlp自然语言处理包的基本使用--python
我以前还使用过jieba分词和
LTP
,综合来说,
LTP
是做的相对要好一点,特别是中文处理这一块,但是它的最大缺点是不开源,
adnb34g
·
2018-09-28 09:52
hanlp
python
自然语言处理
自然语言处理
干货 | 史上最全中文分词工具整理
作者|fendouai一.中文分词分词服务接口列表二.准确率评测:THULAC:与代表性分词软件的性能对比我们选择
LTP
-3.2.0、ICTCLAS(2015版)、jieba(C++版)等国内具代表性的分词软件与
磐创 AI
·
2018-08-25 00:06
nlp
机器学习
中文分词工具大全调研
一.中文分词分词服务接口列表二.准确率评测:THULAC:与代表性分词软件的性能对比我们选择
LTP
-3.2.0、ICTCLAS(2015版)、jieba(C++版)等国内具代表性的分词软件与THULAC
打个大西瓜77
·
2018-08-15 16:13
中文分词
文本预处理
命名实体识别
LTP
(Linux Test Project)学习(六)—— 问题分析:chattr命令的限制
在刚开始接触
ltp
时候,便开始跨平台执行
ltp
(想看下
ltp
的兼容性),当时FAIL很多用例,然后逐个开始分析,直到utimen
hello小崔
·
2018-08-10 18:08
LTP
LBP变体—
LTP
纹理特征
如今,纹理分析和分类已成为计算机视觉和图像处理的重要领域之一。它们在许多应用中发挥着至关重要的作用,如视觉对象识别和检测[1,2],人体探测器[3],物体跟踪[4],行人分类[5],图像检索[6,7]和人脸识别[8,9]。Ojala等人提出了局部二值模式localbinarypattern(LBP)算子[10]用于旋转不变纹理分类。LBP已被修改并适用于多种应用,如人脸识别[8,9]和图像检索[7
God_6838
·
2018-08-09 10:18
IQA
LTP
(Linux Test Project)学习(五)——
LTP
代码学习
LTP
代码学习方法主要介绍两个步骤,个人认为效果最好,见效也快。
hello小崔
·
2018-08-08 19:03
LTP
ltp
分词后处理——强制分词模块
为了解决这个问题:我使用分词(词性标注)词典了,但是为什么某些词典词还是被切开了(词性没有按照字典标注)官方解释为:
ltp
的分词(词性标注)模块并非采用词典匹配的策略,外部词典以特征方式加入机器学习算法
看什么看
·
2018-07-09 17:05
ltp
分词
自然语言处理
代码记录(中文NLP任务)
预处理代码分词输入一句话输出一个词的listfrompyltpimportSegmentorfromzhon.hanziimportpunctuationdefword_cut(sentence):
LTP
_DATA_DIR
Ding_xiaofei
·
2018-07-09 17:53
编码
NLP
文本处理
kali信息收集
一、打开ssh功能,方便远程管理kali下开启ssh:/etc/init.d/sshstart(或者用servicesshstart):接下来验证ssh状态:netstat-
ltp
|grepssh:servicesshstatus
额di个神
·
2018-07-08 20:48
信安
PW06常见PYTHON中文分词工具
常见的python中文分词工具哈工大
LTP
、jieba和NLPIR哈工大LTPLTP为用户提供了一系列中文自然语言处理工具,用户可以使用这些工具对于中文文本进行分词、词性标注、句法分析等等工作。
冬季男孩
·
2018-07-03 21:37
pyltp
frompyltpimportSentenceSplitterfrompyltpimportSegmentorfrompyltpimportPostaggerfrompyltpimportNamedEntityRecognizerLTP_DATA_DIR='E:\model\
ltp
_data
FreeEleven
·
2018-06-15 16:09
分词工具使用解析
perminusminusStanford汉语分词工具(Bakeoff-2两项第一)哈工大语言云(
LTP
-cloud)ICTCLAS——(Bakeoff-1两项第一)Ansj(ICTCLAS的java实现
何春春春春
·
2018-05-27 14:12
Linux Test Project 测试套件说明
LTP
(LinuxTestProject)LinuxTestProject是由SGI、OSDL和Bull开发和维护的一个项目,由IBM、思科、富士通、SUSE、RedHat、Oracle和其他公司共同开发和维护
党志强
·
2018-05-07 15:02
LTP
linux
kernel
Java泛型的应用-双链表
DLinkList接口:packagecn.
ltp
.dlinklist;/***双向链表*@authorZ7M-SL7D2**/interfaceDLinkList{/***添加节点*@paramdata
Bugggget
·
2018-04-27 15:20
JavaSE
python将字符串以utf-8格式保存在txt文件中
#
ltp
_data字符串写进777.txt1、defsave(filename,contents):fh=open(filename,'w',encoding='utf-8')fh.write(contents
halerr
·
2018-04-23 16:03
python
python 常用中文分词工具
最近在做微博的文本处理,在分词工具的选择上,分别选择了:jieba\NLPIR\
LTP
这三种分词工具,在这里分享下~1.jieba分词:#-*-coding:UTF-8-*-importosimportcodecsimportjiebaseg_list
TFknight
·
2018-04-13 15:48
python
LTP
词性标注
aadjective:形容词美丽bothernoun-modifier:其他的修饰名词大型,西式cconjunction:连词和,虽然dadverb:副词很eexclamation:感叹词哎gmorpheme茨,甥hprefix:前缀阿,伪iidiom:成语百花齐放jabbreviation:缩写公检法ksuffix:后缀界,率mnumber:数字一,第一ngeneralnoun:一般名词苹果nd
liushui94
·
2017-11-01 22:15
NLP
Windows上pyltp的安装及使用
后面使用了哈工大的
LTP
,发觉效果明显提升,由于是在Ubuntu上进行代码编写,在安装pyltp时频频报错,确实令人心
DilicelSten
·
2017-11-01 20:01
Python
pyltp
使用server版的哈工大
LTP
进行NLP任务(Java实现)
哈工大的
LTP
可以说是开源中评测得分相对高的(比HanLP,jieba,ansj等都要好很多)本篇文章记录了使用Java语言发送POST请求,请求搭建在服务器端的
LTP
-server进行NLP处理。
Macanv
·
2017-10-20 15:39
java
nlp
Java快速入门本地调用哈工大
LTP
实例
转载请注明出处:http://blog.csdn.net/HHTide/article/details/78181511#因为文件较大,开始阅读文章之前先下载完整的
ltp
_data的model,链接,本文下载的是
HHTide
·
2017-10-09 13:12
LTP
安装银河麒麟操作系统,编译
ltp
,确实有可能报缺少kdeamon.h文件
安装银河麒麟操作系统,编译
ltp
,确实有可能报缺少kdeamon.h文件(捂脸)但也不是不能解决的(奸笑)吼吼~~降级libc6-dev版本至2.21或者升级
ltp
版本解决,或者将
ltp
的makefile
weixin_30316097
·
2017-09-21 17:00
linux 压力测试性能IO MEM CPU
一、文件系统测试工具简介1、
LTP
参考网站:http://oss.sgi.com/projects/
ltp
/
LTP
(LinuxTestProject)是由SGI和IBM联合发起的项目,提供一套验证Linux
lilinji
·
2017-09-02 22:44
linux
压力
IO
MEM
CPU
Linux_Soft
GreenPlum学习(一)
1、0
LTP
与OLAP数据库系统一般分为两种类型,一种是面向前台应用的,应用比较简单,但是重吞吐和高并发的0
LTP
类型;一种是重计算的,对大数据集进行统计分析的OLAP类型。
eff666
·
2017-08-26 15:18
数据库
哈工大
ltp
,分词,词性标注,命名实体识别技术的特征提取
1、分词的特征提取给定一个字符判断:1、标点符号2、数字3、中文数字4、字母等等2、词性标注的特征提取:1、后缀2、部首特征3、词重叠特征3、命名实体识别特征提取:1、词的位置2、词性
LFGxiaogang
·
2017-08-11 14:47
自然语言处理
上一页
2
3
4
5
6
7
8
9
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他