E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
HanLP
java分词工具
hanlp
介绍
前几天(6月28日),在第23届中国国际软件博览会上,
hanlp
这款自然语言处理工具荣获了“2019年第二十三届中国国际软件博览会优秀产品”。
adnb34g
·
2019-07-03 10:34
Java
hanlp
自然语言处理
基于
hanlp
的es分词插件
阅读更多摘要:elasticsearch是使用比较广泛的分布式搜索引擎,es提供了一个的单字分词工具,还有一个分词插件ik使用比较广泛,
hanlp
是一个自然语言处理包,能更好的根据上下文的语义,人名,地名
adnb34g
·
2019-07-01 11:00
基于
hanlp
的es分词插件
摘要:elasticsearch是使用比较广泛的分布式搜索引擎,es提供了一个的单字分词工具,还有一个分词插件ik使用比较广泛,
hanlp
是一个自然语言处理包,能更好的根据上下文的语义,人名,地名,组织机构名等来切分词
adnb34g
·
2019-07-01 10:28
hanlp
自然语言处理
py
hanlp
繁简转换之拼音转换与字符正则化
阅读更多繁简转换
HanLP
几乎实现了所有我们需要的繁简转换方式,并且已经封装到了
HanLP
中,使得我们可以轻松的使用,而分词器中已经默认支持多种繁简格式或者混合。这里我们不再做过多描述。
adnb34g
·
2019-06-28 09:00
py
hanlp
繁简转换之拼音转换与字符正则化
繁简转换
HanLP
几乎实现了所有我们需要的繁简转换方式,并且已经封装到了
HanLP
中,使得我们可以轻松的使用,而分词器中已经默认支持多种繁简格式或者混合。这里我们不再做过多描述。
adnb34g
·
2019-06-28 09:57
pyhanlp
自然语言处理
NLP之分词jieba、
HanLP
、中科院nlpir
目前主流的分词有jieba、哈工大LTP、中科院计算所NLPIR、清华大学THULAC和FoolNLTK、
HanLP
jieba分词目前是最主流的python中文分词组件,包括精确模式,在jieba分词中需要加载自定义词库
chenxinvhai89
·
2019-06-21 15:09
NLP
Ansj与
hanlp
分词工具对比
阅读更多一、Ansj1、利用DicAnalysis可以自定义词库:2、但是自定义词库存在局限性,导致有些情况无效:比如:“不好用“的正常分词结果:“不好,用”。(1)当自定义词库”好用“时,词库无效,分词结果不变。(2)当自定义词库“不好用”时,分词结果为:“不好用”,即此时自定义词库有效。3、由于版本问题,可能DicAnalysis,ToAnalysis等类没有序列化,导致读取hdfs数据出错此
adnb34g
·
2019-06-21 13:00
Ansj与
hanlp
分词工具对比
一、Ansj1、利用DicAnalysis可以自定义词库:2、但是自定义词库存在局限性,导致有些情况无效:比如:“不好用“的正常分词结果:“不好,用”。(1)当自定义词库”好用“时,词库无效,分词结果不变。(2)当自定义词库“不好用”时,分词结果为:“不好用”,即此时自定义词库有效。3、由于版本问题,可能DicAnalysis,ToAnalysis等类没有序列化,导致读取hdfs数据出错此时需要继
adnb34g
·
2019-06-21 12:07
ansj
hanlp
自然语言处理
中文分词工具比较 6大中文分词器测试(哈工大LTP、中科院计算所NLPIR、清华大学THULAC和jieba、FoolNLTK、
HanLP
)
https://blog.csdn.net/shuihupo/article/details/81540433
澜吉未央
·
2019-06-19 15:05
Hanlp
配置自定义词典遇到的问题与解决方法
阅读更多本文是整理了部分网友在配置
hanlp
自定义词典时遇到的一小部分问题,同时针对这些问题,也提供另一些解决的方案以及思路。这里分享给大家学习参考。
adnb34g
·
2019-06-17 10:00
Hanlp
配置自定义词典遇到的问题与解决方法
本文是整理了部分网友在配置
hanlp
自定义词典时遇到的一小部分问题,同时针对这些问题,也提供另一些解决的方案以及思路。这里分享给大家学习参考。
adnb34g
·
2019-06-17 09:41
hanlp
自定义词典
自然语言处理
HanLP
-分类模块的分词器介绍
阅读更多最近发现一个很勤快的大神在分享他的一些实操经验,看了一些他自己关于
hanlp
方面的文章,写的挺好的!转载过来分享给大家!
adnb34g
·
2019-06-14 10:00
HanLP
-分类模块的分词器介绍
最近发现一个很勤快的大神在分享他的一些实操经验,看了一些他自己关于
hanlp
方面的文章,写的挺好的!转载过来分享给大家!
adnb34g
·
2019-06-14 10:58
hanlp
自然语言处理
自然语言处理
HanLP
词性标注列表
字母描述a形容词f方位词mq数量词nn工作相关名词ad副形词g学术词汇n名词nnd职业ag形容词性语素gb生物相关词汇nb生物名nnt职务职称al形容词性惯用语gbc生物类别nba动物名nr人名an名形词gc化学相关词汇nbc动物纲目nr1复姓b区别词gg地理地质相关词汇nbp植物名nr2蒙古姓名begin仅用于始##始gi计算机相关词汇nf食品,比如“薯片”nrf音译人名bg区别语素gm数学相关
片刻_ApacheCN
·
2019-06-10 11:49
HanLP
词性标注列表
字母描述a形容词f方位词mq数量词nn工作相关名词ad副形词g学术词汇n名词nnd职业ag形容词性语素gb生物相关词汇nb生物名nnt职务职称al形容词性惯用语gbc生物类别nba动物名nr人名an名形词gc化学相关词汇nbc动物纲目nr1复姓b区别词gg地理地质相关词汇nbp植物名nr2蒙古姓名begin仅用于始##始gi计算机相关词汇nf食品,比如“薯片”nrf音译人名bg区别语素gm数学相关
片刻_ApacheCN
·
2019-06-10 11:49
Java实现基于文本分类的情感分析功能
此为原创文章,转载请注明出处https://blog.csdn.net/FRYAN28/article/details/91129584最近有做了一个简单的文本情感分析,使用到
hanlp
包实现。
斯沃乐。
·
2019-06-07 18:12
Java
HanLP
-最短路径分词
等把
HanLP
词法分析介绍结束后,还是会换回macbookpro的。个人有强迫症,只要看或写Java或C/C++代码或者用开发机的化,还是喜欢在windows下工作。
adnb34g
·
2019-06-05 11:00
HanLP
-最短路径分词
等把
HanLP
词法分析介绍结束后,还是会换回macbookpro的。个人有强迫症,只要看或写Java或C/C++代码或者用开发机的化,还是喜欢在windows下工作。
adnb34g
·
2019-06-05 10:35
hanlp
最短路径分词
自然语言处理
部分常用分词工具使用整理
1、jieba(结巴分词)免费使用2、
HanLP
(汉语言处理包)免费使用3、SnowNLP(中文的类库)免费使用4、FoolNLTK(中文处理工具包)免费使用5、Jiagu(甲骨NLP)免费使用6、pyltp
adnb34g
·
2019-05-29 09:00
python
部分常用分词工具使用整理
1、jieba(结巴分词)免费使用2、
HanLP
(汉语言处理包)免费使用3、SnowNLP(中文的类库)免费使用4、FoolNLTK(中文处理工具包)免费使用5、Jiagu(甲骨NLP)免费使用6、pyltp
adnb34g
·
2019-05-29 09:00
python
部分常用分词工具使用整理
1、jieba(结巴分词)免费使用2、
HanLP
(汉语言处理包)免费使用3、SnowNLP(中文的类库)免费使用4、FoolNLTK(中文处理工具包)免费使用5、Jiagu(甲骨NLP)免费使用6、pyltp
adnb34g
·
2019-05-29 09:49
hanlp分词
jieba分词
汉语分词系统
自然语言处理
HanLP
-实词分词器详解
阅读更多在进行文本分类(非情感分类)时,我们经常只保留实词(名、动、形)等词,为了文本分类的分词方便,
HanLP
专门提供了实词分词器类NotionalTokenizer,同时在分类数据集加载处理时,默认使用了
adnb34g
·
2019-05-27 10:00
HanLP
-实词分词器
在进行文本分类(非情感分类)时,我们经常只保留实词(名、动、形)等词,为了文本分类的分词方便,
HanLP
专门提供了实词分词器类NotionalTokenizer,同时在分类数据集加载处理时,默认使用了NotionalTokenizer
adnb34g
·
2019-05-27 10:04
pyhanlp
实词分词
自然语言处理
自然语言处理——中英文分词工具(还可做词性标注与命名实体识别)
更多内容请至南木博客主页查看哦中文分词工具JiebaSnowNLPTHULACNLPIRNLPIRStanfordCoreNLP
HanLP
英文分词工具nltknltknltkSpacySpacyStanfordCoreNLP
南木Sir
·
2019-05-24 21:08
自然语言处理
南木的下午茶
Eclipse myeclipse下配置
HanLP
的教程
阅读更多一、说明博主的配置1:window102:myeclipse3:jdk1.8备注:文章分享自贾继康的博客,博客使用的
hanlp
是1.6.8的版本。
adnb34g
·
2019-05-24 10:00
HanLP
-停用词表的使用示例
阅读更多停用词表的修改停用词表在“py
hanlp
\static\data\dictionary”路径下的“stopwords.txt”文件中,CoreStopWordDictionary.apply方法支持去除停用词
adnb34g
·
2019-05-22 11:00
hanlp
自然语言处理工具
hanlp
定制用户词条
阅读更多自然语言处理工具
hanlp
定制用户词条作者:baiziyu关于
hanlp
的文章已经分享过很多,似乎好像大部分以理论性的居多。
adnb34g
·
2019-05-20 10:00
词法分析
自然语言处理工具
hanlp
定制用户词条
作者:baiziyu关于
hanlp
的文章已经分享过很多,似乎好像大部分以理论性的居多。最近有在整理一些
hanlp
应用项目中的文章,待整理完成后会陆续分享出来。
adnb34g
·
2019-05-20 09:32
词法分析
自然语言处理
自然语言处理工具py
hanlp
分词与词性标注
阅读更多Py
hanlp
分词与词性标注的相关内容记得此前是有分享过的。可能时间太久记不太清楚了。以下文章是分享自“baiziyu”所写(小部分内容有修改),供大家学习参考之用。
adnb34g
·
2019-05-18 10:00
python
文本挖掘
文本分类
自然语言处理工具py
hanlp
分词与词性标注
阅读更多Py
hanlp
分词与词性标注的相关内容记得此前是有分享过的。可能时间太久记不太清楚了。以下文章是分享自“baiziyu”所写(小部分内容有修改),供大家学习参考之用。
adnb34g
·
2019-05-18 10:00
python
文本挖掘
文本分类
自然语言处理工具py
hanlp
分词与词性标注
阅读更多Py
hanlp
分词与词性标注的相关内容记得此前是有分享过的。可能时间太久记不太清楚了。以下文章是分享自“baiziyu”所写(小部分内容有修改),供大家学习参考之用。
adnb34g
·
2019-05-18 10:00
python
文本挖掘
文本分类
自然语言处理工具py
hanlp
分词与词性标注
Py
hanlp
分词与词性标注的相关内容记得此前是有分享过的。可能时间太久记不太清楚了。以下文章是分享自“baiziyu”所写(小部分内容有修改),供大家学习参考之用。
adnb34g
·
2019-05-18 09:51
文本分类
文本挖掘
计算语言学
自然语言处理
自然语言处理工具
HanLP
-N最短路径分词
阅读更多本篇给大家分享baiziyu写的
HanLP
中的N-最短路径分词。以为下分享的原文,部分地方有稍作修改,内容仅供大家学习交流!
adnb34g
·
2019-05-17 09:00
N最短路径分词
自然语言处理工具
HanLP
-N最短路径分词
本篇给大家分享baiziyu写的
HanLP
中的N-最短路径分词。以为下分享的原文,部分地方有稍作修改,内容仅供大家学习交流!
adnb34g
·
2019-05-17 09:02
自然语言处理工具
hanlp
N最短路径分词
自然语言处理
NLP基础实验③:中文分词-jiaba
中文分词有很多种,常见的比如有中科院计算所NLPIR、哈工大LTP、清华大学THULAC、斯坦福分词器、
Hanlp
分词器、jieba分词、IKAnalyzer等。
NLP_victor
·
2019-05-14 21:44
中文分词
NLP实战
Python依赖包py
hanlp
的安装说明
1.安装JPype1;2.安装py
hanlp
包:pythonsetup.pyinstall注意:py
hanlp
中requirements.txt中jpype1版本与安装的JPype1的版本相匹配3.有时候可能会报
hellowuxia
·
2019-05-14 18:19
Python
一文掌握
HanLP
用法
本文简绍了
HanLP
的使用方法,
HanLP
是一系列模型与算法组成的NLP工具包,由大快搜索主导并完全开源,目前支持很多功能,项目主要是Java的,也支持python,本文详细简绍py
hanlp
的使用方法
cpongo2
·
2019-05-13 00:00
HanLP
:py
hanlp
安装成功之后,第一次使用出错——连接失败或者无此文件
使用命令`
hanlp
`来验证安装:C:\Users\Cab>
hanlp
Downloadinghttp://file.hankcs.com/
hanlp
/data-for-1.7.3.ziptog:\developinstall
MCabbage
·
2019-05-10 17:45
NLP
python第三方库
自然语言处理工具
hanlp
1.7.3版本更新内容一览
阅读更多
HanLP
1.7.3发布了。
HanLP
是由一系列模型与算法组成的Java工具包,目标是普及自然语言处理在生产环境中的应用。
HanLP
具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点。
adnb34g
·
2019-05-10 10:00
算法
自然语言处理工具
hanlp
1.7.3版本更新内容一览
阅读更多
HanLP
1.7.3发布了。
HanLP
是由一系列模型与算法组成的Java工具包,目标是普及自然语言处理在生产环境中的应用。
HanLP
具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点。
adnb34g
·
2019-05-10 10:00
算法
自然语言处理工具
hanlp
1.7.3版本更新内容一览
阅读更多
HanLP
1.7.3发布了。
HanLP
是由一系列模型与算法组成的Java工具包,目标是普及自然语言处理在生产环境中的应用。
HanLP
具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点。
adnb34g
·
2019-05-10 10:00
算法
自然语言处理工具
hanlp
1.7.3版本更新内容一览
HanLP
1.7.3发布了。
HanLP
是由一系列模型与算法组成的Java工具包,目标是普及自然语言处理在生产环境中的应用。
HanLP
具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点。
adnb34g
·
2019-05-10 09:14
自然
语言
处理
自然语言处理
【py
hanlp
】py
hanlp
的安装与使用
介绍py
hanlp
HanLP
是由一系列模型与算法组成的Java工具包,目标是普及自然语言处理在生产环境中的应用。
HanLP
具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点。
ezreal is easy
·
2019-05-08 17:35
pyhanlp
Spark中分布式使用
HanLP
(1.7.0)分词示例
阅读更多
HanLP
分词,如README中所说,如果没有特殊需求,可以通过maven配置,如果要添加自定义词典,需要下载“依赖jar包和用户字典".分享某大神的示例经验:是直接"javaxf
hanlp
-1.6.8
adnb34g
·
2019-05-08 09:00
spark
Spark中分布式使用
HanLP
(1.7.0)分词示例
阅读更多
HanLP
分词,如README中所说,如果没有特殊需求,可以通过maven配置,如果要添加自定义词典,需要下载“依赖jar包和用户字典".分享某大神的示例经验:是直接"javaxf
hanlp
-1.6.8
adnb34g
·
2019-05-08 09:00
spark
使用
HanLP
框架为内容分词并计算词频
HanLP
网址http://
hanlp
.com/一、首先Maven引入如下包:com.hankcs
hanlp
portable-1.7.3二、下载
HanLP
数据包(data文件)点击下载
HanLP
数据包三
周梦顺
·
2019-05-06 17:33
HanLP
如何在java中去除中文文本的停用词
阅读更多1.整体思路第一步:先将中文文本进行分词,这里使用的
HanLP
-汉语言处理包进行中文文本分词。第二步:使用停用词表,去除分好的词中的停用词。
adnb34g
·
2019-05-06 10:00
NLP技术总结
nlp常用软件包:NLTK,gensim,jieba,stanfordcorenlp,
hanlp
。如何处理分词分错的情况:加载自定义字典。如何处理多个词组成的短语的情况:自定义语法规则。
Alphapeople
·
2019-04-30 15:32
机器学习
自然语言处理(NLP)一些任务的总结
库开源or商业支持语言分词词性标注命名实体识别费用
HanLP
开源Java,C++,Python有有有无Jieba开源Java,C++,Python有无无无FudanNL
奔向算法的喵
·
2019-04-19 13:55
关于使用
hanlp
进行中文分词时,出现错误 TypeError: must be str, not java.util.ArrayList 的解决方法
hanlp
是基于java开发的,主要是用于生产环境下,如果使用python来调用
hanlp
的话,可以通过py
hanlp
来使用它。
DM_learner
·
2019-04-16 21:02
机器学习
上一页
7
8
9
10
11
12
13
14
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他