E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Hanlp
py
hanlp
安装介绍和简单应用
Hanlp
HanLP
是由一系列模型与算法组成的Java工具包,目标是普及自然语言处理在生产环境中的应用。
HanLP
具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点。
人工智站
·
2019-02-22 11:21
py
hanlp
文本分类与情感分析
阅读更多语料库本文语料库特指文本分类语料库,对应IDataSet接口。而文本分类语料库包含两个概念:文档和类目。一个文档只属于一个类目,一个类目可能含有多个文档。比如搜狗文本分类语料库迷你版.zip,下载前请先阅读搜狗实验室数据使用许可协议。用Map描述这种关系可以用Java的Map来描述,其key代表类目,value代表该类目下的所有文档。用户可以利用自己的文本读取模块构造一个Map形式的中间语
adnb34g
·
2019-02-20 15:00
Hanlp
分词之CRF中文词法分析详解
默认模型训练自OpenCorpus/pku98/199801.txt,随
hanlp
1.6.2以上版本发布。语料格式等与感知机词法分析器相同,请先阅读《感知机词法分析器》。
adnb34g
·
2019-02-18 14:17
CRF分词
中文识别
自然语言处理
NLP自然语言处理中的
hanlp
分词实例
阅读更多本篇分享的依然是关于
hanlp
的分词使用,文章内容分享自gladosAI的博客,本篇文章中提出了一个问题,
hanlp
分词影响了实验判断结果。
adnb34g
·
2019-02-18 10:00
NLP
jieba分词
NLP自然语言处理中的
hanlp
分词实例
本篇分享的依然是关于
hanlp
的分词使用,文章内容分享自gladosAI的博客,本篇文章中提出了一个问题,
hanlp
分词影响了实验判断结果。为何会如此,不妨一起学习一下gladosAI的这篇文章。
adnb34g
·
2019-02-18 08:16
NLP
hanlp分词
jieba分词
自然语言处理
Py
hanlp
自然语言处理中的新词识别
阅读更多Py
hanlp
自然语言处理中的新词识别新词发现本“新词发现”模块基于信息熵和互信息两种算法,可以在无语料的情况下提取一段长文本中的词语,并支持过滤掉系统中已存在的“旧词”,得到新词列表。
adnb34g
·
2019-02-15 15:00
Py
hanlp
自然语言处理中的新词识别
调用方法静态方法一句话静态调用接口已经封装到
HanLP
中:/***提取词语**@paramtext大文本*@paramsize需要提取词语的数量*@return一个词语列表*/publicstaticListextractWords
adnb34g
·
2019-02-15 14:06
pyhanlp
新词识别
自然语言处理
Py
hanlp
自然语言处理中的新词识别
调用方法静态方法一句话静态调用接口已经封装到
HanLP
中:/***提取词语**@paramtext大文本*@paramsize需要提取词语的数量*@return一个词语列表*/publicstaticListextractWords
adnb34g
·
2019-02-15 14:06
自然语言处理
新词识别
hanlp
中文自然语言处理工具
HanLP
源码包的下载使用记录
阅读更多这篇文章主要分享的是
hanlp
自然语言处理源码的下载,数据集的下载,以及将让源代码中的demo能够跑通。
Hanlp
安装包的下载以及安装其实之前就已经有过分享了。
adnb34g
·
2019-02-15 10:00
中文自然语言处理工具
HanLP
源码包的下载使用记录
这篇文章主要分享的是
hanlp
自然语言处理源码的下载,数据集的下载,以及将让源代码中的demo能够跑通。
Hanlp
安装包的下载以及安装其实之前就已经有过分享了。
adnb34g
·
2019-02-15 09:10
自然语言处理
hanlp下载
自然语言处理
中文自然语言处理工具
hanlp
隐马角色标注详解
阅读更多本文旨在介绍如何利用
HanLP
训练分词模型,包括语料格式、语料预处理、训练接口、输出格式等。
adnb34g
·
2019-02-13 15:00
hanlp
中文自然语言处理工具
hanlp
隐马角色标注详解
本文旨在介绍如何利用
HanLP
训练分词模型,包括语料格式、语料预处理、训练接口、输出格式等。
adnb34g
·
2019-02-13 14:16
HanLP
训练
分词模型
自然语言处理
自然语言处理工具python调用
hanlp
中文实体识别
阅读更多
Hanlp
作为一款重要的中文分词工具,在GitHub的用户量已经非常之高,应该可以看得出来大家对于
hanlp
这款分词工具还是很认可的。
adnb34g
·
2019-02-13 10:00
python
自然语言处理工具python调用
hanlp
中文实体识别
阅读更多
Hanlp
作为一款重要的中文分词工具,在GitHub的用户量已经非常之高,应该可以看得出来大家对于
hanlp
这款分词工具还是很认可的。
adnb34g
·
2019-02-13 10:00
python
自然语言处理工具python调用
hanlp
中文实体识别
阅读更多
Hanlp
作为一款重要的中文分词工具,在GitHub的用户量已经非常之高,应该可以看得出来大家对于
hanlp
这款分词工具还是很认可的。
adnb34g
·
2019-02-13 10:00
python
自然语言处理工具python调用
hanlp
中文实体识别
Hanlp
作为一款重要的中文分词工具,在GitHub的用户量已经非常之高,应该可以看得出来大家对于
hanlp
这款分词工具还是很认可的。
adnb34g
·
2019-02-13 09:07
自然
语言
处理工具
自然语言处理
自然语言处理工具
hanlp
自定义词汇添加图解
阅读更多过程分析1.添加新词需要确定无缓存文件,否则无法使用成功,因为词典会优先加载缓存文件2.再确认缓存文件不在时,打开本地词典按照格式添加自定义词汇。3.调用分词函数重新生成缓存文件,这时会报一个找不到缓存文件的异常,不用管,因为加载词典进入内存是会优先加载缓存,缓存不在当然会报异常,然后加载词典生成缓存文件,最后处理字符进行分词就会发现新添加的词汇可以进行分词了。操作过程图解:1、有缓存文件
adnb34g
·
2019-01-27 10:00
自然语言处理工具
自然语言处理工具
hanlp
自定义词汇添加图解
过程分析1.添加新词需要确定无缓存文件,否则无法使用成功,因为词典会优先加载缓存文件2.再确认缓存文件不在时,打开本地词典按照格式添加自定义词汇。3.调用分词函数重新生成缓存文件,这时会报一个找不到缓存文件的异常,不用管,因为加载词典进入内存是会优先加载缓存,缓存不在当然会报异常,然后加载词典生成缓存文件,最后处理字符进行分词就会发现新添加的词汇可以进行分词了。操作过程图解:1、有缓存文件的情况下
左手中的倒影
·
2019-01-27 10:40
自然语言处理工具
hanlp
自定义词汇添加图解
过程分析1.添加新词需要确定无缓存文件,否则无法使用成功,因为词典会优先加载缓存文件2.再确认缓存文件不在时,打开本地词典按照格式添加自定义词汇。3.调用分词函数重新生成缓存文件,这时会报一个找不到缓存文件的异常,不用管,因为加载词典进入内存是会优先加载缓存,缓存不在当然会报异常,然后加载词典生成缓存文件,最后处理字符进行分词就会发现新添加的词汇可以进行分词了。操作过程图解:1、有缓存文件的情况下
adnb34g
·
2019-01-27 09:08
自然语言处理工具
hanlp
自然语言处理
在
Hanlp
词典手动添加未登录词的方式介绍
阅读更多在使用
Hanlp
词典进行分词的时候,会出现分词不准的情况,原因是内置词典中并没有收录当前这个词,也就是我们所说的未登录词,只要把这个词加入到内置词典中就可以解决类似问题,如何操作呢,下面我们来看一下
adnb34g
·
2019-01-25 10:00
如何使用
Hanlp
加载大字典
阅读更多问题因为需要加载一个近1G的字典到
Hanlp
中,一开始使用了CustomDictionay.add()方法来一条条的加载,果然到了中间,维护DoubleArraTre的成本太高,添加一个节点,都会很长时间
adnb34g
·
2019-01-23 10:00
hanlp
spark集群使用
hanlp
进行分布式分词操作说明
阅读更多本篇分享一个使用
hanlp
分词的操作小案例,即在spark集群中使用
hanlp
完成分布式分词的操作,文章整理自【qq_33872191】的博客,感谢分享!
adnb34g
·
2019-01-21 10:00
spark
spark集群使用
hanlp
进行分布式分词操作说明
阅读更多本篇分享一个使用
hanlp
分词的操作小案例,即在spark集群中使用
hanlp
完成分布式分词的操作,文章整理自【qq_33872191】的博客,感谢分享!
adnb34g
·
2019-01-21 10:00
spark
自然语言处理
hanlp
的入门基础
阅读更多此文整理的基础是建立在
hanlp
较早版本的基础上的,虽然
hanlp
的最新1.7版本已经发布,但对于入门来说差别不大!分享一篇比较早的“旧文”给需要的朋友!
adnb34g
·
2019-01-18 11:00
hanlp
自然语言处理
hanlp
的入门基础
此文整理的基础是建立在
hanlp
较早版本的基础上的,虽然
hanlp
的最新1.7版本已经发布,但对于入门来说差别不大!分享一篇比较早的“旧文”给需要的朋友!
左手中的倒影
·
2019-01-18 10:51
自然语言处理
hanlp
的入门基础
此文整理的基础是建立在
hanlp
较早版本的基础上的,虽然
hanlp
的最新1.7版本已经发布,但对于入门来说差别不大!分享一篇比较早的“旧文”给需要的朋友!
adnb34g
·
2019-01-18 10:59
hanlp
自然语言处理
基于CRF序列标注的中文依存句法分析器的Java实现
相较于《最大熵依存句法分析器的实现》,分析速度翻了一倍,达到了1262.8655sent/s开源项目本文代码已集成到
HanLP
中开源项目中,最新
hanlp
1.7版本已经发布CRF简介CRF是序列标注场景中常用的模型
adnb34g
·
2019-01-16 13:00
java
基于结构化平均感知机的分词器Java实现
数据在一台普通的IBM兼容机上得到:本模块已集成到
HanLP
1.6以
adnb34g
·
2019-01-14 09:41
大数据
hanlp
人工智能
机器学习
HanLP
分词命名实体提取详解
阅读更多分享一篇大神的关于
hanlp
分词命名实体提取的经验文章,文章中分享的内容略有一段时间(使用的
hanlp
版本比较老),最新一版的
hanlp
已经出来了,也可以去看看新版的
hanlp
在这方面有何提升!
adnb34g
·
2019-01-11 14:00
hanlp
HanLP
分词命名实体提取详解
分享一篇大神的关于
hanlp
分词命名实体提取的经验文章,文章中分享的内容略有一段时间(使用的
hanlp
版本比较老),最新一版的
hanlp
已经出来了,也可以去看看新版的
hanlp
在这方面有何提升!
adnb34g
·
2019-01-11 11:46
大数据
hanlp
HanLP
极致简繁转换详细讲解
阅读更多
HanLP
极致简繁转换详细讲解作者:hankcs(大快高级研究员
hanlp
项目负责人)谈起简繁转换,许多人以为是小意思,按字转换就行了。
adnb34g
·
2019-01-09 13:00
hanlp
py
hanlp
中文词性标注与分词简介
阅读更多py
hanlp
实现的分词器有很多,同时py
hanlp
获取
hanlp
中分词器也有两种方式第一种是直接从封装好的
hanlp
类中获取,这种获取方式一共可以获取五种分词器,而现在默认的就是第一种维特比分词器
adnb34g
·
2019-01-07 13:00
pyhanlp
py
hanlp
中文词性标注与分词简介
py
hanlp
中文词性标注与分词简介py
hanlp
实现的分词器有很多,同时py
hanlp
获取
hanlp
中分词器也有两种方式第一种是直接从封装好的
hanlp
类中获取,这种获取方式一共可以获取五种分词器,而现在默认的就是第一种维特比分词器
adnb34g
·
2019-01-07 10:18
pyhanlp
中文词性标注
分词
自然语言处理
py
hanlp
共性分析与短语提取内容详解
阅读更多py
hanlp
共性分析与短语提取内容详解简介
HanLP
中的词语提取是基于互信息与信息熵。想要计算互信息与信息熵有限要做的是文本分词进行共性分析。
adnb34g
·
2019-01-04 10:00
hanlp
短语提取
中文分词性能对比
jieba(结巴分词)免费使用
HanLP
(汉语言处理包)免费使用SnowNLP(中文的类库)免费使用FoolNLTK(中文处理工具包)免费使用Jiagu(甲骨NLP)免费使用pyltp(哈工大语言云)商用需要付费
Yener丶
·
2019-01-02 19:12
人工智能
Linux编程
知识图谱
常用分词工具使用教程
jieba(结巴分词)免费使用
HanLP
(汉语言处理包)免费使用SnowNLP(中文的类库)免费使用FoolNLTK(中文处理工具包)免费使用Jiagu(甲骨NLP)免费使用pyltp(哈工大语言云)商用需要付费
Yener丶
·
2019-01-02 19:55
人工智能
Linux编程
Python
机器学习
hanlp
汉语自然语言处理入门基础知识介绍
阅读更多自然语言处理定义:自然语言处理是一门计算机科学、人工智能以及语言学的交叉学科。虽然语言只是人工智能的一部分(人工智能还包括计算机视觉等),但它是非常独特的一部分。这个星球上有许多生物拥有超过人类的视觉系统,但只有人类才拥有这么高级的语言。自然语言处理的目标是让计算机处理或说“理解”自然语言,以完成有意义的任务,比如订机票购物或QA等。完全理解和表达语言是极其困难的,完美的语言理解等效于实现
adnb34g
·
2019-01-02 14:00
HanLP
的自定义词典使用方式与注意事项介绍
阅读更多【环境】python2.7方法一:使用py
hanlp
,具体方法如下:pipinstallpy
hanlp
#安装py
hanlp
进入python安装包路径,如/usr/lib/python2.7/site-packages
adnb34g
·
2019-01-02 10:00
python
hanlp
HanLP
的自定义词典使用方式与注意事项介绍
阅读更多【环境】python2.7方法一:使用py
hanlp
,具体方法如下:pipinstallpy
hanlp
#安装py
hanlp
进入python安装包路径,如/usr/lib/python2.7/site-packages
adnb34g
·
2019-01-02 10:00
python
hanlp
简单有效的多标准中文分词详解
(相关内容已经集成到大快的
hanlp
中,代码和语料可访问github上的
hanlp
开源项目主页查询)自然语言处理,特别是中文处理中
adnb34g
·
2018-12-28 14:00
python调用
hanlp
分词包手记
阅读更多python调用
hanlp
分词包手记
Hanlp
作为一款重要的分词工具,本月初的时候看到大快搜索发布了
hanlp
的1.7版本,新增了文本聚类、流水线分词等功能。
adnb34g
·
2018-12-26 11:00
python
hanlp分词
python调用
hanlp
分词包手记
阅读更多python调用
hanlp
分词包手记
Hanlp
作为一款重要的分词工具,本月初的时候看到大快搜索发布了
hanlp
的1.7版本,新增了文本聚类、流水线分词等功能。
adnb34g
·
2018-12-26 11:00
python
hanlp分词
python调用
hanlp
分词包手记
阅读更多python调用
hanlp
分词包手记
Hanlp
作为一款重要的分词工具,本月初的时候看到大快搜索发布了
hanlp
的1.7版本,新增了文本聚类、流水线分词等功能。
adnb34g
·
2018-12-26 11:00
python
hanlp分词
python调用
hanlp
分词包手记
python调用
hanlp
分词包手记
Hanlp
作为一款重要的分词工具,本月初的时候看到大快搜索发布了
hanlp
的1.7版本,新增了文本聚类、流水线分词等功能。
adnb34g
·
2018-12-26 09:03
python
hanlp分词
自然语言处理工具
自然语言处理
自然语言处理工具
HanLP
被收录中国大数据产业发展的创新技术新书《数据之翼》
阅读更多在12月20日由中国电子信息产业发展研究院主办的2018中国软件大会上,大快搜索获评“2018中国大数据基础软件领域领军企业”,并成功入选中国数字化转型TOP100服务商。图:大快搜索获评“2018中国大数据基础软件领域领军企业”在本届2018中国软件大会上,不仅宣传并成立了数字转型促进会,还发布了由中国大数据产业生态联盟副秘书长、《软件和集成电路》杂志社总编辑郭嘉凯编辑的新书——《数据之
adnb34g
·
2018-12-24 13:00
大数据产业发展创新技术新书《数据之翼》收录自然语言处理工具
HanLP
在12月20日由中国电子信息产业发展研究院主办的2018中国软件大会上,大快搜索获评“2018中国大数据基础软件领域领军企业”,并成功入选中国数字化转型TOP100服务商。图:大快搜索获评“2018中国大数据基础软件领域领军企业”在本届2018中国软件大会上,不仅宣传并成立了数字转型促进会,还发布了由中国大数据产业生态联盟副秘书长、《软件和集成电路》杂志社总编辑郭嘉凯编辑的新书——《数据之翼-引领
lanlantian123
·
2018-12-24 10:58
自然语言处理工具
HanLP
被收录中国大数据产业发展的创新技术新书《数据之翼》
在12月20日由中国电子信息产业发展研究院主办的2018中国软件大会上,大快搜索获评“2018中国大数据基础软件领域领军企业”,并成功入选中国数字化转型TOP100服务商。图:大快搜索获评“2018中国大数据基础软件领域领军企业”在本届2018中国软件大会上,不仅宣传并成立了数字转型促进会,还发布了由中国大数据产业生态联盟副秘书长、《软件和集成电路》杂志社总编辑郭嘉凯编辑的新书——《数据之翼-引领
adnb34g
·
2018-12-24 09:20
hanlp
数据之翼
自然语言处理工具
自然语言处理
py
hanlp
两种依存句法分类器
阅读更多依存句法分析器在
HanLP
中一共有两种句法分析器·依存句法分析(1)基于神经网络的高性能依存句法分析器(2)MaxEnt依存句法分析基于神经网络的高性能依存句法分析器
HanLP
中的基于神经网络的高性能依存句法分析器参考的是
adnb34g
·
2018-12-21 11:00
python
依存句法
py
hanlp
两种依存句法分类器
阅读更多依存句法分析器在
HanLP
中一共有两种句法分析器·依存句法分析(1)基于神经网络的高性能依存句法分析器(2)MaxEnt依存句法分析基于神经网络的高性能依存句法分析器
HanLP
中的基于神经网络的高性能依存句法分析器参考的是
adnb34g
·
2018-12-21 11:00
python
依存句法
在Windows下离线安装py
hanlp
HanLP
是一款优秀的中文自然语言处理工具,可以实现包括分词、词性标注、实体识别在内容诸多功能,详情见其项目主页。
SunJW_2017
·
2018-12-20 11:07
python包的安装
上一页
9
10
11
12
13
14
15
16
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他