E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Hanlp
py
hanlp
安装、使用
github地址:https://github.com/hankcs/
HanLP
一、win10安装py
hanlp
1.在cmd环境下输入:condainstall-cconda-forgejpype1pipinstallpy
hanlp
蕾姆233
·
2019-04-11 11:27
NLP
Hanlp
自然语言处理工具之词法分析器
阅读更多本章是接前两篇《分词工具
Hanlp
基于感知机的中文分词框架》和《基于结构化感知机的词性标注与命名实体识别框架》的。
adnb34g
·
2019-04-10 10:00
Hanlp
自然语言处理工具之词法分析器
本章是接前两篇《分词工具
Hanlp
基于感知机的中文分词框架》和《基于结构化感知机的词性标注与命名实体识别框架》的。本系统将同时进行中文分词、词性标注与命名实体识别3个任务的子系统称为“词法分析器”。
adnb34g
·
2019-04-10 09:30
自然语言处理
基于结构化感知机的词性标注与命名实体识别框架
阅读更多上周就关于《结构化感知机标注框架的内容》已经分享了一篇《分词工具
Hanlp
基于感知机的中文分词框架》,本篇接上一篇内容,继续分享词性标注与命名实体识别框架的内容。
adnb34g
·
2019-04-08 14:00
分词工具
Hanlp
基于感知机的中文分词框架
中文分词训练只需指定输入语料的路径(单文档时为文件路径,多文档时为文件夹路径,灵活处理),以及模型保存位置即可:命令行java-cp
hanlp
.
adnb34g
·
2019-04-03 10:00
分词工具
Hanlp
基于感知机的中文分词框架
中文分词训练只需指定输入语料的路径(单文档时为文件路径,多文档时为文件夹路径,灵活处理),以及模型保存位置即可:命令行java-cp
hanlp
.jarc
adnb34g
·
2019-04-03 10:37
hanlp
中文分词
结构化感知机
自然语言处理
分词工具
Hanlp
基于感知机的中文分词框架
中文分词训练只需指定输入语料的路径(单文档时为文件路径,多文档时为文件夹路径,灵活处理),以及模型保存位置即可:命令行java-cp
hanlp
.jarc
adnb34g
·
2019-04-03 10:30
hanlp
中文分词
结构化感知机
自然语言处理
分词工具
Hanlp
基于感知机的中文分词框架
中文分词训练只需指定输入语料的路径(单文档时为文件路径,多文档时为文件夹路径,灵活处理),以及模型保存位置即可:命令行java-cp
hanlp
.jarc
adnb34g
·
2019-04-03 10:46
自然语言处理
Android环境下
hanlp
汉字转拼音功能的使用介绍
后来寻找其他方案,在github上找到了
HanLP
开源库,其多音字转换速度非常快,但是没有针对Android平台进行适配,于是对代码进行了一些修改,终于可以在Android手机上运行。
adnb34g
·
2019-04-01 15:00
自然语言
Hadoop
安卓平台
Android环境下
hanlp
汉字转拼音功能的使用介绍
后来寻找其他方案,在github上找到了
HanLP
开源库,其多音字转换速度非常快,但是没有针对Android平台进行适配,于是对代码进行了一些修改,终于可以在Android手机上运行。
adnb34g
·
2019-04-01 15:00
自然语言
Hadoop
安卓平台
Android环境下
hanlp
汉字转拼音功能的使用介绍
后来寻找其他方案,在github上找到了
HanLP
开源库,其多音字转换速度非常快,但是没有针对Android平台进行适配,于是对代码进行了一些修改,终于可以在Android手机上运行。
adnb34g
·
2019-04-01 15:00
自然语言
Hadoop
安卓平台
Android环境下
hanlp
汉字转拼音功能的使用介绍
后来寻找其他方案,在github上找到了
HanLP
开源库,其多音字转换速度非常快,但是没有针对Android平台进行适配,于是对代码进行了一些修改,终于可以在Android手机上运行。
adnb34g
·
2019-04-01 13:09
自然语言处理
Hadoop
安卓平台
自然语言处理
汉语言处理工具py
hanlp
的拼音转换与字符正则化
阅读更多汉字转拼音
HanLP
中的汉字转拼音功能也十分的强大。说明:l
HanLP
不仅支持基础的汉字转拼音,还支持声母、韵母、音调、音标和输入法首字母首声母功能。
adnb34g
·
2019-03-29 13:00
汉语言处理工具py
hanlp
的拼音转换与字符正则化
汉字转拼音
HanLP
中的汉字转拼音功能也十分的强大。说明:
HanLP
不仅支持基础的汉字转拼音,还支持声母、韵母、音调、音标和输入法首字母首声母功能。
HanLP
能够识别多音字,也能给繁体中文注拼音。
adnb34g
·
2019-03-29 11:23
hanlp
拼音转换
自然语言处理
汉语言处理工具py
hanlp
的简繁转换
阅读更多繁简转换
HanLP
几乎实现了所有我们需要的繁简转换方式,并且已经封装到了
HanLP
中,使得我们可以轻松的使用,而分词器中已经默认支持多种繁简格式或者混合。这里我们不再做过多描述。
adnb34g
·
2019-03-29 10:00
使用Python的http.server实现一个简易的Web Api对外提供
HanLP
拼音转换服务
使用了一个折中的办法,省市区3级(3千+)用高准确度接口(几乎没有拼错的地名),镇级(4万+)用本地
HanLP
提供的接口(大部分多音字还算是能拼正确)。
xiangyuecn
·
2019-03-28 08:00
Hanlp
中N最短路径分词详细介绍
阅读更多N-最短路径是中科院分词工具NLPIR进行分词用到的一个重要算法,张华平、刘群老师在论文《基于N-最短路径方法的中文词语粗分模型》中做了比较详细的介绍。该算法算法基本思想很简单,就是给定一待处理字串,根据词典,找出词典中所有可能的词,构造出字串的一个有向无环图,算出从开始到结束所有路径中最短的前N条路径。因为允许相等长度的路径并列,故最终的结果集合会大于或等于N。根据算法思想,当我们拿到一
adnb34g
·
2019-03-25 13:00
N最短路径分词
【python】结巴分词、PKUSeg分词之间的区别问题及词性标注
分词之间的区别前言一、测试文本内容样式二、分词2.1jieba分词2.1.1源码2.1.2结果2.2PKUSeg分词2.2.1源码2.2.2结果三、词性标注3.1结巴词性标注3.1.1源码3.1.2结果3.2
hanlp
贾继康
·
2019-03-22 21:56
python
NLP自然语言处理中英文分词工具集锦与基本使用
目录NLP分词工具集锦分词实例用文件一、中文分词工具(1)Jieba(2)snowNLP分词工具(3)thulac分词工具(4)pynlpir分词工具(5)StanfordCoreNLP分词工具(6)
Hanlp
Eternal_Sun625
·
2019-03-20 14:31
Python
NLP
Hanlp
汉字转拼音使用python调用详解
1、
hanlp
简介
HanLP
是一系列模型与算法组成的NLP工具包,由大快搜索主导并完全开源,目标是普及自然语言处理在生产环境中的应用。
adnb34g
·
2019-03-20 10:30
hanlp分词
汉字转拼音
python
自然语言处理
Hanlp
自然语言处理中的词典格式说明
阅读更多使用过
hanlp
的都知道
hanlp
中有许多词典,它们的格式都是非常相似的,形式都是文本文档,随时可以修改。本篇文章详细介绍了
hanlp
中的词典格式,以满足用户自定义的需要。
adnb34g
·
2019-03-15 11:00
Hanlp
自然语言处理中的词典格式说明
使用过
hanlp
的都知道
hanlp
中有许多词典,它们的格式都是非常相似的,形式都是文本文档,随时可以修改。本篇文章详细介绍了
hanlp
中的词典格式,以满足用户自定义的需要。
adnb34g
·
2019-03-15 10:02
hanlp
词典格式
自然语言处理工具
自然语言处理
中文分词算法工具
hanlp
源码解析
Hanlp
代码
adnb34g
·
2019-03-13 13:00
算法
中文分词算法工具
hanlp
源码解析
Hanlp
代码
adnb34g
·
2019-03-13 13:00
算法
中文分词算法工具
hanlp
源码解析
Hanlp
代码
adnb34g
·
2019-03-13 13:00
算法
中文分词算法工具
hanlp
源码解析
Hanlp
代码中采用的
adnb34g
·
2019-03-13 10:55
自然语言处理工具
hanlp源码分析
中文分词算法
自然语言处理
公司名称分词工作记录
最近要处理公司名称分词问题,开始接触分词算法,其中隐马尔可夫模型是分词的核心(使用的分词器是
HanLP
,词性表)。处理公司名称真正的难点在于名称中“所属行业”与“公司字号”二者间的有效分隔。
搬砖咸鱼
·
2019-03-13 09:34
工作记录
Hanlp
分词1.7版本在Spark中分布式使用记录
阅读更多新发布1.7.0版本的
hanlp
自然语言处理工具包差不多已经有半年时间了,最近也是一直在整理这个新版本
hanlp
分词工具的相关内容。
adnb34g
·
2019-03-11 15:00
spark
Hanlp
分词1.7版本在Spark中分布式使用记录
阅读更多新发布1.7.0版本的
hanlp
自然语言处理工具包差不多已经有半年时间了,最近也是一直在整理这个新版本
hanlp
分词工具的相关内容。
adnb34g
·
2019-03-11 15:00
spark
Window离线环境下如何安装py
hanlp
阅读更多
Hanlp
在离线环境下的安装我是没有尝试过的,分享SunJW_2017的这篇文章就是关于如何在离线环境下安装
hanlp
的。我们可以一起来学习一下!
adnb34g
·
2019-03-08 10:00
python
Window离线环境下如何安装py
hanlp
阅读更多
Hanlp
在离线环境下的安装我是没有尝试过的,分享SunJW_2017的这篇文章就是关于如何在离线环境下安装
hanlp
的。我们可以一起来学习一下!
adnb34g
·
2019-03-08 10:00
python
Window离线环境下如何安装py
hanlp
阅读更多
Hanlp
在离线环境下的安装我是没有尝试过的,分享SunJW_2017的这篇文章就是关于如何在离线环境下安装
hanlp
的。我们可以一起来学习一下!
adnb34g
·
2019-03-08 10:00
python
如何编译运行
HanLP
自然语言处理包
阅读更多master分支对于master分支,编译方法如下:gitclonehttps://github.com/hankcs/
HanLP
.gitmvninstall-DskipTests·由于目前一些
adnb34g
·
2019-03-06 11:00
如何编译运行
HanLP
自然语言处理包
master分支对于master分支,编译方法如下:gitclonehttps://github.com/hankcs/
HanLP
.gitmvninstall-DskipTests·由于目前一些test
adnb34g
·
2019-03-06 11:40
hanlp
自然语言
处理包
自然语言处理
如何在linux服务器上使用
hanlp
关于如何在linux服务器上使用
hanlp
也有分享过一篇,但分享的内容与湘笑的这篇还是不同的。此处分享一下湘笑的这篇
hanlp
在linux服务器上使用的文章,供新手朋友学习之用。
左手中的倒影
·
2019-03-04 09:30
hanlp
提取文本关键词的使用方法记录
于是这时候便有了
HanLP
-汉语言处理包来进行提取关键词的想法。请到大快搜索官网下载
HanLP
新版本,1.7.1数据包下载【gitub上也可以下载】在项目中配置jar包,添加依赖。
adnb34g
·
2019-03-01 09:00
hanlp
提取文本关键词的使用方法记录
本文是csu_zipple分享的关于使用
hanlp
汉语言处理包提取关键词的过程一个简单的记录分享。想要使用
hanlp
提取文本关键词的新手朋友们可以参考学习一下!如何在一段文本之中提取出相应的关键词呢?
adnb34g
·
2019-03-01 08:33
自然语言处理
java-
hanlp
中文语言处理
hanlp
是一款开源的中文语言处理工具。
lanlantian123
·
2019-02-27 17:16
py
hanlp
文本分类与情感分析
这一次我们需要利用
HanLP
进行文本分类与情感分析。同时这也是py
hanlp
用户指南的倒数第二篇关于接口和Python实现的文章了,再之后就是导论,使用技巧汇总和几个实例落。真是可喜可贺啊。
lanlantian123
·
2019-02-27 17:10
hy
hanlp
两种依存句法分类器
依存句法分析器在
HanLP
中一共有两种句法分析器依存句法分析基于神经网络的高性能依存句法分析器MaxEnt依存句法分析基于神经网络的高性能依存句法分析器
HanLP
中的基于神经网络的高性能依存句法分析器参考的是
lanlantian123
·
2019-02-27 17:20
使用py
hanlp
创建中文词云
+wordcloud+jieba十分钟学会用任意中文文本生成词云(你可能觉得这和wordcloud中官方文档中的中文词云的例子代码很像,不要误会,那个也是我写的)现在我们可以仿照之前的格式在写一份py
hanlp
lanlantian123
·
2019-02-27 16:51
HanLP
里使用DAT存取字典的方法
CoreBiGramTableDictionary.java和CoreDictionary.java结构思路词典里文件的格式:
[email protected]
文件用一个TreeMap>来读取词典。用一个名为pair的int型数组来存储TreeMap。因为一个wordA可能对应有多个wordB,所以用一个名为start的int型数组
lanlantian123
·
2019-02-27 16:59
句法分析工具 LTP
HanLP
参考:http://cslt.riit.tsinghua.edu.cn/mediawiki/images/e/e5/%E5%8F%A5%E6%B3%95%E5%B7%A5%E5%85%B7%E5%88%86%E6%9E%90.pdfhttp://pyltp.readthedocs.io/zh_CN/latest/api.htmlhttps://pypi.python.org/pypi/pyltph
lanlantian123
·
2019-02-27 16:29
开源自然语言处理工具包
hanlp
中CRF分词实现详解
阅读更多[align=center;"align="center]CRF简介[gerative-discriminative.png]这类耗时的任务,还是交给了用C++实现的CRF++。关于CRF++输出的CRF模型,请参考《CRF++模型格式说明》。解码采用维特比算法实现。并且稍有改进,用中文伪码与白话描述如下:如何计算一个字的某个标签的分数呢?某个字根据CRF模型提供的模板
adnb34g
·
2019-02-27 11:00
开源自然语言处理工具包
hanlp
中CRF分词实现详解
CRF简介CRF是序列标注场景中常用的模型,比HMM能利用更多的特征,比MEMM更能抵抗标记偏置的问题。[gerative-discriminative.png]CRF训练这类耗时的任务,还是交给了用C++实现的CRF++。关于CRF++输出的CRF模型,请参考《CRF++模型格式说明》。CRF解码解码采用维特比算法实现。并且稍有改进,用中文伪码与白话描述如下:首先任何字的标签不仅取决于它自己的参
adnb34g
·
2019-02-27 09:52
CRF分词
hanlp
自然语言处理工具包
自然语言处理
hanlp
和jieba等六大中文分工具的测试对比
阅读更多本篇文章测试的哈工大LTP、中科院计算所NLPIR、清华大学THULAC和jieba、FoolNLTK、
HanLP
这六大中文分词工具是由水...琥珀完成的。
adnb34g
·
2019-02-26 13:00
hanlp
和jieba等六大中文分工具的测试对比
本篇文章测试的哈工大LTP、中科院计算所NLPIR、清华大学THULAC和jieba、FoolNLTK、
HanLP
这六大中文分词工具是由水...琥珀完成的。
adnb34g
·
2019-02-25 10:54
jieba分词
hanlp分词
thulac
中文分词
自然语言处理
hanlp
和jieba等六大中文分工具的测试对比
本篇文章测试的哈工大LTP、中科院计算所NLPIR、清华大学THULAC和jieba、FoolNLTK、
HanLP
这六大中文分词工具是由水...琥珀完成的。
adnb34g
·
2019-02-25 10:47
自然语言处理
Spark+Ansj中文分词Scala程序
Spark下四种中文分词工具使用
hanLP
ansjjiebafudannlp推荐使用ansj,速度快而且效果好另外jieba,
hanLP
效果也不错。
29DCH
·
2019-02-24 22:34
Scala学习
大数据平台Spark生态系统
BigData
分词
Java利用
hanlp
完成语句相似度分析的案例详解
阅读更多分享一篇
hanlp
分词工具使用的小案例,即利用
hanlp
分词工具分析两个中文语句的相似度的案例。供大家一起学习参考!在做考试系统需求时,后台题库系统提供录入题目的功能。
adnb34g
·
2019-02-23 09:00
上一页
8
9
10
11
12
13
14
15
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他