E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
PyHanLP
使用
pyhanlp
创建中文词云
Python+wordcloud+jieba十分钟学会用任意中文文本生成词云(你可能觉得这和wordcloud中官方文档中的中文词云的例子代码很像,不要误会,那个也是我写的)现在我们可以仿照之前的格式在写一份
pyhanlp
lanlantian123
·
2019-02-27 16:51
pyhanlp
安装介绍和简单应用
1.前言中文分词≠自然语言处理!HanlpHanLP是由一系列模型与算法组成的Java工具包,目标是普及自然语言处理在生产环境中的应用。HanLP具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点。功能:中文分词词性标注命名实体识别依存句法分析关键词提取新词发现短语提取自动摘要文本分类拼音简繁中文分词只是第一步;HanLP从中文分词开始,覆盖词性标注、命名实体识别、句法分析、文本分类等常用
人工智站
·
2019-02-22 11:21
pyhanlp
文本分类与情感分析
阅读更多语料库本文语料库特指文本分类语料库,对应IDataSet接口。而文本分类语料库包含两个概念:文档和类目。一个文档只属于一个类目,一个类目可能含有多个文档。比如搜狗文本分类语料库迷你版.zip,下载前请先阅读搜狗实验室数据使用许可协议。用Map描述这种关系可以用Java的Map来描述,其key代表类目,value代表该类目下的所有文档。用户可以利用自己的文本读取模块构造一个Map形式的中间语
adnb34g
·
2019-02-20 15:00
Pyhanlp
自然语言处理中的新词识别
阅读更多
Pyhanlp
自然语言处理中的新词识别新词发现本“新词发现”模块基于信息熵和互信息两种算法,可以在无语料的情况下提取一段长文本中的词语,并支持过滤掉系统中已存在的“旧词”,得到新词列表。
adnb34g
·
2019-02-15 15:00
Pyhanlp
自然语言处理中的新词识别
新词发现本“新词发现”模块基于信息熵和互信息两种算法,可以在无语料的情况下提取一段长文本中的词语,并支持过滤掉系统中已存在的“旧词”,得到新词列表。调用方法静态方法一句话静态调用接口已经封装到HanLP中:/***提取词语**@paramtext大文本*@paramsize需要提取词语的数量*@return一个词语列表*/publicstaticListextractWords(Stringtex
adnb34g
·
2019-02-15 14:06
pyhanlp
新词识别
自然语言处理
Pyhanlp
自然语言处理中的新词识别
新词发现本“新词发现”模块基于信息熵和互信息两种算法,可以在无语料的情况下提取一段长文本中的词语,并支持过滤掉系统中已存在的“旧词”,得到新词列表。调用方法静态方法一句话静态调用接口已经封装到HanLP中:/***提取词语**@paramtext大文本*@paramsize需要提取词语的数量*@return一个词语列表*/publicstaticListextractWords(Stringtex
adnb34g
·
2019-02-15 14:06
自然语言处理
新词识别
hanlp
pyhanlp
中文词性标注与分词简介
阅读更多
pyhanlp
实现的分词器有很多,同时
pyhanlp
获取hanlp中分词器也有两种方式第一种是直接从封装好的hanlp类中获取,这种获取方式一共可以获取五种分词器,而现在默认的就是第一种维特比分词器
adnb34g
·
2019-01-07 13:00
pyhanlp
pyhanlp
中文词性标注与分词简介
pyhanlp
中文词性标注与分词简介
pyhanlp
实现的分词器有很多,同时
pyhanlp
获取hanlp中分词器也有两种方式第一种是直接从封装好的hanlp类中获取,这种获取方式一共可以获取五种分词器,而现在默认的就是第一种维特比分词器
adnb34g
·
2019-01-07 10:18
pyhanlp
中文词性标注
分词
自然语言处理
pyhanlp
共性分析与短语提取内容详解
阅读更多
pyhanlp
共性分析与短语提取内容详解简介HanLP中的词语提取是基于互信息与信息熵。想要计算互信息与信息熵有限要做的是文本分词进行共性分析。
adnb34g
·
2019-01-04 10:00
hanlp
短语提取
HanLP的自定义词典使用方式与注意事项介绍
阅读更多【环境】python2.7方法一:使用
pyhanlp
,具体方法如下:pipinstallpyhanlp#安装
pyhanlp
进入python安装包路径,如/usr/lib/python2.7/site-packages
adnb34g
·
2019-01-02 10:00
python
hanlp
HanLP的自定义词典使用方式与注意事项介绍
阅读更多【环境】python2.7方法一:使用
pyhanlp
,具体方法如下:pipinstallpyhanlp#安装
pyhanlp
进入python安装包路径,如/usr/lib/python2.7/site-packages
adnb34g
·
2019-01-02 10:00
python
hanlp
pyhanlp
两种依存句法分类器
阅读更多依存句法分析器在HanLP中一共有两种句法分析器·依存句法分析(1)基于神经网络的高性能依存句法分析器(2)MaxEnt依存句法分析基于神经网络的高性能依存句法分析器HanLP中的基于神经网络的高性能依存句法分析器参考的是14年Chen&Manning的论文(AFastandAccurateDependencyParserusingNeuralNetworks),这里还有一个发在了Gith
adnb34g
·
2018-12-21 11:00
python
依存句法
pyhanlp
两种依存句法分类器
阅读更多依存句法分析器在HanLP中一共有两种句法分析器·依存句法分析(1)基于神经网络的高性能依存句法分析器(2)MaxEnt依存句法分析基于神经网络的高性能依存句法分析器HanLP中的基于神经网络的高性能依存句法分析器参考的是14年Chen&Manning的论文(AFastandAccurateDependencyParserusingNeuralNetworks),这里还有一个发在了Gith
adnb34g
·
2018-12-21 11:00
python
依存句法
在Windows下离线安装
pyhanlp
另外,该工具包还提供了python3的接口,在线安装很方便,但有时需要部署在内网机等没有网络环境的机器上,比较繁琐,整理步骤如下:安装jpype1,这是
pyhanlp
的依赖包,可以下载编译好的.whl文件
SunJW_2017
·
2018-12-20 11:07
python包的安装
hanlp在Python环境中的安装失败后的解决方法
由于要使用hanlp进行分词,而我们的环境是python环境所以得安装
pyhanlp
,但是安装过程总是出现这样的问题看上去感觉是缺少了visualc++环境,于是
adnb34g
·
2018-12-19 10:00
python
hanlp在Python环境中的安装失败后的解决方法
由于要使用hanlp进行分词,而我们的环境是python环境所以得安装
pyhanlp
,但是安装过程总是出现这样的问题看上去感觉是缺少了visualc++环境,于是
adnb34g
·
2018-12-19 10:00
python
hanlp在Python环境中的安装失败后的解决方法
由于要使用hanlp进行分词,而我们的环境是python环境所以得安装
pyhanlp
,但是安装过程总是出现这样的问题看上去感觉是缺少了visualc++环境,于是
adnb34g
·
2018-12-19 10:00
python
py3安装
pyhanlp
直接pipinstallpyhanlp的时候会提示缺少MicrosoftVisualc++环境,方法1可以先安装jpype1,然后在pipinstallpyhanlp就行了。1、离线安装jpyter1jpyter1地址:https://www.lfd.uci.edu/~gohlke/pythonlibs/#jpypepipinstallJPype1-0.6.3-cp36-cp36m-win_amd
judyqing
·
2018-12-19 09:02
hanlp在Python环境中的安装失败后的解决方法
由于要使用hanlp进行分词,而我们的环境是python环境所以得安装
pyhanlp
,但是安装过程总是出现这样的问题看上去感觉是缺少了visualc++环境,于是安装vi
adnb34g
·
2018-12-19 09:03
自然语言处理
pyhanlp
用户自定义词典添加实例说明
阅读更多
pyhanlp
用户自定义词典添加实例说明
pyhanlp
是python版封装的的HanLP,项目地址:https://github.com/hankcs/
pyhanlp
经过测试,HanLP比nltk
adnb34g
·
2018-12-17 11:00
python
pyhanlp
用户自定义词典添加实例说明
阅读更多
pyhanlp
用户自定义词典添加实例说明
pyhanlp
是python版封装的的HanLP,项目地址:https://github.com/hankcs/
pyhanlp
经过测试,HanLP比nltk
adnb34g
·
2018-12-17 11:00
python
pyhanlp
用户自定义词典添加实例说明
阅读更多
pyhanlp
用户自定义词典添加实例说明
pyhanlp
是python版封装的的HanLP,项目地址:https://github.com/hankcs/
pyhanlp
经过测试,HanLP比nltk
adnb34g
·
2018-12-17 11:00
python
Hanlp 汉字转拼音如何通过python调用
开源网址:HanLP:HanLanguageProcessing但由于hanlp是用java来实现的,要在python中使用hanlp,只能通过调用
pyhanlp
这个包来。但是
pyhanlp
里面有
Juanly Jack
·
2018-11-30 10:40
NLP
目前常用的自然语言处理开源项目/开发包大汇总
阅读更多中文主要有:NLTK,FoolNLTK,HanLP(java版本),
pyhanlp
(python版本),Ansj,THULAC,结巴分词,FNLP,哈工大LTP,中科院ICTCLAS分词,GATE
adnb34g
·
2018-11-26 10:00
python
目前常用的自然语言处理开源项目/开发包大汇总
阅读更多中文主要有:NLTK,FoolNLTK,HanLP(java版本),
pyhanlp
(python版本),Ansj,THULAC,结巴分词,FNLP,哈工大LTP,中科院ICTCLAS分词,GATE
adnb34g
·
2018-11-26 10:00
python
python3安装
pyhanlp
今天安装了
pyhanlp
,特此记录一下转自这个博客https://www.cnblogs.com/panda-blog/p/9602039.htmlpipinstallpyhanlp一般是不行的需要安装
爱编程的莲莲猫
·
2018-11-24 16:00
python
pyhanl
pyhanlp
文本聚类详细介绍
阅读更多文本聚类文本聚类简单点的来说就是将文本视作一个样本,在其上面进行聚类操作。但是与我们机器学习中常用的聚类操作不同之处在于。我们的聚类对象不是直接的文本本身,而是文本提取出来的特征。因此如何提取特征因而是非常重要的一步。在HanLP中一共有三个文本聚类方法。前两种都基于词袋模式,第一个是最常见的聚类算法:k-means,但HanLP不光实现了k-means,还实现了速度更快效果更好的repe
adnb34g
·
2018-11-23 10:00
python
pyhanlp
文本聚类详细介绍
阅读更多文本聚类文本聚类简单点的来说就是将文本视作一个样本,在其上面进行聚类操作。但是与我们机器学习中常用的聚类操作不同之处在于。我们的聚类对象不是直接的文本本身,而是文本提取出来的特征。因此如何提取特征因而是非常重要的一步。在HanLP中一共有三个文本聚类方法。前两种都基于词袋模式,第一个是最常见的聚类算法:k-means,但HanLP不光实现了k-means,还实现了速度更快效果更好的repe
adnb34g
·
2018-11-23 10:00
python
python3 安装
pyhanlp
方法
标签:文件链接路径链接http官方c++执行bspspa直接pipinstallpyhanlp的时候会提示缺少MicrosoftVisualc++环境,其实没有MicrosoftVisualc++环境也是可以的,可以先安装jpype1,然后在pipinstallpyhanlp就行了。步骤:①在python非官方库网站上下载库jpyre1的whl文件,文件链接https://download.lfd
lanlantian123456
·
2018-11-21 16:07
pyhanlp
停用词与用户自定义词典功能详解
阅读更多hanlp的词典模式之前我们看了hanlp的词性标注,现在我们就要使用自定义词典与停用词功能了,首先关于HanLP的词性标注方式具体请看HanLP词性标注集。其核心词典形式如下:自定义词典自定义词典有多种添加模式,首先是展示的一个小例子,展示了词汇的动态增加与强行插入,删除等。更复杂的内容请参考后边的第二段代码。简单的例子frompyhanlpimport*text="攻城狮逆袭单身狗,迎
adnb34g
·
2018-11-16 10:00
自然语言处理
pyhanlp
停用词与用户自定义词典
hanlp的词典模式之前我们看了hanlp的词性标注,现在我们就要使用自定义词典与停用词功能了,首先关于HanLP的词性标注方式具体请看HanLP词性标注集。其核心词典形式如下:自定义词典自定义词典有多种添加模式,首先是展示的一个小例子,展示了词汇的动态增加与强行插入,删除等。更复杂的内容请参考后边的第二段代码。简单的例子frompyhanlpimport*text="攻城狮逆袭单身狗,迎娶白富美
lanlantian123
·
2018-11-15 13:43
python调用Hanlp做命名实体识别以及词性标注
pyhanlp
只有少数功能,其他复杂一点
lanlantian123
·
2018-11-02 16:38
pyhanlp
文本分类与情感分析
同时这也是
pyhanlp
用户指南的倒数第二篇关于接口和Python实现的文章了,再之后就是导论,使用技巧汇总和几个实例落。真是可喜可贺啊。
Font Tian
·
2018-09-24 20:45
#
【自然语言处理】
基础
#
【自然语言处理】HanLP
剑指汉语自然语言处理
pyhanlp
分词与词性标注
pyhanlp
中的分词器简介
pyhanlp
实现的分词器有很多,同时
pyhanlp
获取hanlp中分词器也有两种方式第一种是直接从封装好的hanlp类中获取,这种获取方式一共可以获取五种分词器,而现在默认的就是第一种维特比分词器维特比
Font Tian
·
2018-09-20 19:49
#
【自然语言处理】
基础
#
【自然语言处理】HanLP
剑指汉语自然语言处理
python3 安装
pyhanlp
方法
直接pipinstallpyhanlp的时候会提示缺少MicrosoftVisualc++环境,其实没有MicrosoftVisualc++环境也是可以的,可以先安装jpype1,然后在pipinstallpyhanlp就行了。步骤:①在python非官方库网站上下载库jpyre1的whl文件,文件链接https://www.lfd.uci.edu/~gohlke/pythonlibs/#jpyp
panday
·
2018-09-06 23:00
pip安装包错误:Microsoft Visual C++ 14.0 is required问题解决方案
通过pycharm安装
pyhanlp
时,出现如下错误:error:MicrosoftVisualC++14.0isrequired.Getitwith“MicrosoftVisualC++BuildTools
偷偷玩两下
·
2018-08-24 17:26
Python
自然语言处理之hanlp,Python调用与构建,分词、关键词提取、命名主体识别
在Python中一种是直接调用hanlp的接口
pyhanlp
.还有就是导入其基于Java的原始配置文件。关于pyhanlpHanLP的Pyth
IT界的小小小学生
·
2018-08-21 15:53
python
文本分析
自然语言处理
自然语言处理(NLP)专栏
pyhanlp
用户自定义词典添加
pyhanlp
是python版封装的的HanLP,项目地址:https://github.com/hankcs/
pyhanlp
经过测试,HanLP比nltk在中文分词和实体识别方面都更好用。
明月三千里68
·
2018-05-16 16:14
NLP
上一页
1
2
3
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他