E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
HanLP
hanlp
源码解析之中文分词算法详解
Hanlp
代码中采用的
adnb34g
·
2018-11-07 09:29
hanlp
中文分词
自然语言处理
【自然语言处理】详说中文自动分词
文章目录详说中文自动分词前言一、whatis中文分词二、中文分词的用途三、中文分词的特点和难点四、常见的中文分词方法五、中文分词工具1、
HanLP
中文分词A、python调用
hanlp
进行中文分词2、BosonNLP3
贾继康
·
2018-11-06 17:44
自然语言处理
自然语言处理小分支
【jpype】pycharm中配置jpype
文章目录pycharm中配置jpype前言说明一、资源获取1:jpype获取,安装2:
hanlp
jar包获取3:数据包(data)获取二、配置说明三、测试配置结果四、参考链接pycharm中配置jpype
贾继康
·
2018-11-06 12:48
python
【
HanLP
】eclipse/myeclipse下配置
HanLP
文章目录eclipse下配置HanPL一、说明二、资源获取1、
hanlp
jar包获取2、数据包获取三、配置说明1、配置jar包2、放置数据包3、放置获取
hanlp
-1.6.8压缩文件中的
hanlp
.properties4
贾继康
·
2018-11-05 23:27
java
自然语言处理
自然语言处理小分支
elasticsearch教程--中文分词器作用和使用
目录概述环境准备认识中文分词器常用的中文分词器IKAnalyzer
hanlp
中文分词器彩蛋概述上一篇博文记录了elasticsearch插件安装和管理,在地大物博的祖国使用es,不得不考虑中文分词器,es
java_龙
·
2018-11-05 13:27
elasticsearch
elasticsearch
HanLP
关键词提取算法分析详解
l参考论文:《TextRank:BringingOrderintoTexts》lTextRank算法提取关键词的Java实现lTextRank算法自动摘要的Java实现这篇文章中作者大概解释了一下TextRank公式1.论文Inthispaper,weintroducetheTextRankgraphbasedrankingmodelforgraphsextractedfromnaturallan
adnb34g
·
2018-11-05 09:42
hanlp
关键词提取
算法分析
自然语言处理
Hanlp
自然语言处理工具的使用演练
rd.get(0));}3、短语提取方法签名:ListextractPhrase(Stringtxt,intphSum);返回:短语签名参数说明:txt:要提取短语的语句,phSum短语数量范例:给出一段文字,能代表文章的五个短语,第一个短语是算法工程师。程序清单3publicvoidtestExtractPhrase()throwsException{Stringtext="算法工程师\n"+"
lanlantian123
·
2018-11-02 16:23
python调用
Hanlp
做命名实体识别以及词性标注
看完了一些相关论文以后觉得短时间内自己实现不大现实,于是找了一些开源工具,其中哈工大的LTP效果是很好的,但是免费使用限流量,需要给钱才行;NLPIR的pynlpir似乎还不能支持命名实体识别等复杂工作,只能做一些分词之类;最后还剩下
Hanlp
lanlantian123
·
2018-11-02 16:38
HanLP
用户自定义词典源码分析详解
P2P和C2C这种词没有分出来,希望加到主词库l关于词性标注:可参考词性标注2.源码解析分析com.hankcs.demo包下的DemoCustomDictionary.java基于自定义词典使用标准分词
HanLP
.segment
adnb34g
·
2018-11-02 10:04
hanlp
自定义词典源码
自然语言处理
自然语言处理工具包
HanLP
在 Spring Boot中的应用
概述
HanLP
是基于Java开发的NLP工具包,由一系列模型与算法组成,目标是普及自然语言处理在生产环境中的应用。
CodeSheep
·
2018-11-01 00:00
springboot
自然语言处理
nlp
Python中调用自然语言处理工具
HanLP
手记
阅读更多
HanLP
方法封装类:1.#-*-coding:utf-8-*-2.
adnb34g
·
2018-10-31 10:00
python
Python中调用自然语言处理工具
HanLP
手记
阅读更多
HanLP
方法封装类:1.#-*-coding:utf-8-*-2.
adnb34g
·
2018-10-31 10:00
python
Python中调用自然语言处理工具
HanLP
手记
阅读更多
HanLP
方法封装类:1.#-*-coding:utf-8-*-2.
adnb34g
·
2018-10-31 10:00
python
Python中调用自然语言处理工具
HanLP
手记
HanLP
方法封装类:1.#-*-coding:utf-8-*-2.
adnb34g
·
2018-10-31 10:39
自然语言处理
python
hanlp
自然语言处理工具
HanLP
中的人名识别分析详解
阅读更多在看源码之前,先看几遍论文《基于角色标注的中国人名自动识别研究》关于命名识别的一些问题,可参考下列一些issue:uu名字识别的问题#387uu机构名识别错误uu关于层叠HMM中文实体识别的过程
HanLP
adnb34g
·
2018-10-29 10:00
人名识别
linux 命令行使用
hanlp
本文主要工作是在linux服务器上使用
hanlp
,测试源码主要是
hanlp
源码中的1.文件内容结构介绍本人的工作目录命名为
hanlp
,该目录下主要由以下文件:main文件夹对应
hanlp
源码中
HanLP
lanlantian123
·
2018-10-26 13:56
Hanlp
实战HMM-Viterbi角色标注中国人名识别
阅读更多这几天写完了人名识别模块,与分词放到一起形成了两层隐马模型。虽然在算法或模型上没有什么新意,但是胜在训练语料比较新,对质量把关比较严,实测效果很满意。比如这句真实的新闻“签约仪式前,秦光荣、李纪恒、仇和等一同会见了参加签约的企业家。”,分词结果:[签约/v,仪式/n,前/f,,/w,秦光荣/nr,、/w,李纪恒/nr,、/w,仇和/nr,等/u,一同/d,会见/v,了/ul,参加/v,签约
adnb34g
·
2018-10-22 14:00
Hanlp
实战HMM-Viterbi角色标注中国人名识别
这几天写完了人名识别模块,与分词放到一起形成了两层隐马模型。虽然在算法或模型上没有什么新意,但是胜在训练语料比较新,对质量把关比较严,实测效果很满意。比如这句真实的新闻“签约仪式前,秦光荣、李纪恒、仇和等一同会见了参加签约的企业家。”,分词结果:[签约/v,仪式/n,前/f,,/w,秦光荣/nr,、/w,李纪恒/nr,、/w,仇和/nr,等/u,一同/d,会见/v,了/ul,参加/v,签约/v,的
adnb34g
·
2018-10-22 09:01
中国人名识别
hanlp
自然语言处理
Hanlp
中使用纯JAVA实现CRF分词
本文(
HanLP
)使用纯Java实现CRF模型的读取与维特比后向解码,内部特征函数采用双数组Trie树(DoubleArrayTrie)储存,得到了一个高性能的中文分词器。
adnb34g
·
2018-10-19 11:00
Hanlp
中使用纯JAVA实现CRF分词
Hanlp
中使用纯JAVA实现CRF分词与基于隐马尔可夫模型的最短路径分词、N-最短路径分词相比,基于条件随机场(CRF)的分词对未登录词有更好的支持。
adnb34g
·
2018-10-19 09:30
Hanlp
JAVA
CRF分词
自然语言处理
依存句法分析器的简单实现
开源项目本文代码已集成到
HanLP
中开源:http://hanl
adnb34g
·
2018-10-17 11:00
依存句法分析
MapReduce实现与自定义词典文件基于
hanLP
的中文分词详解
但是如果希望在Hadoop集群上通过mapreduce程序来进行分词,则
hanLP
更加胜任。一、使用介绍
hanLP
是一个用java语言开发的分词工具,官网是http://
hanlp
.com/。
adnb34g
·
2018-10-15 13:00
mapreduce
hadoop
MapReduce实现与自定义词典文件基于
hanLP
的中文分词详解
但是如果希望在Hadoop集群上通过mapreduce程序来进行分词,则
hanLP
更加胜任。一、使用介绍
hanLP
是一个用java语言开发的分词工具,官网是http://
hanlp
.com/。
adnb34g
·
2018-10-15 13:00
mapreduce
hadoop
MapReduce实现与自定义词典文件基于
hanLP
的中文分词详解
但是如果希望在Hadoop集群上通过mapreduce程序来进行分词,则
hanLP
更加胜任。一、使用介绍
hanLP
是一个用java语言开发的分词工具,官网是http://
hanlp
.com/。
adnb34g
·
2018-10-15 13:00
mapreduce
hadoop
MapReduce实现与自定义词典文件基于
hanLP
的中文分词详解
但是如果希望在Hadoop集群上通过mapreduce程序来进行分词,则
hanLP
更加胜任。一、使用介绍
hanLP
是一个用java语言开发的分词工具,官网是http://
hanlp
.com/。
adnb34g
·
2018-10-15 10:23
MapReduce
中文分词
hanlp
自然语言处理
基于电影知识图谱的智能问答系统(八) -- 终极完结篇 - Appleyk的专栏 - CSDN博客
基于电影知识图谱的智能问答系统(一)--Mysql数据准备基于电影知识图谱的智能问答系统(二)--Neo4j导入CSV文件基于电影知识图谱的智能问答系统(三)--Spark环境搭建基于电影知识图谱的智能问答系统(四)--
HanLP
·
2018-10-11 22:00
中文自然语言处理分词方法说明
hanlp
中文自然语言处理分词方法说明自然语言处理在大数据以及近年来大火的人工智能方面都有着非同寻常的意义。那么,什么是自然语言处理呢?
本宫没空1
·
2018-10-10 11:49
支持
HanLP
代码与词典分离方案与流程
阅读更多
HanLP
代码与词典分离方案与流程之前在spark环境中一直用的是portable版本,词条数量不是很够,且有心想把jieba,swcs词典加进来,其他像ik,ansi-seg等分词词典由于没有词性并没有加进来
adnb34g
·
2018-10-10 10:00
hanlp分词
hanlp
NLP学习------
HanLP
使用实验
原文链接:https://my.oschina.net/u/3984125/blog/2236797在之前的实验中得到了不在词向量里的词与分词结果,结果有500多个词不在词向量里,解决方案就是重新分词,或再追加训练这些词到词向量里。但后者相对麻烦且目前样本量不大。我跟据词向量的作者[6]所使用的分词工具来分词,会比不同工具(jieba)的效果要好,因为都是同一模式的分词,分出来的词应该都会存在于大
chuanmi6070
·
2018-10-09 17:00
Elasticsearch集成
HanLP
分词器
阅读更多Elasticsearch集成
HanLP
分词器1、通过git下载分词器代码。
adnb34g
·
2018-10-09 08:00
人工智能
hanlp
Elasticsearch集成
HanLP
分词器
阅读更多Elasticsearch集成
HanLP
分词器1、通过git下载分词器代码。
adnb34g
·
2018-10-09 08:00
人工智能
hanlp
Elasticsearch集成
HanLP
分词器
连接如下:https://gitee.com/hualongdata/
hanlp
-ext
hanlp
官网如下:http://
hanlp
.linrunsoft.com/2、下载gradle,如果本机有,就可以略过此步骤
adnb34g
·
2018-10-08 14:24
hanlp
自然语言处理
汉语言处理
自然语言处理
菜鸟如何使用
hanlp
做分词的过程记录
菜鸟如何使用
hanlp
做分词的过程记录最近在学习
hanlp
的内容,准备在节后看看有没有时间整理一波
hanlp
分享下,应该还是会像之前分享DKHadoop一样的方式吧。
ciwei03773
·
2018-09-30 10:05
hanlp
自然语言处理包的基本使用--python
hanlp
拥有:中文分词、命名实体识别、摘要关键字、依存句法分析、简繁拼音转换、智能推荐。
adnb34g
·
2018-09-28 09:52
hanlp
python
自然语言处理
自然语言处理
全文检索Solr集成
HanLP
中文分词
以前发布过
HanLP
的Lucene插件,后来很多人跟我说其实Solr更流行(反正我是觉得既然Solr是Lucene的子项目,那么稍微改改配置就能支持Solr),于是就抽空做了个Solr插件出来,开源在Github
adnb34g
·
2018-09-26 14:41
hanlp
中文自然语言处理
自然语言处理
py
hanlp
文本分类与情感分析
这一次我们需要利用
HanLP
进行文本分类与情感分析。同时这也是py
hanlp
用户指南的倒数第二篇关于接口和Python实现的文章了,再之后就是导论,使用技巧汇总和几个实例落。真是可喜可贺啊。
Font Tian
·
2018-09-24 20:45
#
【自然语言处理】
基础
#
【自然语言处理】HanLP
剑指汉语自然语言处理
py
hanlp
分词与词性标注
py
hanlp
中的分词器简介py
hanlp
实现的分词器有很多,同时py
hanlp
获取
hanlp
中分词器也有两种方式第一种是直接从封装好的
hanlp
类中获取,这种获取方式一共可以获取五种分词器,而现在默认的就是第一种维特比分词器维特比
Font Tian
·
2018-09-20 19:49
#
【自然语言处理】
基础
#
【自然语言处理】HanLP
剑指汉语自然语言处理
Hanlp
自然语言处理工具的使用演练
Hanlp
是由一系列模型与算法组成的工具包,目标是普及自然语言处理在生产环境中的应用。
左手中的倒影
·
2018-09-19 11:56
【转】机器学习-Python自然语言处理库
github.com/mylovelybaby/chinese-nlp-toolkit-testawesome:https://github.com/crownpku/Awesome-Chinese-NLP
Hanlp
Doris_H_n_q
·
2018-09-17 12:48
自然语言处理
NLP关键字提取之TF-IDF算法
最近在看关键字提取的算法,之前看了
hanlp
的textrank算法,今天看了下tf-idf算法,这两个算法都比较简单,优缺点也很明显,主要都是通过词频来统计的。
Little Programmer
·
2018-09-13 11:40
NLP
python3 安装py
hanlp
方法
直接pipinstallpy
hanlp
的时候会提示缺少MicrosoftVisualc++环境,其实没有MicrosoftVisualc++环境也是可以的,可以先安装jpype1,然后在pipinstallpy
hanlp
panday
·
2018-09-06 23:00
pip安装包错误:Microsoft Visual C++ 14.0 is required问题解决方案
通过pycharm安装py
hanlp
时,出现如下错误:error:MicrosoftVisualC++14.0isrequired.Getitwith“MicrosoftVisualC++BuildTools
偷偷玩两下
·
2018-08-24 17:26
Python
自然语言处理之
hanlp
,Python调用与构建,分词、关键词提取、命名主体识别
转载请注明出处:https://blog.csdn.net/HHTNAN
HanLP
是一系列模型与算法组成的NLP工具包,由大快搜索主导并完全开源,目标是普及自然语言处理在生产环境中的应用。
IT界的小小小学生
·
2018-08-21 15:53
python
文本分析
自然语言处理
自然语言处理(NLP)专栏
Java利用
HanLP
完成语句相似度分析
在做考试系统需求时,后台题库系统提供录入题目的功能。在录入题目的时候,由于题目来源广泛,且参与录入题目的人有多位,因此容易出现录入重复题目的情况。所以需要实现语句相似度分析功能,从而筛选出重复的题目并人工处理之。分析语句相似度思想的具体介绍,参考阮一峰的博客:http://www.ruanyifeng.com/blog/2013/03/cosine_similarity.html下面介绍如何使用J
DengDengLei
·
2018-08-17 11:56
JAVA学习
使用Spring boot 构建知识图谱及简单Java GUI学习笔记
2.完成Spark分类器
HanLP
分词以及Springboot后端与前端的链接。使用的工具EclipseIntelliJIDEAmavenSpark
HanLP
FDcsdn
·
2018-08-12 23:04
机器学习-Python自然语言处理库
github.com/mylovelybaby/chinese-nlp-toolkit-testawesome: https://github.com/crownpku/Awesome-Chinese-NLP
Hanlp
gao8658
·
2018-08-06 00:00
算法研究
NLP大神推荐的机器学习入门书单(附大量百度网盘电子书)
这是因为NLP涉及到太多的ML模型,仅仅拿过来用的话,我实现的
HanLP
已经快到个人极限了。而模型背后的原理、如何优化、如何并行化等问题,都需要寻根求源才能解决。
墨飏韶年
·
2018-07-27 15:24
ML
中文自然语言处理入门之
Hanlp
介绍
自然语言处理定义:自然语言处理是一门计算机科学、人工智能以及语言学的交叉学科。虽然语言只是人工智能的一部分(人工智能还包括计算机视觉等),但它是非常独特的一部分。这个星球上有许多生物拥有超过人类的视觉系统,但只有人类才拥有这么高级的语言。自然语言处理的目标是让计算机处理或说“理解”自然语言,以完成有意义的任务,比如订机票购物或QA等。完全理解和表达语言是极其困难的,完美的语言理解等效于实现人工智能
adnb34g
·
2018-07-24 11:43
自然语言处理
《全唐诗》文本分析
文本预处理对于现代汉语的分词,开源/免费的解决方案或工具很多,开源的解决方案如Jieba、
HanLp
、StanfordNLP和IKAnalyzer等,“傻瓜式”的免费操作工具的也有新浪微舆情的文本挖掘工具
MU心
·
2018-05-31 17:08
LibSvm流程及java代码测试
使用libSvm实现文本分类的基本过程,此文参考使用libsvm实现文本分类对前期数据准备及后续的分类测试进行了验证,同时对文中作者的分词组件修改成
hanLP
分词,对数字进行过滤,仅保留长度大于1的词进行处理
yhzhou
·
2018-05-31 09:00
上一页
10
11
12
13
14
15
16
17
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他