E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
HanLP
NLP之CRF应用篇(序列标注任务)
模板的解析:具体参考
hanlp
提供的:http://www.hankcs.com/nlp/the-crf-model-format-description.htmlUnigram和Bigram模板分别生成
weixin_30896657
·
2020-06-28 02:15
py
hanlp
文本推荐,同义改写,语义距离
因为作者
HanLP
源代码和博客都没有写该部分的原理。所以笔者大概查看了源码,发现功能实现原理非常之简单,就是根据文档与给定单词的距离进行打分,而这个语义距离就是从word2vec来的。
weixin_30628077
·
2020-06-27 22:03
py
hanlp
提取关键词、自动摘要、新词识别
关键词提取说明内部采用TextRankKeyword实现,用户可以直接调用TextRankKeyword.getKeywordList(document,size)算法详解《TextRank算法提取关键词的Java实现》部分内容如下谈起自动摘要算法,常见的并且最易实现的当属TF-IDF,但是感觉TF-IDF效果一般,不如TextRank好。TextRank是在Google的PageRank算法启发
track sun
·
2020-06-27 21:29
HanLP
自然语言处理包开源(包含源码)
HanLP
自然语言处理包开源(包含源码)支持中文分词(N-最短路分词、CRF分词、索引分词、用户自定义词典、词性标注),命名实体识别(中国人名、音译人名、日本人名、地名、实体机构名识别),关键词提取,自动摘要
weixin_30443895
·
2020-06-27 19:07
Hanlp
词性表
HanLP
词性标注集1Area形容词ad副形词ag形容词性语素al形容词性惯用语an名形词b区别词beginbg区别语素bl区别词性惯用语c连词cc并列连词d副词dg辄,俱,复之类的副词dl连语e叹词end
只想安静的一个人
·
2020-06-27 08:40
NLP自然语言处理理论篇
中文文本情感分析:基于机器学习方法的思路
3)常用工具:哈工大—语言云、东北大学NiuTrans统计机器翻译系统、中科院张华平博士ICTCLAS、波森科技、结巴分词、Ansj分词,
HanLP
。3.特征提取1)文本中拿什么作为特征。
aliceint
·
2020-06-27 07:01
机器学习
nlp之
HanLP
HanLP
是一系列模型与算法组成的NLP工具包,目标是普及自然语言处理在生产环境中的应用。
HanLP
具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点。
方兵兵
·
2020-06-26 23:58
nlp入门
NLP实验计划1.0
安装jieba,
hanLP
(需要C++14.0,java1.8支撑)程序2:做简单中文分词程序。输入任意语句,输出分词结果。2.文本可视化:词云、关系图、热力图等制作词云,进一步了解分词和词频。
东皋春雨
·
2020-06-26 23:00
《自然语言处理入门》不是 NLP 学习路上的万能药
《自然语言处理入门》是图灵2019年10月出版的一本NLP领域的入门图书,作者是何晗(网名hankcs,
HanLP
作者、「码农场」博客博主)。
turingbooks
·
2020-06-26 20:56
HanLP
用户自定义词典源码分析
标签:通过默认-ohtmlclass配置boolean定义ict
HanLP
用户自定义词典源码分析1.官方文档及参考链接关于词典问题Issue,首先参考:FAQ自定义词典其实是基于规则的分词,它的用法参考这个
lanlantian123
·
2020-06-26 10:51
HanLP
Demo(学习笔记)
自己整理,因为是开源的,所以配合Demo理解,不是算法层次的,嗯,更新中....data包没下载下来,家里这边网不支持下载那个data包.有些Demo没测....嗯,下载下来在测官网:http://www.
hanlp
.com
意必固我_LRL
·
2020-06-26 07:00
人工智能
HTML解析
在Python中调用Java扩展包
HanLP
测试记录
最近在研究中文分词及自然语言相关的内容,关注到JAVA环境下的
HanLP
,
HanLP
是一个致力于向生产环境普及NLP技术的开源Java工具包,支持中文分词(N-最短路分词、CRF分词、索引分词、用户自定义词典
左手中的倒影
·
2020-06-25 10:09
java
hanlp
语义分析 提取关键词
1.提取文件夹下所有文档数据,提取关键词(本框架基于JFinal)/***递归读取文件路径下的所有文件**@parampath*@paramfileNameList*@return*/publicstaticArrayListreadFiles1(Stringpath,ArrayListfileNameList){Filefile=newFile(path);if(file.isDirectory
DU_XXRS
·
2020-06-25 09:48
语义分析
读书笔记2之中文分词流程
HanLP
句子切分:系统读取带分词的字符串。输入的是一个句子或者一篇文章。如果是篇章则系统会首先进行句子切分,然后调用多线程,对每个切分的句子再进行分词。导入词典:根据输入的配置信息,导入相应的词典。进入粗分阶段:首先,对句子进行字符级切分,即将输入的句子切分为单个UTF-8编码的字符数组然后,一元切分。查询核心词典,将字符切分的结果与词典最大匹配,匹配结果,包括词形、词性、词频等信息形成一元词网,之后对一
人上人生之人
·
2020-06-25 02:28
NLP
NLP
NLP入门
框架的选择
分词效果的评测算法(原创)
二、适用范围:
HanLP
中的索引分词不适用,其余均可,LTP、NIPIR均可。
小耗子吹泡泡
·
2020-06-24 19:21
NLP
6种分词工具的效率、效果对比
转自:https://www.jianshu.com/p/575fd73ce379六种分词器使用建议:对命名实体识别要求较高的可以选择
HanLP
,根据说明其训练的语料比较多,载入了很多实体库,通过测试在实体边界的识别上有一定的优势
nameforcsdn
·
2020-06-24 16:39
python实战经验
java使用
HanLP
获取文本摘要_自然语言处理
HanLP
官网https://www.hankcs.com/nlp/
hanlp
.htmlcom.hankcs
hanlp
portable-1.7.7publicstaticListzhaiyao(Stringdoc
翻墙看妹子
·
2020-06-24 16:02
自然语言处理基础技术工具篇之Jieba
(代码我均使用jupyter编辑)~~先来罗列一波:jieba、
hanlp
、snownlp、Stanfordcorenlp
AI小白入门
·
2020-06-24 11:03
nlp
AI小白入门
py
hanlp
安装记录
hanlp
-1.7.4-release.zip fileNotFound Error
安装命令pipinstallpy
hanlp
安装失败的话可以去https://github.com/hankcs/py
hanlp
下载py
hanlp
-master.zip,然后用一下命令安装:pipinstallpy
hanlp
-master.zip
pit_man
·
2020-06-24 07:21
nlp
大数据产业发展创新技术新书《数据之翼》收录自然语言处理工具
HanLP
在12月20日由中国电子信息产业发展研究院主办的2018中国软件大会上,大快搜索获评“2018中国大数据基础软件领域领军企业”,并成功入选中国数字化转型TOP100服务商。图:大快搜索获评“2018中国大数据基础软件领域领军企业”在本届2018中国软件大会上,不仅宣传并成立了数字转型促进会,还发布了由中国大数据产业生态联盟副秘书长、《软件和集成电路》杂志社总编辑郭嘉凯编辑的新书——《数据之翼-引领
lanlantian123456
·
2020-06-24 02:35
HanLP
汉语言分析框架
HanLP
(HanLanguageProcessing)是由一系列模型与算法组成的Java工具包,目标是普及自然语言处理在生产环境中的应用。
lanlantian123456
·
2020-06-24 02:35
自然语言处理工具包
HanLP
在 Spring Boot中的应用
概述
HanLP
是基于Java开发的NLP工具包,由一系列模型与算法组成,目标是普及自然语言处理在生产环境中的应用。
lanlantian123456
·
2020-06-24 02:35
python调用
Hanlp
做命名实体识别以及词性标注
看完了一些相关论文以后觉得短时间内自己实现不大现实,于是找了一些开源工具,其中哈工大的LTP效果是很好的,但是免费使用限流量,需要给钱才行;NLPIR的pynlpir似乎还不能支持命名实体识别等复杂工作,只能做一些分词之类;最后还剩下
Hanlp
lanlantian123456
·
2020-06-24 02:34
java-
hanlp
中文语言处理
hanlp
是一款开源的中文语言处理工具。
lanlantian123456
·
2020-06-24 02:03
如何配置
hanlp
.properties
如何在spring中读取properties配置文件里面的信息一般来说。我们会将一些配置的信息放在。properties文件中。然后使用${}将配置文件中的信息读取至spring的配置文件。那么我们如何在spring读取properties文件呢。1.首先。我们要先在spring配置文件中。定义一个专门读取properties文件的类.例:classpath*:jdbc.properties这里为
lanlantian123456
·
2020-06-24 02:03
机器学习-Python自然语言处理库
github.com/mylovelybaby/chinese-nlp-toolkit-testawesome:https://github.com/crownpku/Awesome-Chinese-NLP
Hanlp
gao8658
·
2020-06-23 09:16
算法研究
elasticsearch安装并使用中文分词器
hanlp
安装1.先下载好zip包https://github.com/KennFalcon/elasticsearch-analysis-
hanlp
/releases/download/v6.5.4/elasticsearch-analysis-
hanlp
fall_hat
·
2020-06-23 06:12
es
Java中文分词
hanlp
使用
HanLP
介绍:http://
hanlp
.linrunsoft.com/github地址:https://github.com/hankcs/
HanLP
说明:使用
hanlp
实现分词、智能推荐、关键字提取
chuanmi6070
·
2020-06-22 23:14
Hanlp
自然语言处理工具的使用演练
Hanlp
是由一系列模型与算法组成的工具包,目标是普及自然语言处理在生产环境中的应用。
adnb34g
·
2020-06-22 12:48
自然语言处理
Java利用
hanlp
完成语句相似度分析的案例详解
分享一篇
hanlp
分词工具使用的小案例,即利用
hanlp
分词工具分析两个中文语句的相似度的案例。供大家一起学习参考!在做考试系统需求时,后台题库系统提供录入题目的功能。
adnb34g
·
2020-06-22 12:48
自然语言处理
NLP入门(1)-词典分词方法及实战
1、词典准备既然是词典分词,那么我们首先需要找到一部字典,这里使用
Hanlp
提供的mini版本的中文词典:https://github.com/hankcs/Ha
文文学霸
·
2020-06-22 12:04
基于
HanLP
分词的命名实体提取
文本挖掘是抽取有效、新颖、有用、可理解的、散布在文本文件中的有价值知识,并且利用这些知识更好地组织信息的过程。对于文本来说,由于语言组织形式各异,表达方式多样,文本里面提到的很多要素,如人名、手机号、组织名、地名等都称之为实体。在工程领域,招投标文件里的这些实体信息至关重要。利用自然语言处理技术从形式各异的文件中提取出这些实体,能有效提高工作效率和挖掘实体之间的潜在联系。文本预处理1、文本清洗目前
XiaoXiao_Yang77
·
2020-06-22 08:03
文本挖掘
算法
自然语言处理
技术
优秀的github项目 (python)
fastapiglances系统监控cheat.sh备忘清单python-firePySnooper调试代码requests-html进阶之路你以为你会python50个数据结构和算法数据结构和算法-教育数据和AI
hanlp
CoolScript
·
2020-06-21 18:33
awesome
github
学习NLP的第7天——基于
HanLP
实现的停用词过滤
这里主要记录我在学习过程中整理的知识、调试的代码和心得理解,以供其他学习的朋友参考。停用词,是指文本中没有多少实际意义的词语,包括助词、连词、副词、语气词等词性,句子中去掉了停用词并不影响语句的理解。停用词视具体情况在英雄联盟的游戏内聊天框中,敏感词和低俗词也都被视作了停用词。停用词过滤是语言文本预处理的一个重要步骤,有两种常用的情景:将分词结果中的停用词剔除直接将文本中的停用词替换为*或移除下面
长行
·
2020-06-21 18:39
学习NLP的第N天
nlp
【NLP】分词算法综述
之前总是在看前沿文章,真正落实到工业级任务还是需要实打实的硬核基础,我司选用了
HANLP
作为分词组件,在使用的过程中才感受到自己基础的薄弱,决定最近好好把分词的底层算法梳理一下。
weixin_34348111
·
2020-06-21 11:24
elasticsearch教程--中文分词器作用和使用
2019独角兽企业重金招聘Python工程师标准>>>目录概述环境准备认识中文分词器常用的中文分词器IKAnalyzer
hanlp
中文分词器彩蛋概述上一篇博文记录了elasticsearch插件安装和管理
weixin_33975951
·
2020-06-21 11:50
开源项目推荐
halo-dev/halohttps://github.com/looly/hutoolhttps://github.com/sqshq/piggymetricshttps://github.com/hankcs/
HanLP
https
王雪亮114
·
2020-06-21 05:20
计算机面面观
利用
HanLP
计算中文词语语义相似度
HanLP
官方GitHub地址
HanLP
在java项目中配置
HanLP
推荐使用Maven方法在poem.xml中加入以下代码com.hankcs
hanlp
portable-1.3.3但是在AndroidStudio
lanlantian123456
·
2020-06-21 02:56
Nlp中文自然语言处理之DK
Hanlp
自然语言处理定义:自然语言处理是一门计算机科学、人工智能以及语言学的交叉学科。虽然语言只是人工智能的一部分(人工智能还包括计算机视觉等),但它是非常独特的一部分。这个星球上有许多生物拥有超过人类的视觉系统,但只有人类才拥有这么高级的语言。自然语言处理的目标是让计算机处理或说“理解”自然语言,以完成有意义的任务,比如订机票购物或QA等。完全理解和表达语言是极其困难的,完美的语言理解等效于实现人工智能
左手中的倒影
·
2020-06-20 22:54
solr7 集群搭建并集成
Hanlp
分词组件
准备工作我们需要事先在网站下载好我们需要版本的的solr和zookeeper,我这里选择的是solr7.72,zookeeper版本为3.4.14将我们下载好的tar文件上传服务器解压因为solr依赖jdk,所以我们在服务器上安装了对应jdk,我这里选择的是jdk1.8安装zookeeper集群首先我们在三台服务器上搭建zookeeper集群。#配置data目录dataDir=/usr/local
波若
·
2020-05-27 23:01
java
后端
solrcloud
solr
NLP(自然语言处理)基本入门之分词操作
文章目录环境问题
Hanlp
代码解读
Hanlp
分词
Hanlp
分词标准分词NLP分词索引分词极速词典分词自定义分词命名实体识别与词性标注关键词提取准确分词(自定义字典)jieba分词
hanlp
分词添加字典词性标注代码实现及信息提取
YxinMiracle
·
2020-05-02 10:37
NLP
人工智能
python
自然语言处理
py
hanlp
安装成功,import导入失败,出现:importerror: cannot import name 'jvmnotfoundexception'
1、问题描述:py
hanlp
成功安装,并且可以正常使用,但是这段时间再去用的时候,发现出问题了,一运行就出现,下面的问题:importerror:cannotimportname'jvmnotfoundexception
大明王
·
2020-04-11 16:00
Hanlp
在Python环境中安装、介绍及使用
标签:自定义mpat高效pathnlpsys文件prifrom
Hanlp
HanLP
是由一系列模型与算法组成的Java工具包,目标是普及自然语言处理在生产环境中的应用。
lanlantian123
·
2020-04-10 06:48
3月份Github上最热门的Python开源项目
2.
HanLP
https://github.com/hankcs/
HanLP
Star18651
HanLP
是面向生产环境的多语种自然语言处
Python学习啊
·
2020-04-07 14:00
py
hanlp
用户自定义词典添加实例说明
py
hanlp
是python版封装的的
HanLP
,项目地址:https://github.com/hankcs/py
hanlp
经过测试,
HanLP
比nltk在中文分词和实体识别方面都更好用.如何向py
hanlp
左手中的倒影
·
2020-04-06 07:16
hanlp
源码解析之中文分词算法详解
Hanlp
代码中采用的
左手中的倒影
·
2020-04-03 19:56
python调用
Hanlp
做命名实体识别以及词性标注
看完了一些相关论文以后觉得短时间内自己实现不大现实,于是找了一些开源工具,其中哈工大的LTP效果是很好的,但是免费使用限流量,需要给钱才行;NLPIR的pynlpir似乎还不能支持命名实体识别等复杂工作,只能做一些分词之类;最后还剩下
Hanlp
wong小尧
·
2020-04-03 01:20
Hanlp
使用Bug记录
Hanlp
是最近学习的一个自然语言处理包,本篇文章将一些使用过程之中遇到的bug放到这里做一个备忘记录,有时间一并联系作者更改。-Predefine类的好多预定义tag没有在核心词典中。
lanlantian123
·
2020-03-29 23:28
HanLP
代码与词典分离方案与流程
环境中一直用的是portable版本,词条数量不是很够,且有心想把jieba,swcs词典加进来,其他像ik,ansi-seg等分词词典由于没有词性并没有加进来.本次修改主要是采用jar包方包将词典目录data与
hanlp
.properties
左手中的倒影
·
2020-03-28 11:35
在Mac OS中安装和使用
HanLP
HanLP
在MacOS的Python环境中安装、介绍及使用demo链接
HanLP
介绍
hanlp
简称汉语言处理包,它是一系列模型与算法组成的NLP工具包,由大快搜索主导并完全开源,目标是普及自然语言处理在生产环境中的应用
多网
·
2020-03-27 05:25
上一页
4
5
6
7
8
9
10
11
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他