E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
hankcs
NLP入门(1)-词典分词方法及实战
1、词典准备既然是词典分词,那么我们首先需要找到一部字典,这里使用Hanlp提供的mini版本的中文词典:https://github.com/
hankcs
/Ha
文哥的学习日记
·
2019-12-26 10:12
统计字符串里每个词语的数目
结果:采用HashMap:源码:packagetest.java.com.
hankcs
.demo;importjava.util.HashMap;publicclassdemo{publicstaticvoidcount
小程大序的猿
·
2019-11-21 22:00
HanLP用户自定义词典源码分析详解
自定义词典其实是基于规则的分词,它的用法参考这个issuel如果有些数量词、字母词需要分词,可参考:P2P和C2C这种词没有分出来,希望加到主词库l关于词性标注:可参考词性标注2.源码解析分析com.
hankcs
.demo
左手中的倒影
·
2019-11-07 05:51
基于结构化感知机的词性标注与命名实体识别框架
词性标注训练词性标注是分词后紧接着的一个任务,训练语料同上,接口如下:命令行java-cphanlp.jarcom.
hankcs
.hanlp.model.perceptron.Main-taskPOS-train-referencedat
左手中的倒影
·
2019-11-05 19:25
NLP常用到的工具
常用到的第三发工具NLP常用基本工具•jieba:•https://github.com/fxsjy/jieba•HanLP:•http://hanlp.com/•https://github.com/
hankcs
鲨鱼儿
·
2019-09-13 12:07
AI_NLP
DES加密算法介绍(含例子)
http://www.
hankcs
.com/security/des-algorithm-illustrated.htmlDES(DataEncryptionStandard)算法是世界上最常用的加密算法
alittlecomputer
·
2019-08-29 21:00
HanLP词性标注集
原文链接:http://www.
hankcs
.com/nlp/part-of-speech-tagging.htmlHanLP使用的HMM词性标注模型训练自2014年人民日报切分语料,随后增加了少量98
神奇的老黄
·
2019-08-22 10:37
hanlp
分词
地名地址
hanlp词性标注
Python实战项目
HMM、CRF、BERT命名实体上的实战及源码阅读
相关资源汇总相关数据源:https://github.com/buppt/ChineseNERCRF++代码:https://taku910.github.io/crfpp/CRF++源代码解析:http://www.
hankcs
.com
luke_chou
·
2019-08-15 09:59
Hanlp 安装使用详解
安装githubhttps://github.com/
hankcs
/pyhanlpcondainstall-cconda-forgejpype1pipinstallpyhanlp使用命令hanlpsegment
Waldenz
·
2019-07-30 15:55
NLP
Spark基于自定义聚合函数实现【列转行、行转列】
二.列转行代码实现1packageutils2importcom.
hankcs
.hanlp
云山之巅
·
2019-07-29 21:00
斯坦福cs224n assignment1
有些来自于http://www.
hankcs
.com/nlp/讲解更精简,有很多学习资料第一部分关于Softmax第一个问题a是关于公式推导,验证softmax函数的常数不变性第二部分b是实现代码要求既能处理向量
Shannon333
·
2019-07-16 15:32
斯坦福cs224n
CRF++
https://blog.csdn.net/lilong117194/article/details/83106711----命名实体识别—CRF++地名识别(这篇文章很详细)http://www.
hankcs
.com
LFGxiaogang
·
2019-07-12 19:42
自然语言处理
python
CRF++
https://blog.csdn.net/lilong117194/article/details/83106711----命名实体识别—CRF++地名识别(这篇文章很详细)http://www.
hankcs
.com
LFGxiaogang
·
2019-07-12 19:42
自然语言处理
python
用python调度hanlp
pythonlibs/#jpype安装对应版本:pipinstallxxxxxx(对应文件)注意:pipinstalljpype1报错下载安装hanlp:官方文档:github:https://github.com/
hankcs
leofionn
·
2019-07-04 14:51
python
文本分析下的量化金融
DES算法实例详解
转自:http://www.
hankcs
.com/security/des-algorithm-illustrated.html译自J.OrlinGrabbe的名作《DESAlgorithmIllustrated
三杯酒
·
2019-06-01 16:02
信息安全
HanLP:pyhanlp安装成功之后,第一次使用出错——连接失败或者无此文件
使用命令`hanlp`来验证安装:C:\Users\Cab>hanlpDownloadinghttp://file.
hankcs
.com/hanlp/data-for-1.7.3.ziptog:\developinstall
MCabbage
·
2019-05-10 17:45
NLP
python第三方库
word2vec学习笔记
http://www.
hankcs
.com/nlp/word-vector-representations-word2vec.htmlhttps://zh.gluon.ai/chapter_natural-language-processing
青松愉快
·
2019-04-26 19:21
推荐算法
HanLP中文分词Lucene插件
Mavencom.
hankcs
.nlphanlp-lucene-plugin1.1.6Solr快速上手1.将hanlp-portable.jar和hanlp-lucene-plugin.jar共两个jar
adnb34g
·
2019-04-15 09:59
hanlp中文分词
Lucene插件
自然语言处理
pyhanlp 安装、使用
github地址:https://github.com/
hankcs
/HanLP一、win10安装pyhanlp1.在cmd环境下输入:condainstall-cconda-forgejpype1pipinstallpyhanlp
蕾姆233
·
2019-04-11 11:27
NLP
NLP学习总结 持续更新中
NLP学习总结持续更新中统计学习方法笔记CS229课程笔记CS224课程笔记优秀知乎论文github统计学习方法笔记http://www.
hankcs
.com/ml/the-perceptron.htmlCS229
TianXieErYang
·
2019-04-11 09:39
nlp
基于结构化感知机的词性标注与命名实体识别框架
词性标注训练词性标注是分词后紧接着的一个任务,训练语料同上,接口如下:命令行java-cphanlp.jarcom.
hankcs
.hanlp.model.perceptron.Main-taskPOS-train-referenc
adnb34g
·
2019-04-08 14:00
如何编译运行HanLP自然语言处理包
阅读更多master分支对于master分支,编译方法如下:gitclonehttps://github.com/
hankcs
/HanLP.gitmvninstall-DskipTests·由于目前一些
adnb34g
·
2019-03-06 11:00
如何编译运行HanLP自然语言处理包
master分支对于master分支,编译方法如下:gitclonehttps://github.com/
hankcs
/HanLP.gitmvninstall-DskipTests·由于目前一些test
adnb34g
·
2019-03-06 11:40
hanlp
自然语言
处理包
自然语言处理
如何在linux服务器上使用hanlp
本文主要工作是在linux服务器上使用hanlp,测试源码主要是hanlp源码中的HanLP-1.3.1\src\test\java\com\
hankcs
\demo\DemoKeyword.java(hanlp
左手中的倒影
·
2019-03-04 09:30
java-hanlp中文语言处理
环境:jdk1.7、myeclipse8.5、win64官网:http://hanlp.linrunsoft.com/git下载使用说明地址:https://github.com/
hankcs
/HanLP
lanlantian123
·
2019-02-27 17:16
Spark+Ansj中文分词Scala程序
具体参考ansj:https://github.com/NLPchina/ansj_segHanLP:https://github.com/
hankcs
/HanLP我的代码如下,加了scala连接mysql
29DCH
·
2019-02-24 22:34
Scala学习
大数据平台Spark生态系统
BigData
分词
spark集群使用hanlp进行分布式分词操作说明
以下为全文:分两步:第一步:实现
hankcs
.hanlp/corpus.io.IIOAdapterpublicclassHadoopFileIoAdapterimplementsIIOAdapter{2.3
adnb34g
·
2019-01-21 10:00
spark
spark集群使用hanlp进行分布式分词操作说明
以下为全文:分两步:第一步:实现
hankcs
.hanlp/corpus.io.IIOAdapterpublicclassHadoopFileIoAdapterimplementsIIOAdapter{2.3
adnb34g
·
2019-01-21 10:00
spark
基于结构化平均感知机的分词器Java实现
阅读更多基于结构化平均感知机的分词器Java实现作者:
hankcs
最近高产似母猪,写了个基于AP的中文分词器,在Bakeoff-05的MSR语料上F值有96.11%。
adnb34g
·
2019-01-14 10:00
java
hanlp
HanLP极致简繁转换详细讲解
阅读更多HanLP极致简繁转换详细讲解作者:
hankcs
(大快高级研究员hanlp项目负责人)谈起简繁转换,许多人以为是小意思,按字转换就行了。
adnb34g
·
2019-01-09 13:00
hanlp
Trie树分词
http://www.
hankcs
.com/program/java/tire-tree-participle.html最近在看Ansj中文分词的源码,以前没有涉足过这个领域,所以需要做一些笔记。
weixin_33701294
·
2019-01-08 07:21
java
数据结构与算法
CS224n NLP句法分析依赖解析深度学习作业笔记
CS224nNLP句法分析依赖解析深度学习之作业笔记句法分析的基础内容请参阅CS224n笔记6句法分析http://www.
hankcs
.com/nlp/cs224n-dependency-parsing.html
段智华
·
2018-12-26 11:28
AI
&
Big
Data案例实战课程
pyhanlp用户自定义词典添加实例说明
阅读更多pyhanlp用户自定义词典添加实例说明pyhanlp是python版封装的的HanLP,项目地址:https://github.com/
hankcs
/pyhanlp经过测试,HanLP比nltk
adnb34g
·
2018-12-17 11:00
python
pyhanlp用户自定义词典添加实例说明
阅读更多pyhanlp用户自定义词典添加实例说明pyhanlp是python版封装的的HanLP,项目地址:https://github.com/
hankcs
/pyhanlp经过测试,HanLP比nltk
adnb34g
·
2018-12-17 11:00
python
pyhanlp用户自定义词典添加实例说明
阅读更多pyhanlp用户自定义词典添加实例说明pyhanlp是python版封装的的HanLP,项目地址:https://github.com/
hankcs
/pyhanlp经过测试,HanLP比nltk
adnb34g
·
2018-12-17 11:00
python
Lucene7.0与HanLP分词器整合索引数据库建立索引文件
HanLP官网:http://hanlp.linrunsoft.com/GitHup地址:https://github.com/
hankcs
/HanLPHanLP插件地址:https://github.com
lanlantian123
·
2018-11-30 17:37
自然语言处理之:搭建基于HanLP的开发环境
环境搭建比FNLP的简单,具体参考:https://github.com/
hankcs
/HanLP各个版本的下载:https://github.com/
hankcs
/HanLP/releases完毕后有一个报错
adnb34g
·
2018-11-09 09:59
自然语言处理
hanlp
自然语言处理
HanLP用户自定义词典源码分析详解
自定义词典其实是基于规则的分词,它的用法参考这个issuel如果有些数量词、字母词需要分词,可参考:P2P和C2C这种词没有分出来,希望加到主词库l关于词性标注:可参考词性标注2.源码解析分析com.
hankcs
.demo
adnb34g
·
2018-11-02 10:04
hanlp
自定义词典源码
自然语言处理
JVM Option
原文在这,只是做个笔记http://www.
hankcs
.com/program/java/adjust-vm-option-jvm-performance-optimization.html*----
Hide on Globe
·
2018-08-09 11:59
java基础
golang知识图谱NLP实战第二节——解析依存句法分析结果
参考资料基于依存句法分析的开放式中文实体关系抽取https://blog.csdn.net/heuguangxu/article/details/80088489基于神经网络的高性能依存句法分析器http://www.
hankcs
.com
q平面人
·
2018-07-29 00:18
golang
beego
人工智能
知识图谱
什么是卷积
本文转载自:http://www.
hankcs
.com/ml/understanding-the-convolution-in-deep-learning.html译自TimDettmers的UnderstandingConvolutioninDeepLearning
看未来
·
2018-07-23 02:59
深度学习
EM算法整理及其python实现
此文转载以供以后查阅学习方便,参考原文请移步链接http://www.
hankcs
.com/ml/em-algorithm-and-its-generalization.html另外,参考李航老师的《统计学习方法
brave_stone
·
2018-06-01 15:44
pyhanlp用户自定义词典添加
pyhanlp是python版封装的的HanLP,项目地址:https://github.com/
hankcs
/pyhanlp经过测试,HanLP比nltk在中文分词和实体识别方面都更好用。
明月三千里68
·
2018-05-16 16:14
NLP
word2vec实现cbow和skip-gram
word2vec实现cbow和skip-gramskip-gramcbow1.CBOW实现"""学习参考:http://www.
hankcs
.com/ml/cbow-word2vec.htmlhttps
我是白小纯
·
2018-05-07 11:33
NLP
获取指定文件夹下的所有文件的绝对路径名
*;importcom.
hankcs
.hanlp.HanLP;/***Thetoolclass:theencapsulationofcommonfunctions.
爱做梦真是太好了
·
2018-04-30 12:49
Java编程语言
中文文本相似度计算工具集
https://github.com/fxsjy/jiebab.HanLP自然语言处理中文分词词性标注命名实体识别依存句法分析关键词提取新词发现短语提取自动摘要文本分类拼音简繁http://hanlp.
hankcs
磐创 AI
·
2018-04-19 14:09
机器学习
人工智能
统计学习方法之EM算法及其推广
转至:http://www.
hankcs
.com/ml/em-algorithm-and-its-generalization.html本文是《统计学习方法》第九章的笔记,注解了原著的部分公式推导,补充了另一个经典的双硬币模型
fan_fan_feng
·
2018-04-14 15:10
机器学习
word2vec的应用----使用gensim来训练模型
一、word2vec的原理就不介绍原理可以参考码农场介绍:http://www.
hankcs
.com/nlp/word-vector-representations-word2vec.html二、gensim
風起云扬
·
2018-01-18 17:56
自然语言处理(NLP)
招聘网站技术类词频分析_第二版
人才需求使用框架:平台:阿里云爬虫:scrapyhttps://docs.scrapy.org/en/latest/index.html中文分词:HanLP中文分词https://github.com/
hankcs
狂暴棕熊
·
2018-01-15 17:28
个人项目
无法打开内核设备“\\.\Global\vmx86”: 系统找不到指定的文件。
原文地址:http://www.
hankcs
.com/uncategorized/vmware-pal5q.html在打开仙五前传虚拟机的时候提示无法打开内核设备.Globalvmx86:系统找不到指定的文件
叽哩古哩
·
2017-12-18 13:20
linux系统命令
上一页
1
2
3
4
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他