E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
bilstmcrf词性标注
基于统计的中文分词
其基本思想就是在分词的同时进行句法、语义分析, 利用句法信息和语义信息来进行
词性标注
, 以解决分词歧义现象。
·
2015-11-11 06:43
中文分词
收集到几种开源NLP工具
Apache OpenNLP库是一个基于机器学习的自然语言文本处理的开发工具包,它支持自然语言处理中一些共有的任务,例如:标记化、句子分割、
词性标注
、固有实体提取(指在句子中辨认出专有名词,例如:人名)
·
2015-11-11 03:16
开源
结巴分词标注兼容_ICTCLAS2008汉语
词性标注
集
计算所汉语词性标记集Version 3.0制订人:刘群 张华平 张浩计算所汉语词性标记集... 10. 说明... 11. 名词 (1个一类,7个二类,5个三类) 22. 时间词(1个一类,1个二类) 23. 处所词(1个一类) 34. 方位词(1个一类) 35. 动词(1个一类,9个二类) 36. 形容词(1个一类,4个二类) 37. 区别词(1个一类,2个二类) 38. 状态词
·
2015-11-09 13:20
2008
利用 word2vec 训练的字向量进行中文分词
最近针对之前发表的一篇博文《Deep Learning 在中文分词和
词性标注
任务中的应用》中的算法做了一个 C 语言的实现,感觉效果还不错。
·
2015-11-09 13:01
word
词性标注
对照表
形容词 a a 形容词 最/d 大/a 的/u true 副形词 ad ad 副形词 一定/d 能够/v 顺利/ad 实现/v 。/w true 形语素 Ag ag 形语素 喜/v 煞/Ag 人/n true 名形词 an an 名形词 人民/n 
·
2015-11-02 19:58
表
词性标注
4.10
词性标注
词性用来描写叙述一个词在上下文中的作用。比如描写叙述一个概念的词叫做名词,在下文引用这个名词的词叫做代词。
·
2015-11-02 18:47
词性标注
-隐马尔科夫模型应用
问题的提出已知:词序列: 寻找词性序列: 使得条件概率最大: 解:(忽略词序列概率,因为没用)图示:具体实现就是:动态规划-维特比算法 [维特比算法.....自己看吧,数学之美上有解释]概念解释:发射概率:某个词作为名词出现的频率/名词在语料库中出现的频率 也叫生成概率 某个隐状态生成显状态的概率转移概率:某个词性到另一个词性的频率/某个词性生成所有其他
·
2015-11-02 13:28
应用
中科院分词ICTCLAS5.0_JNI 使用方法
耗时一年研制出了基于多层隐码模型的汉语词法分析系统 ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),该系统的功能有:中文分词;
词性标注
·
2015-11-01 12:41
jni
Penn Treebank
Penn Treebank是一个项目的名称,项目目的是对语料进行标注,标注内容包括
词性标注
以及句法分析。
·
2015-10-31 11:06
tree
Python自然语言处理学习笔记(40):5.1 使用
词性标注
器
CHAPTER 5 Categorizing and Tagging Words 分类和标注单词 Back in elementary school you learned the difference between nouns, verbs, adjectives, and adverbs. These “word classes” are not just the id
·
2015-10-30 11:01
python
写一点应用关于 Lucene.Net,snowball的重新组装(一)在Lucene.Net中加入
词性标注
与词根还原功能
作者:finallyliuyu (资料使用,博文引用请您表面出处) 本专题是有关借助于Lucene.Net工具如何对英文文章进行分词,
词性标注
,词根还原的。
·
2015-10-28 08:44
Lucene
NLP
之前我们都知道中科院的ictclas,能够实现分词、
词性标注
功能,而且最新版的还增加了几个篇章级的功能,如新词识别,关键词抽取等,在接口方面ictclas有java, c++, python
·
2015-10-27 13:16
nl
BosonNLP分词技术解密
在九月初BosonNLP全面开放了分词和
词性标注
引擎以后,很多尤其是从事数据处理和自然语言研究的朋友在试用后很好奇,玻森如何能够做到目前的高准确率?希望这篇文章能够帮助大家理解玻森分词背后的实现原理。
power914
·
2015-10-23 15:30
中文
朋友
文章
英文
准确率
BosonNLP分词技术解密
在九月初BosonNLP全面开放了分词和
词性标注
引擎以后,很多尤其是从事数据处理和自然语言研究的朋友在试用后很好奇,玻森如何能够做到目前的高准确率?希望这篇文章能够帮助大家理解玻森分词背后的实现原理。
power914
·
2015-10-23 15:30
朋友
文章
中文
BosonNLP分词技术解密
在九月初BosonNLP全面开放了分词和
词性标注
引擎以后,很多尤其是从事数据处理和自然语言研究的朋友在试用后很好奇,玻森如何能够做到目前的高准确率?希望这篇文章能够帮助大家理解玻森分词背后的实现原理。
power914
·
2015-10-23 15:30
中文
朋友
文章
英文
准确率
在路上:语义和创业
语义技术,无非分词、
词性标注
、分类。如果有几个开源的东西一拼接就行了。如果等你打算做到百度新闻的领域,就会意识到算法是核心竞争力。 比如这次改版
·
2015-10-23 08:02
在路上
BosonNLP分词技术解密
在九月初BosonNLP全面开放了分词和
词性标注
引擎以后,很多尤其是从事数据处理和自然语言研究的朋友在试用后很好奇,玻森如何能够做到目前的高准确率?希望这篇文章能够帮助大家理解玻森分词背后的实现原理。
macg0406
·
2015-10-22 00:00
大数据
自然语言处理
中文分词
bosonnlp
CRF HMM,MEMM的区别
图示区别:http://blog.csdn.net/zhoubl668/article/details/7787690CRF,HMM(隐马模型),MEMM(最大熵隐马模型)都常用来做序列标注的建模,像
词性标注
baidu_26550817
·
2015-10-09 09:00
Python自然语言处理(一)--利用NLTK自带方法完成NLP基本任务
NLTK是Python很强大的第三方库,可以很方便的完成很多自然语言处理(NLP)的任务,包括分词、
词性标注
、命名实体识别(NER)及句法分析。
海涛anywn
·
2015-09-29 11:04
nlp
python
自然语言处理
Python自然语言处理(一)--利用NLTK自带方法完成NLP基本任务
NLTK是Python很强大的第三方库,可以很方便的完成很多自然语言处理(NLP)的任务,包括分词、
词性标注
、命名实体识别(NER)及句法分析。
lihaitao000
·
2015-09-29 11:00
python
NLP
几种中文分词工具
能通过自定义配置文件来改变组件行为,能自定义用户词库、自动检测词库变化、支持大规模分布式环境,能灵活指定多种分词算法,能使用refine功能灵活控制分词结果,还能使用
词性标注
、同义标注、
秦朝老亖
·
2015-09-24 18:14
[中文分词]
Python自然语言处理学习笔记(二)
许多文本语料库都包含了语言学标注,有
词性标注
,命名实体,句法结构,语义角色等等。2)文本语料库的结构*Isolated:
Anne_Fu
·
2015-09-04 23:22
word v1.3 发布,Java 分布式中文分词组件
能通过自定义配置文件来改变组件行为,能自定义用户词库、自动检测词库变化、支持大规模分布式环境,能灵活指定多种分词算法,能使用refine功能灵活控制分词结果,还能使用词频统计、
词性标注
、同义标注、反
杨尚川
·
2015-08-29 09:00
word
分词
中文分词
分词算法
NLP
word v1.3 发布,Java 分布式中文分词组件
能通过自定义配置文件来改变组件行为,能自定义用户词库、自动检测词库变化、支持大规模分布式环境,能灵活指定多种分词算法,能使用refine功能灵活控制分词结果,还能使用词频统计、
词性标注
、同义标注、反
yangshangchuan
·
2015-08-29 09:00
word
分词
中文分词
分词算法
NLP
word v1.3 发布,Java 分布式中文分词组件
能通过自定义配置文件来改变组件行为,能自定义用户词库、自动检测词库变化、支持大规模分布式环境,能灵活指定多种分词算法,能使用refine功能灵活控制分词结果,还能使用词频统计、
词性标注
、同义
yangshangchuan
·
2015-08-29 09:00
中文分词
分词
分词算法
word
NLP
word v1.3 发布,Java 分布式中文分词组件
能通过自定义配置文件来改变组件行为,能自定义用户词库、自动检测词库变化、支持大规模分布式环境,能灵活指定多种分词算法,能使用refine功能灵活控制分词结果,还能使用词频统计、
词性标注
、同义
yangshangchuan
·
2015-08-29 09:00
中文分词
分词
分词算法
word
NLP
python的nltk中文使用和学习资料汇总帮你入门提高
//blog.csdn.net/huyoo/article/details/12188573作者:糊糊nltk是一个python工具包,用来处理和自然语言处理相关的东西.包括分词(tokenize),
词性标注
糊糊
·
2015-08-12 20:00
自然语言处理
NLTK
词性标注
词性标识编码表
参考《PFR人民日报标注语料库》的词性编码表,如表4-4所示:表4-4 词性编码表代码名称举例a形容词最/d 大/a 的/u ad副形词一定/d 能够/v 顺利/ad 实现/v 。/w ag形语素喜/v 煞/ag 人/n an名形词人民/n 的/u 根本/a 利益/n 和/c 国家/n 的/u 安稳/an 。/w B区别词副/b 书记/n 王/nr 思齐/nr c连词全军/n 和/c 武警/n 先
mm_bit
·
2015-08-07 11:00
预处理
文本分类
最大熵模型文献阅读指南
maximum-entropy-model-tutorial-reading最大熵模型文献阅读指南发表于2009年11月4号由52nlp最大熵模型(MaximumEntropyModel)是一种机器学习方法,在自然语言处理的许多领域(如
词性标注
hechenghai
·
2015-07-05 16:40
机器学习
最大熵模型文献阅读指南
maximum-entropy-model-tutorial-reading最大熵模型文献阅读指南发表于 2009年11月4号 由 52nlp最大熵模型(MaximumEntropyModel)是一种机器学习方法,在自然语言处理的许多领域(如
词性标注
hechenghai
·
2015-07-05 16:00
NLP的python包:pattern.en
简介和安装pattern.en是一个基于python的自然语言处理工具包,en代表English(没错,还有西班牙语es、德语de、法语fr、意大利语it、荷兰语nl),它可以做的事包括:
词性标注
(part-of-speechtagger
lv26230418
·
2015-05-21 21:00
python
Pattern
自然语言处理
NLP
神经网络语言模型详解
1简介语言模型是自然语言处理领域的基础问题,其在
词性标注
、句法分析、机器翻译、信息检索等任务中起到了重要作用。
hechenghai
·
2015-05-07 14:35
学习笔记
神经网络语言模型详解
1简介语言模型是自然语言处理领域的基础问题,其在
词性标注
、句法分析、机器翻译、信息检索等任务中起到了重要作用。
hechenghai
·
2015-05-07 14:00
生物语料
词性标注
工具——genia tagger
GENIATagger-part-of-speechtagging,shallowparsing,andnamedentityrecognitionforbiomedicaltext-What'sNew20Oct.2006Ademopage isavailable.6Oct.2006Version3.0:Thetaggernowperformsnamedentityrecognition.Over
u010454729
·
2015-04-23 10:00
genia
tagger
python nltk 基本操作
nltk.sent_tokenize(text)#按句子分割nltk.word_tokenize(sentence)#分词nltk的分词是句子级别的,所以对于一篇文档首先要将文章按句子进行分割,然后句子进行分词:
词性标注
sherrylml
·
2015-04-22 16:00
python
NLTK
国内可用免费语料库
现代汉语语料库在线提供免费检索的语料约2000万字,为分词和
词性标注
语料。 2古代汉语语
·
2015-04-21 17:00
免费
自然语言处理工具
最近有一些需求,对一个英文句子进行
词性标注
,NLP的经典问题,应该也有很多现成工具,就去找了一下,在此把结果先贴一下,使用后再补充。
lv26230418
·
2015-04-07 16:00
NLP
pos
词性标注
HanLP开源
支持中文分词(N-最短路分词、CRF分词、索引分词、用户自定义词典、
词性标注
),命名实体识别(中国人名、音译人名、日本人名、地名、实体机构名识别),关键词提取,自动摘要,短语提取,拼音转换,简繁转换,文本推荐
hankcs
·
2015-03-27 16:00
Go语言的分词器(sego)
支持普通和搜索引擎两种分词模式,支持用户词典、
词性标注
,可运行JSONRPC服务。 分词速度单线程2.7MB/s,
ACdreamers
·
2015-03-26 22:00
ICTCLAS 汉语
词性标注
集
以前使用jieba分词时,并没有注意到
词性标注
集到底包含哪些,刚好最近学习自然语言处理,涉及到分词以及
词性标注
,将ICTCLAS
词性标注
集记录如下:ICTCLAS汉语
词性标注
集代码名称帮助记忆的诠释Ag
bbking
·
2015-03-16 15:00
java实现NLPIR(ICTCLAS)分词
1、NLPIR简介 NLPIR汉语分词系统(又名ICTCLAS2013),主要功能包括中文分词;
词性标注
;命名实体识别;用户词典功能;支持GBK编码、UTF8编码、BIG5编码。
u013758116
·
2015-03-10 14:00
java
NLPIRICTCLAS
【python】NLTK好文
包括分词(tokenize),
词性标注
(POS), 文本分类, 等等现成的工具. 1. nltk的安装资料1.1: 黄聪:Python+NLTK自然语言处理学习(一):环境搭建 http://www.cnblo
·
2015-02-27 17:00
python
R语言中文分词jiebaR
支持最大概率法(MaximumProbability),隐式马尔科夫模型(HiddenMarkovModel),索引模型(QuerySegment),混合模型(MixSegment),共四种分词模式,同时有
词性标注
u011402596
·
2015-02-17 11:00
r
中文分词
jiebaR
【文本挖掘】
词性标注
记法
ICTCLAS 汉语
词性标注
集 汉语文本
词性标注
标记集Ag 形语素 形容词性语素。形容词代码为a,语素代码g前面置以A。a 形容词 取英语形容词adjective的第1个字母。
·
2015-02-10 17:00
Stanford Parser的使用——进行词法语法分析
http://blog.csdn.net/pipisorry/article/details/42976457
词性标注
介绍POStagging:part-of-speechtagging,orwordclassesorlexicalcategories
pipisorry
·
2015-01-21 20:00
parser
pos
stanford
tagging
词法语法分析
"结巴"中文分词的R语言版本:jiebaR
支持最大概率法(MaximumProbability),隐式马尔科夫模型(HiddenMarkovModel),索引模型(QuerySegment),混合模型(MixSegment),共四种分词模式,同时有
词性标注
猪猪daxia
·
2014-12-22 10:00
IR、NLP科普
2)句法分析如中文分词、
词性标注
等。 3)语法分析分析句子的句法结构,如一个句子中的主谓结构、动宾结构等语法成分,常用依存文法分析器就是一个语法分析工具。
HappyBKs
·
2014-12-20 15:00
ansj_seg源码分析之用户自定义词性覆盖系统原有词性
今天遇到一个需求,需要用用户自定义词库的
词性标注
,替换系统原有词库的
词性标注
。也就是玉壶自定义词性覆盖系统原有词性。
yucang52555
·
2014-12-12 15:00
分词
ansj
词库
用户自定义
词性标注
ansj_seg源码分析之用户自定义词性覆盖系统原有词性
阅读更多今天遇到一个需求,需要用用户自定义词库的
词性标注
,替换系统原有词库的
词性标注
。也就是玉壶自定义词性覆盖系统原有词性。
yucang52555
·
2014-12-12 15:00
ansj
词性标注
用户自定义
分词
词库
史上最详细最容易理解的HMM文章
hmm-learn-best-practices-four-hidden-markov-modelswiki上一个比较好的HMM例子分类 隐马尔科夫模型 HMM(隐马尔科夫模型)是自然语言处理中的一个基本模型,用途比较广泛,如汉语分词、
词性标注
及语音识别等
u014600432
·
2014-12-10 21:00
Algorithm
机器学习
语音识别
模式识别
上一页
22
23
24
25
26
27
28
29
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他