E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
bilstmcrf词性标注
使用ICTCLAS JAVA版(ictclas4j)进行中文分词(附ictclas,停用词表,commons-lang-2.4.jar下载地址)
耗时一年研制出了基于多层隐码模型的汉语词法分析系统 ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),该系统的功能有:中文分词;
词性标注
fhqllt
·
2011-03-09 16:00
java
apache
eclipse
bean
asp
ICTCLAS 汉语
词性标注
集
ICTCLAS 汉语
词性标注
集 汉语文本
词性标注
标记集Ag 形语素 形容词性语素。形容词代码为a,语素代码g前面置以A。a 形容词 取英语形容词adjective的第1个字母。
fhqllt
·
2011-03-09 11:00
C++
c
C#
F#
J#
词性标注
程序探讨
程序设计主要分为五个部分,即词频统计和词性符号统计、状态转移概率的计算、发射概率的计算、
词性标注
、性能评价。
androidssh
·
2011-03-07 20:00
算法
J#
词性标注
程序探讨
阅读更多程序设计主要分为五个部分,即词频统计和词性符号统计、状态转移概率的计算、发射概率的计算、
词性标注
、性能评价。
androidssh
·
2011-03-07 20:00
J#
算法
Penn Treebank Tags做点小翻译 (上篇)
前言 :最近在研究自然语言处理,搞的很浅,然后下了openNLP,实现了分词和分句,现在要做
词性标注
,结果openNLP参照的是这个Penn Treebank Tags,所以没办法要看懂
词性标注
的结果,
fuhao_987
·
2011-01-22 23:00
vb
viterbi 算法
词性标注
:该算法解决的是HMM经典问题中最优状态序列的选择问题。
zimohuakai
·
2010-12-13 10:00
算法
活动
iterator
Path
transition
output
最大熵模型文献阅读指南
最大熵模型(MaximumEntropyModel)是一种机器学习方法,在自然语言处理的许多领域(如
词性标注
、中文分词、句子边界识别、浅层句法分析及文本分类等)都有比较好的应用效果。
lengyuhong
·
2010-11-22 11:00
Algorithm
application
Random
自然语言处理
Parameters
模型工具
基于CRF的中文分词
Field:条件随机场,一种机器学习技术(模型)CRF由JohnLafferty最早用于NLP技术领域,其在NLP技术领域中主要用于文本标注,并有多种应用场景,例如:分词(标注字的词位信息,由字构词)
词性标注
lengyuhong
·
2010-11-16 14:00
测试
validation
File
token
features
output
ICTCLAS 中科院分词系统 代码 注释 中文分词
词性标注
ICTCLAS 中科院分词系统 代码 注释 中文分词
词性标注
http://hi.baidu.com/hupoo/blog/item/a8898044b434514c500ffee3.html2006
liuxinglanyue
·
2010-11-13 09:00
C++
c
算法
C#
J#
概率图模型之生成模型与判别模型
自然语言处理中,经常要处理序列标注问题(分词、
词性标注
、组快分析等),为给定的观察序列标注标记序列。
杰
·
2010-11-05 13:00
standford vs opennlp
然而,使用stanford parser为基础的语义分析有一个致命的缺点:分析严重受制于stanford parser的结果,而stanford parser是将分词、
词性标注
都集成在一起,难以使用第三方的分词器和
turingfellow
·
2010-09-04 06:00
工作
人民日报1998年中文标注语料库及读取代码
该语料库对600多万字节的中文文章进行了分词及
词性标注
,其被作为原始数据
foamflower
·
2010-08-30 22:00
POS Tagging
POStagging:part-of-speechtagging,orwordclassesorlexicalcategories.说法很多其实就是
词性标注
。
fxjtoday
·
2010-08-26 17:00
vb
import
each
tags
Training
tokenize
基于特定语料的HMM模型计算和Viterbi算法的实现
在中文信息处理方面,它主要用于
词性标注
,计算机并不知道一句话中某个词的具体词性,需要通过相应的模型和算法来使计算机能够识别出一句话中具体某个词的词性,那么模型就是某个HMM,算法就是在此模型上的Viterbi
jiagou
·
2010-08-24 18:00
算法
使用ICTCLAS JAVA版(ictclas4j)进行中文分词(附ictclas,停用词表,commons-lang-2.4.jar下载地址)
耗时一年研制出了基于多层隐码模型的汉语词法分析系统 ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),该系统的功能有:中文分词;
词性标注
emily2ly
·
2010-08-20 11:00
java
apache
eclipse
qq
MyEclipse
基于特定语料的HMM模型计算和Viterbi算法的实现
在中文信息处理方面,它主要用于
词性标注
,计算机并不知道一句话中某个词的具体词性,需要通过相应的模型和算法来使计算机能够识别出一句话中具体某个词的词性,那么模型就是某个HMM,算法就是在此模型上的Viterbi
fushengfei
·
2010-08-15 20:00
设计模式
算法
.net
Blog
J#
HMM模型的浅出式理解 [ZZ]
实在为我投入NPL的先师 HMM(隐马尔科夫模型)是自然语言处理中的一个基本模型,用途比较广泛,如汉语分词、
词性标注
及语音识别等,在NLP中占有很重要的地位。
·
2010-08-10 14:00
理解
HMM学习
词性标注
中应用比较多。3.学习,根据观测序列,学习模型的参数A,B,PI等,前向-后向算法的使用,EM算法。 我想我首先想用的就是前向-后向算法吧,对参数进行学习的,这部分是最复杂的。
caoeryingzi
·
2010-07-20 18:00
中科院的分词系统使用的
词性标注
标准
汉语文本
词性标注
标记集Ag形语素形容词性语素。形容词代码为a,语素代码g前面置以A。a形容词取英语形容词adjective的第1个字母。ad副形词直接作状语的形容词。形容词代码a和副词代码d并在一起。
liehuo123
·
2010-05-26 11:00
c
ICTCLAS 中科院分词系统 代码 注释 中文分词
词性标注
中科院分词系统概述 这几天看完了中科院分词程序的代码,现在来做一个概述,并对一些关键的数据结构作出解释 〇、总体流程 考虑输入的一句话,sSentence="张华平欢迎您" 总体流程: 一、分词 "张/华/平/欢迎/您" 二、posTagging "张/q 华/j 平/j 欢迎/v 您/r" 三、NE识别:人名识别,音译名识
lzj0470
·
2010-04-30 14:00
C++
c
算法
C#
J#
ICTCLAS 中科院分词系统 代码 注释 中文分词
词性标注
中科院分词系统概述 这几天看完了中科院分词程序的代码,现在来做一个概述,并对一些关键的数据结构作出解释 〇、总体流程 考虑输入的一句话,sSentence="张华平欢迎您" 总体流程: 一、分词 "张/华/平/欢迎/您" 二、posTagging "张/q 华/j 平/j 欢迎/v 您/r" 三、NE识别:人名识别,音译名识
zfsn
·
2010-04-16 15:00
C++
c
算法
C#
J#
ICTCLAS2010分词工具
耗时一年研制出了基于多层隐马模型的汉语词法分析系统 ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),该系统的功能有:中文分词;
词性标注
tlovet1314
·
2010-04-15 21:00
又开源了一个项目
code.google.com/p/lightwords/ ): lightwords是一个中分分词引擎,用双数组Trie树作为词典结构,采用最短N路径算法构造词图粗切分,后期加工采用隐马尔科夫模型(HMM)进行人名地名识别和
词性标注
kenbinzhang
·
2010-04-04 17:00
c
算法
Google
语言
引擎
生成模型与判别模型
自然语言处理中,经常要处理序列标注问题(分词、
词性标注
、组快分析等),为给定的观察序列标注标记序列。
neuTblue
·
2010-04-04 17:00
优化
Random
自然语言处理
methods
structure
variables
生成模型与判别模型
自然语言处理中,经常要处理序列标注问题(分词、
词性标注
、组快分析等),为给定的观察序列标注标记序列。
neutblue
·
2010-04-04 17:00
NLP
parsing
转载
中科院的分词系统使用的
词性标注
标准
汉语文本
词性标注
标记集 Ag 形语素 形容词性语素。形容词代码为a,语素代码g前面置以A。 a 形容词 取英语形容词adjective的第1个字母。
lzj0470
·
2010-03-23 11:00
C++
c
C#
F#
J#
中英文
词性标注
工具介绍
一下工具具有C/C++版本 中文
词性标注
工具:比较好的有中科院:ictclas具体使用方面看他里面的例子及文档很详细。突出功能是分成功能,还有命名实体识别功能。
isping
·
2010-03-01 22:20
职场
c/c++
休闲
中英文
词性标注
工具介绍
一下工具具有C/C++版本中文
词性标注
工具:比较好的有中科院:ictclas具体使用方面看他里面的例子及文档很详细。突出功能是分成功能,还有命名实体识别功能。
isping
·
2010-03-01 22:20
职场
休闲
C/C++
其他技术
中英文
词性标注
工具介绍
一下工具具有C/C++版本 中文
词性标注
工具:比较好的有中科院:ictclas具体使用方面看他里面的例子及文档很详细。突出功能是分成功能,还有命名实体识别功能。
isping
·
2010-03-01 22:20
职场
c/c++
休闲
中科院中文分词工具ICTCLAS30进行名实体识别的方法
使用中科院的分词工具ICTCLAS30可以进行名实体识别,方法也很简单就是在分词时候同时进行
词性标注
,然后把代表人名、地名、时间名、数量的提取出来。
isping
·
2010-01-19 21:40
职场
休闲
名实体识别
ICTCLAS30
中科院中文分词工具ICTCLAS30进行名实体识别的方法
使用中科院的分词工具ICTCLAS30可以进行名实体识别,方法也很简单就是在分词时候同时进行
词性标注
,然后把代表人名、地名、时间名、数量的提取出来。
isping
·
2010-01-19 21:40
职场
休闲
名实体识别
ICTCLAS30
中科院中文分词工具ICTCLAS30进行名实体识别的方法
使用中科院的分词工具ICTCLAS30可以进行名实体识别,方法也很简单就是在分词时候同时进行
词性标注
,然后把代表人名、地名、时间名、数量的提取出来。
isping
·
2010-01-19 21:40
职场
休闲
名实体识别
其他技术
ICTCLAS 中科院分词系统 代码 注释 中文分词
词性标注
ICTCLAS中科院分词系统代码注释中文分词
词性标注
风暴红QxRed发表于2006-04-2020:38:50中科院分词系统概述这几天看完了中科院分词程序的代码,现在来做一个概述,并对一些关键的数据结构作出解释
sealbird
·
2009-12-09 13:00
数据结构
c
算法
less
存储
IM
中科院ICTCLAS工具
中科院的ICTCLAS工具是目前国内有名的中文分词工具,分词准确率很高且具有
词性标注
的功能,在ICTCLAS的官方网站上可以下到最新的免费版供研究使用。
isping
·
2009-11-23 15:15
职场
休闲
ictclas
中科院ICTCLAS工具
中科院的ICTCLAS工具是目前国内有名的中文分词工具,分词准确率很高且具有
词性标注
的功能,在ICTCLAS的官方网站上可以下到最新的免费版供研究使用。
isping
·
2009-11-23 15:15
职场
休闲
ictclas
条件随机场(CRF)相对于HMM,MEMM的优势
条件随机场(CRF)相对于HMM,MEMM的优势首先,CRF,HMM(隐马模型),MEMM(最大熵隐马模型)都常用来做序列标注的建模,像
词性标注
,Truecasing。
chl033
·
2009-11-01 20:00
算法
工具
条件随机场(CRF)相对于HMM,MEMM的优势
条件随机场(CRF)相对于HMM,MEMM的优势首先,CRF,HMM(隐马模型),MEMM(最大熵隐马模型)都常用来做序列标注的建模,像
词性标注
,Truecasing。
cowboy_wz
·
2009-11-01 20:00
机器学习
简与美(7)
尤其是第二个问题,和我们接下来要讨论的
词性标注
有直接关系。 在NPL领域,有一个称为N元模型的语言统计模型,它对应N-1阶马尔科夫模型。
kenbinzhang
·
2009-10-11 10:00
词语切分与
词性标注
- 规范与加工手册
现代汉语语料库词语切分和
词性标注
规范在现代分词系统被广泛使用,中科院的分词系统中的
词性标注
也差不多采用这个标记集合。Yard中文分词系统在后面的版本中也将采用这个标记集合。
soul_fly
·
2009-06-17 02:00
F#
J#
ictclas4j分词模块
ictclas4j中文分词模块ms也是采用了Viterbi算法进行切词,在切词基础上进行
词性标注
。
summerbell
·
2009-05-19 14:00
算法
bean
SNS
python词法分析(分词+
词性标注
)
#-*-coding:cp936-*-###librarys:importsys###globalvariables:freqdic={}dic={}transferdic={}inputfilename=''outputfilename=''trainingfilename=''marklist=[]###classes:classnodeinfotable:def__init__(self,
soundfuture
·
2009-04-29 09:00
python
File
Path
character
Training
Numbers
基于CRF的中文分词
ConditionalRandomField:条件随机场,一种机器学习技术(模型)CRF由JohnLafferty最早用于NLP技术领域,其在NLP技术领域中主要用于文本标注,并有多种应用场景,例如:分词(标注字的词位信息,由字构词)
词性标注
ifengle
·
2009-01-22 10:00
自然语言处理
lieTu 分词
词性标注
24832 a 形容词 24932 ad 副形词 24935 ag 形语素 24942 an 名形词 25088 b 区别词 25344 c 连词 25600 d 副词 25703 dg 副语素 25856 e 叹词 26112 f 方位词 26368 g 语素 26624 h 前接成分 26880 i 成语 27136 j 简称略语 273
gcgmh
·
2008-12-09 12:00
C++
c
F#
C#
J#
北大ppt 文本挖掘技术系列之一---TextMining02-特征提取---(附:海明距离)
ppt文本挖掘技术系列之一---TextMining02-特征提取---(附:海明距离)TextMining02-特征提取.pdf分词最大匹配法..分词歧义和各种数字,日期,姓名识别最大概率法最短路径法
词性标注
基于规则的
词性标注
专注创造价值
·
2008-06-09 20:00
ICTCLAS 中科院分词系统 代码 注释 中文分词
词性标注
ICTCLAS中科院分词系统代码注释中文分词
词性标注
(转)中科院分词系统概述这几天看完了中科院分词程序的代码,现在来做一个概述,并对一些关键的数据结构作出解释〇、总体流程考虑输入的一句话,sSentence
刀剑笑
·
2007-12-28 22:00
SharpICTCLAS 1.0 发布!
2007年4月20日)下载SharpICTCLAS1.0一、SharpICTCLAS1.0版相对于测试版的改进1、修改了原子分词代码,使得对于全角字母有较好的识别2、修改了部分
词性标注
部分的代码因为
词性标注
部分的代码存在问题
刀剑笑
·
2007-12-28 20:00
SharpICTCLAS分词系统简介(1)读取词典库
SharpICTCLAS分词系统简介(1)读取词典库(转)ICTCLAS分词的总体流程包括:1)初步分词;2)
词性标注
;3)人名、地名识别;4)重新分词;5)重新
词性标注
这五步。
刀剑笑
·
2007-12-28 19:00
人民日报1998年中文标注语料库及读取代码
该语料库对600多万字节的中文文章进行了分词及
词性标注
,其被作为原始数据
eaglet
·
2007-09-10 13:00
搜索引擎
中文分词
SharpICTCLAS 1.0 发布!
2007年4月20日)下载SharpICTCLAS1.0一、SharpICTCLAS1.0版相对于测试版的改进1、修改了原子分词代码,使得对于全角字母有较好的识别2、修改了部分
词性标注
部分的代码因为
词性标注
部分的代码存在问题
吕震宇
·
2007-04-18 15:00
分词:
词性标注
北大标准
汉语词性对照表[北大标准/中科院标准] 词性编码词性名称注解Ag形语素形容词性语素。形容词代码为a,语素代码g前面置以A。a形容词取英语形容词adjective的第1个字母。ad副形词直接作状语的形容词。形容词代码a和副词代码d并在一起。an名形词具有名词功能的形容词。形容词代码a和名词代码n并在一起。b区别词取汉字“别”的声母。c连词取英语连词conjunction的第1个字母。dg副语素副词
dbigbear
·
2007-01-19 22:00
上一页
23
24
25
26
27
28
29
30
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他