E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
bilstmcrf词性标注
Python 中文分词工具 ——结巴分词的使用方法总结
今天要说的内容与实际应用更贴近——从文本中读取中文信息,利用结巴分词工具进行分词及
词性标注
。
捂汗县长
·
2013-07-08 21:09
Python
结巴分词
Python 中文分词工具 ——结巴分词的使用方法总结
今天要说的内容与实际应用更贴近——从文本中读取中文信息,利用结巴分词工具进行分词及
词性标注
。
laoyaotask
·
2013-07-08 21:00
Python 结巴分词在使用过程中遇到的问题及对策
结巴分词是Python语言中效果最好的分词工具,其功能包括:分词、
词性标注
、关键词抽取、支持用户词表等。这几天一直在研究这个工具,在安装与使用过程中遇到一些问题,现在把自己的一些方法帖出来分享一下。
laoyaotask
·
2013-07-08 00:00
自己写中文分词器之(一)_逆向最大匹配算法的实现
希望自己最后能把分词、
词性标注
、命名实体识别这几块都完成。好了,话不多述,进入正题。分词最简单的思路就是查词典,确实,最开始大家都是这么做的。包括现在都有人这样做。
sbp810050504
·
2013-07-01 00:55
中文
中文分词
分词
NLP&ML
自己写中文分词器之(一)_逆向最大匹配算法的实现
希望自己最后能把分词、
词性标注
、命名实体识别这几块都完成。 好了,话不多述,进入正题。 分词最简单的思路就是查词典,确实,最开始大家都是这么做的。包括现在都有人这样做。
sbp810050504
·
2013-07-01 00:55
java
中文
分词
分词
中文分词
逆向最大匹配
POS tagging的解釋
轉錄文章~~什么是
词性标注
(POStagging)Tue,04/13/2010-10:36—Fuller
词性标注
也叫词类标注,POStagging是part-of-speechtagging的缩写。
·
2013-06-18 16:00
tag
隐马尔科夫模型(HMM)学习之 概要
其实HMM的运用是非常广泛的,如语音识别,
词性标注
等等,凡是关于时间序列的问题都可以用HMM来解决。 我们知道,世间的万事万物都是有一定的规律的,而且这种规律一般来说是非常复杂,而且会随着时间变化。
iKingLai
·
2013-06-16 14:55
语音识别
hmm
隐马尔科夫
学习笔记之HMM模型
//beecindy.blogbus.com/logs/125199263.htmlwiki上一个比较好的HMM例子:HMM(隐马尔科夫模型)是自然语言处理中的一个基本模型,用途比较广泛,如汉语分词、
词性标注
及语音识别等
wuwuwuwuwuwuwuwu
·
2013-05-10 10:00
ICTCLAS2011_JNI接口-整体介绍
ICTCLAS(InstituteofComputingTechnology,ChineseLexicalAnalysisSystem)2011版,汉语词法分析系统ICTCLAS主要功能包括中文分词;
词性标注
jazywoo123
·
2013-04-18 11:00
中科院分词ICTCLAS汉语分词系统简单配置
汉语分词一直来说都是进行文本分析的瓶颈,这里介绍一个汉语分词系统ICTCLAS,全球很受欢迎的汉语分词开源系统,曾获得首界国际分词大赛综合排名第一,国家973评测第一名;支持词典,多级
词性标注
,支持人名
jazywoo123
·
2013-04-18 11:00
[置顶] ICTCLAS2013 的使用方法
先看看他的官方介绍吧:NLPIR汉语分词系统(又名ICTCLAS2013),主要功能包括中文分词;
词性标注
;命名实体识别;用户词典功能;支持GBK编码、UTF8编码、BIG5编码。
hellonlp
·
2013-04-12 13:00
使用继续完善前人写的文章:使用ICTCLAS JAVA版(ictclas4j)进行中文分词
耗时一年研制出了基于多层隐码模型的汉语词法分析系统ICTCLAS(InstituteofComputingTechnology,ChineseLexicalAnalysisSystem),该系统的功能有:中文分词;
词性标注
luojinping
·
2013-04-11 15:00
java
技术
使用TextRank实现的关键字提取
RadaMihalcea论文《TextRank:BringOrderintotexts》整个算法步骤:【1】文本分词 可以使用常见的java分词,本例使用的是IKAnalyer【2】
词性标注
scugxl
·
2013-04-10 20:00
算法
pagerank
textrank
关键词提取
ICTCLAS2013 Java版本的使用方法
先看看他的官方介绍吧:NLPIR汉语分词系统(又名ICTCLAS2013),主要功能包括中文分词;
词性标注
;命名实体识别;用户词典功能;支持GBK编码、UTF8编码、BIG5编码。
warrioR_wx
·
2013-04-07 17:12
NLP
java
[置顶] ICTCLAS2013 Java版本的使用方法
先看看他的官方介绍吧:NLPIR汉语分词系统(又名ICTCLAS2013),主要功能包括中文分词;
词性标注
;命名实体识别;用户词典功能;支持GBK编码、UTF8编码、BIG5编码。
hellonlp
·
2013-04-07 17:00
NLP开源软件
一、分词1、 ICTCLAShttp://www.ictclas.org/包含分词、
词性标注
功能,C++编写,提供Java借口,业界比较出名。
xuh5156
·
2013-03-21 10:00
词性标注
类函数
classCCoMatrix:publicCObject{ private: intCorpusSize;//语料规模int*TagFreqs;//每种词性标记的出现次数,一位数组int*Matrix;//共现频度矩阵,用一维数组来模拟二维数组public:CStringArray*pTags;//词性标记集CStringArray*pOpenTags;//开放标记集BOOLModified;//
xlm289348
·
2013-01-17 15:00
再谈文本分析系统移植
该系统是基于CRF++的,分别经过了分词阶段,
词性标注
阶段,实习识别阶段,而从实现方式上也经过了单线程,多线程,线程池,线程安全,本地执行,Thrift服务,控制台接收,文本处理等阶段,其中所含内容甚多
heavendai
·
2013-01-07 18:00
转载 POS tagging :part-of-speech tagging
POStagging :part-of-speechtagging ,or wordclasses or lexicalcategories .说法很多其实就是
词性标注
。
luochao_tj
·
2013-01-06 11:00
中英文文本预处理软件、工具和算法
1.中文分词、
词性标注
中科院:ictclashttp://www.ictclas.org/sub_1_1.html具体使用方面看他里面的例子及文档很详细。突出功能是分词功能,还有命名实体识别功能。
zzxian
·
2012-12-21 21:00
中文词语的语法划分
从语言学角度来讲,词的语义划分主观性太大,不太好控制 ,通常为了让语义划分变得客观,都需要首先分析词的语法意义,通常这个阶段叫做
词性标注
。
·
2012-12-08 16:00
中文
判别式和产生式的区别
这个题目遇到两次自然语言处理中,经常要处理序列标注问题(分词、
词性标注
、组快分析等),为给定的观察序列标注标记序列。
sunmenggmail
·
2012-11-29 13:00
几款开源的中文分词系统
中国科学院计算技术研究所在多年研究工作积累的基础上,研制出了汉语词法分析系统ICTCLAS(InstituteofComputingTechnology,ChineseLexicalAnalysisSystem),主要功能包括中文分词;
词性标注
·
2012-11-13 17:18
Java中文分词器Ansj
Ansj中文分词是一款纯Java的、主要应用于自然语言处理的、高精度的中文分词工具,目标是“准确、高效、自由地进行中文分词”,可用于人名识别、地名识别、组织机构名识别、多级
词性标注
、关键词提取、指纹提取等领域
howareyoutodaysoft
·
2012-11-10 11:00
ansj
中文分词器
不了了之
不了了之之了之
自然语言处理和数据挖掘项目中的一些技术体会
这次做的这个项目,也是我工作的第一个项目,就是利用自然语言处理的分词、
词性标注
、句法分析,还有就是数据挖掘的一些东西。
forever1dreamsxx
·
2012-10-25 22:55
自然语言处理
数据挖掘
数学模型
学习心得
史上最详细最容易理解的HMM文章
hmm-learn-best-practices-four-hidden-markov-modelswiki上一个比较好的HMM例子分类隐马尔科夫模型HMM(隐马尔科夫模型)是自然语言处理中的一个基本模型,用途比较广泛,如汉语分词、
词性标注
及语音识别等
MachineLearning-ZJU
·
2012-10-15 13:18
自然语言处理
算法
algorithm
library
vb
脚本
机器学习
史上最详细最容易理解的HMM文章
hmm-learn-best-practices-four-hidden-markov-modelswiki上一个比较好的HMM例子分类隐马尔科夫模型 HMM(隐马尔科夫模型)是自然语言处理中的一个基本模型,用途比较广泛,如汉语分词、
词性标注
及语音识别等
daringpig
·
2012-10-15 13:00
Algorithm
算法
脚本
自然语言处理
vb
library
隐马可夫(HMM)中文分词
词性标注
程序
隐马可夫(HMM)中文分词
词性标注
程序本隐马可夫(HMM)中文分词
词性标注
程序中的隐马可夫(HMM)概率模型是由PFR人民日报标注语料199801语料库生成public class HMM{ static
lucene + hadoop 分布式并行计算搜索框架
·
2012-09-14 17:00
自然语言处理中文 工具包
LingPipe目前已有很丰富的功能,包括主题分类(TopClassification)、命名实体识别(NamedEntityRecognition)、
词性标注
(Part-ofSpeechTagging
ariessurfer
·
2012-09-04 15:19
常用工具
自然语言处理中文 工具包
LingPipe目前已有很丰富的功能,包括主题分类(TopClassification)、命名实体识别(NamedEntityRecognition)、
词性标注
(Part-ofSpeechTagging
AriesSurfer
·
2012-09-04 15:00
Lucene
自然语言处理
工具
classification
Parsing
中文分词库
CRF 移植
Part1.前些天把
词性标注
的接口与分词的接口全并在一起,终于达到了足够稳定的程度(小数据量自己测试)。
heavendai
·
2012-08-24 17:00
由update数据表引起的com.mysql.jdbc.exceptions.MySQLSyntaxErrorException: 问题
news_fudan = '" + s + "' where id = '" + j + "'"; st.execute(update); s为中文
词性标注
后的字符串
gaojiehigh
·
2012-07-18 14:00
java
mysql
单引号
基于CRF的中文分词
Field:条件随机场,一种机器学习技术(模型)CRF由JohnLafferty最早用于NLP技术领域,其在NLP技术领域中主要用于文本标注,并有多种应用场景,例如:分词(标注字的词位信息,由字构词)
词性标注
zhoubl668
·
2012-05-25 16:00
FudanNLP java -based
fudannlp-开源中文自然语言处理工具包|中文分词|
词性标注
|实体名识别|关键词抽取|句法分析|文本分类|机器学习|信息检索|JAVA-GoogleProjectHosting介绍FudanNLP主要是为中文自然语言处理而开发的工具包
·
2012-05-06 23:00
java
wiki上一个比较好的HMM例子
HMM(隐马尔科夫模型)是自然语言处理中的一个基本模型,用途比较广泛,如汉语分词、
词性标注
及语音识别等,在NLP中占有很重要的地位。
wangzhiqing3
·
2012-04-17 10:00
中科院分词系统的大致流程
coreDict记录了6768个词块,里面有对应的词频和句柄(用于
词性标注
);biGramDict里面记录的是词和词之间的关系,
单眼皮大娘
·
2012-03-26 15:00
系统
Java自然语言处理 LingPipe
LingPipe目前已有很丰富的功能,包括主题分类(Top Classification)、命名实体识别(Named Entity Recognition)、
词性标注
(Part-of Speech Tagging
orange.lpai
·
2012-02-29 23:00
java
算法
Java自然语言处理 LingPipe
LingPipe目前已有很丰富的功能,包括主题分类(TopClassification)、命名实体识别(NamedEntityRecognition)、
词性标注
(Part-ofSpeechTagging
orange.lpai
·
2012-02-29 23:00
java
算法
CRF条件随机场简介
CRF(ConditionalRandomField)条件随机场是近几年自然语言处理领域常用的算法之一,常用于句法分析、命名实体识别、
词性标注
等。
heavendai
·
2012-02-02 15:00
算法
vector
百度
Random
自然语言处理
微软
分词:
词性标注
北大标准
汉语词性对照表[北大标准/中科院标准] 词性编码词性名称注解Ag形语素形容词性语素。形容词代码为a,语素代码g前面置以A。a形容词取英语形容词adjective的第1个字母。ad副形词直接作状语的形容词。形容词代码 a和副词代码d并在一起。an名形词具有名词功能的形容词。形容词代码a和名词代码n并在一起。b区别词取汉字“别”的声母。c连词取英语连词conjunction的第1个字母。dg副语
zhoubl668
·
2011-11-07 09:00
c
ICTCLAS2011_JNI学习笔记-ICTCLAS_SetPOSmap及ICTCLAS_ParagraphProcess接口
指定
词性标注
集>  
andyliuxs
·
2011-09-29 21:00
process
ICTCLAS2011_JNI学习笔记-eclipse部署
的提供的JNI版本导入Eclipse工程下以便以后的开发,部署很简单:1)新建一个Java工程,将ICTCLAS提供的最重要的4个文件一并拷贝到工程目录下:Data目录:主要存放系统自带的各个词典文件、
词性标注
映射集及用户自定义词典等
andyliuxs
·
2011-09-29 21:00
eclipse
ICTCLAS2011_JNI接口之学习笔记-整体介绍
ICTCLAS(Institute of Computing Technology,Chinese Lexical Analysis System)2011版,汉语词法分析系统ICTCLAS主要功能包括中文分词;
词性标注
andyliuxs
·
2011-09-29 20:00
学习笔记
开源中文分词FudanNLP
推荐FudanNLP,这是一个复旦大学计算机学院开发的开源中文自然语言处理(NLP)工具包FudanNLP里包含中文分词、关键词抽取、命名实体识别、
词性标注
、时间词抽取、语法分析等功能,对搜索引擎、文本分析等极为有价值
cserchen
·
2011-09-28 13:03
自然语言处理
文本分析技术
开源中文分词FudanNLP
推荐FudanNLP,这是一个复旦大学计算机学院开发的开源中文自然语言处理(NLP)工具包FudanNLP里包含中文分词、关键词抽取、命名实体识别、
词性标注
、时间词抽取、语法分析等功能,对搜索引擎、文本分析等极为有价值
cserchen
·
2011-09-28 13:00
搜索引擎
SVN
自然语言处理
工具
黄聪:ICTCLAS学习文档
接口文档 ICTCLAS2011接口文档 ICTCLAS2009接口文档 ICTPOS3.0
词性标注
集
·
2011-08-29 21:00
Tcl
自然语言处理
ConditionalRandomField:条件随机场,一种机器学习技术(模型)CRF由JohnLafferty最早用于NLP技术领域,其在NLP技术领域中主要用于文本标注,并有多种应用场景,例如:分词(标注字的词位信息,由字构词)
词性标注
roki
·
2011-07-10 16:00
自然语言处理
CRF 由 John Lafferty 最早用于 NLP 技术领域,其在 NLP 技术领域中主要用于文本标注,并有多种应用场景,例如: 分词(标注字的词位信息,由字构词)
词性标注
roki
·
2011-07-10 16:00
自然语言处理
使用stanford postagger
词性标注
阅读更多//标注Stringmodel="models/chinese.tagger";Stringcontent="你们是祖国美丽盛开的花朵";MaxentTaggertagger=newMaxentTagger(model);List>sentences=MaxentTagger.tokenizeText(newBufferedReader(newStringReader(content)))
Reset
·
2011-04-11 14:00
使用stanford postagger
词性标注
//标注 String model = "models/chinese.tagger"; String content = "你们 是 祖国 美丽 盛开 的 花朵"; MaxentTagger tagger = new MaxentTagger(model); List<ArrayList<? extend
Reset
·
2011-04-11 14:00
post
上一页
23
24
25
26
27
28
29
30
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他