E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
bilstmcrf词性标注
一个值得学习的资料
200行Python代码实现感知机
词性标注
器http://www.hankcs.com/nlp/averaged-perceptron-tagger.html
freshingwater
·
2017-02-15 00:00
Neural Machine Translation(NMT)技术概述
在神经网络语言模型处理NLP领域,我做的研究一直都和文本分类相关,其实还有很多其他的应用领域,比方说:语言翻译、
词性标注
、命名实体识别等。
guoyuhaoaaa
·
2017-02-11 16:48
深度学习
CRF 及CRF++ 安装与解释
Field:条件随机场,一种机器学习技术(模型)CRF由JohnLafferty最早用于NLP技术领域,其在NLP技术领域中主要用于文本标注,并有多种应用场景,例如:分词(标注字的词位信息,由字构词)
词性标注
u013378306
·
2017-01-18 19:00
Pyhon 自然语言处理(二)文本预处理流程
Python自然语言处理(二)文本预处理流程完整的文本预处理的过程如下:原始文本语料—>分词Tokenize—>
词性标注
POSTag—>词干化Lemma/Stemming—>去除停用词—>处理后的文本语料
慕白
·
2017-01-12 10:53
Python
NLP
Pyhon 自然语言处理(二)文本预处理流程
Python自然语言处理(二)文本预处理流程完整的文本预处理的过程如下:原始文本语料—>分词Tokenize—>
词性标注
POSTag—>词干化Lemma/Stemming—>去除停用词—>处理后的文本语料
慕白
·
2017-01-12 10:53
Python
NLP
ansj 分词系统的词性说明
原文:https://github.com/NLPchina/ansj_seg/wiki/
词性标注
规范汉语文本
词性标注
标记集#1.名词(1个一类,7个二类,5个三类) 名词分为以下子类: n名词 nr人名
k21325
·
2017-01-04 09:00
自然语言处理(NLP)的基本原理及应用
自然语言处理要解决的主要问题有:(1)垃圾邮件识别(2)中文输入法(3)机器翻译(4)自动问答、客服机器人这里简单罗列了一些NLP的常见领域:分词,
词性标注
,命名实体识别,句法分析,语义识别,垃圾邮件识别
inter_peng
·
2016-12-03 00:08
Algorithm
问答系统(QA)0
FrequentlyAskedQuestions,FAQ,即通过提取问题特征进行相似度计算来返回排序后的答案,问题解析:主要包括分词、
词性标注
、句法分析、命名实体识别、问题分类、问题扩展等。
_lichaoxi
·
2016-11-23 12:22
问答系统
QA
自然语言处理
question
answering
自然语言处理
自然语言处理之
词性标注
集
词性标注
(Part-of-Speechtagging或POStagging),又称词类标注或者简称标注,是指为分词结果中的每个单词标注一个正确的词性的程序,也即确定每个词是名词、动词、形容词或其他词性的过程
标点符
·
2016-10-29 07:00
自然语言处理
程序开发
jieba分词、自定义词典提取高频词、
词性标注
及获取词的位置
准备工作安装anaconda环境,anaconda环境是一个强大的科学计算环境,自带python2.7和3.4两个版本以及很多科学计算库安装完成后配置环境变量,然后在终端用pipinstalljieba安装结巴分词库jieba介绍支持三种分词模式:精确模式,试图将句子最精确地切开,适合文本分析;全模式,把句子中所有的可以成词的词语都扫描出来,速度非常快,但是不能解决歧义;搜索引擎模式,在精确模式的
Ezrealmore
·
2016-10-12 16:01
NLP:stanfordNLP
stanfordnlp.github.io/CoreNLP/http://blog.csdn.net/ltbylc/article/details/85579651.stanfordNLP分词:StanfordTokenizer
词性标注
LandscapeMi
·
2016-10-03 08:46
NLP
Python下的自然语言处理利器-LTP语言技术平台 pyltp 学习手札
1什么是pyltp语言技术平台(LTP)是由哈工大社会计算与信息检索研究中心11年的持续研发而形成的一个自然语言处理工具库,其提供包括中文分词、
词性标注
、命名实体识别、依存句法分析、语义角色标注等丰富、
MebiuW
·
2016-09-10 20:20
pyltp
ltp
分词
依存句法
命名实体
机器学习
Python++
环境配置
技术手札
NLP
序列标注问题中将分类标签引入RNN网络结构的尝试
序列标注问题是NLP领域中最常见的一大类问题,包含很多子研究领域,比如中文分词、
词性标注
、NER命名实体识别、语
张俊林博客
·
2016-09-06 19:29
深度学习
自然语言处理
CRF 简介入门 .
ConditionalRandomField:条件随机场,一种机器学习技术(模型)CRF由JohnLafferty最早用于NLP技术领域,其在NLP技术领域中主要用于文本标注,并有多种应用场景,例如:分词(标注字的词位信息,由字构词)
词性标注
noter16
·
2016-09-05 14:56
NLP
机器学习
NLP
NLPIR/ICTCLAS 2015 分词系统使用
张华平博士在多年研究工作积累的基础上,研制出了NLPIR分词系统,主要功能包括中文分词;英文分词;
词性标注
;命名实体识别;新词识别;关键词提取;支持用户专业词典与微博分析。NLPIR系统
Gatherfly
·
2016-08-25 12:50
自然语言处理
Python文本处理工具——TextRank
这个工具使用POS(part-of-speechtagging:
词性标注
)然后抽取名词,这种方法对于关键词提取独具特色。注意:先安装NLTK再使用这个工具。NLTK版本要求3.2.1以上。
搬砖小工053
·
2016-06-19 17:42
关键词提取
TextRank
wordcloud
词云
nltk
Python文本处理
Python文本处理工具——TextRank
这个工具使用POS(part-of-speechtagging:
词性标注
)然后抽取名词,这种方法对于关键词提取独具特色。注意:先安装NLTK再使用这个工具。NLTK版本要求3.2.1以上。
SA14023053
·
2016-06-19 17:00
NLTK
textrank
关键词提取
词云
wordcloud
中文分词的条件随机场模型(CRF)介绍
Field:条件随机场,一种机器学习技术(模型)CRF由JohnLafferty最早用于NLP技术领域,其在NLP技术领域中主要用于文本标注,并有多种应用场景,例如:分词(标注字的词位信息,由字构词)
词性标注
shibing624
·
2016-06-16 23:00
自然语言处理
NLP
开源NLP工具
中文词法分析THULAC:一个高效的中文词法分析工具包包括中文分词、
词性标注
功能。已经提供C++、Java、Python版本。
shibing624
·
2016-06-16 23:00
NLP
关于NLPIR应用在KETTLE中的探索
NLPIR汉语分词系统(自然语言处理与信息检索共享平台),主要功能包括中文分词;
词性标注
;命名实体识别;用户词典功能;支持GBK编码、UTF8编码、BIG5编码。
kingstudy
·
2016-05-09 14:00
coreNLP的使用
coreNLP是斯坦福大学开发的一套关于自然语言处理的工具(toolbox),使用简单功能强大,有;命名实体识别、
词性标注
、词语词干化、语句语法树的构造还有指代关系等功能,使用起来比较方便。
u010223750
·
2016-05-06 20:00
自然语言处理
coreNLP
ICTCLAS 汉语
词性标注
集
ICTCLAS汉语
词性标注
集发表于1年前(2014-12-0511:34) 阅读(571) | 评论(0) 2人收藏此文章, 我要收藏赞0ICTCLAS汉语
词性标注
集 汉语文本
词性标注
标记集 Ag形语素形容词性语素
Real_Myth
·
2016-04-25 09:00
【java】使用Stanford CoreNLP处理英文(
词性标注
/词形还原/解析等)
本文旨在学习使用StanfordCoreNLP进行自然语言处理。编程环境:64位win7系统,NetBeans,java要求1.8+CoreNLP版本:3.6.0,下载地址:http://stanfordnlp.github.io/CoreNLP/,获取stanford-corenlp-full-2015-12-09.zip压缩包。StanfordCoreNLP功能:分词(tokenize)、分句
竹聿Simon
·
2016-04-22 14:30
Java
自然语言处理
CoreNLP
R语言︱文本挖掘——jiabaR包分词
《数据挖掘之道》点评:虽然我比较执着于Rwordseg,并不代表各位看管执着于我的执着,推荐结巴分词包,小巧玲珑,没有那么多幺蛾子,而且R版本和python版本都有,除了
词性标注
等分词包必备功能以外,jiebaR
sinat_26917383
·
2016-04-05 21:00
github
安装
r
分词
jiabaR
OpenNLP:驾驭文本,分词那些事
典型代表便是分词、
词性标注
、句子识别等等。本文所介绍的工具主要针对英文分词,对于英文分词工具很多,笔者经比较ApacheOpenNLP效率和使用便捷度较好。另外其针对
伏草惟存
·
2016-03-27 19:00
HanLP自然语言处理包开源
支持中文分词(N-最短路分词、CRF分词、索引分词、用户自定义词典、
词性标注
),命名实体识别(中国人名、音译人名、日本人名、地名、实体机构名识别),关键词提取,自动摘要,短语提取,拼音转换,简繁转换,文本推荐
ctwen
·
2016-03-26 07:15
HanLP自然语言处理包开源
支持中文分词(N-最短路分词、CRF分词、索引分词、用户自定义词典、
词性标注
),命名实体识别(中国人名、音译人名、日本人名、地名、实体机构名识别),关键词提取,自动摘要,短语提取,拼音转换,简繁转换,文本推荐
ctwen
·
2016-03-26 00:10
Industry
Applications
在Python里安装Jieba中文分词组件
Jieba是一个中文分词组件,可用于中文句子/词性分割、
词性标注
、未登录词识别,支持用户词典等功能。该组件的分词精度达到了97%以上。下载介绍在Python里安装Jieba。
sanqima
·
2016-03-23 18:00
python
中文分词
jieba
LDA
coreNLP的使用
coreNLP是斯坦福大学开发的一套关于自然语言处理的工具(toolbox),使用简单功能强大,有;命名实体识别、
词性标注
、词语词干化、语句语法树的构造还有指代关系等功能,使用起来比较方便。
u010223750
·
2016-03-23 07:23
自然语言处理
coreNLP
《懒人Shell脚本》之二——语料库的格式化输出
1、引言在进行自然语言处理(NLP)处理的时候,基本的操作无外乎分词、分类、聚类、命名实体识别、规则过滤、摘要提取、关键字提取、
词性标注
、拼音标注等。
wojiushiwo987
·
2016-03-04 22:00
NLTK学习笔记——信息抽取(1)
命名实体及其关系的识别是至关重要要的,信息抽取分为以下几个步骤:1.文本切分,将string类型的文本划分为list类型的句子2.句子切分,将每个list类型的句子划分成由单词或chunk组成的list3.
词性标注
小猿Joanna
·
2016-03-03 20:20
自然语言处理
文本挖掘工具的介绍
LingPipe主要用于自然语言的处理:主题分类(TopClassification)命名实体识别(NamedEntityRecognition)
词性标注
(Part-ofSpeechTagging)句题检测
u011955252
·
2016-02-26 18:00
文本挖掘工具
系统学习机器学习之随机场(一)--HMM
HMM(隐马尔科夫模型)是自然语言处理中的一个基本模型,用途比较广泛,如汉语分词、
词性标注
及语音识别等,在NLP中占有很重要的地位。
Eason.wxd
·
2015-12-26 15:18
机器学习
系统学习机器学习之增强学习(一)
HMM(隐马尔科夫模型)是自然语言处理中的一个基本模型,用途比较广泛,如汉语分词、
词性标注
及语音识别等,在NLP中占有很重要的地位。
App_12062011
·
2015-12-26 15:00
ansj_seg中文分词实例
首先介绍一下这个开源分词软件以下摘自原作者的话:Ansj中文分词是一款纯Java的、主要应用于自然语言处理的、高精度的中文分词工具,目标是“准确、高效、自由地进行中文分词”,可用于人名识别、地名识别、组织机构名识别、多级
词性标注
qq_26562641
·
2015-12-17 15:00
[转载][工具]Java自然语言处理 LingPipe
LingPipe目前已有很丰富的功能,包括主题分类(TopClassification)、命名实体识别(NamedEntityRecognition)、
词性标注
(Part-ofSpeechTagging
qq_26562641
·
2015-12-16 15:00
LTP语法分析
http://blog.csdn.net/pipisorry/article/details/50306931POS
词性标注
解释
词性标注
(Part-of-speechTagging,POS)是给句子中每个词一个词性类别的任务
pipisorry
·
2015-12-15 00:00
tag
语法
pos
词性标注
《机器学习:算法原理与编程实践》的读书笔记:SMO部分最难,大部分代码基于Scikit-Learn,决策树其实用处不大
机器学习的基础2 中文文本分类3 决策树的发展4 推荐系统原理5 梯度寻优6 神经网络初步7 预测的技术与哲学8 万能分类器:SVM9 人脸识别中的机器学习10 认知计算与深度学习11 概率图模型与
词性标注
机器学习的基础
cteng
·
2015-12-12 17:00
算法
机器学习
smo
theano
scikit-learn
史上最详细最容易理解的HMM文章 .
hmm-learn-best-practices-four-hidden-markov-modelswiki上一个比较好的HMM例子分类 隐马尔科夫模型 HMM(隐马尔科夫模型)是自然语言处理中的一个基本模型,用途比较广泛,如汉语分词、
词性标注
及语音识别等
u014437511
·
2015-12-04 14:00
语音识别
hmm
史上最详细最容易理解的HMM文章
hmm-learn-best-practices-four-hidden-markov-modelswiki上一个比较好的HMM例子HMM(隐马尔科夫模型)是自然语言处理中的一个基本模型,用途比较广泛,如汉语分词、
词性标注
及语音识别等
GarfieldEr007
·
2015-11-18 13:00
Model
hidden
hmm
Markov
隐马尔可夫模型
52nlp
词性标注
4.10
词性标注
词性用来描写叙述一个词在上下文中的作用。比如描写叙述一个概念的词叫做名词,在下文引用这个名词的词叫做代词。
·
2015-11-13 21:13
词性标注
4.10
词性标注
词性用来描写叙述一个词在上下文中的作用。比如描写叙述一个概念的词叫做名词,在下文引用这个名词的词叫做代词。
·
2015-11-13 19:06
Deep Learning 在中文分词和
词性标注
任务中的应用
开源软件包 SENNA 和 word2vec 中都用到了词向量(distributed word representation),当时我就在想,对于我们的中文,是不是也类似地有字向量(distributed character representation)的概念呢? 最近恰好读到复旦大学郑骁庆博士等人的文章 [1]《Deep Learning for Chinese Word Segmenta
·
2015-11-12 21:46
中文分词
利用 word2vec 训练的字向量进行中文分词
最近针对之前发表的一篇博文《Deep Learning 在中文分词和
词性标注
任务中的应用》中的算法做了一个实现,感觉效果还不错。
·
2015-11-12 21:39
word
词性标注
4.10
词性标注
词性用来描写叙述一个词在上下文中的作用。比如描写叙述一个概念的词叫做名词,在下文引用这个名词的词叫做代词。
·
2015-11-12 21:06
中文分词分类有哪些小黄鸡中文分词案例分析
按照是否与
词性标注
过程相结合,又可以分为单纯分词方法和分词与标注相结合的一体化方法。
太原seoer珍惜
·
2015-11-12 16:00
基于神经网络的高性能依存句法分析器
本文剖析了一个基于神经网络分类模型和arc-standard转移动作的判决式汉语依存句法分析器,其Java实现由我移植自LTP的C++代码,并添加了详细的注释,将内部数据结构由哈希表替换为高速的DoubleArrayTrie,分词和
词性标注
替换为
hankcs
·
2015-11-12 14:00
词性标注
4.10
词性标注
词性用来描写叙述一个词在上下文中的作用。比如描写叙述一个概念的词叫做名词,在下文引用这个名词的词叫做代词。
·
2015-11-12 08:34
词性标注
4.10
词性标注
词性用来描写叙述一个词在上下文中的作用。比如描写叙述一个概念的词叫做名词,在下文引用这个名词的词叫做代词。
·
2015-11-11 19:03
Python自然语言处理读书笔记-第7章
整体流程: 分句->分词->
词性标注
->分块->实体识别->信息抽取->查询 先做分句->分词->
词性标注
:
·
2015-11-11 17:17
python
上一页
21
22
23
24
25
26
27
28
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他