E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
bilstmcrf词性标注
Pytorch Exercise: Augmenting the LSTM part-of-speech tagger with character-level features
最近在学习pytorch,尝试了一个LSTM来进行
词性标注
的demo,看到文末有可以练习的Exercise,于是尝试解决。最终代码如下。
CrazyBull2012
·
2018-02-10 09:27
NLP snownlp 实际用例
如中文分词、
词性标注
、情感分析、文本分类、提取文本关键词、文本相似度计算等。
_yuki_
·
2018-01-26 04:48
python
NLP
机器学习中什么是端到端的学习(end-to-end learning)?
相对于深度学习,传统机器学习的流程往往由多个独立的模块组成,比如在一个典型的自然语言处理(NaturalLanguageProcessing)问题中,包括分词、
词性标注
、句法分析、语义分析等多个独立步骤
cs24k1993
·
2018-01-21 10:59
常识
什么是end to end 学习
非端到端:相对于深度学习,传统机器学习的流程往往由多个独立的模块组成,比如在一个典型的自然语言处理(NaturalLanguageProcessing)问题中,包括分词、
词性标注
、句法分析、语义分析等多个独立步骤
redis_v
·
2018-01-14 14:03
深度学习
RNN与LSTM之间的介绍和公式梳理
其在自然语言中贡献巨大,中文分词、
词性标注
、命名实体识别、机器翻译、语音识别都属于序
IT界的小小小学生
·
2018-01-09 16:58
python
algorithm
principle/原理
tensorflow
2017年深度学习在NLP领域的进展和趋势
命名实体识别、
词性标注
和情感分析就即是神经网络模型优于传统方法的地方。而机器翻译是所有进展中是最值得纪念的。从自己训练word2vec到使用预训练模
android_ruben
·
2018-01-04 21:19
翻译
条件随机场(4)——CRF++分词训练和预测
CRF、最大熵、隐马尔科夫模型貌似都可以做分词、
词性标注
、命名实体识别,以前只是在hanLP里面用这些工具,实际上是不明所以的。现在要开始弄明白其中原理,并自己训练模型了。好吧,又啰嗦了。
老笨妞
·
2017-12-25 14:10
统计学习方法
字符级别word2vec
论文《End-to-endSequenceLabelingviaBi-directionalLSTM-CNNs-CRF》在做
词性标注
任务的时候,提到了对字符进行编码,用卷积神经网络编码字符级别信息。
BabY虎子
·
2017-12-21 11:58
机器学习
自然语言处理
rnn、lstm,gru中output信息说明
在一般的rnn模型中,rnn一般输出的形式如下[batch,seq_len,hidden_size],如果用做分类,一般是取最后一个状态[batch,hidden_size],如果用于做
词性标注
和分词则取全部的状态
旭旭_哥
·
2017-12-08 17:55
python编程
机器学习
自然语言处理(NLP)的深度学习发展史和待解难题
我们可以使用一些很简单且容易理解的模型来解决常见问题,比如垃圾邮件过滤、
词性标注
等。但并不是所有问题都能用这些经典模型来解决。简单的模型不能准确地捕捉到语言中的细
芦金宇
·
2017-11-13 18:27
nlp
python 结巴分词(jieba)学习
[-]jieba特点在线演示安装说明算法主要功能1分词2添加自定义词典载入词典调整词典3关键词提取基于TF-IDF算法的关键词抽取基于TextRank算法的关键词抽取基本思想使用示例4
词性标注
5并行分词
nethub2
·
2017-11-11 18:00
命名实体识别
诸如中文分词、
词性标注
、命名实体等问题均属于序列标签标注问题。
棒棒唐_KT
·
2017-11-10 16:49
自然语言处理
自然语言处理基础技术之分词、向量化、
词性标注
获取更多腾讯海量技术实践干货哦~作者:段石石前言前段时间,因为项目需求,开始接触了NLP,有感自己不是科班出身,很多东西理解不深,于是花时间再读了一些NLP的经典教程的部分章节,这里是第一部分,主要包括三小块:中文分词、词向量、
词性标注
腾讯云加社区
·
2017-11-07 00:00
分词
深度学习
神经网络
自然语言处理
TensorFlow实现经典深度学习网络(5):TensorFlow实现自然语言处理基础网络Word2Vec
而Word2Vec则是将语言中的字词转化为计算机可以理解的稠密向量DenseVector,进而可以做其他自然语言处理任务,比如文本分类、
词性标注
、机器翻译等。有时,Word2
Zhenguo_Yan
·
2017-11-02 08:02
Python
机器学习
深度学习
计算机视觉
LTP
词性标注
aadjective:形容词美丽bothernoun-modifier:其他的修饰名词大型,西式cconjunction:连词和,虽然dadverb:副词很eexclamation:感叹词哎gmorpheme茨,甥hprefix:前缀阿,伪iidiom:成语百花齐放jabbreviation:缩写公检法ksuffix:后缀界,率mnumber:数字一,第一ngeneralnoun:一般名词苹果nd
liushui94
·
2017-11-01 22:15
NLP
哈工大NLP处理工具pyltp安装历程
阅读更多这个pyltp的安装可谓艰辛,pyltp是哈工大的自然语言处理包,用于分词,
词性标注
,依存句法分析等工作,是目前国内最好的解析器之一。
企鹅木白
·
2017-10-26 16:00
python
基于神经网络的实体识别和关系抽取联合学习
例如实体识别和实体标准化联合学习,分词和
词性标注
联合学习等等。最近,研究者们在基于神经网络方法上进行实体识别和关系抽取联合学习,我阅读了一些相关工作,
robert_ai
·
2017-10-22 17:00
多任务学习进化史
例如:针对一篇文章进行分词、
词性标注
、句法分析等,所用的数据都是一篇文章,但是对应的task不同。2)不同的dataset,解决相同的task。例如:对不同学校的学生成绩进行预测问题。
ckqsars
·
2017-10-17 00:00
算法
ICTCLAS2008汉语
词性标注
集
计算所汉语词性标记集Version3.0制订人:刘群张华平张浩计算所汉语词性标记集(共计99个,22个一类,66个二类,11个三类)主要用于中国科学院计算技术研究所研制的汉语词法分析器、句法分析器和汉英机器翻译系统。本标记集主要参考了以下词性标记集:北大《人民日报》语料库词性标记集;北大2002新版词性标记集(草稿);清华大学汉语树库词性标记集;教育部语用所词性标记集(国家推荐标准草案2002版)
deathkon
·
2017-10-12 16:37
自然语言处理
深度学习和自然语言处理的应用和脉络3-nlp的各种场景和技术。
CRF可以用于:分词,
词性标注
,句法分析
changdejie
·
2017-10-11 10:38
中文文本处理传统方法
时仍未匹配,单词切割即可正向最大匹配正向最小匹配逆向最大匹配逆向最小匹配一体化分词考虑统计词频,寻找在给定字串上最大概率的分割序列(以词频统计做概率似然)歧义字段发现:双向扫描分词结果不一致判为歧义字段
词性标注
TheOneAc1
·
2017-10-05 14:39
自然语言处理
字符粒度表示用于
词性标注
简述概括来讲,就是把单词的字符序列用CNN来提取特征,与预训练的word2vec一并,用于提升
词性标注
的效果文章全名:LearningCharacter-levelRepresentationsforPart-of-SpeechTagging
haimizhao
·
2017-09-19 14:05
机器学习与自然语言处理
标记问题:
词性标注
(POS)和命名实体识别(NER)
在NLP问题中,有两个问题是比较重要的标记问题:
词性标注
和命名实体识别。比如上图我们介绍了一个简单的
词性标注
问题。模型输入的是一个句子,输出是一个标记序列,模型会为每个词都产生一个标记。
chuange6363
·
2017-09-10 01:00
NLP 的应用
2.
词性标注
Part-of-speechTagging,POS.给句子中每个词标注一个词性。这里的词性类别可能是名词、动词、形容词或其他。下面是一个
词性标注
的例子。
yichudu
·
2017-08-20 18:11
NLP
GitHub - hankcs/HanLP: 自然语言处理 中文分词
词性标注
命名实体识别 依存句法分析 关键词提取 自动摘要 短语提取 拼音 简繁转换
HanLP提供下列功能:中文分词最短路分词N-最短路分词CRF分词索引分词极速词典分词用户自定义词典
词性标注
命名实体识别中国人名识别音译人名识别日本人名识别地名识别实体机
·
2017-08-18 14:00
github
hankcs
hanlp
nltk
词性标注
英文简称及分类
标注词表:名词:NN,NNS,NNP,NNPS代词:PRP,PRP$形容词:JJ,JJR,JJS数词:CD动词:VB,VBD,VBG,VBN,VBP,VBZ副词:RB,RBR,RBS1.CCCoordinatingconjunction连接词2.CDCardinalnumber基数词3.DTDeterminer限定词(如this,that,these,those,such,不定限定词:no,som
_我走路带风
·
2017-08-16 16:00
自然语言
自然语言处理与文本检索
nlp的主要内容1词语处理(lexicalanalysis=part-of-speechtagging):分词与
词性标注
2句法分析(syntacticanalysis):句法树、依存关系分析3语义分析(
makeadate
·
2017-08-14 01:17
信息检索
哈工大ltp,分词,
词性标注
,命名实体识别技术的特征提取
1、分词的特征提取给定一个字符判断:1、标点符号2、数字3、中文数字4、字母等等2、
词性标注
的特征提取:1、后缀2、部首特征3、词重叠特征3、命名实体识别特征提取:1、词的位置2、词性
LFGxiaogang
·
2017-08-11 14:47
自然语言处理
词性标注
词性标签PartofSpeechTag,PosTag,wikipedia用于给句子的不同词语加标注,有多种标签规则.PennTreebank项目用到的词性标签示意,点这里Number,Tag,Description1.CCCoordinatingconjunction2.CDCardinalnumber3.DTDeterminer4.EXExistentialthere5.FWForeignwor
yichudu
·
2017-08-07 16:28
NLP
NLTK 词频统计(一) 词频统计,绘图,
词性标注
内容简介代码一,笔记简略版本代码二,词频统计与pandas集合,分词词性提取与词频统计结合代码一importFontCN_NLPtoolsasfts引用的是我自己写的一个类,是对我常用的一些方法的封装,code已经上传#-*-coding:utf-8-*-##作者:田丰(FontTian)#创建时间:'2017/7/3'#邮箱:
[email protected]
#CSDN:http://blo
Font Tian
·
2017-07-29 21:51
#
【自然语言处理】
基础
#
【自然语言处理】
可视化
剑指汉语自然语言处理
中文NLP工具
中文NLP工具1HanLPHanLP(汉语言处理包)是一款开源的使用Java进行开发的中文自然语言处理工具,提供的功能包括中文分词、
词性标注
、命名实体识别、依存句法分析等。
诗书不富人
·
2017-07-20 19:45
[置顶] NLTK学习笔记(六):利用机器学习进行文本分类
一监督式分类建立在训练语料基础上的分类特征提取器和朴素贝叶斯分类器过拟合当特征过多错误分析二实例文本分类和
词性标注
文本分类
词性标注
决策树分类器三更近一步的连续分类或贪婪序列分类在朴素贝叶斯和决策树之后四评估五三种分类器的总结六后记关于分类文本
AsuraDong
·
2017-06-15 21:00
机器学习
自然语言处理
[置顶] NLTK学习笔记(五):分类和标注词汇
词性标注
器标注语料库表示已经标注的标识符nltktagstr2tupleword类型读取已经标注的语料库名词动词形容词等尝试找出每个名词类型中最频繁的名词探索已经标注的语料库自动标注默认标注器正则表达式标注器查询标注器
AsuraDong
·
2017-06-13 00:00
自然语言处理
自然语言标注-用于机器学习
统计学自然语言处理(语义消歧)
但是落实到具体细节中,我认为主要分以下几种:1.分词的消歧,这是很常见的一个例子(南京市长江大桥)2.多义词的具体词义3.词性的判断对于词性的判断可以看做一个
词性标注
的问题
词性标注
的话,我们通常考虑邻近上下文
continueOo
·
2017-06-12 11:31
自然语言处理
NLP
python 自然语言处理 第五章
自然语言处理第五章分类和标注词汇5.1使用
词性标注
器
词性标注
器POStagger,part-of-speechtagger,处理次序列,为每个词附加词性标记nltk.pos_tag(text)importnltktext
W&J
·
2017-06-10 10:36
自然语言处理入门(2)——中文文本处理利器snownlp
如中文分词、
词性标注
、情感分析、文本分类、提取文本关键词、文本相似度计算等。
飞鸟2010
·
2017-05-31 22:08
自然语言处理
树库介绍
最近做完了分词、
词性标注
、命名实体识别、关键词提取、自动摘要、拼音、简繁转换、文本推荐,感觉HanLP初具雏形。
continueOo
·
2017-05-31 20:58
使用Stanford CoreNLP的Python封装包处理中文(分词、
词性标注
、命名实体识别、句法树、依存句法分析)
StanfordCoreNLP的源代码是使用Java写的,提供了Server方式进行交互。stanfordcorenlp是一个对StanfordCoreNLP进行了封装的Python工具包,GitHub地址,使用非常方便。安装stanfordcorenlp包之前:1:下载安装JDK1.8及以上版本。2:下载StanfordCoreNLP文件,解压。3:处理中文还需要下载中文的模型jar文件,然后放
手撕机
·
2017-05-28 22:26
笔记
隐马尔科夫模型-基本模型与三个基本问题
常见的应用比如分词,
词性标注
,命名实体识别等问题序列标注问题均可使用隐马尔科夫模型.下面,我根据自己的理解举例进行讲解一下HMM的基本模型以及三个基本问题,希望对大家理解有帮助~1隐马尔科夫模型定义隐马尔可夫模型是关于时序的概率模型
算法学习者
·
2017-05-25 23:09
ML
用pyltp做分词、
词性标注
、ner
工具:win10、python2.7主要参考官方文档http://pyltp.readthedocs.io/zh_CN/latest/api.html#http://ltp.readthedocs.io/zh_CN/latest/install.html1、安装pyltphttps://github.com/hit-scir/pyltp别忘了下载网页里面的模型,这个是会更新的下载源码后解压,用cm
gbbb1234
·
2017-05-24 15:59
nlp
jieba分词使用报告
关键词:windows平台下jieba安装、三种模式比较、自定义词典、停用词语料、词频统计、词云生成jieba简介Jieba是一个中文分词组件,可用于中文句子/词性分割、
词性标注
、未登录词识别,支持用户词典等功能
秋灯锁忆
·
2017-05-23 13:53
Python 分词工具 jieba
目录1.jieba下载安装2.算法实现3.分词功能1.jieba下载安装Jieba是一个中文分词组件,可用于中文句子/词性分割、
词性标注
、未登录词识别,支持用户词典等功能。
AmiyaTANG
·
2017-05-22 17:23
自然语言处理Java开源包FNLP(FudanNLP)的使用
时间所限,也是能力所限,我当然不会自己去实现一些诸如中文分词与
词性标注
的自然语言处理算法。自然的,我想到了在网上找一些开源包。我主要考虑的是三个包,首
黄骨鱼骨
·
2017-05-21 21:43
隐马尔科夫模型、三个基本问题、三个训练算法
常见的应用比如*分词,
词性标注
,命名实体识别等问题序列标注问题均可使用隐马尔科夫模型*.下面,我根据自己的理解举例进行讲解一下HMM的基本模型以及三个基本问题,希望对大家理解有帮助~隐马尔科夫模型定义隐马尔可
Mr.Gavin
·
2017-05-18 11:28
数据挖掘
NLP
Python中文分词工具之结巴分词用法实例总结【经典案例】
这里要说的内容与实际应用更贴近――从文本中读取中文信息,利用结巴分词工具进行分词及
词性标注
。示例代码如下:#coding=utf-8importjiebaimportjieba.possegasp
捂汗县长
·
2017-04-15 10:00
Python结巴中文分词工具使用过程中遇到的问题及解决方法
分享给大家供大家参考,具体如下:结巴分词是Python语言中效果最好的分词工具,其功能包括:分词、
词性标注
、关键词抽取、支持用户词表等。
捂汗县长
·
2017-04-15 08:58
条件随机场(Conditional Random Field)简介
为什么需要CRF作为Motivation,我们考虑如下
词性标注
任务:对于一段输入文字“Thedogbarks”,我们希望获得他的词性
Carl-Xie
·
2017-04-01 10:06
自然语言处理
条件随机场
机器学习
序列标注模型
序列标注模型被广泛应用于文本处理相关领域,例如分词、
词性标注
、命名实体识别等方面。
hebastast
·
2017-03-27 14:32
词性标注
词性标注
(part-of-speechtagging,POStagging)给文本中的词自动分配词性的过程称为
词性标注
、POS标注或标注。
Shingle_
·
2017-03-03 10:32
自然语言处理
简单感知器实现中文
词性标注
简单感知器实现中文
词性标注
感知器算法感知器可以认为是一个内置权重weight的分类器,对于输入特征features,输—出h(features)=weightT˙feature。
pku_zzy
·
2017-03-02 20:08
Machine
Learing
上一页
20
21
22
23
24
25
26
27
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他