E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
python自然语言处理
我用Python挖掘了一哈《权力的游戏》中的人物关系
最近在学习自然语言处理,看完了《
Python自然语言处理
》这本书,想做一点实践性的练习。
BUAA_Coder
·
2019-12-21 13:21
Python自然语言处理
学习笔记(一)
操作平台:Fedora22,Python3.4(偶尔使用2.7查看差异)正式接触NLTK(NaturalLanguageToolkit)工具包。重点学习NLP和NLTK的使用,不过分纠结于Python语言本身。1.安装与下载在官网上安装NLTK后,开始下载所需的包。启动Python解释器,执行如下两行命令:>>>importnltk>>>nltk.download()Python3.4下在字符界面
Anne_Fu
·
2019-12-06 08:56
python自然语言处理
学习笔记(一)
安装完NLTK之后,使用如下代码来安装《
python自然语言处理
》这本书所需要的数
freedom_king
·
2019-12-01 22:32
python自然语言处理
学习笔记(二)—— 语料库
一、获取文本语料库1.古腾堡语料库NLTK包含古腾堡项目(ProjectGutenberg)电子文本档案的经过挑选的一小部分文本。该项目大约有25,000(现在是36,000了)本免费电子图书查看语料简·奥斯丁的《爱玛》在之前的章节中,使用了text1.concordance()直接对text1这样的文本进行索引,但对现在这种情况的数据,需要多加一步才能使用诸如.concordance()的方法:
freedom_king
·
2019-11-30 11:47
python自然语言处理
学习笔记(五)—— 词性标注
早在小学时我们就学过名词、动词、形容词和副词之间的差异。这些“词类”不是闲置的文法家的发明,而是对许多语言处理任务都有用的分类。正如我们将看到的,这些分类源于对文本中词的分布的简单的分析。将单词按它们的词性分类并进行相应地标注的过程,称为词语性质标注、词性标注或简称标注。词性也称为词类或词汇类别。用于特定任务的标记的集合被称为一个标记集。我们在本章的重点是运用标记和自动标注文本。一、使用词性标注器
freedom_king
·
2019-11-29 20:23
python自然语言处理
学习笔记(八)—— 句法分析
前面的章节重点关注词:如何识别它们,分析它们的结构,分配给他们词汇类别,以及获得它们的含义。我们还看到了如何识别词序列或n-grams中的模式。然而,这些方法只触碰到支配句子的复杂约束的表面。我们需要一种方法处理自然语言中显著的歧义。我们还需要能够应对这样一个事实,句子有无限的可能,而我们只能写有限的程序来分析其结构和发现它们的含义。本章的目的是要回答下列问题:我们如何使用形式化语法来描述无限的句
freedom_king
·
2019-11-29 13:31
[
Python自然语言处理
] 入门 —— jieba库入门
作者链接:zhaozhengcoder1.什么是jiaba库jieba是一个python实现的分词库,对中文有着很强大的分词能力。git链接:https://github.com/fxsjy/jieba2.jieba库的优点1支持三种分词模式:a.精确模式,试图将句子最精确地切开,适合文本分析;b.全模式,把句子中所有的可以成词的词语都扫描出来,速度非常快,但是不能解决歧义;c.搜索引擎模式,在精
白眉海雕
·
2019-11-17 13:12
自然语言处理
jieba
NLP
python
如何用Python处理自然语言?(Spacy与Word Embedding)
本文教你用简单易学的工业级
Python自然语言处理
软件包Spacy,对自然语言文本做词性分析、命名实体识别、依赖关系刻画,以及词嵌入向量的计算和可视化。
王树义
·
2019-11-02 15:46
Python自然语言处理
工具小结
作者:伏草惟存来源:http://www.cnblogs.com/baiboy/p/nltk2.htmlPython的几个自然语言处理工具1.NLTK:NLTK在用Python处理自然语言的工具中处于领先的地位。它提供了WordNet这种方便处理词汇资源的借口,还有分类、分词、除茎、标注、语法分析、语义推理等类库。2.Pattern:Pattern的自然语言处理工具有词性标注工具(Part-Of-
马哥教育
·
2019-08-21 17:21
Python
云计算相关
Python自然语言处理
工具小结
作者:伏草惟存来源:http://www.cnblogs.com/baiboy/p/nltk2.htmlPython的几个自然语言处理工具1.NLTK:NLTK在用Python处理自然语言的工具中处于领先的地位。它提供了WordNet这种方便处理词汇资源的借口,还有分类、分词、除茎、标注、语法分析、语义推理等类库。2.Pattern:Pattern的自然语言处理工具有词性标注工具(Part-Of-
JokerW
·
2019-08-21 16:28
Python自然语言处理
工具小结
作者:伏草惟存来源:http://www.cnblogs.com/baiboy/p/nltk2.htmlPython的几个自然语言处理工具1.NLTK:NLTK在用Python处理自然语言的工具中处于领先的地位。它提供了WordNet这种方便处理词汇资源的借口,还有分类、分词、除茎、标注、语法分析、语义推理等类库。2.Pattern:Pattern的自然语言处理工具有词性标注工具(Part-Of-
JokerW
·
2019-08-21 16:28
Python自然语言处理
(十)------标注词汇与分类
词性标注:将词汇按照它们的词性分类并相应地对它们进行标注的过程。标记集:用于特定任务标记的集合。重点:利用标记和自动标注文本词性标注器词性标注器:处理一个词序列,为每个词附加一个词性标注。例:包括一些同形同音异义词(refuse,permit)为什么要引入词汇类别(如名词)以及词性标记(NN)?因为这些类别中很多都源于对文本中词语分布的浅层分析。例:使用similar()方法找到某个词的所有上下文
我住长江头
·
2019-07-23 16:52
Python自然语言处理
人工智能书单
人工智能时代》:26《人工智能简史》:16《终极算法:机器学习和人工智能如何重塑世界》:12《科学+遇见人工智能》:12《深度学习》:12《统计思维:程序员数学之概率统计》:12《智能的本质》:12《
Python
KangHuasen
·
2019-07-21 15:26
资源下载
人工智能书单
人工智能时代》:26《人工智能简史》:16《终极算法:机器学习和人工智能如何重塑世界》:12《科学+遇见人工智能》:12《深度学习》:12《统计思维:程序员数学之概率统计》:12《智能的本质》:12《
Python
Hubhub
·
2019-07-21 12:05
Python自然语言处理
实战学习笔记(第二章NLP前置技术解析)
第二章NLP前置技术解析搜索微信公众号:‘AI-ming3526’或者’计算机视觉这件小事’获取更多干货github:https://github.com/aimi-cn/AILearners在本章中,你将学到NLP相关的一些前置技术很多的数据科学库、框架、模块以及工具箱可以有效地实现NLP大部分常见的算法与技术,掌握与运用正则表达式,Numpy是开始NLP工作的好方式。本章要点包括:选择Pyth
CNchangan
·
2019-05-18 10:09
NLTK——NLTK的正则表达式分词器(nltk.regexp_tokenize)
在《
Python自然语言处理
》一书中的P121出现来一段利用NLTK自带的正则表达式分词器——nlt.regexp_tokenize,书中代码为:1text='ThatU.S.A.poster-printex-costs-ed
weixin_30411239
·
2019-05-16 15:00
python
人工智能
ai 文本挖掘相关
所以前半个月开始了用python进行文本挖掘的学习,很多人都推荐我从《
python自然语言处理
》这本书入门,学习了半个月以后,通篇将nltk库进行英文文本挖掘的,
沿溪行
·
2019-03-26 15:43
Python 自然语言处理笔记(二)—— 中文分词
Python自然语言处理
笔记(二)——中文分词数据集与代码都放在了GitHub仓库正向最大匹配算法正向最大匹配FMM算法思想假定词典中最长的单词长度为m,从左至右取待分词的前m个字符串作为匹配字段。
Dic0k
·
2019-03-20 23:16
自然语言处理
《精通
Python自然语言处理
( Deepti Chopra)》读书笔记(第九章):语篇分析
《精通
Python自然语言处理
》DeeptiChopra(印度)王威译第九章语篇分析:理解才是可信的9.1语篇分析简介语篇分析是执行文本或语言分析的过程,其包含了文本解释以及对社交互动的理解。
Mr.小白
·
2019-03-17 17:20
NLP
中文分词
大数据
《精通
Python自然语言处理
( Deepti Chopra)》读书笔记(第六章):语义分析
《精通
Python自然语言处理
》DeeptiChopra(印度)王威译第六章语义分析:意义很重要语义分析(意义生成)被定义为确定字符或单次序列意义的过程,可用于执行语义消歧任务。
Mr.小白
·
2019-03-13 20:37
NLP
中文分词
大数据
自然语言理解
相关文章将会发布在我的个人博客专栏《
Python自然语言处理
》,欢迎大家关注。
象在舞
·
2019-03-10 14:34
自然语言处理
Python自然语言处理
《精通
Python自然语言处理
( Deepti Chopra)》读书笔记(第三章):形态学
《精通
Python自然语言处理
》DeeptiChopra(印度)王威译第三章形态学:在实践中学习3.1形态学简介形态学可以定义为在语素的帮助下对标识符的构造进行研究。语素是承载意义的基本语言单位。
Mr.小白
·
2019-03-07 18:24
NLP
中文分词
《精通
Python自然语言处理
( Deepti Chopra)》读书笔记(第二章)
《精通
Python自然语言处理
》DeeptiChopra(印度)王威译第二章统计语言建模计算语言学的应用范围包括机器翻译,语音识别、智能Web搜索、信息检索和智能拼写等。
Mr.小白
·
2019-03-03 13:58
NLP
中文分词
书籍:
python自然语言处理
(PyTorch) Natural Language Processing with PyTorch - 2019
简介使用PyTorch进行自然语言处理自然语言处理(NLP)为解决人工智能问题提供了无限机会,使亚马逊Alexa和谷歌翻译等产品成为可能。如果您是NLP和深度学习新手的开发人员或数据科学家,本实用指南将向您展示如何使用PyTorch(一种基于Python的深度学习库)应用这些方法。作者DelipRao和BrianMcMahon为您提供了NLP和深度学习算法的坚实基础,并演示了如何使用PyTorch
weixin_33978044
·
2019-02-28 17:48
人工智能
python
设计模式
书籍:
python自然语言处理
(PyTorch) Natural Language Processing with PyTorch - 2019
简介图片.png使用PyTorch进行自然语言处理自然语言处理(NLP)为解决人工智能问题提供了无限机会,使亚马逊Alexa和谷歌翻译等产品成为可能。如果您是NLP和深度学习新手的开发人员或数据科学家,本实用指南将向您展示如何使用PyTorch(一种基于Python的深度学习库)应用这些方法。作者DelipRao和BrianMcMahon为您提供了NLP和深度学习算法的坚实基础,并演示了如何使用P
python测试开发_AI命理
·
2019-02-28 17:59
《精通
Python自然语言处理
( Deepti Chopra)》读书笔记(第一章)
《精通
Python自然语言处理
》DeeptiChopra(印度)王威译第一章字符串操作1.1切分1.1.1将文本切分成语句importnltktext="Welcomereaders.Ihopeyoufinditinteresting.Pleasedoreply
Mr.小白
·
2019-02-27 17:04
NLP
中文分词
《
Python自然语言处理
(第二版)-Steven Bird等》学习笔记:第01章 语言处理与Python
第01章语言处理与Python1.1语言计算:文本和单词Python入门NLTK入门搜索文本计数词汇1.2近观Python:将文本当做词链表链表(list,也叫列表)索引列表变量字符串1.3计算语言:简单的统计频率分布细粒度的选择词词语搭配和双连词(bigrams)计数其他东西1.4回到Python决策与控制条件对每个元素进行操作嵌套代码块条件循环1.5自动理解自然语言词意消歧指代消解自动生成语言
miniAI学堂
·
2019-01-13 09:12
2015年度
自然语言处理
Python
第二版
Steven
Bird
Python自然语言处理
—使用CNN进行Text Classification
文章是https://github.com/yandexdataschool/nlp_courseweek2的学习笔记,本周主要介绍了使用CNN进行文本分类(我上次接触CNN还是吴恩达老师的课程介绍的CNN用作图像处理)。本次文章将介绍CNN的基本原理,并使用Keras搭建一个CNN模型处理Kaggle的一个工资预测,第一次自己搭碰到很多坑,我会在第七步搭建过程中介绍一下这些坑。一文本分类1.下图
午匀需
·
2018-12-24 13:07
Python-自然语言处理
Python自然语言处理
—词嵌入 word2vec
Python自然语言处理
这本书后几章感觉更偏向一些文法知识,我简单读了一下放弃了。
午匀需
·
2018-12-13 10:36
Python-自然语言处理
NLP----关键词提取算法(TextRank,TF/IDF)
参考书目:
python自然语言处理
实战——核心技术与算法TF/IDF基本思想:TF是计算一个词在一篇文档中出现的频率,IDF是一个词在多少篇文档中出现过,显然TF越高证明这个词在这篇文章中的代表性就越强
·
2018-12-11 00:00
geek
python 中文分词(规则分词实现,HMM+Viterbi实现统计分词,jieba分词应用)
参考书目:
python自然语言处理
实战——核心技术与算法规则分词顾名思义,直接靠规则来进行分词,这种方法是一种机械的分词方法,主要手段就是通过将语句的每个字符串与词表进行匹配,找到就分,找不到就不分。
沃·夏澈德
·
2018-11-05 11:00
自然语言处理
Python自然语言处理
入门--利用NLTK自带方法完成NLP基本任务
NLTK是Python很强大的第三方库,可以很方便的完成很多自然语言处理(NLP)的任务,包括分词、词性标注、命名实体识别(NER)及句法分析。NLTK安装教程:www.pythontip.com/blog/post/10011/下面介绍如何利用NLTK快速完成NLP基本任务一、NLTK进行分词用到的函数:nltk.sent_tokenize(text)#对文本按照句子进行分割nltk.word_
cq1042713261
·
2018-10-22 11:46
NPL
NLP成长计划(二)
在本讲座中,我们将使用Gensim和NLTK,这两个广泛使用的
Python自然语言处理
库。
codes_first
·
2018-10-19 23:43
breadcrumb
NLP成长计划
【转】机器学习-
Python自然语言处理
库
自然语言处理的库非常多,下面列举一些对Python友好,简单易用,轻量,功能又全的库。1中文中文自然语言处理工具评测:https://github.com/mylovelybaby/chinese-nlp-toolkit-testawesome:https://github.com/crownpku/Awesome-Chinese-NLPHanlp地址:https://github.com/han
Doris_H_n_q
·
2018-09-17 12:48
自然语言处理
spacy包使用
从52nlp官网上截取了这段话:spaCy是一个
Python自然语言处理
工具包,诞生于2014年年中,号称“Industrial-StrengthNaturalLanguageProcessinginPython
momo_zhong
·
2018-09-14 11:29
自然语言处理工具包spaCy初体验
spaCy是一个
Python自然语言处理
工具包,诞生于2014年年中,号称“Industrial-StrengthNaturalLanguageProcessinginPython”,是具有工业级强度的
Zhang_Raymond
·
2018-09-02 01:50
python
机器学习
深度学习笔记—什么是神经网络与TensorFlow实现神经网络?
学习目录:(
python自然语言处理
实战-核心技术与算法书籍《涂铭刘详刘树春》)—推荐(吴恩达-深度学习)[http://mooc.study.163.com/smartSpec/detail/1001319001
陈郑游
·
2018-08-10 11:08
@Python与深度学习
Python与深度学习
机器学习-
Python自然语言处理
库
自然语言处理的库非常多,下面列举一些对Python友好,简单易用,轻量,功能又全的库。1中文中文自然语言处理工具评测:https://github.com/mylovelybaby/chinese-nlp-toolkit-testawesome: https://github.com/crownpku/Awesome-Chinese-NLPHanlp地址:https://github.com/ha
gao8658
·
2018-08-06 00:00
算法研究
Python自然语言处理
实战(4):词性标注与命名实体识别
4.1词性标注词性是词汇基本的语法属性,通常也称为词类。从整体上看,大多数词语,尤其是实词,一般只有一到两个词性,且其中一个词性的使用频次远远大于另一个,即使每次都将高频词性作为词性选择进行标注,也能实现80%以上的准确率。目前较为主流的方法是如同分词一样,将句子的词性标注作为一个序列标注问题来解决。较为主流的词性标注规范有北大的词性标注集和滨州词性标注集两大类。jieba的词性标注同样是结合规则
CopperDong
·
2018-07-16 15:29
NLP
Python自然语言处理
实战(1):NLP基础
从建模的角度看,为了方便计算机处理,自然语言可以被定义为一组规则或符号的集合,我们组合集合中的符号来传递各种信息。自然语言处理研究表示语言能力、语言应用的模型,通过建立计算机框架来实现这样的语言模型,并且不断完善这样的语言模型,还需要根据语言模型来设计各种实用的系统,并且探讨这些实用技术的评测技术。从自然语言的角度出发,NLP基本可以分为两个部分:自然语言处理以及自然语言的生成,演化为理解和生成文
CopperDong
·
2018-07-14 20:23
NLP
python自然语言处理
第一章习题
1.尝试使用Python解释器作为一个计算器,输入表达式,如:12/(4+1)>>>12/(4+1)2.42.26个字母可以组成26的10次方或者26**10个10字母长的字符串。也就是141167095653376L(结尾处的L只是表示这是Python长数字格式)。100个字母长度的字符串可能有多少个?>>>26**1003142930641582938830174357788501626427
哎起名费劲
·
2018-07-13 11:04
Python自然语言处理
NLTK 库用法入门教程【经典】
本文实例讲述了
Python自然语言处理
NLTK库用法。分享给大家供大家参考,具体如下:在这篇文章中,我们将基于Python讨论自然语言处理(NLP)。本教程将会使用PythonNLTK库。
hzp666
·
2018-06-26 10:52
Python自然语言处理
之分词原理
写在前面入坑自然语言处理,最基本的就是要做文本挖掘,而首先要做的就是文本的预处理。自然语言处理的主要流程可以表示为:文本->分句->分词->词性标注->短语分析->句法分析->语义分析->语篇分析->理解分句这部分一般有标点符号分割,便于处理。于是首先要做的就是分词。英文单词天然有空格隔开容易按照空格分词,但是也有时候需要把多个单词做为一个分词,比如一些名词如“NewYork”,需要做为一个词看待
kaiyuan_sjtu
·
2018-06-17 10:14
NLP
python自然语言处理
入门(NLTK)
参考开篇这边主要讲一些nltk的日常使用,对于我来说算是一种复习吧,希望也给大家一些入门的启发,关于nlp的一些python库,我日后会慢慢介绍,前面已经出现了一些中文处理的库,后期我想把他们放到一起讲讲。关于nltk的安装,这边就不多讲了,一条命令就可以下载,语料库在nltk_data可能比较难下载,有兴趣的可以给我留言索要。这边太大了,我无法上传。数据数据的主要来源是亚马逊的商品评论,这边的话
Ding_xiaofei
·
2018-05-22 23:26
NLP
文本处理
python基于共现的《红楼梦》人物关系图
最近受
python自然语言处理
的影响,突然想用机器学习来实现红楼梦人物关系的大致情况。对于我这个从没读过《红楼梦》的人来说省去了很多时间,因为太长,真的读不来啊!那么,用python如何实现呢?
dayslrk
·
2018-05-12 00:31
如何用Python处理自然语言?(Spacy与Word Embedding)
本文教你用简单易学的工业级
Python自然语言处理
软件包Spacy,对自然语言文本做词性分析、命名实体识别、依赖关系刻画,以及词嵌入向量的计算和可视化。
nkwshuyi
·
2018-05-12 00:00
python自然语言处理
——NLTK——词性标签(pos_tag)
最近在做一个分类40000条推特评论的情感分类器。设计文本情感分类器的时候首先要用到的就是NLTK包来进行单词过滤。先用NLTK包的pos_tag方法(part-of-speechtagging)来对单词的词性进行标记,标记后的结果是二元数组格式。之后从这个二元数列中挑出我们所有需要的tag,存放进一个二元数列。实现代码:首先别忘了importnltk假设我们处理的是likehate这两个词。任意
JasonJarvan
·
2018-04-16 07:52
Python
机器学习
Python自然语言处理
学习(一)
今天开始对HTML文件的处理,主要根据
Python自然语言处理
这本书籍。1.实现对本地文件的读取和可视化过程。
Roy-Better
·
2018-03-24 18:23
Python自然语言处理
python自然语言处理
1,统计词频(中文)importjiebafromnltkimportFreqDistdata=jieba.cut('字符串')#这是一个生成器dataFre=FreqDist(list(data))#获得一个词频字典2,统计词频(英文)tokens=nltk.word_tokenize(raw)text=nltk.Text(tokens)dataFre=FreqDist(text)3,用nltk
Cicome
·
2018-03-14 11:29
python
python自然语言处理
1,统计词频(中文)importjiebafromnltkimportFreqDistdata=jieba.cut('字符串')#这是一个生成器dataFre=FreqDist(list(data))#获得一个词频字典2,统计词频(英文)tokens=nltk.word_tokenize(raw)text=nltk.Text(tokens)dataFre=FreqDist(text)3,用nltk
Cicome
·
2018-03-14 11:29
python
上一页
2
3
4
5
6
7
8
9
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他