E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
python自然语言处理
python自然语言处理
之lda
自然语言处理之LDALDA由PLSA发展而来,PLSA由LSA发展而来,同样用于隐含语义分析,这里先给出两篇实现LSA和PLSA的文章链接。自然语言处理之LSA自然语言处理之PLSA我们知道,PLSA也定义了一个概率图模型,假设了数据的生成过程,但是不是一个完全的生成过程:没有给出先验。因此PLSA给出的是一个最大似然估计(ML)或者最大后验估计(MAP)。LDA拓展了PLSA,定义了先验,因此L
数据科学家corten
·
2020-08-16 07:48
机器学习
Python之NLP(转)
gh-pages/index.xmlA----http://blog.csdn.net/caicai1617/article/details/21191781《使用Python进行自然语言处理》学习笔记五标签:
python
weixin_33728268
·
2020-08-15 08:37
python自然语言处理
源文件和处理结果已经上传到我的资源#!user/bin/python#-*-coding:utf-8-*-'''自然语言处理实现的功能有:1.文件的读取;2.使用jieba分词;3.用分词结果画出词云;4.用分词结果画柱状图;5.用分词结果画饼状图'''importjieba#jiea库用于分词importjieba.possegaspseg#词性标注也叫词类标注。POStagging是part-
成_蹉_跎
·
2020-08-14 16:34
python
python自然语言处理
python自然语言处理
(一)自言语言处理基础知识参考:https://blog.csdn.net/meihao5/article/details/79592667英文资料:http://github.com
【一只小小小鸟】
·
2020-08-14 15:32
NLP
python自然语言处理
实战核心技术与算法——HMM模型代码详解
本人初学NLP,当我看着《
python自然语言处理
实战核心技术与算法》书上这接近200行的代码看着有点头皮发麻,于是我读了接近一天基本把每行代码的含义给读的个七七八八,考虑到可能会有人和我一样有点迷茫,
在秃顶的边缘疯狂试探
·
2020-08-11 12:40
nlp
python
python自然语言处理
实战核心技术与算法——命名实体识别实战一:日期识别代码详解(二)
这里是《
python自然语言处理
实战核心技术与算法》——命名实体识别实战一:日期识别的第二部分,上一部分的文章链接点击这里。
在秃顶的边缘疯狂试探
·
2020-08-11 12:40
nlp
python
Python: NLTK几个入门函数
安装了nltk以及对应的一些英文语料之后,开始按照
python自然语言处理
学习来学习,有几个入门级别的函数,记录如下:text.concordance(word)这个函数就是用来搜索单词word在text
ShomyLiu
·
2020-08-10 22:36
python
Python自然语言处理
——nltk库入门之文本分词(英文)
#-*-coding:utf-8-*-from__future__importunicode_literalsimportnltk.tokenizeastk#需要分词的文本doc="Areyouok?\I'mfun,andyou?\I'mok."#文本分句tokens=tk.sent_tokenize(doc)fori,tokeninenumerate(tokens):print('%2d'%(i
Quanworld
·
2020-08-10 14:54
科技
程序员
Python自然语言处理
nltk库中的一些重要的模块
nltk库中的一些重要的模块——nltk.corpus————获取语料库。——————语料库和词典的标准化接口——nltk.tokenize,nltk.stem————字符串处理——————分词,句子分解,提取主干——nltk.collocations————搭配探究——————t检验,卡方检验,点互信息——nltk.tag————词性标识符——————n-gram,backoff,Brill,H
Quanworld
·
2020-08-10 06:49
程序员
DeBug记录:'dict_keys' object is not subscriptable
问题背景学习《
python自然语言处理
》这本书的时候,有如下代码>>>fdist1=FreqDist(text1)>>>vocabulary1=fdist1.keys()>>>vocabulary1[:
Wang_PChao
·
2020-08-10 06:00
DeBug
Python自然语言处理
-带你玩转NLTK库常见操作
fromnltk.bookimport*#加载语料库text1.concordance('monstrous')#搜索文本上下文text1.similar('monstrous')#查找与monstrous拥有共同上下文的词text2.common_contexts(['monstrous','very'])text4.dispersion_plot(['America','citizen','d
Data_Designer
·
2020-08-10 05:17
Python
学习笔记(03):
Python自然语言处理
-BERT模型实战-项目参数配置
立即学习:https://edu.csdn.net/course/play/26498/334624?utm_source=blogtoeduwin系统上输入老师的arguments会报错我自己尝试了一下用这个不会--task_name=MRPC\--do_train=true\--do_eval=true\--data_dir=../GLUE/glue_data/MRPC--vocab_file
pt net
·
2020-08-09 22:41
研发管理
跟着阿里大牛捞干货:2019这5本书带你玩转大数据
1《
Python自然语言处理
实战:核心技术与算法》作者:涂铭,刘祥,
大数据v
·
2020-08-09 16:25
Python自然语言处理
相,新词发现,主题模型,隐马尔模型词性标注,Word2Vec,情感分析...
向AI转型的程序员都关注了这个号????????????机器学习AI算法工程公众号:datayx代码环境:python--version3.5.2tensorflowkeras代码+数据集获取:关注微信公众号datayx然后回复NLP即可获取。AI项目体验地址https://loveai.tech本项目旨在归纳总结自然语言处理工程师常见实践内容,每个模块尽量包含理论(经典算法和最新paper)和实
demm868
·
2020-08-08 15:31
python自然语言处理
实战核心技术与算法——基于PCFG的中文句法分析实战
在本书中这一篇章就写的略显单薄,不过作者也说明了,本书是NLP入门实践书籍,句法分析又属于NLP中较为高阶的问题,所以并没有深入讲解,我学习本书也是入门NLP,学习完本书后会学习《统计自然语言处理》。由于本章实战内容很少,而且也没有特别晦涩的代码,所以在本文中更多的是讲解windows配置等问题。目录一、JDK安装与配置二、PCFG文件下载三、代码四、总结五、参考一、JDK安装与配置因为stanf
野指针小李
·
2020-08-06 14:57
nlp
python
python
自然语言处理
《
Python自然语言处理
-雅兰·萨纳卡(Jalaj Thanaki)》学习笔记:07 规则式自然语言处理系统
07规则式自然语言处理系统7.1规则式系统7.2规则式系统的目的7.2.1为何需要规则式系统7.2.2使用规则式系统的应用7.2.3练习7.2.4开发规则式系统需要的资源7.3规则式系统的架构7.3.1从专家系统的角度来看规则式系统的通用架构7.3.2NLP应用中的规则式系统的实用架构7.3.3NLP应用中的规则式系统的定制架构7.3.4练习7.3.5ApacheUIMA架构7.4规则式系统的开发
miniAI学堂
·
2020-07-28 22:47
2017年度
python自然语言处理
学习笔记一
第一章语言处理与python1语言计算文本与词汇NLTK入门下载安装nltkhttp://www.nltk.org下载数据>>>importnltk>>>nltk.download()下载完成,加载文本>>>fromnltk.bookimport****IntroductoryExamplesfortheNLTKBook***Loadingtext1,...,text9andsent1,...,s
retacn
·
2020-07-28 10:22
python自然语言处理
【原】Python NLP实战之一:环境准备
最近正在学习Python,看了几本关于Python入门的书和用Python进行自然语言处理的书,如《Python编程实践》、《Python基础教程》(第2版)、《
Python自然语言处理
》(影印版)。
iteye_19939
·
2020-07-16 00:46
NLTK
NLTK使用中NameError: name 'FreqDist' is not defined问题解决
在使用NLTK学习自然语言处理时,按照《
Python自然语言处理
》的代码进行频率分布统计,原代码如下:fdist1=FreqDist(text1)但是使用时报错如下:Traceback(mostrecentcalllast
ustbYolanda
·
2020-07-15 02:14
NLTK
python NLP总结
刘知远2自然语言处理工具包spaCy介绍spaCy是一个
Python自然语言处理
工具包,诞生于2014年年中,号称“Industrial-StrengthNaturalLanguageProcessinginPython
zwwhsxq
·
2020-07-12 20:56
python
自然语言处理
《
Python自然语言处理
(第二版)-Steven Bird等》学习笔记:第04章 编写结构化程序
第04章编写结构化程序4.1回到基础赋值等式条件语句4.2序列序列类型上的操作合并不同类型的序列产生器表达式4.3风格的问题过程风格与声明风格计数器的一些合理用途4.4函数:结构化编程的基础函数的输入和输出参数传递变量的作用域参数类型检查功能分解文档说明函数4.5更多关于函数作为参数的函数累计函数高阶函数参数的命名4.6程序开发Python模块的结构多模块程序误差源头调试技术防御性编程4.7算法设
miniAI学堂
·
2020-07-12 13:41
2015年度
NLP读书笔记
NLP读书笔记,在看过《
python自然语言处理
实战核心技术与算法》、《数学之美第二版》记录一些笔记,日后常看看然语言处理技术可以帮助这样的用户使用自然语言和机器交流;NLP基本可以分为两个部分:自然语言处理以及自然语言生成
远陌
·
2020-07-11 01:16
读书笔记
Python NLP 入门
#首先importnltk模块importnltknltk.download()#弹出的web界面选择book#下载测试资料bookfromnltk.bookimport*#以下为
python自然语言处理
代码样例和学习笔记
Chao Hsin-fang
·
2020-07-10 15:10
NLP
《
Python自然语言处理
》第二章 习题解答 练习6
问题描述:在比较词表的讨论中,创建一个对象叫做translate,通过它你可以使用德语和意大利语词汇查找对应的英语词汇。这种方法可能会出现什么问题,你能提出一个办法来避免这个问题吗?书上的做法是通过entries()方法来指定一个语言链表来访问多语言中的同源词,再把它转换成一个简单的词典。代码如下:1fromnltk.corpusimportswadesh2swadesh.fileids()3it
weixin_33759269
·
2020-07-10 07:19
python自然语言处理
学习笔记(七)
一、信息提取信息有很多种形状和大小。一个重要的形式是结构化数据:实体和关系的可预测的规范的结构。位置数据如果这个位置数据被作为一个元组(entity,relation,entity)的链表存储在Python中,那么这个问题:“哪些组织在亚特兰大经营?”可翻译如下:print[orgfor(e1,rel,e2)ifrel=='IN'ande2=='Atlanta']>>['BBDOSouth','G
freedom_king
·
2020-07-09 18:40
Python自然语言处理
分析倚天屠龙记
Python中文社区全球Python中文开发者的精神部落最近在了解到,在机器学习中,自然语言处理是较大的一个分支。存在许多挑战。例如:如何分词,识别实体关系,实体间关系,关系网络展示等。我用Jieba+Word2vec+NetworkX结合在一起,做了一次自然语言分析。语料是倚天屠龙记。之前也有很多人用金庸的武侠小说做分析和处理,希望带来一些不同的地方。截几张图来看看:所有人物的相似图连接。关系同
Python中文社区
·
2020-07-09 10:55
python自然语言处理
-就职演说语料库
书中-就职演说语料库这个小程序统计词汇america和citizen随时间推移的使用情况这个小程序有点bug,我电脑python版本(Python3.6.1)原书中代码是>>>cfd=nltk.ConditionalFreqDist(...(target,file[:4])...forfileidininaugural.fileids()...forwininaugural.words(filei
寻找现实扭曲力场
·
2020-07-09 03:43
Python
《
Python自然语言处理
-雅兰·萨纳卡(Jalaj Thanaki)》学习笔记:09 NLU和NLG问题中的深度学习
09NLU和NLG问题中的深度学习9.1人工智能概览9.1.1人工智能的基础9.1.2人工智能的阶段9.1.3人工智能的种类9.1.4人工智能的目标和应用9.2NLU和NLG之间的区别9.2.1自然语言理解9.2.2自然语言生成9.3深度学习概览9.4神经网络基础9.4.1神经元的第一个计算模型9.4.2感知机9.4.3理解人工神经网络中的数学概念9.5实现神经网络9.5.1单层反向传播神经网络9
miniAI学堂
·
2020-07-08 22:43
2017年度
《
Python自然语言处理
-雅兰·萨纳卡(Jalaj Thanaki)》学习笔记:06 高级特征工程和NLP算法
06高级特征工程和NLP算法6.1词嵌入6.2word2vec基础6.2.1分布语义6.2.2定义word2vec6.2.3无监督分布语义模型中的必需品6.3word2vec模型从黑盒到白盒6.3.1基于分布相似性的表示6.3.2了解word2vec模型的组件6.3.3了解word2vec模型的逻辑6.3.4了解word2vec模型背后的算法和数学6.3.5关于word2vec模型的一些事实6.3
miniAI学堂
·
2020-07-08 22:43
2017年度
《
Python自然语言处理
-雅兰·萨纳卡(Jalaj Thanaki)》学习笔记:10 高级工具
10高级工具10.1使用ApacheHadoop作为存储框架10.2使用ApacheSpark作为数据处理框架10.3使用ApacheFlink作为数据实时处理框架10.4Python中的可视化类库本附录重点介绍如何在NLP应用程序中使用各种框架。我们将查看这些框架的概述,并介绍它们的基本特性以及它们为您做了什么。我们不会看到每个框架的详细架构。这里,目的是让您了解可以一起用于构建各种NLP应用程
miniAI学堂
·
2020-07-08 22:43
2017年度
《
Python自然语言处理
-雅兰·萨纳卡(Jalaj Thanaki)》学习笔记:11 如何提高你的NLP技能
11如何提高你的NLP技能11.1开始新的NLP职业生涯11.2备忘列表11.3确定你的领域11.4通过敏捷的工作来实现成功11.5NLP和数据科学方面一些有用的博客11.6使用公开的数据集11.7数据科学领域需要的数学知识11.8总结本附录将为您提供更多关于如何提高NLP技能的信息。这也将帮助您更新您的知识。11.1开始新的NLP职业生涯如果你是一名编码员,想要在NLP工作,那么记住以下几点:N
miniAI学堂
·
2020-07-08 22:11
2017年度
《
Python自然语言处理
-雅兰·萨纳卡(Jalaj Thanaki)》学习笔记:04 预处理
03预处理4.1处理原始语料库文本4.1.1获取原始文本4.1.2小写化转换4.1.3分句4.1.4原始文本词干提取4.1.5原始文本词形还原4.1.6停用词去除4.2处理原始语料库句子4.2.1词条化4.2.2单词词形还原4.3基础预处理4.3.1正则表达式4.3.2基本级正则表达式4.3.3高级正则表达式4.4实践和个性化预处理4.4.1由你自己决定4.4.2预处理流程4.4.3预处理的类型4
miniAI学堂
·
2020-07-08 22:11
2017年度
《
Python自然语言处理
-雅兰·萨纳卡(Jalaj Thanaki)》学习笔记:12 安装指导
12安装指导12.1安装Python、pip和NLTK12.2安装PyCharm开发环境12.3安装依赖库12.4框架安装指导12.5解决你的疑问12.6总结本附录为您提供了有关安装Python库、单节点Hadoop集群和单节点Spark集群的信息。如果你想问我有关这本书的问题或任何与NLP有关的问题,你可以加入我的Gitter。12.1安装Python、pip和NLTKpip代表pipinsta
miniAI学堂
·
2020-07-08 22:11
2017年度
《
Python自然语言处理
(第二版)-Steven Bird等》学习笔记:第03章 加工原料文本
第03章加工原料文本3.1从网络和硬盘访问文本电子书处理的HTML处理搜索引擎的结果处理RSS订阅读取本地文件从PDF、MSWord及其他二进制格式中提取文本捕获用户输入NLP的流程3.2字符串最底层的文本处理字符串的基本操作输出字符串访问单个字符访问子字符串更多的字符串操作链表与字符串的差异3.3使用Unicode进行文字处理什么是Unicode?从文件中提取已编码文本在Python中使用本地编
miniAI学堂
·
2020-07-08 22:10
2015年度
《
Python自然语言处理
-雅兰·萨纳卡(Jalaj Thanaki)》学习笔记:01 WIN 7 Anaconda python 3.5 NLTK 安装配置
安装Anaconda安装NLTK安装Anaconda下载Anaconda中支持python3.5(WIN7)版本(本人桌面系统环境)地址:https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/?C=N&O=D地址:https://repo.continuum.io/archive/文件:https://repo.continuum.io/arc
miniAI学堂
·
2020-07-08 22:10
2017年度
《
Python自然语言处理
(第二版)-Steven Bird等》学习笔记:第09章 建立基于特征的文法
第09章建立基于特征的文法9.1文法特征句法协议使用属性和约束术语9.2处理特征结构包含和统一9.3扩展基于特征的文法子类别核心词回顾助动词与倒装无限制依赖成分9.4小结importnltk怎样用特征扩展上下文无关文法框架,以获得更细粒度的对文法类别和产生式的控制?特征结构的主要形式化属性是什么,如何使用它们来计算?用基于特征的文法能捕捉到什么语言模式和文法结构?9.1文法特征基于规则的文法上下文
miniAI学堂
·
2020-07-08 22:10
2015年度
《
Python自然语言处理
-雅兰·萨纳卡(Jalaj Thanaki)》学习笔记:03 理解句子的结构
03理解句子的结构3.1理解NLP的组成3.1.1自然语言理解3.1.2自然语言生成3.1.3NLU和NLG的区别3.1.4NLP的分支3.2上下文无关文法3.3形态分析3.3.1形态学3.3.2词素3.3.3词干3.3.4形态分析3.3.5词3.3.6词素的分类3.3.7词干和词根的区别3.4词法分析3.4.1词条3.4.2词性标注3.4.3导出词条的过程3.4.4词干提取和词形还原的区别3.4
miniAI学堂
·
2020-07-08 22:10
2017年度
自然语言处理
形态分析
词法分析
句法分析
语用分析
PythonNLP学习进阶:第二章练习题(
Python自然语言处理
)
python自然语言处理
.2014年7月第一版课后习题练习1.
txlCandy
·
2020-07-08 08:05
python自然语言
Python自然语言处理
笔记(二)nltk实践记录
nltk的安装installnltknltk.download()报错[nltk_data]Errorloadingwordnet:nltk.download()报错getaddrinfofailed参考解决NLTK语料库下载出错及nltk_data路径等问题可以解决只有通过手动下载的方法,后期不太方便,如果有更好的方法欢迎交流~ps:相同问题照此修改代理没有用,不知原因nltk的使用使用wn.s
席八
·
2020-07-07 23:07
Python
自然语言处理
python
自然语言处理
python学习-文本数据分析2(文本分类)
进行文本分类,可用于过滤垃圾文本1.抽样2.人工标注样本文本中垃圾信息3.样本建模4.模型评估5.新文本预测参考:http://scikit-learn.org/stable/user_guide.html
PYTHON
旭旭_哥
·
2020-07-07 15:09
数据挖掘
机器学习
python编程
python自然语言处理
实战核心技术与算法——双向最大匹配法
本人初学nlp,使用的是机械工业出版社的《
python自然语言处理
实战核心技术与算法》,学习到了双向最大匹配法,于是写下这篇文章记录一下整个代码的工作原理以及相应的理解。
野指针小李
·
2020-07-07 10:01
nlp
python
自然语言处理
语料库的获取与词频分析
相关文章将会发布在我的个人博客专栏《
Python自然语言处理
》,欢迎大家关注。
象在舞
·
2020-07-07 08:30
Python
自然语言处理
Python自然语言处理
《
Python自然语言处理
-雅兰·萨纳卡(Jalaj Thanaki)》学习笔记:02 语料库和数据集
什么是语料库?为什么我们需要语料库?理解语料库分析?数据属性的类型语料库的不同文件格式免费语料库的资源为NLP应用准备数据集网页爬取什么是语料库?在语料库中,大数据集合可以采用以下格式:文本数据,意思是书面材料语音数据,即语音材料语料库有三种类型:单语语料库:这种语料库只有一种语言双语语料库:这种语料库有两种语言多语言语料库:这种语料库有多种语言例如:谷歌图书NGRAM语料库布朗语料库美国国家语料
miniAI学堂
·
2020-07-06 19:07
2017年度
自然语言处理
Python
Jalaj
Thanaki
语料库
NLTK库的data路径问题
问题描述最近在学习《
Python自然语言处理
》一书中需要使用到NLTK模块,但是在导入数据时出现了问题。
雪地冰激凌
·
2020-07-06 16:52
NLP
python自然语言处理
学习笔记二
第二章获得文本语料和词汇资源1获取文本语料古腾堡语料库gutenberg>>>importnltk>>>nltk.corpus.gutenberg.fileids()['austen-emma.txt','austen-persuasion.txt','austen-sense.txt','bible-kjv.txt','blake-poems.txt','bryant-stories.txt',
retacn
·
2020-07-05 10:22
python自然语言处理
python自然语言处理
-学习笔记(三)之文本相似度计算
'''文本相似度计算方法'''#1,编辑距离计算'''是指两个字符串之间,由一个转成另一个所需的最少操作次数,如果它们就距离越大,说明它们越不同,预科的编辑操作包括将一个字符替换成另一个字符,插入一个字符删除一个字符'''importdistanceprint(distance.levenshtein('setting','string'))#2#第一步在s和t之间插入一个v字符e#第二步把r替换
pyswt
·
2020-07-05 02:36
自然语言处理
Python自然语言处理
-第一章学习笔记 & 习题
软件安装P18Python3.8.2https://www.python.org/pippipenvNLTK、NLTK-Datapipinstallnltkhttp://www.nltk.org/install.htmlNumPypipinstallnumpyMatplotlibpipinstallmatplotlibNetworkXpipinstallnetworkxProver91.1语言计算
cyberickk
·
2020-07-02 11:22
NLP
Python
python
nlp
nltk
自然语言处理
python自然语言处理
之分类和标注词性5.1-5.3
介绍下NLP的基本技术:包括序列标注、N-gram模型、回退和评估。将词汇按照词性分类并相应的对他们进行标注,也即:词性标注(part-of-speechtagging,POStagging),也称作标注。词性也称为词类或者词汇范畴。用于特定任务标记的集合被称作一个标记集。5.1使用词性标注器用以处理一个词序列,为每一个词附加词性标记。>>>importnltk>>>text=nltk.word_
LawenceRay
·
2020-07-01 11:23
python自然语言处理
2017-2018 学习总结
4.部分实践《
python自然语言处理
》书中的代码5.学习李宏毅的机器学习视频,部分实现代码包括CNN等(基于ke
bineleanor
·
2020-06-30 11:40
自然语言处理
python自然语言处理
-----计算文本相似度
fromgensimimportcorpora,models,similaritiesimportjiebafromcollectionsimportdefaultdictimporturllib.request#d1=open("C:/Users/yyq/Desktop/毕业论文/文档1.txt").read()#d2=open("C:/Users/yyq/Desktop/毕业论文/文档2.tx
yyq675886993
·
2020-06-30 11:58
python自然语言处理
python机器学习
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他