E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
gensim
基于
gensim
模块的中文句子相似度计算工具
概述中文句子相似度的计算有很多模型,我们使用TFIDF,LSI与LDA模型这3中模型更加适用于文章相似度的计算对于句子来说,长度太短,正确率相对不高算法及代码具体这几种模型的原理介绍可以参考别人的博客 http://www.52nlp.cn/%E5%A6%82%E4%BD%95%E8%AE%A1%E7%AE%97%E4%B8%A4%E4%B8%AA%E6%96%87%E6%A1%A3%E7%9A%
wds2006sdo
·
2016-04-05 00:00
python
相似度计算
[python] LDA处理文档主题分布代码入门笔记
gensim
下载地址:https://
Eastmount
·
2016-03-09 03:00
python
代码分析
LDA
入门介绍
主题分布
[python] LDA处理文档主题分布代码入门笔记
gensim
下载地址:https://
Eastmount
·
2016-03-09 03:00
python
代码分析
LDA
入门介绍
主题分布
word2vec词向量训练及中文文本相似度计算
官网C语言下载地址:http://word2vec.googlecode.com/svn/trunk/官网Python下载地址:http://radimrehurek.com/
gensim
/models
Eastmount
·
2016-02-18 00:41
word2vec
词向量
源码
相似度计算
python
自然语言处理
知识图谱
知识图谱
web数据挖掘及NLP
word2vec词向量训练及中文文本相似度计算
官网C语言下载地址:http://word2vec.googlecode.com/svn/trunk/官网Python下载地址:http://radimrehurek.com/
gensim
/models
Eastmount
·
2016-02-18 00:00
源码
python
相似度计算
词向量
word2vec
word2vec词向量训练及中文文本相似度计算
官网C语言下载地址:http://word2vec.googlecode.com/svn/trunk/官网Python下载地址:http://radimrehurek.com/
gensim
/models
Eastmount
·
2016-02-18 00:00
源码
python
相似度计算
词向量
word2vec
文本分析之TFIDF/LDA/Word2vec实践
写在最前面的话,最好的学习材料是官方文档及API:http://radimrehurek.com/
gensim
/tutorial.htmlhttp://radimrehurek.com/
gensim
/apiref.html
vs412237401
·
2016-02-03 10:00
数据挖掘
机器学习
深度学习:使用 word2vec 和
gensim
gensim
官网:http://radimrehurek.com/
gensim
/index.htmlWord2vec:thegood,thebad(andthefast)Google发布了一些无监督深度学习算法
chvalrous
·
2016-01-06 17:28
Machine
Learning
linux下安装
gensim
的方法。
.确保SciPy>=0.7NumPy安装语句 sudoapt-getinstallpython-numpySciPy安装语句sudo apt-getinstallpython-scipy接着就可以安装
gensim
u011954647
·
2015-12-03 17:00
python
ubuntu
Python 文本挖掘:使用
gensim
进行文本相似度计算
在文本处理中,比如商品评论挖掘,有时需要了解每个评论分别和商品的描述之间的相似度,以此衡量评论的客观性。评论和商品描述的相似度越高,说明评论的用语比较官方,不带太多感情色彩,比较注重描述商品的属性和特性,角度更客观。那么Python里面有计算文本相似度的程序包吗,恭喜你,不仅有,而且很好很强大。这是从52nlp大神的博客里面发现的,其实具体的处理流程和程序和他的基本一致,只要仔细研读他的这几篇博客
chencheng126
·
2015-11-27 14:00
转:Python 文本挖掘:使用
gensim
进行文本相似度计算
Python使用
gensim
进行文本相似度计算 转于:http://rzcoding.blog.163.com/blog/static/2222810172013101895642665
·
2015-11-13 07:34
python
word2vec的艰难成长史
1.首先在网站上面下载
gensim
,我是在11服务器上面下载的 2.使用winpython打开 3.在command windows 下使用pip install
gensim
这句话进行,原先使用这句话
·
2015-11-11 09:32
word
windows/linux 安装
gensim
简易方法
//blog.csdn.net/hereiskxm/article/details/49424799为了使用wiki百科来训练模型(中英文维基百科语料上的Word2Vec实验)我需要安装python和
gensim
kexinmei
·
2015-10-26 15:00
python
安装
大数据
gensim
word2vec的艰难成长史
1.首先在网站上面下载
gensim
,我是在11服务器上面下载的2.使用winpython打开3.在commandwindows下使用pipinstall
gensim
这句话进行,原先使用这句话pipinstall-U
gensim
cuilijuan02
·
2015-08-26 15:53
自然语言处理
sklearn、nltk、
gensim
语料输入对比之nltk
经过测试,nltk虽然有包装了sklearn的SklearnClassifier,但是还是很局限,我在测试随机森林分类器时就出现了运行错误,因此建议整个流程都使用nltk!nltk的数据集中每条记录的特征是通过自定义的特征提取方法获得的。每条记录的特征是一个字典对象,每个字典对象元由特征名称和对应的值组成。例如defgender_features(word): return{'last_lette
xuxiuning
·
2015-08-24 19:00
自然语言处理
sklearn、nltk、
gensim
语料输入对比之sklearn
sklearn语料处理:sklearn的sklearn.datasets.load_files方法支持从目录读取所有分类好的文本。不过目录必须按照一个文件夹一个标签名的规则放好。比如本文使用的数据集共有2个标签,一个为“net”,一个为“pos”,每个目录下面有6个文本文件。目录如下所示:neg1.txt2.txt……pos1.txt2.txt….12个文件的内容汇总起来如下所示:neg: shi
xuxiuning
·
2015-08-24 13:00
机器学习
Gensim
学习笔记-2-理解
Gensim
中的Corpus对象
所有corpora.xxxcorpus中的对象均继承接口
gensim
.interfaces.CorpusABC一个语料库对象(corpus)是一个可迭代的对象,每次迭代得到一篇文档(document)一个
xuxiuning
·
2015-08-17 14:00
gensim
Gensim
学习笔记-1--理解corpora.Dictionary
gensim
使用python标准的logging包,引入方式为:importlogginglogging.basicConfig(format=’%(asctime)s:%(levelname)s:%(
xuxiuning
·
2015-08-17 09:00
gensim
windows下安装python拓展包
linux和windows下安装python拓展包-pycharm、numpy、scipy、matplotlib、scikit、
gensim
、PIL、OpenCV、django、pythonqt...http
hzyido
·
2015-07-25 23:03
利用
gensim
主题模型寻找相似的coursera课程
参考http://www.52nlp.cn/如何计算两个文档的相似度三#encoding=utf-8 fromnltk.tokenizeimportword_tokenize fromnltk.corpusimportstopwords fromnltk.stem.lancasterimportLancasterStemmer courses=[line.strip()forlineinfile
kesonyk
·
2015-06-26 15:00
gensim
的LSI模型来计算文档的相似度
from
gensim
importcorpora,models,similarities dictionary=corpora.Dictionary.load('/tmp/deerwester.dict'
kesonyk
·
2015-06-26 01:00
gensim
的主题模型LSI
将上问的输入文档归为两个主题from
gensim
importcorpora,models,similarities dictionary=corpora.Dictionary.load('/tmp/deerwester.dict
kesonyk
·
2015-06-26 00:00
使用
gensim
计算文档的相似度
gensim
是一个主题模型的python库,可以在官网下载http://radimrehurek.com/
gensim
/index.html以下代码使用
gensim
来计算文档之间的相关性,使用的是tfidf
kesonyk
·
2015-06-25 23:00
主题模型TopicModel:通过
gensim
实现LDA
http://blog.csdn.net/pipisorry/article/details/46447561使用python
gensim
轻松实现lda模型。
-柚子皮-
·
2015-06-10 22:18
主题模型Topic
Model
小谈
gensim
gensim
是一个用于主题分析(LSI/LDA)的工具包。它的强大,在于大量使用了矩阵运算(速度比循环判断快),提供了基本上一整套的主题建模、相似判断、分布式训练、甚至是可以进行相似判断的服务器。
junGle
·
2015-03-16 11:00
技术
LDA
gensim
lsi
主题分析
gensim
话题模型初体验
NeilZhu,IDNot_GOD,UniversityAI创始人&ChiefScientist,致力于推进世界人工智能化进程。制定并实施UAI中长期增长战略和目标,带领团队快速成长为人工智能领域最专业的力量。作为行业领导者,他和UAI一起在2014年创建了TASA(中国最早的人工智能社团),DLCenter(深度学习知识中心全球价值网络),AIgrowth(行业智库培训)等,为中国的人工智能人才
朱小虎XiaohuZhu
·
2014-12-31 17:54
TopicModel主题模型 - LDA的python实现及参数选择
http://blog.csdn.net/pipisorry/article/details/42129099一、使用
gensim
python拓展包1.install
gensim
,sklearn,nltk2
pipisorry
·
2014-12-24 21:00
python
Model
topic
LDA
gensim
nltk-构建和使用语料库-可用于小说的推荐-完整实例
python #-*-coding=utf-8-*- #数据源目录(二级目录) sourceDataDir='data' #数据源文件列表 fileLists = [] import os from
gensim
深蓝苹果
·
2014-09-26 18:00
python
自然语言处理
NLP
NLTK
gensim
gensim
-5个学习阶段
阶段1--语料库和向量http://radimrehurek.com/
gensim
/tut1.html*建立语料库步骤 1.从字符串==>向量 2.去除停用词;去除出现次数=1的词; 3.
深蓝苹果
·
2014-09-18 12:00
自然语言处理
NLP
NLTK
gensim
自然语言处理-感述
最近花了点时间学习nlp--实际只是学习使用nltk和伴随它出现的
gensim
。
深蓝苹果
·
2014-09-17 18:00
自然语言处理
NLP
Python 文本挖掘:使用
gensim
进行文本相似度计算
转自:http://rzcoding.blog.163.com/blog/static/2222810172013101895642665/在文本处理中,比如商品评论挖掘,有时需要了解每个评论分别和商品的描述之间的相似度,以此衡量评论的客观性。评论和商品描述的相似度越高,说明评论的用语比较官方,不带太多感情色彩,比较注重描述商品的属性和特性,角度更客观。那么Python里面有计算文本相似度的程序包
fennvde007
·
2014-06-23 11:00
如何计算两个文档的相似度(三)
上一节我们用了一个简单的例子过了一遍
gensim
的用法,这一节我们将用课程图谱的实际数据来做一些验证和改进,同时会用到NLTK来对课程的英文数据做预处理。
fennvde007
·
2014-06-12 11:00
如何计算两个文档的相似度(二)
上一节我们介绍了一些背景知识以及
gensim
,相信很多同学已经尝试过了。这一节将从
gensim
最基本的安装讲起,然后举一个非常简单的例子用以说明如何使用
gensim
,下一节再介绍其在课程图谱上的应用。
fennvde007
·
2014-06-12 11:00
如何计算两个文档的相似度(三)
上一节我们用了一个简单的例子过了一遍
gensim
的用法,这一节我们将用课程图谱的实际数据来做一些验证和改进,同时会用到NLTK来对课程的英文数据做预处理。
niujin1212
·
2014-04-04 11:00
如何计算两个文档的相似度(二)
上一节我们介绍了一些背景知识以及
gensim
,相信很多同学已经尝试过了。
niujin1212
·
2014-04-04 11:00
关注的一些博客
p=803http://shenfeng.me/resume/index.html一些开源库:http://radimrehurek.com/
gensim
/tutorial.htmlhttp://mymedialite.net
woshizhouxiang
·
2013-12-25 12:00
博客
机器学习
gensim
试用
gensim
试用
gensim
: http://radimrehurek.com/
gensim
/index.html
Gensim
isafreePythonframeworkdesignedtoautomaticallyextractsemantictopicsfromdocuments
largetalk
·
2013-08-28 12:00
如何计算两个文档的相似度(三)
上一节我们用了一个简单的例子过了一遍
gensim
的用法,这一节我们将用课程图谱的实际数据来做一些验证和改进,同时会用到NLTK来对课程的英文数据做预处理。
52nlp
·
2013-06-07 22:00
Topic
Model
推荐系统
自然语言处理
Deep
Learning
Deep
Learning公开课
如何计算两个文档的相似度(三)
上一节我们用了一个简单的例子过了一遍
gensim
的用法,这一节我们将用课程图谱的实际数据来做一些验证和改进,同时会用到NLTK来对课程的英文数据做预处理。
52nlp
·
2013-06-07 14:00
Model
推荐系统
自然语言处理
topic
deep
deep
learning
Learning公开课
python
今天看到52nlp用
gensim
做的文档相似度比较,觉得真是不错。哎,人家真是厉害,能把东西理解那么透彻,而且又能用浅显语言表达出来,真是深入浅出啊。佩服,学习。在家带孩子,希望能连续学点东西吧。
caoeryingzi
·
2013-05-28 23:00
Bloomfilter很好很强大
在文本预处理阶段,想要实现去停用词和去掉只出现一次的词这两个功能版本一:使用
gensim
上的python语句,基本上是遍历文本集了,两个阶段分别用1分钟和大于30分钟的时间(1800篇文章)实现是这样写的
pirage
·
2013-05-27 17:00
如何计算两个文档的相似度(二)
上一节我们介绍了一些背景知识以及
gensim
,相信很多同学已经尝试过了。这一节将从
gensim
最基本的安装讲起,然后举一个非常简单的例子用以说明如何使用
gensim
,下一节再介绍其在课程图谱上的应用。
52nlp
·
2013-05-27 12:00
Model
推荐系统
自然语言处理
topic
LDA
gensim
上一页
17
18
19
20
21
22
23
24
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他