gensim 第24页

基于gensim模块的中文句子相似度计算工具

概述中文句子相似度的计算有很多模型，我们使用TFIDF,LSI与LDA模型这3中模型更加适用于文章相似度的计算对于句子来说，长度太短，正确率相对不高算法及代码具体这几种模型的原理介绍可以参考别人的博客 http://www.52nlp.cn/%E5%A6%82%E4%BD%95%E8%AE%A1%E7%AE%97%E4%B8%A4%E4%B8%AA%E6%96%87%E6%A1%A3%E7%9A%

wds2006sdo·2016-04-05 00:00

[python] LDA处理文档主题分布代码入门笔记

gensim下载地址：https://

Eastmount·2016-03-09 03:00

[python] LDA处理文档主题分布代码入门笔记

gensim下载地址：https://

Eastmount·2016-03-09 03:00

word2vec词向量训练及中文文本相似度计算

官网C语言下载地址：http://word2vec.googlecode.com/svn/trunk/官网Python下载地址：http://radimrehurek.com/gensim/models

Eastmount·2016-02-18 00:41

word2vec词向量训练及中文文本相似度计算

官网C语言下载地址：http://word2vec.googlecode.com/svn/trunk/官网Python下载地址：http://radimrehurek.com/gensim/models

Eastmount·2016-02-18 00:00

word2vec词向量训练及中文文本相似度计算

官网C语言下载地址：http://word2vec.googlecode.com/svn/trunk/官网Python下载地址：http://radimrehurek.com/gensim/models

Eastmount·2016-02-18 00:00

文本分析之TFIDF/LDA/Word2vec实践

写在最前面的话，最好的学习材料是官方文档及API:http://radimrehurek.com/gensim/tutorial.htmlhttp://radimrehurek.com/gensim/apiref.html

vs412237401·2016-02-03 10:00

深度学习：使用 word2vec 和 gensim

gensim官网：http://radimrehurek.com/gensim/index.htmlWord2vec:thegood,thebad(andthefast)Google发布了一些无监督深度学习算法

chvalrous·2016-01-06 17:28

linux下安装gensim的方法。

.确保SciPy>=0.7NumPy安装语句 sudoapt-getinstallpython-numpySciPy安装语句sudo apt-getinstallpython-scipy接着就可以安装gensim

u011954647·2015-12-03 17:00

Python 文本挖掘：使用gensim进行文本相似度计算

在文本处理中，比如商品评论挖掘，有时需要了解每个评论分别和商品的描述之间的相似度，以此衡量评论的客观性。评论和商品描述的相似度越高，说明评论的用语比较官方，不带太多感情色彩，比较注重描述商品的属性和特性，角度更客观。那么Python里面有计算文本相似度的程序包吗，恭喜你，不仅有，而且很好很强大。这是从52nlp大神的博客里面发现的，其实具体的处理流程和程序和他的基本一致，只要仔细研读他的这几篇博客

chencheng126·2015-11-27 14:00

转：Python 文本挖掘：使用gensim进行文本相似度计算

Python使用gensim进行文本相似度计算转于：http://rzcoding.blog.163.com/blog/static/2222810172013101895642665

·2015-11-13 07:34

word2vec的艰难成长史

1.首先在网站上面下载gensim，我是在11服务器上面下载的 2.使用winpython打开 3.在command windows 下使用pip install gensim这句话进行，原先使用这句话

·2015-11-11 09:32

windows/linux 安装gensim简易方法

//blog.csdn.net/hereiskxm/article/details/49424799为了使用wiki百科来训练模型（中英文维基百科语料上的Word2Vec实验）我需要安装python和gensim

kexinmei·2015-10-26 15:00

word2vec的艰难成长史

1.首先在网站上面下载gensim，我是在11服务器上面下载的2.使用winpython打开3.在commandwindows下使用pipinstallgensim这句话进行，原先使用这句话pipinstall-Ugensim

cuilijuan02·2015-08-26 15:53

sklearn、nltk、gensim语料输入对比之nltk

经过测试，nltk虽然有包装了sklearn的SklearnClassifier，但是还是很局限，我在测试随机森林分类器时就出现了运行错误，因此建议整个流程都使用nltk！nltk的数据集中每条记录的特征是通过自定义的特征提取方法获得的。每条记录的特征是一个字典对象，每个字典对象元由特征名称和对应的值组成。例如defgender_features(word): return{'last_lette

xuxiuning·2015-08-24 19:00

sklearn、nltk、gensim语料输入对比之sklearn

sklearn语料处理：sklearn的sklearn.datasets.load_files方法支持从目录读取所有分类好的文本。不过目录必须按照一个文件夹一个标签名的规则放好。比如本文使用的数据集共有2个标签，一个为“net”，一个为“pos”，每个目录下面有6个文本文件。目录如下所示：neg1.txt2.txt……pos1.txt2.txt….12个文件的内容汇总起来如下所示：neg: shi

xuxiuning·2015-08-24 13:00

Gensim学习笔记-2-理解Gensim中的Corpus对象

所有corpora.xxxcorpus中的对象均继承接口gensim.interfaces.CorpusABC一个语料库对象（corpus）是一个可迭代的对象，每次迭代得到一篇文档（document）一个

xuxiuning·2015-08-17 14:00

Gensim学习笔记-1--理解corpora.Dictionary

gensim使用python标准的logging包，引入方式为：importlogginglogging.basicConfig(format=’%(asctime)s:%(levelname)s:%(

xuxiuning·2015-08-17 09:00

windows下安装python拓展包

linux和windows下安装python拓展包-pycharm、numpy、scipy、matplotlib、scikit、gensim、PIL、OpenCV、django、pythonqt...http

hzyido·2015-07-25 23:03

利用gensim主题模型寻找相似的coursera课程

参考http://www.52nlp.cn/如何计算两个文档的相似度三#encoding=utf-8 fromnltk.tokenizeimportword_tokenize fromnltk.corpusimportstopwords fromnltk.stem.lancasterimportLancasterStemmer courses=[line.strip()forlineinfile

kesonyk·2015-06-26 15:00

gensim的LSI模型来计算文档的相似度

fromgensimimportcorpora,models,similarities dictionary=corpora.Dictionary.load('/tmp/deerwester.dict'

kesonyk·2015-06-26 01:00

gensim的主题模型LSI

将上问的输入文档归为两个主题fromgensimimportcorpora,models,similarities dictionary=corpora.Dictionary.load('/tmp/deerwester.dict

kesonyk·2015-06-26 00:00

使用gensim计算文档的相似度

gensim是一个主题模型的python库，可以在官网下载http://radimrehurek.com/gensim/index.html以下代码使用gensim来计算文档之间的相关性，使用的是tfidf

kesonyk·2015-06-25 23:00

主题模型TopicModel：通过gensim实现LDA

http://blog.csdn.net/pipisorry/article/details/46447561使用pythongensim轻松实现lda模型。

-柚子皮-·2015-06-10 22:18

小谈gensim

gensim是一个用于主题分析（LSI/LDA）的工具包。它的强大，在于大量使用了矩阵运算（速度比循环判断快），提供了基本上一整套的主题建模、相似判断、分布式训练、甚至是可以进行相似判断的服务器。

junGle·2015-03-16 11:00

gensim话题模型初体验

NeilZhu，IDNot_GOD，UniversityAI创始人&ChiefScientist，致力于推进世界人工智能化进程。制定并实施UAI中长期增长战略和目标，带领团队快速成长为人工智能领域最专业的力量。作为行业领导者，他和UAI一起在2014年创建了TASA（中国最早的人工智能社团）,DLCenter（深度学习知识中心全球价值网络），AIgrowth（行业智库培训）等，为中国的人工智能人才

朱小虎XiaohuZhu·2014-12-31 17:54

TopicModel主题模型 - LDA的python实现及参数选择

http://blog.csdn.net/pipisorry/article/details/42129099一、使用gensimpython拓展包1.installgensim，sklearn,nltk2

pipisorry·2014-12-24 21:00

nltk-构建和使用语料库-可用于小说的推荐-完整实例

python #-*-coding=utf-8-*- #数据源目录(二级目录) sourceDataDir='data' #数据源文件列表 fileLists = [] import os from gensim

深蓝苹果·2014-09-26 18:00

gensim-5个学习阶段

阶段1--语料库和向量http://radimrehurek.com/gensim/tut1.html*建立语料库步骤 1.从字符串==>向量 2.去除停用词；去除出现次数=1的词； 3.

深蓝苹果·2014-09-18 12:00

自然语言处理-感述

最近花了点时间学习nlp--实际只是学习使用nltk和伴随它出现的gensim。

深蓝苹果·2014-09-17 18:00

Python 文本挖掘：使用gensim进行文本相似度计算

转自：http://rzcoding.blog.163.com/blog/static/2222810172013101895642665/在文本处理中，比如商品评论挖掘，有时需要了解每个评论分别和商品的描述之间的相似度，以此衡量评论的客观性。评论和商品描述的相似度越高，说明评论的用语比较官方，不带太多感情色彩，比较注重描述商品的属性和特性，角度更客观。那么Python里面有计算文本相似度的程序包

fennvde007·2014-06-23 11:00

如何计算两个文档的相似度（三）

上一节我们用了一个简单的例子过了一遍gensim的用法，这一节我们将用课程图谱的实际数据来做一些验证和改进，同时会用到NLTK来对课程的英文数据做预处理。

fennvde007·2014-06-12 11:00

如何计算两个文档的相似度（二）

上一节我们介绍了一些背景知识以及gensim,相信很多同学已经尝试过了。这一节将从gensim最基本的安装讲起，然后举一个非常简单的例子用以说明如何使用gensim，下一节再介绍其在课程图谱上的应用。

fennvde007·2014-06-12 11:00

如何计算两个文档的相似度（三）

上一节我们用了一个简单的例子过了一遍gensim的用法，这一节我们将用课程图谱的实际数据来做一些验证和改进，同时会用到NLTK来对课程的英文数据做预处理。

niujin1212·2014-04-04 11:00

如何计算两个文档的相似度（二）

上一节我们介绍了一些背景知识以及gensim ,相信很多同学已经尝试过了。

niujin1212·2014-04-04 11:00

关注的一些博客

p=803http://shenfeng.me/resume/index.html一些开源库：http://radimrehurek.com/gensim/tutorial.htmlhttp://mymedialite.net

woshizhouxiang·2013-12-25 12:00

gensim试用

gensim试用gensim: http://radimrehurek.com/gensim/index.htmlGensimisafreePythonframeworkdesignedtoautomaticallyextractsemantictopicsfromdocuments

largetalk·2013-08-28 12:00

如何计算两个文档的相似度（三）

上一节我们用了一个简单的例子过了一遍gensim的用法，这一节我们将用课程图谱的实际数据来做一些验证和改进，同时会用到NLTK来对课程的英文数据做预处理。

52nlp·2013-06-07 22:00

如何计算两个文档的相似度（三）

上一节我们用了一个简单的例子过了一遍gensim的用法，这一节我们将用课程图谱的实际数据来做一些验证和改进，同时会用到NLTK来对课程的英文数据做预处理。

52nlp·2013-06-07 14:00

python

今天看到52nlp用gensim做的文档相似度比较，觉得真是不错。哎，人家真是厉害，能把东西理解那么透彻，而且又能用浅显语言表达出来，真是深入浅出啊。佩服，学习。在家带孩子，希望能连续学点东西吧。

caoeryingzi·2013-05-28 23:00

Bloomfilter很好很强大

在文本预处理阶段，想要实现去停用词和去掉只出现一次的词这两个功能版本一：使用gensim上的python语句，基本上是遍历文本集了，两个阶段分别用1分钟和大于30分钟的时间（1800篇文章）实现是这样写的

pirage·2013-05-27 17:00

如何计算两个文档的相似度（二）

上一节我们介绍了一些背景知识以及gensim,相信很多同学已经尝试过了。这一节将从gensim最基本的安装讲起，然后举一个非常简单的例子用以说明如何使用gensim，下一节再介绍其在课程图谱上的应用。

52nlp·2013-05-27 12:00

推荐频道

gensim

基于gensim模块的中文句子相似度计算工具

[python] LDA处理文档主题分布代码入门笔记

[python] LDA处理文档主题分布代码入门笔记

word2vec词向量训练及中文文本相似度计算

word2vec词向量训练及中文文本相似度计算

word2vec词向量训练及中文文本相似度计算

文本分析之TFIDF/LDA/Word2vec实践

深度学习：使用 word2vec 和 gensim

linux下安装gensim的方法。

Python 文本挖掘：使用gensim进行文本相似度计算

转：Python 文本挖掘：使用gensim进行文本相似度计算

word2vec的艰难成长史

windows/linux 安装gensim简易方法

word2vec的艰难成长史

sklearn、nltk、gensim语料输入对比之nltk

sklearn、nltk、gensim语料输入对比之sklearn

Gensim学习笔记-2-理解Gensim中的Corpus对象

Gensim学习笔记-1--理解corpora.Dictionary

windows下安装python拓展包

利用gensim主题模型寻找相似的coursera课程

gensim的LSI模型来计算文档的相似度

gensim的主题模型LSI

使用gensim计算文档的相似度

主题模型TopicModel：通过gensim实现LDA

小谈gensim

gensim话题模型初体验

TopicModel主题模型 - LDA的python实现及参数选择

nltk-构建和使用语料库-可用于小说的推荐-完整实例

gensim-5个学习阶段

自然语言处理-感述

Python 文本挖掘：使用gensim进行文本相似度计算

如何计算两个文档的相似度（三）

如何计算两个文档的相似度（二）

如何计算两个文档的相似度（三）

如何计算两个文档的相似度（二）

关注的一些博客

gensim试用

如何计算两个文档的相似度（三）

如何计算两个文档的相似度（三）

python

Bloomfilter很好很强大

如何计算两个文档的相似度（二）