E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
lda主题模型
本文建模系列值三:
LDA
感悟
LDA
:LatentDirichletAllocation 是一个很著名的文本模型,最初是在2003年被一群大牛提出的,包括DavidM.Blei 、AndrewY.Ng等。
u010223750
·
2016-05-06 21:00
主题模型
LDA
文本建模系列之二:pLSA
之所以说是probabilistic,是因为这个模型中还加入了一个隐变量:主题Z,也正因为此,它被称之为
主题模型
。 在pLSA中,一片文档可能有多个主题
u010223750
·
2016-05-06 21:00
主题模型
文本建模系列之一:LSA
文本建模是自然语言处理领域中很基础的内容,而且也已经被研究了千万遍,这个系列我主要的思路是从LSA->pLSA->unigrammodel->
LDA
,其中pLSA和
LDA
都是主
u010223750
·
2016-05-06 21:00
主题模型
LSA
基于gibbsLDA的文本分类
阅读更多之前几篇文章讲到了文档
主题模型
,但是毕竟我的首要任务还是做分类任务,而涉及
主题模型
的原因主要是用于textrepresentation,因为考虑到TopicModel能够明显将文档向量降低维度,
u010223750
·
2016-05-06 15:00
LDA
文本分类
基于gibbsLDA的文本分类
之前几篇文章讲到了文档
主题模型
,但是毕竟我的首要任务还是做分类任务,而涉及
主题模型
的原因主要是用于textrepresentation,因为考虑到TopicModel能够明显将文档向量降低维度,当然TopicModel
u010223750
·
2016-05-06 15:00
文本分类
LDA
基于gibbsLDA的文本分类
阅读更多之前几篇文章讲到了文档
主题模型
,但是毕竟我的首要任务还是做分类任务,而涉及
主题模型
的原因主要是用于textrepresentation,因为考虑到TopicModel能够明显将文档向量降低维度,
u010223750
·
2016-05-06 15:00
LDA
文本分类
hrbust/哈理工oj 1042 过河卒【记忆化搜索】
TotalSubmit:162(35users)TotalAccepted:34(22users)Rating: SpecialJudge: No DescriptionLda学会了中国象棋,在一次与Kevin的切磋中,
Lda
mengxiang000000
·
2016-05-05 17:00
1042
1042
hrbust
哈理工oj
推荐系统中隐语义模型
隐语义模型LFM和LSI,
LDA
,TopicModel其实都属于隐含语义分析技术,是一类概念,他们在本质上是相通的,都是找出潜在的主
ZhikangFu
·
2016-05-03 21:00
Gaussian
LDA
(2): Gaussian
LDA
简介
LatentDirichletAllocation(
LDA
)是一个
主题模型
,能够对文本进行建模,得到文档的主题分布。但是
LDA
得到的每个主题是一个在词项上的多项分布,这个分布非常稀疏。
clear-
·
2016-04-29 11:46
文本建模
基于fisher线性判别法的分类器设计
选择fisher判别法的原因主要是想学习一下这个方法,这个方法属于线性判别法,操作起来和
lda
判别法近乎没啥区别。
slheluo
·
2016-04-28 22:56
模式识别
本文建模系列值三:
LDA
感悟
LDA
:LatentDirichletAllocation是一个很著名的文本模型,最初是在2003年被一群大牛提出的,包括DavidM.Blei、AndrewY.Ng等。
u010223750
·
2016-04-27 23:00
LDA
文本建模系列之二:pLSA
之所以说是probabilistic,是因为这个模型中还加入了一个隐变量:主题Z,也正因为此,它被称之为
主题模型
。 在pLSA中,一片文档可能有多个主题
u010223750
·
2016-04-26 20:00
PLSA
文本建模
文本建模系列之一:LSA
文本建模是自然语言处理领域中很基础的内容,而且也已经被研究了千万遍,这个系列我主要的思路是从LSA->pLSA->unigrammodel->
LDA
,其中pLSA和
LDA
都是主
u010223750
·
2016-04-26 16:00
文本模型
让机器搞懂100万种隐含语义 腾讯Peacock模型全揭秘
编者按:
LDA
是一个简洁、优雅、实用的隐含
主题模型
,腾讯效果广告平台部(广
Real_Myth
·
2016-04-25 10:00
在Python中使用
LDA
处理文本
[翻译]在Python中使用
LDA
处理文本发表于2个月前(2016-02-1716:10) 阅读(78) | 评论(0) 1人收藏此文章, 我要收藏目录[-]安装示例说明:原文:http://chrisstrelioff.ws
Real_Myth
·
2016-04-25 09:00
朴素贝叶斯的实际应用
1.应用环境需求是将爬虫的数据的content部分在预处理的环节中进行分类打上标签,可以考虑的分类方法有很多种,svm,
lda
等等,这里使用朴素贝叶斯,因为相对简单容易上手。
fzu_rookie
·
2016-04-19 17:49
设计模式
初试
主题模型
LDA
-基于python的gensim包
LDA
是文本挖掘中常用的
主题模型
,用来从大量文档中提取出最能表达各个主题的一些关键词,具体算法原理可参阅KM上相关文章。
a_step_further
·
2016-04-18 08:00
Latent Dirichlet Allocation
主题模型
LDA
是一个
主题模型
,关于
主题模型
的解释有个很通俗的例子:第一个是:“乔布斯离我们而去了。”第二个是:“苹果价格会不会降?”
Lansing999
·
2016-04-16 21:00
NLP
LDA
主题模型
语义分析
xxxxxx(1):
LDA
回顾以及变分EM
LatentDirichletAllocation(
LDA
)是一个
主题模型
,能够对文本进行建模,得到文档的主题分布。
u011414416
·
2016-04-16 15:00
主题模型
LDA
变分EM
线性判别分析(
LDA
)模型
线性判别分析(LinearDiscriminantAnalysis)简称
LDA
,是分类算法中的一种。
LDA
通过对历史数据进行投影,以保证投影后同一类别的数据尽量靠近,不同类别的数据尽量分开。
czp11210
·
2016-04-15 14:00
【问题跟踪】KryoException: java.io.IOException: No space left on device
今天在对
LDA
进行不同参数训练模型,记录其avglogLikelihood和logPerplexity,以便判断模型训练是否收敛时,产生了一个令人极度崩溃的事儿:程序在辛辛苦苦跑了7.3h后...挂了!
yhao2014
·
2016-04-15 10:00
spark
LDA
LDA
和PCA算法
阅读更多1.问题之前我们讨论的PCA、ICA也好,对样本数据来言,可以是没有类别标签y的。回想我们做回归时,如果特征太多,那么会产生不相关特征引入、过度拟合等问题。我们可以使用PCA来降维,但PCA没有将类别标签考虑进去,属于无监督的。比如回到上次提出的文档中含有“learn”和“study”的问题,使用PCA后,也许可以将这两个特征合并为一个,降了维度。但假设我们的类别标签y是判断这篇文章的to
xjnine
·
2016-04-14 16:00
classification
基于Apache Spark的机器学习及神经网络算法和应用
技术课堂上,英特尔公司软件开发工程师王以恒分享了《基于ApacheSpark的机器学习及神经网络算法和应用》的课程,介绍了大规模分布式机器学习在欺诈检测、用户行为预测(稀疏逻辑回归)中的实际应用,以及英特尔在
LDA
周建丁
·
2016-04-14 00:26
基于spark mllib的
LDA
模型训练源码解析
一直想写一篇关于
LDA
模型训练的源代码走读,但是因为个人水平以及时间原因未能如愿,今天想起来就记录了一下源码走读过程。有什么解释的不太清楚或者错误的地方请大家指正。
yhao2014
·
2016-04-13 17:00
源码
spark
机器学习
LDA
Stanford Topic Modeling Toolbox0.4.0翻译
本文内容翻译自 http://nlp.stanford.edu/software/tmt/tmt-0.4/推荐一本书《
LDA
漫游指南》,对
LDA
的原理、应用均进行了详尽的介绍。
re_virtual
·
2016-04-13 17:11
信息检索
【机器学习详解】矩阵奇异值分解(SVD)及其应用
本文转载自: LeftNotEasy发布于http://leftnoteasy.cnblogs.com前言: 上一次写了关于PCA与
LDA
的文章,PCA的实现一般有两种,一种是用特征值分解去实现的
luoshixian099
·
2016-04-10 09:00
机器学习
SVD
奇异值分解
通俗理解
LDA
主题模型
本文转载自July的CSDN博客,仅作为知识记录所用,原文链接:http://blog.csdn.net/v_july_v/article/details/412095150前言 印象中,最开始听说“
LDA
yhao2014
·
2016-04-08 17:00
机器学习
LDA
基于gensim模块的中文句子相似度计算工具
概述中文句子相似度的计算有很多模型,我们使用TFIDF,LSI与
LDA
模型这3中模型更加适用于文章相似度的计算对于句子来说,长度太短,正确率相对不高算法及代码具体这几种模型的原理介绍可以参考别人的博客
wds2006sdo
·
2016-04-05 00:00
python
相似度计算
矩阵奇异值分解(SVD)及其应用
前言: 上一次写了关于PCA与
LDA
的文章,PCA的实现一般有两种,一种是用特征值分解去实现的,一种是用奇异值分解去实现的。在上篇文章中便是基于特征值分解的一种解释。
Losteng
·
2016-04-02 13:00
机器学习算法的Python实现 (1):logistics回归 与 线性判别分析(
LDA
)
本文主要包括:1、logistics回归2、线性判别分析(
LDA
)使用的python库:numpymatplotlibpandas使用的数据集:机器学习教材上的西瓜数据集3.0αIdxdensityratio_su
wzmsltw
·
2016-04-01 16:00
python
机器学习
文本语言模型的参数估计-最大似然估计、MAP及贝叶斯估计
以PLSA和
LDA
为代表的文本语言模型是当今统计自然语言处理研究的热点问题。这类语言模型一般都是对文本的生成过程提出自己的概率图模型,然后利用观察到的语料数据对模型参数做估计。
littleqqqqq
·
2016-03-29 19:00
PCA主成分分析过程及理论
在写这篇之前,我阅读了PCA、SVD和
LDA
。这几个模型相近,却都有自己的特点。本篇打算先介绍PCA,至于他们之间的关系,只能是边学边体会了。PCA以前也叫做Principa
YCH1035235541
·
2016-03-24 20:00
pca与svd的好文
本文由LeftNotEasy发布于http://leftnoteasy.cnblogs.com,前言: 上一次写了关于PCA与
LDA
的文章,PCA的实现一般有两种,一种是用特征值分解去实现的,一种是用奇异值分解去实现的
ivysister
·
2016-03-21 16:00
pca
SVD
无标题文章
本文主要摘抄整理自Rickjin的《
LDA
数学八卦》统计模拟中一个很重要的问题就是给定一个概率分布$p(x)$,我们如何在计算机中生成它的样本。
iV0id
·
2016-03-21 16:38
LDA
两类Fisher线性判别分析及python实现
参考:《模式识别》(第三版)第4.3章-Fisher线性判别分析机器学习中的数学(4)-线性判别分析(
LDA
),主成分分析(PCA):http://www.cnblogs.com/LeftNotEasy
u012005313
·
2016-03-19 23:00
python
机器学习
模式识别
LDA
机器学习:线性判别分析
LDA
更多见机器学习中的数学(4)-线性判别分析(
LDA
),主成分分析(PCA)红色的
ztf312
·
2016-03-19 21:00
SVD(二)
http://leftnoteasy.cnblogs.com,本文可以被全部的转载或者部分使用,但请注明出处,如果有问题,请联系
[email protected]
前言: 上一次写了关于PCA与
LDA
littleqqqqq
·
2016-03-16 16:00
[python]
LDA
处理文档主题分布及分词、词频、tfidf计算
这篇文章主要是讲述如何通过
LDA
处理文本内容TXT,并计算其文档主题分布,主要是核心代码为主。
Eastmount
·
2016-03-15 02:26
机器学习
知识图谱
知识图谱
web数据挖掘及NLP
[python]
LDA
处理文档主题分布及分词、词频、tfidf计算
这篇文章主要是讲述如何通过
LDA
处理文本内容TXT,并计算其文档主题分布,主要是核心代码为主。
Eastmount
·
2016-03-15 02:00
python
图像
LDA
TFIDF
文本主题分布
[python]
LDA
处理文档主题分布代码入门笔记
以前只知道
LDA
是个好东西,但自己并没有真正去使用过。同时,关于它的文章也非常之多,推荐大家阅读书籍《
LDA
漫游指南》,最近自己在学习文档主题分布和实体对齐中也尝试使用
LDA
进行简单的实验。
Eastmount
·
2016-03-09 03:00
python
代码分析
LDA
入门介绍
主题分布
[python]
LDA
处理文档主题分布代码入门笔记
以前只知道
LDA
是个好东西,但自己并没有真正去使用过。同时,关于它的文章也非常之多,推荐大家阅读书籍《
LDA
漫游指南》,最近自己在学习文档主题分布和实体对齐中也尝试使用
LDA
进行简单的实验。
Eastmount
·
2016-03-09 03:00
python
代码分析
LDA
入门介绍
主题分布
SK-Learn使用NMF(非负矩阵分解)和
LDA
(隐含狄利克雷分布)进行话题抽取
英文链接:http://scikit-learn.org/stable/auto_examples/applications/topics_extraction_with_nmf_
lda
.html这是一个使用
ZH奶酪
·
2016-03-08 14:00
主题模型
(一)简介1.
主题模型
是对文本中隐含主题的一种建模方法;每个主题其实是词表上单词的概率分布;2.
主题模型
是一种生成模型,一篇文章的每个词都是通过“以一定概率选择了某个主题,并从这个主题中以一定概率选择某个词语
zakexu
·
2016-03-06 11:59
自然语言处理
把几个降维的算法(FA PCA SVD ICA LPP
LDA
)归纳一下
因子分析(FA)因子分析其实就是认为高维样本点实际上是由低维样本点经过高斯分布、线性变换、误差扰动生成的,因此高维数据可以使用低维来表示(本质上就是一种降维算法)。因子分析(factoranalysis)是一种数据简化的技术。它通过研究众多变量之间的内部依赖关系,探求观测数据中的基本结构,并用少数几个假想变量来表示其基本的数据结构。这几个假想变量能够反映原来众多变量的主要信息。原始的变量是可观测的
qiusuoxiaozi
·
2016-03-05 20:39
machine
learning
把几个降维的算法(FA PCA SVD ICA LPP
LDA
)归纳一下
因子分析(FA)因子分析其实就是认为高维样本点实际上是由低维样本点经过高斯分布、线性变换、误差扰动生成的,因此高维数据可以使用低维来表示(本质上就是一种降维算法)。因子分析(factoranalysis)是一种数据简化的技术。它通过研究众多变量之间的内部依赖关系,探求观测数据中的基本结构,并用少数几个假想变量来表示其基本的数据结构。这几个假想变量能够反映原来众多变量的主要信息。原始的变量是可观测的
qiusuoxiaozi
·
2016-03-05 20:00
算法
降维算法
opencv 一堆算法,图像处理等
1675453数据挖掘十大经典实用算法及OpenCV算法 http://www.xuebuyuan.com/2178605.html线性判别分析(LinearDiscriminantAnalysis,
LDA
donaldlee
·
2016-03-02 23:00
文本分类之降维技术之特征抽取之
LDA
线性判别分析
背景:为什么需要特征抽取? 基于的向量空间模型有个缺点,即向量空间中的每个关键词唯一地代表一个概念或语义单词,也就是说它不能处理同义词和多义词,然而实际情况是:一个词往往有多个不同的含义,多个不同的词可以代表一个概念。在这种情况下,基于的向量空间模型不能很好的解决这种问题。 特征抽取方法则可以看作从测量空间到特征空间的一种映射或变换,一般是通过构造一个特征评分函数,把测量空间的数据投影到特
u011955252
·
2016-03-02 09:00
LDA
特征抽取
线性判别分析
文本降维
LDA
(文档
主题模型
)
htmlLSAlatentsemanticanalysis映射词-文档到一个低维隐语义空间比较词和文档在低纬空间的相似性topic是Vocab上的概率分布(符合多项式分布)文档到主题的一个分布,主题到词库的分布,通过训练得到这两个分布模型plsa模型
LDA
bamn84711
·
2016-02-29 17:00
贝叶斯规则和
LDA
主题模型
共轭先验和共轭分布P(θ)先验分布、P(θ|X)后验分布、P(X|θ)似然函数。后验分布=先验分布*似然函数/P(X)使得先验分布和后验分布具有相同的形式,称他们是共轭分布;先验分布称为相应似然函数的共轭先验。似然函数是关于统计模型中的参数的函数,表示模型参数的似然性,用于在已知观测所得到的结果时,对模型的参数进行估计。Beta分布是二项分布的共轭先验分布;狄利克雷分布是多项式分布的共轭先验分布。
ae5555
·
2016-02-26 15:10
机器学习
Spark MLlib
LDA
基于GraphX实现原理及源码分析
LDA
背景
LDA
(隐含狄利克雷分布)是一个主题聚类模型,是当前主题聚类领域最火、最有力的模型之一,它能通过多轮迭代把特征向量集合按主题分类。目前,广泛运用在文本主题聚类中。
LDA
的开源实现有很多。
tanglizhe1105
·
2016-02-25 22:00
源码
spark
GraphX
MLlib
LDA
上一页
47
48
49
50
51
52
53
54
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他