E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
lda主题模型
LDA
小改进(附源码)
首先通俗的解释下Topic模型
LDA
:假如我们需要写一篇关于新上市汽车的文章,首先需要确定文章大概的主题,比如要写这辆汽车的动力、外观、内饰。
chaaffff
·
2017-09-18 00:01
算法工程师面试
然后结合公司业务做得内容各不相同传统机器学习算法:感知机,SVM,LR,softmax,Kmeans,DBSCAN,决策树(CART,ID3,C45),GBDT,RF,Adaboost,xgboost,EM,BP神经网络,朴素贝叶斯,
LDA
HappyAngel19921027
·
2017-09-17 13:18
LDA
(
LDA
文档主题生成模型)
LDA
(LatentDirichletAllocation)是一种文档主题生成模型,也称为一个三层贝叶斯概率模型,包含词、主题和文档三层结构。
chaaffff
·
2017-09-15 06:40
三种常用降维方法的思想总结
一.判别分析降维
LDA
降维和PCA的不同是
LDA
是有监督的降维,其原理是将特征映射到低维上,原始数据的类别也能清晰的反应在低维的数据上,也就是低维的数据也可以用来判别分类。
wlj1107
·
2017-09-14 20:00
NLP中关键词的提取
一:关键词提取的方法有多种,分别如下:TF-IDF、
主题模型
、TestRank、rake二:首先来说一下TF-IDF:TF是词频,IDF是逆向文件频率,IDF起到给词赋予权重的作用。
gentelyang
·
2017-09-12 17:22
NLP
词级语言建模与字符级语言建模
在这种情况下,通过TF技术或者
主题模型
技术或者词嵌入模型来生成特征向量或字矢量,每个单词都用一个
chuange6363
·
2017-09-10 01:00
pyLDAvis基于gensim的
LDA
模型可视化
importgensimfromgensimimportmodelsimportpyLDAvis.gensimdeflda_vis():dictionary=gensim.corpora.Dictionary.load('
lda
.dict
代码猴
·
2017-09-05 14:03
自然语言处理
基于腾讯Angel的
LDA
*入选VLDB,超越微软LightLDA
腾讯TEG数据平台部和北京大学联合撰写的大规模
主题模型
系统的论文《
LDA
*:ARobustandLarge-scaleTopicModelingSystem》,入选了今年VLDB的ResearchTrack
腾讯开源
·
2017-09-04 00:00
开源项目介绍
[cvpr2017]Domain Adaptation by Mixture of Alignments of Second- or Higher-Order Scatter Tensors
三个散度矩阵:
LDA
上的三个散度矩阵introduction作者将自己的模型称为SecondorHigher-orderTransferofKnowledge(So-HoT),是一个对sourcedomain
MataFela
·
2017-08-31 21:13
机器学习
domain
adaptation
[cvpr2017]Domain Adaptation by Mixture of Alignments of Second- or Higher-Order Scatter Tensors
三个散度矩阵:
LDA
上的三个散度矩阵introduction作者将自己的模型称为SecondorHigher-orderTransferofKnowledge(So-HoT),是一个对sourcedomain
MataFela
·
2017-08-31 21:13
domain
adaptation
分类模型的再考以及随机森林的应用
一、进行分类建模前的准备在上一篇博客里我们应用了逻辑回归和
LDA
方法来判别|预测一个对象的分类,其中逻辑回归多应用于只有两种类型(Yes或者No)的分类,
LDA
可用于2种类型及2种以上类型的分类。
JohnSuperD
·
2017-08-31 15:44
市场调查
[cvpr2017]Joint Geometrical and Statistical Alignment for Visual Domain Adaptation
线性判别分析线性判别分析
LDA
原理总结三个散度矩阵:
LDA
上的三个散度矩阵introduction作者提出了一个称为JointGeometricalandStatisticalAlignment(JGSA
MataFela
·
2017-08-30 19:02
domain
adaptation
[cvpr2017]Joint Geometrical and Statistical Alignment for Visual Domain Adaptation
线性判别分析线性判别分析
LDA
原理总结三个散度矩阵:
LDA
上的三个散度矩阵introduction作者提出了一个称为JointGeometricalandStatisticalAlignment(JGSA
MataFela
·
2017-08-30 19:02
domain
adaptation
LDA
(
主题模型
)简介
LDA
(
主题模型
)1、基本概念
LDA
(LatentDirichletAllocation)是一种文档主题生成模型。
dextern
·
2017-08-29 21:07
机器学习
自然语言处理入门(6)——基于
LDA
的文章主题生成
1.
LDA
概述
LDA
(LatentDirichletAllocation)是一种文档主题生成模型,也称为一个三层贝叶斯概率模型,包含词、主题和文档三层结构。
飞鸟2010
·
2017-08-27 21:06
自然语言处理
机器学习----SVD
也可以加我的微博:@leftnoteasy前言:上一次写了关于PCA与
LDA
的文章,PCA的实现一般有两种,一种是用特征值分解去实现的,一种是用奇异值分解去实现的。在上篇文章中便是基于特征值分解的一
小白的进阶
·
2017-08-24 13:13
机器学习
机器学习
机器学习
Spark
LDA
实战
选取了10个文档,其中4个来自于一篇论文,3篇来自于一篇新闻,3篇来自于另一篇新闻。首先在pom文件中加入mysql-connector-java:mysqlmysql-connector-java5.1.6main函数:defmain(args:Array[String]):Unit={//连接MySQL数据库caseclassArticle(id:Int,article:String)case
MSTK
·
2017-08-13 15:00
基于
LDA
KNN的人脸识别详解
人脸识别(
LDA
+KNN方法):dataTrain=creatData(TrainDatabasePath);dataTest=creatData(TestDatabasePath);trainLabel
a微风掠过
·
2017-08-11 22:58
Arxiv网络科学论文摘要18篇(2017-08-08)
研发网络的兴衰;基于个人消费行为定价住宅电力;缺少使用SIS流行病迹的链接识别;网络动力学异质意见状态模型案例;
主题模型
的网络方法;多媒体网络上的通信频道交替的社会传染;具有反射的毫米波蜂窝网络中的覆盖分析
ComplexLY
·
2017-08-08 09:40
Gensim-TFIDF,
LDA
,LSI实战
介绍Gensim能很方便的分析文本,包括了TFIDF,
LDA
,LSA,DP等文本分析方法词典与词库首先将文本处理生成dictionary和corpus。
yuquanle
·
2017-08-07 11:39
nlp
代码笔记
NLP问题特征表达基础 - 语言模型(Language Model)发展演化历程讨论
这里面就包括如图中所示的模型和算法,包括:(1)文本层:NLP文本表示;(2)文本-感知世界:词汇相关性分析、
主题模型
、意见情感分析等;(3)文本-真实
郑瀚Andrew.Hann
·
2017-08-03 15:00
PCA降维——主成分分析(principal component analysis,PCA)与
LDA
(线性判别分析)
LDA
是一种监督学习的降维技术,也就是说它的数据集的每个样本是有类别输出的。这点和PCA不同。PCA是不考虑样本类别输出的无监督降维技术。
ali_dongdong
·
2017-07-31 10:58
LDA
漫游系列(五)-基于Gibbs Sampling的
LDA
模型
我们日常生活中总是产生大量的文本,如果每一个文本存储为一篇文档,那么每篇文丹从人的观察来说就是有序的词的序列d=(w1,w2,...wn).统计文本建模的目的就是追问这些观察到的语料库中的词序列是如何生成的,统计学被人们描述为猜测上帝的游戏,人类产生的所有语料文本我们都可以看成是一个伟大的上帝在天堂上抛掷骰子生成的,我们观察到的只是上帝玩这个游戏的结果-词序列构成的语料,而上帝玩这个游戏的过程对我
文哥的学习日记
·
2017-07-30 19:36
线性判别分析简明入门教程
原文:http://sebastianraschka.com/Articles/2014_python_
lda
.html编译:AsherLi注1:文中出现了线性代数术语“eigenvalue”“eigenvector
asher_lithium
·
2017-07-29 11:31
机器学习/深度学习
脑电信号处理
Numpy中的矩阵乘法问题
最近参加的一个Program,主题是生物识别,其中的PCA/
LDA
特征值提取部分需要大量用到线性代数矩阵论的知识,但是稍不注意numpy中的乘法规则就很容易得到错误的结果,最终导致后续结果的崩盘,尤其是较大规模的矩阵
CodingQK
·
2017-07-27 22:54
Python
NLP —— 图模型(三)pLSA(Probabilistic latent semantic analysis,概率隐性语义分析)模型
LSA(Latentsemanticanalysis,隐性语义分析)、pLSA(Probabilisticlatentsemanticanalysis,概率隐性语义分析)和
LDA
(LatentDirichletallocation
Determined22
·
2017-07-26 09:00
机器学习-学习笔记 学习总结归纳(第六周)
线性判别分析
LDA
的思想先给定一个数据集具体定义如下当满足思想的时候,
DLNU-linglian
·
2017-07-21 14:12
MATLAB
机器学习-学习笔记 神经网络
线性判别分析
LDA
的思想先给定一个数据集具体定义如下当满足思想的时候,
DLNU-linglian
·
2017-07-20 22:33
机器学习
MATLAB
PLSA
主题模型
的EM算法推导
看论文顺便粗略学习了EM算法和PLSA
主题模型
,鉴于刚入门,本文不对其原理进行深入探讨,主要针对其中的公式推导详细说明一下。
Bahuia
·
2017-07-17 22:46
自然语言处理
PLSA
em算法
EM算法
利用python对中文文本数据进行
LDA
训练、计算概率距离
数据来自于“豆瓣读书”25名用户标注图书的一些标签(已经过分词、去停用词、去除不规范的标签),目的主要是通过对标签利用
LDA
得出25名用户在各主题上的概率分布,然后利用JS散度计算概率距离,从而计算25
无敌最最俊朗
·
2017-07-17 17:09
python
LDA
JS散度
Spark机器学习(8):
LDA
主题模型
算法
1.
LDA
基础知识
LDA
(LatentDirichletAllocation)是一种
主题模型
。
LDA
一个三层贝叶斯概率模型,包含词、主题和文档三层结构。
MSTK
·
2017-07-12 12:00
LDAP架构部署认证
LDAP的核心规范在RFC中都有定义,所有与LDAP相关的RFC都可以在LDAPmanRFC网页中找到
lda
xuqizhang
·
2017-07-10 14:21
SVN
LDAP
《机器学习》学习笔记九
主题模型
之
LDA
关于
主题模型
LDA
,主要参考了博文http://blog.csdn.net/v_JULY_v/article/details/41209515,并进行了总结。
willer0619
·
2017-07-01 23:58
机器学习
2017.06.22:
LDA
与困惑度代码
LDA
代码:classLDAModel(object):def__init__(self,dpre):self.dpre=dpre#获取预处理参数##模型参数#聚类个数K,迭代次数iter_times,
傻瓜菜的傻瓜菜地
·
2017-06-22 11:28
学习笔记
程序代码
机器学习
线性判别分析
LDA
的多个python实现
在这里就不说明
LDA
的原理了,不懂的同学可以百度找相关资料学。这里直接给出楼主的python实现,以及搜索到的其他实现。
Jiede1
·
2017-06-19 22:59
机器学习
python学习
OpenLDAP的安装与基本配置(一)
通常,在实际工作环境中,都会通过
LDA
skypeGNU1
·
2017-06-17 13:36
Open
LDAP
Linux中级
机器学习:线性判别式分析(
LDA
)
1.概述线性判别式分析(LinearDiscriminantAnalysis),简称为
LDA
。
lc19861217
·
2017-06-13 14:00
深入浅出讲解
LDA
主题模型
(一)
最近总是遇到
主题模型
LDA
(LatentDirichletAllocation),网上的博客写的天花乱坠而不知所以然,无奈看了最厚的《
LDA
数学八卦》,观完略通一二,记录于此~顺便放两张遇到的图,挺有意思的
这题我会啊
·
2017-06-13 11:10
data-mining
矩阵奇异值分解(SVD)及其应用
原文地址:http://www.cnblogs.com/LeftNotEasy/archive/2011/01/19/svd-and-applications.html前言:上一次写了关于PCA与
LDA
CC丶Z
·
2017-06-09 16:59
math
NLP 主题抽取 Topic
LDA
代码实践 gensim包 代码
[Mr.Scofieldhttp://blog.csdn.net/scotfield_msn/article/details/72904651]FromRxNLP.分享一个代码实践:用gensim包的
LDA
Scofield_Phil
·
2017-06-07 22:13
NLP
Notes—Latent Dirichlet Allocation,
LDA
主题模型
【数学之美】……未完待续……ref:1、★★★★★★★★★★通俗理解
LDA
主题模型
★★★★★★★★★★2、
主题模型
-
LDA
浅析3、搜索背后的奥秘――浅谈语义主题计算4、
主题模型
TopicModel:
主题模型
code_caq
·
2017-06-03 13:02
NLP
Notes
Notes—
LDA
中的gamma函数和几个分布
ref:http://blog.csdn.net/v_JULY_v/article/details/41209515(详细推导见该链接)
LDA
模型中用到的数学知识:一个函数:gamma函数四个分布:二项分布
code_caq
·
2017-06-03 10:24
NLP
Notes
LDA
通俗理解
LDA
主题模型
转自:http://blog.csdn.net/v_july_v/article/details/41209515#t13 通俗理解
LDA
主题模型
0前言 印象中,最开始听说“
LDA
”这个名词,是缘于
u011331731
·
2017-06-02 09:00
自然语言处理入门(1)——文本相似度计算
文本相似度常用的计算方法有TF-IDF、LSI、
LDA
等。
FlySky1991
·
2017-05-27 23:00
自然语言处理
文本相似度
LDA
lsi
TF-IDF
用scikit-learn学习
LDA
主题模型
在
LDA
模型原理篇我们总结了
LDA
主题模型
的原理,这里我们就从应用的角度来使用scikit-learn来学习
LDA
主题模型
。
刘建平Pinard
·
2017-05-26 15:00
Hive设置连接用户名和密码
authenticationCUSTOMExpectsoneof[nosasl,none,ldap,kerberos,pam,custom].Clientauthenticationtypes.NONE:noauthenticationcheckLDAP:
LDA
Kerry___
·
2017-05-22 17:09
分布式系统
hadoop
hive
大数据
文本
主题模型
之
LDA
(三)
LDA
求解之变分推断EM算法
文本
主题模型
之
LDA
(一)
LDA
基础文本
主题模型
之
LDA
(二)
LDA
求解之Gibbs采样算法文本
主题模型
之
LDA
(三)
LDA
求解之变分推断EM算法本文是
LDA
主题模型
的第三篇,读这一篇之前建议先读文本
主题模型
之
刘建平Pinard
·
2017-05-22 12:00
文本
主题模型
之
LDA
(二)
LDA
求解之Gibbs采样算法
文本
主题模型
之
LDA
(一)
LDA
基础文本
主题模型
之
LDA
(二)
LDA
求解之Gibbs采样算法文本
主题模型
之
LDA
(三)
LDA
求解之变分推断EM算法本文是
LDA
主题模型
的第二篇,读这一篇之前建议先读文本
主题模型
之
刘建平Pinard
·
2017-05-18 10:00
LDA
主题模型
困惑度计算
对于
LDA
模型,最常用的两个评价方法困惑度(Perplexity)、相似度(Corre)。其中困惑度可以理解为对于一篇文章d,所训练出来的模型对文档d属于哪个主题有多不确定,这个不确定成都就是困惑度。
happy~
·
2017-05-12 10:00
LDA
Jgibbslda
以下代码是Jibbslda中计算(文档-主题)和(主题-词)矩阵的代码实现计算Theta(文档-主题)nd[m][k]是文档m被分配到主题k的单词数量ndsum[m]是文档m中单词的数量K*trnModel.alpha//因为所有的alpha,beta是一样的所以,K*alpha为所有alpha的和publicvoidcomputeTheta(){for(intm=0;m
中天剑j
·
2017-05-09 15:11
单词
主题
public
LDA
上一页
44
45
46
47
48
49
50
51
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他