以负熵为食

《Parameter estimation for text analysis》阅读笔记（五）

本文内容为Parameter estimation for text analysis阅读笔记第五篇，如有错误或疏漏之处，恳请各位批评指正！

简介：

Latent Dirichlet Allocation（LDA）是一种概率生成模型，它通过unsupervised learning的方式，去估计multinomial observations的properties。在文本建模中，LDA的方法被用于进行latent semantic analysis (LSA，用于寻找文本中的“主题”信息，而这样的主题信息被文本中一个个单词选择的noise给obsure了) task。第一次提出LSA的是Deerwester et al.，他们指出，文本中词汇共现的结构可以被用于挖掘隐含的主题结构（实际上，我们人类在只需要看到文本中出现了哪些词语（单纯就是看一个个离散的词语），就可以判断这篇文章的主题大概是什么）。反过来，这些隐含的主题表示可以被用于建模一些linguistic phenomena（例如，同义词或是一词多义）。这在信息检索领域有所应用：我们可以通过将用户查询的关键词与文本在meaning level上进行匹配（而不是机械地去匹配文本中是否有与查询关键词中的词汇一致的情况）。

LDA的方法与PLSA（probabilistic LSA）方法关系密切，可以说LDA是PLSA的extension。PLSA只能算是一种ML或MAP的estimator，而LDA定义了完整的一套generative process，并且Girolami and Kaban的研究显示了以Dir(1)为prior的LDA是一个fully Bayesian estimator。

1. 混合模型（Mixture model）

LDA是一个混合模型。那么什么是混合模型？首先我们有多个分布，我们的data就是从这多个分布中sample出来的，这就是混合模型。可能还需要解释：什么是“从多个分布中sample出来的”？其实，混合模型sample出data的方法是这样的：第一步：我们从多个分布中（依某一个概率）挑选一个分布出来；第二步：根据我们挑选出来的这个分布公式本身所表达的概率，从这个分布中sample一个data出来。因此我们可以把混合模型表示成多个分布的“加权”形式，其中的“权重”就是这里“第一步”中用于挑选某个分布的概率。在LDA中，一个单词可以从某一个特定的“topic”中生成，而每一个topic拥有一个特有的单词分布，这里每一个topic的单词分布都是我们要进行加权的对象。因此LDA中生成某一个单词的概率可以表示为：

其中，是一个在特定topic k上，关于单词的multinomial distribution。我们可以把其中一个拿出来，那么这单独一个就是一个unigram model。而则表示单词w=t从topic k中生成的概率。

然而LDA并没有为corpus全局设定统一的topic的分布，而是为每一个document都设定了不同的topic的分布。因此，LDA inference就需要得到两方面的内容：

1.1. 每一个特定topic k下单词t的分布： $p(t|z=k)=\vec{\phi}$

1.2. 每一个特定document m下topic的分布： $p(z|d=m)=\vec{\vartheta}_m$

所以需要估计的参数有 $\stackrel{\Phi}{\_}=\{\vec{\phi}_k\}_{k=1}^K$ 和 $\stackrel{\Theta}{\_}=\{\vec{\vartheta}_m\}_{m=1}^M$ .。并且这两组参数代表着words和documents的latent-semantic representation。

2. 生成模型 (Generative model)：

我们将LDA看作是一个生成的过程，以便之后引出LDA inference所需要的策略。LDA的BN表示如下图：

由上图可以进一步认识LDA所描述的生成过程：LDA生成了一个stream of observable words。这个stream被一个个document划分开来。

对每一个document而言，它首先sample出一个 $\vec{\vartheta}_m$ , 作为该document的topic proportion。然后通过此topic proportion，sample出每一个单词所对应的topic, 最后再通过topic-specific的单词分布 $\vec{\phi}_{z_{m,n}}$ sample出一个单词。其中topic-specific的单词分布 $\vec{\phi}_{k}$ 是global的，即它只会被sample一次，然后整个corpus将共用这一系列的topic-specific的单词分布。

有没有发现什么特别之处？这里一共有2个mixture models！并且这两个mixture models是套在一起的：

2.1. 对于每一个topic，它是由一个mixture model生成的：其中component是document-specific的topic proportion，是一个multinomial distribution；weight是topic proportion，服从的Dirichlet分布。

2.2. 对于每一个word，它是由一个mixture model生成的：其中component是topic-specific的单词分布（就是上文提到的那个只sample一次，整个corpus共用同一个的topic-word分布），服从multinomial distribution；weight是2.1中所提到的document-specific的topic proportion，服从multinomial distribution。

因此，这整个model不单纯是一个mixture model，它实际上是一个admixture model。

LDA的整个生成过程如下：

3. 似然 (Likelihoods)

通过LDA的BN，我们可以得到在given hyperparameters下，这些observed和hidden variables的联合概率公式：

$\LARGE p(\vec{w}_m,\vec{z}_m,\vec{\vartheta}_m,\stackrel{\Phi}{\_}|\vec{\alpha}, \vec{\beta})\\ =\prod_{n=1}^{N_m}p(w_{m,n}|\vec{\phi}_{z_{m,n}})p(z_{m,n}|\vec{\vartheta}_m)\cdot p(\vec{\vartheta}_m|\vec{\alpha})\\ \cdot p(\stackrel{\Phi}{\_}|\vec{\beta})$

这个公式实际上是在given hyperparameter的情况下，所有variables（hidden和observed）的likelihood。基于这个公式，我们可以导出其他的公式。因此，对于一个term t，它instantiate出来的某一个特定word $w_{m,n}$ 在given LDA parameters下的概率，可以通过marginalize $z_{m,n}$ 实现：

此式是关于word的mixture model。

由于无论是一个document $\vec{w}_m$ 或是是整个corpus $\mathcal{W}=\{\vec{w}_m\}_{m=1}^M$ ,它们的likelihood实际上都是各个i.i.d.的 $w_{m,n}$ 的joint likelihood形式：

$\LARGE p(\mathcal{W}|\stackrel{\Theta}{\_},\stackrel{\Phi}{\_})\\ =\prod_{m=1}^Mp(\vec{w}_m|\vec{\vartheta}_m,\stackrel{\Phi}{\_})=\prod_{m=1}^M\prod_{n=1}^{N_m}p(w_{m,n}|\vec{\vartheta}_m, \stackrel{\Phi}{\_})$

此时我们暂停一下，先别急着往下看（虽然原文中是直接叙述下文部分的）。但，我们为什么要求得word的likelihood？在回答这个问题前，我们必须清楚的一件事是：我们的目的是什么？进行文本的latent semantic analysis。那么我们怎么得到这些隐含的文本语义？通过我们模型中的参数： $\vec{\vartheta}_m$ (得到每一个document包含主题的情况，即document-level的meaning）和 $\stackrel{\Phi}{\_}$ （每一个主题的单词分布，即这个特定主题中，哪些单词出现的概率高，哪些出现的概率低）。

于是我们知道了我们的目的：即估计参数。那么我们就自然而言想通过Bayesian inference的方法，得到这些参数的后验分布（在given observations的时候）。那么，在LDA模型中，observations是什么？observations是我们的words，因此这些参数的后验分布实际上就是given 这些单词时的条件概率分布。

而在likelihood函数中，这些关系是反过来的：这些待估计的parameters是given出来的，而这些observations是likelihood中的自变量。所以，这也是为什么，我们需要在这里一步步，先构建构建单个单词的概率分布，再构建一堆单词的联合概率分布--likelihood。

4. 通过Gibbs sampling进行推断（Inference via Gibbs sampling）

虽然LDA的模型较为简单，但对于它的精确推断确是intractable的。解决这一问题的主要方法有3种：平均场变分EM、期望传播和Gibbs sampling。其中Gibbs sampling是一种简单的、用于高维模型（例如LDA）下的近似推断的方法，它是马尔科夫链蒙特卡洛(Markov-chain Monte Carlo, MCMC)模拟的一种特例。

MCMC方法通过Markov chain的平稳行为来模拟高维空间下随机变量的概率分布 $p(\vec{x})$ 。Markov chain首先会经历一个称为“burn-in period”的阶段（用以消除初始化参数的影响），而后进入平稳态。在平稳态上，chain的每一次transition都会生成一个样本，这个样本将服从概率分布 $p(\vec{x})$ 。作为MCMC方法的一个special case，Gibbs sampling方法在随机变量的每一个维度进行alternatively sampling（given其他所有的随机变量）。也就是说，每次在采样前，Gibbs sampling算法先会选出随机变量的一个维度，我们设为, 然后以除了之外，其余所有的随机变量（记为 $x_{\neg i}$ ）为condition，从而构造相应的distribution $p(x_i|x_{\neg i})$ ，称为“full conditional”，然后依照这个distribution对进行sample。

Gibbs sampling方法的叙述如下：

4.1. 选择随机变量的一个维度i

4.2. 从概率分布 $p(x_i|x_{\neg i})$ 中sample出一个出来

由以上算法我们可以看出，要想执行Gibbs sampling，我们首先要找到概率分布 $p(x_i|x_{\neg i})$ 的表达式。

首先我们引入如下公式：

$\LARGE p(x_i|x_{\neg i})=\frac{p(\vec{x})}{p(\vec{x}_{\neg i})}=\frac{p(\vec{x})}{\int p(\vec{x})\text{d}x_{ i}}, \vec{x}=\{{x_i,\vec{x}_{\neg i}}\}$

上式仅仅是一个基本公式，我们在下面会用到，但其中的符号与LDA model中的符号没有任何关系。

此时联想到一般情况下，我们采用inference的目的是什么？目的是，希望通过已知得到未知。已知就是evidence，这里记作 $\vec{x}$ , 未知是hidden variables，这里记作 $\vec{z}$ 。因此，对于处理含有latent variables的model时，Gibbs sampling中full conditionals的一般表达式为（同样需要注意的是，下面这个公式中的符号与LDA model中的符号没有任何对应关系，请勿混淆）：

$\LARGE p(z_i|\vec{z}_{\neg i}, \vec{x})=\frac{p(\vec{z},\vec{x})}{p(\vec{z}_{\neg i},\vec{x})}=\frac{p(\vec{z},\vec{x})}{\int_Z p(\vec{z},\vec{x})\text{d}z_i}$

当其中的latent variables $\vec{z}$ 是discrete的时候，分母中的积分号将被换为求和号。当对latent variables $\vec{z}$ 进行过充分sample之后，我们得到一系列sample后的结果： $\widetilde{\vec{z}_r}$ , 其中 $r\in[1,R]$ , R为采样的总样本数。于是我们可以对在inference中，latent variables的posterior做如下估计：

$\LARGE p(\vec{z}|\vec{x})\approx \frac{1}{R}\sum_{r=1}^R \delta(\vec{z}-\widetilde{\vec{z}_r})$

其中 $\large \delta$ 为Kronecker delta，并有： $\delta(\vec{u})=\{1\ \text{if}\ \vec{u}=\vec{0};0\ \text{otherwise}\}$

5. The collapsed LDA Gibbs sampler

我个人还是比较习惯用英文直接叙述某一个专有名词，这样比较一致（因为中文的翻译往往有不止一种版本，可能会有些杂乱）。

在LDA模型中，无法被observed到的部分有 $\stackrel{\Theta}{\_}$ 、 $\stackrel{\Phi}{\_}$ 和z, 而在Gibbs sampling中，由于我们只需要得到单词w和其相应的topic z即可， $\stackrel{\Theta}{\_}$ 和 $\stackrel{\Phi}{\_}$ 则完全可以由w和z的共现对统计推算得到，因此我们等于是将 $\stackrel{\Theta}{\_}$ 和 $\stackrel{\Phi}{\_}$ 给“collapsed”掉了。这也就是本节的Gibbs sampling中添加了一个“collapsed”的原因。因此呢，我们的后验分布就直接只针对topic进行估计：

$\LARGE p(\vec{z}|\vec{w})=\frac{p(\vec{z}, \vec{w})}{p(\vec{w})}=\frac{\prod_{i=1}^W p(z_i,w_i)}{\prod_{i=1}^W\sum_{k=1}^Kp(z_i=k,w_i)}$

实际上，只要我们能计算出这个式子，该问题就解决了。但是我们实际上难以计算该式中的分母（因为分母的加和项共有 $\LARGE K^W$ 项）。此时我们就可以采用Gibbs sampling的方法来解决这个问题。为了去估计上式 $p(\vec{z}|\vec{w})$ , Gibbs sampling的方法要求首先计算full conditional： $p(z_i|\vec{z}_{\neg i}, \vec{w})$ 。而又由4.2中第2个公式可以得知，如果我们想要计算这个full conditional, 那么就需要首先推导出该公式中分子上的joint distribution。

Joint distribution：

在LDA中，我们首先可以对这个Joint distribution进行分解：

$\LARGE p(\vec{w},\vec{z}|\vec{\alpha}, \vec{\beta})\\ =p(\vec{w}|\vec{z},\vec{\alpha},\vec{\beta})p(\vec{z}|\vec{\alpha},\vec{\beta})\\ =p(\vec{w}|\vec{z},\vec{\beta})p(\vec{z}|\vec{\alpha})$

上式中，第1行到第2行是联合概率密度公式推导的常规操作；第2行中的部分条件之所以能在第3行中省略，是由于：1. $\vec{\alpha}$ 和 $\vec{w}$ 在given $\vec{z}$ 的前提下是相互独立的；2. $\vec{z}$ 和 $\vec{\beta}$ 之间本身就是互相独立的。

其中，分解之后的第一个因子 $p(\vec{w}|\vec{z},\vec{\beta})$ 可以看作是给定每一个单词所属于的topic之后，生成每一个单词的概率。其中每一个单词生成的概率均服从multinomial distribution：

$\LARGE p(\vec{w}|\vec{z},\stackrel{\Phi}{\_})=\prod_{i=1}^Wp(w_i|z_i)=\prod_{i=1}^W\phi_{z_i,w_i}$

也就是说，每一个单词都可以看作，在given相应topic下的multinomial distribution（其中的parameters在given multinomial distribution的时候就已经确定好了）。而这种乘积的方式，其无非是先遍历了每一个单词，该单词所对应的topic，然后再在topic-word matrix去寻找相应的概率值。然而，这种表达方式中的乘积因子数毕竟是不定的，不方便处理，因此我们采用另一种表达方式：首先遍历topic-word矩阵中的每一个元素，然后统计与该元素相关的word-topic共现对的数量，作为这个乘积项的指数值，最终的表达式如下：

但是，不要忘了我们的最终目标还是要求： $p(\vec{w}|\vec{z},\vec{\beta})$ 。此时我们需要在上式的基础上对 $\stackrel{\Phi}{\_}$ 进行marginalizing：

$\LARGE p(\vec{w}|\vec{z},\vec{\beta})\\ =\int p(\vec{w}|\vec{z}, \stackrel{\Phi}{\_})p(\stackrel{\Phi}{\_}|\vec{\beta})\text{d}\stackrel{\Phi}{\_}\\ =\int \prod_{z=1}^K\frac{1}{\Delta(\vec{\beta})}\prod_{t=1}^V\phi_{z,t}^{n_z^{(t)}+\beta_t-1}\text{d}\vec{\phi}_z\\ =\prod_{z=1}^K\frac{\Delta(\vec{n}_z+\vec{\beta})}{\Delta(\vec{\beta})}, \vec{n}_z=\{n_z^{(t)}\}_{t=1}^V$

由上式的推导结果，可以看出，这个distribution可以被当作K个Dirichlet-multinomial models的乘积。这K个models就分别表示着K个topics。

类比于 $p(\vec{w}|\vec{z},\vec{\beta})$ 的计算，我们可以首先计算得出 $p(\vec{z}|\vec{\alpha})$ ：

$\LARGE p(\vec{z}|\stackrel{\Theta}{\_})=\prod_{i=1}^Wp(z_i|d_i)=\prod_{m=1}^M\prod_{k=1}^K\vartheta_{m,k}^{n_m^{(k)}}$

然后我们继续仿照上面的步骤，对 $\stackrel{\Theta}{\_}$ 进行integrate out的操作：

$\LARGE p(\vec{z}|\vec{\alpha})\\ =\int p(\vec{z}|\stackrel{\Theta}{\_})p(\stackrel{\Theta}{\_}|\vec{\alpha})\text{d}\stackrel{\Theta}{\_}\\ =\int \prod_{m=1}^M\frac{1}{\Delta(\vec{\alpha})}\prod_{k=1}^K\vartheta_{m,k}^{n^{(k)}_m+\alpha_k-1}\text{d}\vec{\vartheta}_m\\ =\prod_{m=1}^M\frac{\Delta(\vec{n}_m+\vec{\alpha})}{\Delta(\vec{\alpha})}, \vec{n}_m=\{n_m^{(k)}\}_{k=1}^K$

根据求得的两个结果，我们能明显看出共轭的好处。现在我们把这两个因子整合在一起：

$\LARGE p(\vec{z},\vec{w}|\vec{\alpha}, \vec{\beta})=\prod_{z=1}^K\frac{\Delta(\vec{n}_z+\vec{\beta})}{\Delta(\vec{\beta})}\cdot \prod_{m=1}^M\frac{\Delta(\vec{n}_m+\vec{\alpha})}{\Delta(\vec{\alpha})}$

当得到这个joint distribution之后，我们就可以计算full conditional了。

Full conditional：

由于是full conditional的distribution，所以我们首先要选出一个z（这个z是特定于某一个单词的，也就是说，这个z是生成某一个特定单词w的那个z）。于是我们假设我们选择的单词的编号是, 此时需要注意的是，之后我们的公式中将用“i”来代替这个坐标(m,n)上的单词或是其对应的topic。并且我们将从i位置上进行topic的sampling：（ $\vec{w}=\{w_i=t, \vec{w}_{\neg i}\}$ , $\vec{z}=\{z_i=k, \vec{z}_{\neg i}\}$ ）

$\LARGE p(z_i=k|\vec{z}_{\neg i}, \vec{w})\\ =\frac{p(\vec{w}, \vec{z})}{p(\vec{w}, \vec{z}_{\neg i})}=\frac{p(\vec{w}|\vec{z})}{p(\vec{w}_{\neg i}|\vec{z}_{\neg i})p(w_i)}\cdot \frac{p(\vec{z})}{p(\vec{z}_{\neg i})}\\ \varpropto \frac{\Delta(\vec{n}_k+\vec{\beta})}{\Delta(\vec{n}_{k, \neg i}+\vec{\beta})}\cdot \frac{\Delta(\vec{n}_m+\vec{\alpha})}{\Delta(\vec{n}_{m, \neg i}+\vec{\alpha})}\\ =\frac{\Gamma(n_k^{(t)}+\beta_t)\Gamma(\sum_{t=1}^V n^{(t)}_{k, \neg i}+\beta_t)}{\Gamma(n_{k, \neg i}^{(t)}+\beta_t)\Gamma(\sum_{t=1}^V n^{(t)}_k+\beta_t)}\cdot \frac{\Gamma(n_m^{(k)}+\alpha_k)\Gamma(\sum_{k=1}^K n^{(k)}_{m, \neg i}+\alpha_k)}{\Gamma(n_{m, \neg i}^{(k)}+\alpha_k)\Gamma(\sum_{k=1}^K n^{(k)}_m+\alpha_k)}\\ =\frac{n_{k, \neg i}^{(t)}+\beta_t}{\sum_{t=1}^V n^{(t)}_{k, \neg i}+\beta_t}\cdot \frac{n_{m, \neg i}^{(k)}+\alpha_k}{[\sum_{k=1}^K n^{(k)}_{m}+\alpha_k]-1}\\ \varpropto \frac{n_{k, \neg i}^{(t)}+\beta_t}{\sum_{t=1}^V n^{(t)}_{k, \neg i}+\beta_t}({n_{m, \neg i}^{(k)}+\alpha_k})$

其中，在第一行公式中，由于和 $\vec{z}_{\neg i}$ 之间是相互独立的，所以可以把单独提出来。同时我们也需要注意到，当的取值发生改变时，不会发生任何的变化。因此我们可以把当作是constant的，从而在接下来的分析中omit掉。可能有人会问：不是由生成的吗，的改变怎么可能会对没有任何影响？我们需要注意的是，这里的实际上已经不包含这个condition了，也就是说，它是在的基础上，对z进行过marginalize后，所推出的公式 (即)，所以z的取值不会对这个式子产生影响（因为这个式子已经考虑到了z取任何值时的情况）。

此时我们根据剩余的4个式子，利用之前推导得出的Dirichlet-multinomial models, 就可以推出第2行公式中的正比关系。第2行到第4行的推导则完全是Dirichlet distribution中normalize项的性质和 $\Gamma$ 函数的性质。

第4行到第5行的推导实际上是omit掉了第二个因子中的分母，同样的，因为当z的取值发生改变时，这个分母的值是不变的，所以我们可以忽略掉这一项，由此导出了最终的正比关系。

Multinomial parameters:

上文中对于z的估计已经做完了，然而我们曾经提到过，对w和z（z实际上是我们在Markov chain中的state）的共现对进行估计之后，就可以对multinomial distribution的参数 $\stackrel{\Phi}{\_}$ 和 $\stackrel{\Theta}{\_}$ 进行估计。由于我们在之前已经得出了在给定参数 $\stackrel{\Phi}{\_}$ 和 $\stackrel{\Theta}{\_}$ 下w和z的likelihood，所以我们可以直接分别将这两个公式与 $\stackrel{\Phi}{\_}$ 和 $\stackrel{\Theta}{\_}$ 的先验相结合，来进行 $\stackrel{\Phi}{\_}$ 和 $\stackrel{\Theta}{\_}$ 的后验的估计，然后再利用笔记（三）中所述的 $p(\vec{p}|\mathcal{W}, \vec{\alpha})$ 的推导结论, 来进行最终后验分布结果的求解：

$\LARGE p(\vec{\vartheta}_m|\vec{z}_m, \vec{\alpha})\\ =\frac{1}{Z_{\vartheta_m}}\ \prod_{n=1}^{N_m}p(z_{m,n}|\vec{\vartheta}_m)\cdot p(\vec{\vartheta}_m|\vec{\alpha})\\ =Dir(\vec{\vartheta}_m|\vec{n}_m+\vec{\alpha})$

$\LARGE p(\vec{\phi}_k|\vec{z}, \vec{w}, \vec{\beta})\\ =\frac{1}{Z_{\phi_k}}\ \prod_{\{i:z_i=k\}}p(w_i|\vec{\phi}_k)\cdot p(\vec{\phi}_k|\vec{\beta})\\ =Dir(\vec{\phi}_k|\vec{n}_k+\vec{\beta})$

大家或许注意到，这里的两个后验分布的condition并不统一，但其实它们都是一样的，都是我们已知的三组量：word，与word相对应的topic和hyperparameters。然而对于 $\vartheta$ 的后验分布估计，我们其实是不需要知道word具体有哪些，而只用知道这些word对应的topic以及hyperparameters就行。

这里的 $\vec{n}_m$ 表示第m篇文档中出现各个topic的数量（也即该文档中topic-word共现对的统计）； $\vec{n}_k$ 表示第k个topic中各个单词出现的频数。

此时，我们已经分别得到了2个参数的posterior distribution。然后我们可以利用Dirichlet distribution期望公式，对两组参数进行估计：

$\LARGE \phi_{k,t}=\frac{n^{(t)}_k+\beta_t}{\sum_{t=1}^Vn^{(t)}_k+\beta_t}$

$\LARGE \vartheta_{m,k}=\frac{n_m^{(k)}+\alpha_k}{\sum_{k=1}^Kn_m^{(k)}+\alpha_k}$

大家可能有一个疑问：为什么我们这里要采用参数后验分布的期望？在回答这个问题前，我们需要明确的是，根据我们得到的后验分布，实际上我们已经可以用MAP estimator了--即只用求使这个后验概率分布最大的那个参数的取值就行，这实质上是用该参数的“众数”来作为该参数取值的代表。但是众数实际上是有问题的：比如我们有5个人考试，其中两个人考了100分，其他几个人的成绩分别是60,50,40。那么此时我们的众数就是100，但我们可以说这个100代表了这5名考生的一般情况吗？显然，采用期望是一个更好的方法，因为平均值相比于众数更能反映数据的一般性。

Gibbs sampling algorithm:

当我们得到如上full conditional的公式和两组参数 $\stackrel{\Phi}{\_}$ 和 $\stackrel{\Theta}{\_}$ 的估计公式之后，我们就可以根据这三个式子执行Gibbs sampling的整个过程：

这张图是在《Parameter estimation for text analysis》中的，其中Eq.78, 81, 82分别代表full conditional的公式和两组参数 $\stackrel{\Phi}{\_}$ 和 $\stackrel{\Theta}{\_}$ 的估计公式。

我们在开始前，首先需要给出文本 $\vec{w}$ ，两组参数 $\stackrel{\Phi}{\_}$ 和 $\stackrel{\Theta}{\_}$ 的先验分布参数 $\beta,\alpha$ ，以及topic数量K。

在Global data中， $n_m^{(k)}$ 表示第m个document下第k个topic出现的次数，将所有的topic出现的数量合起来就是, 也就是第m个document中单词的数量； $n_k^{(t)}$ 表示第k个topic下单词t出现的次数，将所有的单词在topic k下出现的次数加起来即得到该topic下单词的数量。同时也需要给计算full conditional的结果留出空间保存。

output中，我们需要得到的有，每一个单词所对应的topic： $\vec{z}$ ；多项式分布的参数 $\stackrel{\Phi}{\_}$ 和 $\stackrel{\Theta}{\_}$ ；以及对于hyperparameters $\beta,\alpha$ 的估计（在原文第6部分中有讲，如有时间，我会更新第6部分的内容）。

Gibbs sampling分为3个periods：

initialization: 对每一个word（该word的位置为(m,n)）所对应的topic（假设sample出来的topic是k）进行随机初始化。

Gibbs sampling: 顺序遍历每一篇文章中的每一个单词，先去掉分给该单词的topic，然后再通过full conditional distribution重新进行topic的sampling。循环进行该步骤，直到收敛为止。收敛后，再对参数 $\stackrel{\Phi}{\_}$ 和 $\stackrel{\Theta}{\_}$ 进行估计。

MCMC方法的一个缺点在于：我们很难精确判断其收敛的时刻。原文中通过人工查看对于那些语义相近而又不在同一个corpus中的document和word的聚类效果如何来进行收敛程度的判断。

你可能感兴趣的:(Topic,Model)

roslaunch打开更改gazebo world报错：SpawnModel: Failure - model name mrobot already exist. 阿斯顿的风格自动驾驶人工智能机器学习
roslaunchmbot_gazeboview_mbot_gazebo_obstacle2.launch...loggingto/home/suifeng/.ros/log/e98b739c-cd05-11ec-9bfc-b0fc364da57d/roslaunch-suifeng-RESCUER-R720-15IKBN-20614.logCheckinglogdirectoryfordisku
认识数学建模，什么是数学建模 ymchuangke 从零开始学数学建模数学建模
目录一、什么是数学建模？二、数学建模的核心思想三、数学建模的应用领域四、数学建模的基本步骤五、常用的数学建模方法和工具六、数学建模的挑战与未来发展一、什么是数学建模？数学建模（MathematicalModeling）是一种利用数学语言、结构和方法，对实际问题进行描述、简化、分析和求解的过程。其核心在于通过将复杂的现实世界问题转化为可操作的数学形式，从而利用数学理论和计算技术对其进行深入研究和解决
Java 双亲委派模型（Parent Delegation Model）重生之我在成电转码 java 开发语言 jvm
一、什么是双亲委派模型？双亲委派模型是Java类加载器（ClassLoader）的一种设计机制：✅避免重复加载✅保证核心类安全、避免被篡改✅提高类加载效率核心思想：类加载请求从子加载器逐级向上委托父加载器，只有父加载器加载失败（ClassNotFoundException）后，子加载器才会尝试自己加载。二、双亲委派的加载流程（核心）当某个类加载器接收到类加载请求时：1️⃣先检查自己是否加载过（缓存
后端框架模块化 GIS程序媛—椰子后端
后端框架的模块化设计旨在简化开发流程、提高可维护性，并通过分层解耦降低复杂性。以下是常见的后端模块及其在不同语言（Node.js、Java、Python）中的实现方式：目录1.路由（Routing）2.中间件（Middleware）3.数据库与ORM（models）4.迁移（Migration）5.服务层（ServiceLayer）6.配置管理（Configuration）7.依赖注入（DI）8.
AlphaFolding填补蛋白质动态结构预测空白！复旦大学等提出4D扩散模型，成果入选AAAI 2025 HyperAI超神经 ScienceAI 人工智能深度学习机器学习扩散模型蛋白质结构 AI4S 4D
蛋白质的功能很大程度上取决于其3D结构。19世纪中期，科学界普遍认为蛋白质结构是固定的、刚性的，类似「锁与钥匙」模型(lock-and-keymodel)，即蛋白质与配体的结合是由固定的三维结构决定的。然而，当DanielKoshland提出酶与底物结合时会发生构象变化的观点后，传统思维开始受到挑战。1980年代，分子动力学模拟(MolecularDynamics,MD)兴起，首次从计算角度揭示了
【NLP】 API在大语言模型中的应用 Nerous_ 深度学习自然语言处理语言模型人工智能
大语言模型（LargeLanguageModels,LLMs）通过API（应用程序接口）为开发者提供了便捷的调用方式，使其能够快速集成自然语言处理能力到各类应用中。以下是API在LLM中的核心应用场景及技术实现细节：一、核心应用场景自然语言理解与生成应用示例：智能客服：解析用户问题并生成回复（如ChatGPTAPI）。内容创作：自动生成文章、广告文案或代码（如OpenAI的GPT-4）。技术实现：
HRM：分层多步奖励模型大模型最新论文速读深度学习语言模型人工智能自然语言处理
论文标题TowardsHierarchicalMulti-StepRewardModelsforEnhancedReasoninginLargeLanguageModels论文地址https://arxiv.org/pdf/2503.13551代码地址https://github.com/tengwang0318/hierarchial_reward_model作者背景香港大学，北京大学，新加坡国
模型上下文协议 (MCP)是什么？Model Context Protocol 需要你了解一下同学小张学习 AIGC AI-native agi gpt 开源协议
大家好，我是同学小张，+v:jasper_8017一起交流，持续学习AI大模型应用实战案例，持续分享，欢迎大家点赞+关注，订阅我的大模型专栏，共同学习和进步。在人工智能领域，ModelContextProtocol（MCP）正逐渐成为连接AI模型与各类数据源及工具的重要标准。MCP究竟为何物？它又将如何改变AI应用的开发与使用？文章目录0.概念1.MCP的总体架构2.为何使用MCP？3.我的理解4
MCP服务器：AI智能体的新时代连接标准真挺乐人工智能
在AI技术的不断发展中，MCP（ModelContextProtocol，模型上下文协议）正成为AI智能体与外部系统交互的新标准。MCP的目标是提供一个统一的方法，让AI智能体能够安全、高效地访问各种数据源、API接口和系统工具，从而扩展其能力，提升智能化水平。本文将深入探讨MCP服务器的架构、优势及其在现实世界中的应用。什么是MCP服务器？MCP服务器是MCP架构中的关键组件，它们充当AI智能体
ollama 基本使用教程海上彼尚 AI ai 前端
目录1.安装OllamamacOS或LinuxWindows(WSL2)2.基础命令启动与停止更新Ollama3.模型管理下载预训练模型运行模型查看已安装模型删除模型从Modelfile创建自定义模型4.高级功能服务器模式与API多会话管理环境变量配置5.常见问题与技巧加速模型下载查看日志模型参数调整模型导出与分享Ollama是一个开源的大型语言模型服务工具，能够帮助用户在本地运行大模型。通过简单
RabbitMQ常见面试题及解析 chi_666 面试 RabbitMQ 面试
1、什么是RabbitMQ？RabbitMQ是一个开源的消息队列系统，它实现了高级消息队列协议（AMQP）。它允许不同的应用程序之间进行异步通信，通过将消息发送到队列中，让消费者从队列中获取消息并进行处理，从而实现解耦、异步和削峰填谷等功能。2、核心组件与流程**Producer：**发送消息的应用。**Exchange：**接收消息并路由到队列（类型：Direct，Fanout，Topic，He
deepseek api参数详解孽小倩大语言模型 python java 前端人工智能 deepseek
deepseek的参数与openai保持兼容，所以openai能用的参数deepseek都可以使用，以下是常用的参数介绍。在使用Deepseek/OpenAI的PythonAPI时，最常用的API端点是chat/completions，用于调用deepseek生成文本对话内容。以下是openai.ChatCompletion.create()方法的主要参数及其作用：1.model作用：指定使用的模
Chapter 9: Using Templates in Practice_《C++ Templates》notes 郭涤生 c/c++c++开发语言笔记
UsingTemplatesinPracticeStep1:UnderstandTemplateDefinitionsandtheInclusionModelKeyConceptCodeExampleExplanationStep2:TackleLinkerErrorswithExplicitInstantiationKeyConceptCodeExampleTestCaseStep3:Decod
【BERT和GPT的区别】调皮的芋头人工智能深度学习机器学习 bert gpt
BERT采用完形填空（MaskedLanguageModeling,MLM）与GPT采用自回归生成（AutoregressiveGeneration）的差异，本质源于两者对语言建模的不同哲学导向与技术目标的根本分歧。这种选择不仅塑造了模型的架构特性，更决定了其应用边界与能力上限。以下从语言建模本质、任务适配性、技术约束及后续影响四个维度深入剖析：一、语言建模的本质差异1.BERT的“全知视角”与全
大模型微调归一码字人工智能
文章目录前言一、使用的库二、数据预处理1.引入库2.读入数据3.对数据进行预处理4.转换为json格式文件三，使用算子分析数据并进行数据处理四，划分训练集和测试集五，编写训练脚本开始训练六，进行模型推理人工评估总结前言这是使用知乎评论进行模型微调，让模型输出更加通畅接近人的使用语言一、使用的库modelscope：提供模型、数据集下载能力data-juicer：提供数据集处理能力ms-swift：
“by” the way ——借ViewModel创建方式探索Kotlin的委托机制 Omnipotent_7 kotlin android java
文章目录获取viewModel的新方法旧方法新方法什么是委托模式？那么委托模式到底是什么呢？类委托应用场景属性委托的应用场景“by”关键字到底是啥总结获取viewModel的新方法旧方法有新方法肯定要先介绍一下旧方法。在传统的viewModel获取中，我们都有这样一个经验——不能在Activity里直接创建viewModel对象。因为ViewModel的生命周期是长于Activity的，如果在Ac
模型部署实战：PyTorch生产化指南小诸葛IT课堂 pytorch 人工智能 python
‌一、为什么要做模型部署？‌模型部署是将训练好的模型‌投入实际应用‌的关键步骤，涉及：模型格式转换（TorchScript/ONNX）性能优化（量化/剪枝）构建API服务移动端集成本章使用ResNet18实现图像分类，并演示完整部署流程。‌二、模型转换：TorchScript与ONNX‌‌1.准备预训练模型importtorchimporttorchvision#加载预训练模型model=torc
C#基于MVC模式实现TCP三次握手，附带简易日志管理模块风，停下 C#设计模式网络协议 c#mvc tcp/ip
C#基于MVC模式实现TCP三次握手1Model1.1ServerModel1.2ClientModel1.3配置参数模块1.4日志管理模块1.4.1数据结构1.4.1日志管理工具类1.4.1日志视图展示1.4.1.1UcLogManage.cs1.4.1.2UcLogManage.Designer.cs2视图（View）2.1ViewServer2.1.1ViewServer.cs2.1.1Vi
js 创建对象写法 ---追溯狼魂豹速 javascript 前端开发语言
复制重新生成importSqlParaDTOfrom‘./SqlParamDTO’;exportdefault{create(funcSysId,jsonPara){//实例私有状态(每次create()调用独立)conststate={funcSysId:String(funcSysId||‘’),//强制字符串类型sqlId:‘’,modelName:undefined,queryColumn
java 实现数据库备份李逍遙️ mysql 数据库 java mysql
importcom.guangyi.project.model.system.DataBaseInFo;importjava.io.BufferedReader;importjava.io.File;importjava.io.FileOutputStream;importjava.io.IOException;importjava.io.InputStream;importjava.io.Inp
LangChain入门：使用Python和通义千问打造免费的Qwen大模型聊天机器人南七小僧人工智能网站开发 AI技术产品经理服务器数据库 windows
前言LangChain是一个用于开发由大型语言模型（LargeLanguageModels，简称LLMs）驱动的应用程序的框架。它提供了一个灵活的框架，使得开发者可以构建具有上下文感知能力和推理能力的应用程序，这些应用程序可以利用公司的数据和APIs。这个框架由几个部分组成。LangChain库：Python和JavaScript库。包含了各种组件的接口和集成，一个基本的运行时，用于将这些组件组合
大规模语言模型从理论到实践分布式训练的集群架构 AI智能涌现深度研究 DeepSeek R1 &大数据AI人工智能 Python入门实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
大规模语言模型从理论到实践分布式训练的集群架构作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着深度学习技术的飞速发展，大规模语言模型（LargeLanguageModels,LLMs）在自然语言处理（NaturalLanguageProcessing,NLP）领域取得了突破性进展。LLMs，如BERT、GPT-3等，通
Vue实例 · new Vue() liudachu Vue.js new Vue
十六、Vue实例1.创建一个Vue实例每个Vue应用都是通过用Vue函数创建一个新的Vue实例开始的：varvm=newVue({//选项//当创建一个Vue实例时，你可以传入一个选项对象。})虽然没有完全遵循MVVM模型，但是Vue的设计也受到了它的启发。因此在文档中经常会使用vm(ViewModel的缩写)这个变量名表示Vue实例。一个Vue应用由一个通过newVue创建的根Vue实例，以及可
python之gmsh划分网格老歌老听老掉牙 python有限元分析 python 开发语言 gmsh 划分网格
Gmsh（GeometryModelingandMeshingSuite）是一个开源的三维有限元网格生成器，它集成了内置的CAD引擎和后处理器。Gmsh的设计目标是提供一个快速、轻量级且用户友好的网格工具，同时具备参数化输入和高级可视化能力。Gmsh围绕几何（geometry）、网格（mesh）、求解器（solver）和后处理（post-processing）四个模块构建，用户可以通过图形用户界面
【论文阅读】MMedPO：用临床感知多模态偏好优化调整医学视觉语言模型勤奋的小笼包论文阅读语言模型人工智能自然语言处理 chatgpt
MMedPO：用临床感知多模态偏好优化调整医学视觉语言模型1.背景2.核心问题：3.方法：3.实验结果与优势4.技术贡献与意义5.结论MMedPO:AligningMedicalVision-LanguageModelswithClinical-AwareMultimodalPreferenceOptimizationMMedPO：用临床感知多模态偏好优化调整医学视觉语言模型gitgub:地址1.
android MutableLiveData setValue 响应速速 postValue 快 mmsx Android 常用开发技术 android livedata
MutableLiveData是LiveData的一个可变版本，常用于在ViewModel中保存和管理UI相关的数据。MutableLiveData提供了两种主要的方法来更新其值：setValue和postValue。关于这两者的响应速度，通常认为setValue比postValue更快。下面详细解释这两者的区别以及影响响应速度的因素。一、setValuevspostValue1.setValue
python-flask复习(一) 胖虎是只mao python-web python函数 python python flask
一、Python现阶段三大主流Web框架Django、Tornado、Flask对比Django主要特点是大而全，集成了很多组件（例如Models、Admin、Form等等）,不管你用得到用不到，反正它全都有，属于全能型框架，通常用于大型Web应用，由于内置组件足够强大所以使用Django开发可以一气呵成，优点是大而全，缺点也就暴露出来了，这么多的资源一次性全部加载，肯定会造成一部分的资源浪费；T
WPF使用MVVM模式开发 pluto li .net .net
本文用到的有：WPF（.net5）Microsoft.Toolkit.Mvvm按钮不带参数/带参数点击事件绑定文本框Text绑定，点击事件绑定步骤如下：创建wpf项目：WpfMVVM创建Views、ViewModels两个文件夹nuget添加Microsoft.Toolkit.Mvvm在ViewModels文件夹添加类MainViewModelusingMicrosoft.Toolkit.Mvvm
复旦：过程奖励优化多模态推理大模型任我行大模型-模型训练人工智能自然语言处理语言模型论文笔记
标题：VisualPRM:AnEffectiveProcessRewardModelforMultimodalReasoning来源：arXiv,2503.10291摘要我们引入了VisualPRM，这是一种具有8B参数的高级多模态过程奖励模型（PRM），它通过Best-of-N（BoN）评估策略提高了现有多模态大型语言模型（MLLM）在不同模型尺度和族之间的推理能力。具体来说，我们的模型提高了三
FastAPI测试策略：参数解析单元测试 qcidyu 文章归档异常传播验证依赖注入测试请求模拟技术测试覆盖率优化 Pydantic验证测试单元测试策略参数解析测试
扫描二维码关注或者微信搜一搜：编程智域前端至全栈交流与成长探索数千个预构建的AI应用，开启你的下一个伟大创意第一章：核心测试方法论1.1三层测试体系架构#第一层：模型级测试deftest_user_model_validation():withpytest.raises(ValidationError):User(age=-5)#第二层：依赖项测试deftest_auth_dependency()
java类加载顺序 3213213333332132 java
package com.demo; /** * @Description 类加载顺序 * @author FuJianyong * 2015-2-6上午11:21:37 */ public class ClassLoaderSequence { String s1 = "成员属性"; static String s2 = "
Hibernate与mybitas的比较 BlueSkator sql Hibernate 框架 ibatis orm
第一章 Hibernate与MyBatis Hibernate 是当前最流行的O/R mapping框架，它出身于sf.net，现在已经成为Jboss的一部分。 Mybatis 是另外一种优秀的O/R mapping框架。目前属于apache的一个子项目。 MyBatis 参考资料官网：http:
php多维数组排序以及实际工作中的应用 dcj3sjt126com PHP usort uasort
自定义排序函数返回false或负数意味着第一个参数应该排在第二个参数的前面, 正数或true反之, 0相等usort不保存键名uasort 键名会保存下来uksort 排序是对键名进行的 <!doctype html> <html lang="en"> <head> <meta charset="utf-8&q
DOM改变字体大小周华华前端
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
c3p0的配置 g21121 c3p0
c3p0是一个开源的JDBC连接池，它实现了数据源和JNDI绑定，支持JDBC3规范和JDBC2的标准扩展。c3p0的下载地址是：http://sourceforge.net/projects/c3p0/这里可以下载到c3p0最新版本。以在spring中配置dataSource为例：  <bean name="prope
Java获取工程路径的几种方法 510888780 java
第一种： File f = new File(this.getClass().getResource("/").getPath()); System.out.println(f); 结果: C:\Documents%20and%20Settings\Administrator\workspace\projectName\bin 获取当前类的所在工程路径; 如果不加“
在类Unix系统下实现SSH免密码登录服务器 Harry642 免密 ssh
1.客户机 (1)执行ssh-keygen -t rsa -C "[email protected]"生成公钥，xxx为自定义大email地址 (2)执行scp ~/.ssh/id_rsa.pub root@xxxxxxxxx:/tmp将公钥拷贝到服务器上，xxx为服务器地址 (3)执行cat
Java新手入门的30个基本概念一 aijuans java java 入门新手
在我们学习Java的过程中,掌握其中的基本概念对我们的学习无论是J2SE,J2EE,J2ME都是很重要的,J2SE是Java的基础,所以有必要对其中的基本概念做以归纳,以便大家在以后的学习过程中更好的理解java的精髓,在此我总结了30条基本的概念。　　Java概述:　　目前Java主要应用于中间件的开发(middleware)---处理客户机于服务器之间的通信技术,早期的实践证明,Java不适合
Memcached for windows 简单介绍 antlove java Web windows cache memcached
1. 安装memcached server a. 下载memcached-1.2.6-win32-bin.zip b. 解压缩，dos 窗口切换到 memcached.exe所在目录，运行memcached.exe -d install c.启动memcached Server,直接在dos窗口键入 net start "memcached Server&quo
数据库对象的视图和索引百合不是茶索引 oeacle数据库视图
视图视图是从一个表或视图导出的表，也可以是从多个表或视图导出的表。视图是一个虚表，数据库不对视图所对应的数据进行实际存储，只存储视图的定义，对视图的数据进行操作时,只能将字段定义为视图,不能将具体的数据定义为视图为什么oracle需要视图; &
Mockito(一) --入门篇 bijian1013 持续集成 mockito 单元测试
Mockito是一个针对Java的mocking框架，它与EasyMock和jMock很相似，但是通过在执行后校验什么已经被调用，它消除了对期望行为（expectations）的需要。其它的mocking库需要你在执行前记录期望行为（expectations），而这导致了丑陋的初始化代码。 &nb
精通Oracle10编程SQL(5)SQL函数 bijian1013 oracle 数据库 plsql
/* * SQL函数 */ --数字函数 --ABS(n):返回数字n的绝对值 declare v_abs number(6,2); begin v_abs:=abs(&no); dbms_output.put_line('绝对值：'||v_abs); end; --ACOS(n):返回数字n的反余弦值，输入值的范围是-1~1，输出值的单位为弧度
【Log4j一】Log4j总体介绍 bit1129 log4j
Log4j组件：Logger、Appender、Layout Log4j核心包含三个组件：logger、appender和layout。这三个组件协作提供日志功能：日志的输出目标日志的输出格式日志的输出级别(是否抑制日志的输出) logger继承特性 A logger is said to be an ancestor of anothe
Java IO笔记白糖_ java
public static void main(String[] args) throws IOException { //输入流 InputStream in = Test.class.getResourceAsStream("/test"); InputStreamReader isr = new InputStreamReader(in); Bu
Docker 监控 ronin47 docker监控
目前项目内部署了docker，于是涉及到关于监控的事情，参考一些经典实例以及一些自己的想法，总结一下思路。 1、关于监控的内容监控宿主机本身监控宿主机本身还是比较简单的，同其他服务器监控类似，对cpu、network、io、disk等做通用的检查，这里不再细说。额外的，因为是docker的
java-顺时针打印图形 bylijinnan java
一个画图程序要求打印出： 1.int i=5; 2.1 2 3 4 5 3.16 17 18 19 6 4.15 24 25 20 7 5.14 23 22 21 8 6.13 12 11 10 9 7. 8.int i=6 9.1 2 3 4 5 6 10.20 21 22 23 24 7 11.19
关于iReport汉化版强制使用英文的配置方法 Kai_Ge iReport汉化英文版
对于那些具有强迫症的工程师来说，软件汉化固然好用，但是汉化不完整却极为头疼，本方法针对iReport汉化不完整的情况，强制使用英文版，方法如下：在 iReport 安装路径下的 etc/ireport.conf 里增加红色部分启动参数，即可变为英文版。 # ${HOME} will be replaced by user home directory accordin
[并行计算]论宇宙的可计算性 comsci 并行计算
现在我们知道,一个涡旋系统具有并行计算能力.按照自然运动理论,这个系统也同时具有存储能力,同时具备计算和存储能力的系统,在某种条件下一般都会产生意识...... 那么,这种概念让我们推论出一个结论 &nb
用OpenGL实现无限循环的coverflow dai_lm android coverflow
网上找了很久，都是用Gallery实现的，效果不是很满意，结果发现这个用OpenGL实现的，稍微修改了一下源码，实现了无限循环功能源码地址： https://github.com/jackfengji/glcoverflow public class CoverFlowOpenGL extends GLSurfaceView implements GLSurfaceV
JAVA数据计算的几个解决方案1 datamachine java Hibernate 计算
老大丢过来的软件跑了10天，摸到点门道，正好跟以前攒的私房有关联，整理存档。 -----------------------------华丽的分割线------------------------------------- 数据计算层是指介于数据存储和应用程序之间，负责计算数据存储层的数据，并将计算结果返回应用程序的层次。J &nbs
简单的用户授权系统,利用给user表添加一个字段标识管理员的方式 dcj3sjt126com yii
怎么创建一个简单的(非 RBAC)用户授权系统通过查看论坛，我发现这是一个常见的问题，所以我决定写这篇文章。本文只包括授权系统.假设你已经知道怎么创建身份验证系统(登录)。数据库首先在 user 表创建一个新的字段(integer 类型),字段名 'accessLevel',它定义了用户的访问权限扩展 CWebUser 类在配置文件(一般为 protecte
未选之路 dcj3sjt126com 诗
作者:罗伯特*费罗斯特黄色的树林里分出两条路, 可惜我不能同时去涉足, 我在那路口久久伫立, 我向着一条路极目望去, 直到它消失在丛林深处. 但我却选了另外一条路, 它荒草萋萋,十分幽寂; 显得更诱人,更美丽, 虽然在这两条小路上, 都很少留下旅人的足迹. 那天清晨落叶满地, 两条路都未见脚印痕迹. 呵,留下一条路等改日再
Java处理15位身份证变18位蕃薯耀 18位身份证变15位 15位身份证变18位身份证转换
15位身份证变18位，18位身份证变15位 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 201
SpringMVC4零配置--应用上下文配置【AppConfig】 hanqunfeng springmvc4
从spring3.0开始，Spring将JavaConfig整合到核心模块，普通的POJO只需要标注@Configuration注解，就可以成为spring配置类，并通过在方法上标注@Bean注解的方式注入bean。 Xml配置和Java类配置对比如下： applicationContext-AppConfig.xml <!-- 激活自动代理功能参看：
Android中webview跟JAVASCRIPT中的交互 jackyrong JavaScript html android 脚本
在android的应用程序中,可以直接调用webview中的javascript代码,而webview中的javascript代码,也可以去调用ANDROID应用程序(也就是JAVA部分的代码).下面举例说明之: 1 JAVASCRIPT脚本调用android程序要在webview中,调用addJavascriptInterface(OBJ,int
8个最佳Web开发资源推荐 lampcy 编程 Web 程序员
Web开发对程序员来说是一项较为复杂的工作，程序员需要快速地满足用户需求。如今很多的在线资源可以给程序员提供帮助，比如指导手册、在线课程和一些参考资料，而且这些资源基本都是免费和适合初学者的。无论你是需要选择一门新的编程语言，或是了解最新的标准，还是需要从其他地方找到一些灵感，我们这里为你整理了一些很好的Web开发资源，帮助你更成功地进行Web开发。这里列出10个最佳Web开发资源，它们都是受
架构师之面试------jdk的hashMap实现 nannan408 HashMap
1.前言。如题。 2.详述。 (1)hashMap算法就是数组链表。数组存放的元素是键值对。jdk通过移位算法（其实也就是简单的加乘算法），如下代码来生成数组下标(生成后indexFor一下就成下标了）。 static int hash(int h) { h ^= (h >>> 20) ^ (h >>>
html禁止清除input文本输入缓存 Rainbow702 html 缓存 input 输入框 change
多数浏览器默认会缓存input的值，只有使用ctl+F5强制刷新的才可以清除缓存记录。如果不想让浏览器缓存input的值，有2种方法：方法一：在不想使用缓存的input中添加 autocomplete="off"; <input type="text" autocomplete="off" n
POJO和JavaBean的区别和联系 tjmljw POJO java beans
POJO 和JavaBean是我们常见的两个关键字，一般容易混淆，POJO全称是Plain Ordinary Java Object / Pure Old Java Object，中文可以翻译成：普通Java类，具有一部分getter/setter方法的那种类就可以称作POJO，但是JavaBean则比 POJO复杂很多， Java Bean 是可复用的组件，对 Java Bean 并没有严格的规
java中单例的五种写法 liuxiaoling java 单例
/** * 单例模式的五种写法： * 1、懒汉 * 2、恶汉 * 3、静态内部类 * 4、枚举 * 5、双重校验锁 */ /** * 五、双重校验锁，在当前的内存模型中无效 */ class LockSingleton { private volatile static LockSingleton singleton; pri