SIGAI_csdn

理解隐马尔可夫模型

作者简介：SIGAI人工智能平台

全文PDF下载：http://www.tensorinfinity.com/paper_99.html

隐马尔可夫模型（Hidden Markov Model，简称HMM）由Baum等人在1966年提出[1]，是一种概率图模型，用于解决序列预测问题，可以对序列数据中的上下文信息建模。所谓概率图模型，指用图为相互依赖的一组随机变量进行建模，图的顶点为随机变量，边为变量之间的概率关系。

在隐马尔可夫模型中，有两种类型的节点，分别为观测值序列与状态值序列，后者是不可见的，它们的值需要通过从观测值序列进行推断而得到。很多现实应用可以抽象为此类问题，如语音识别，自然语言处理中的分词、词性标注，计算机视觉中的动作识别。隐马尔可夫模型在这些问题中得到了成功的应用。本文作为已经出版的《机器学习与应用》，清华大学出版社，雷明著第16章“循环神经网络”中隐马尔可夫模型一节的扩充，已经被独立成一章，在第二版中出版。为降低阅读与理解难度，本文尽量不过多涉及概率图模型的概念，而是从序列建模的角度对HMM进行解释。

马尔可夫过程与马尔可夫模型

马尔可夫过程是随机过程的典型代表。所谓随机过程，是指一个系统的状态随着时间线随机的演化。这种模型可以计算出系统每一时刻处于各种状态的概率以及这些状态之间的转移概率。首先定义状态的概念，在 $t$ 时刻系统的状态为 $z_t$ ，在这里是一个离散型随机变量，取值来自一个有限集
$S=\left \{ s_{1},...,s_{n} \right \}$
例如我们要为天气进行建模，需观察每一天的天气，则状态集为
$S=\left \{ 晴天，阴天，雨天 \right \}$
为简化表示，将状态用整数编号，可以写成
$S=\left \{ 1,2,3 \right \}$
从 $1$ 时刻开始到 $T$ 时刻为止，系统所有时刻的状态值构成一个随机变量序列
$Z=\left \{ z_{1},...,z_{T} \right \}$
系统在不同时刻可以处于同一种状态，但在任一时刻只能有一种状态。不同时刻的状态之间是有关系的。例如，如果今天是阴天，明天下雨的可能性会更大，在时刻 $t$ 的状态由它之前时刻的状态决定，可以表示为如下的条件概率
$p\left ( z_{t}\mid z_{t-1},...,z_{1} \right )$
即在从 $1$ 到 $t - 1$ 时刻系统的状态值分别为 $z_1,\cdots ,z_{t-1}$ 的前提下，时刻 $t$ 系统的状态为 $z_t$ 的概率。如果要考虑之前所有时刻的状态计算太复杂。为此进行简化，假设 $t$ 时刻的状态只与 $t - 1$ 时刻的状态有关，与更早的时刻无关，即忘记了更早的信息。上面的概率可以简化为
$p\left ( z_{t}\mid z_{t-1},...,z_{1} \right )=p\left ( z_{t}\mid z_{t-1} \right )$
该假设称为一阶马尔可夫假设，满足这一假设的马尔可夫模型称为一阶马尔可夫模型。如果状态有 $n$ 种取值，在 $t$ 时刻取任何一个值与 $t - 1$ 时刻取任何一个值的条件概率构成一个 $\times n$ 的矩阵 $A$ ，称为状态转移概率矩阵，其元素为
$a_{ij}=p\left ( z_{t}=j\mid z_{t-1}=i \right )$
该值表示 $t - 1$ 时刻的状态为 $i$ ，时刻的状态为 $j$ ，即从状态 $i$ 转移到状态 $j$ 的概率。如果知道了状态转移矩阵，就可以计算出任意时刻系统状态取每个值的概率。状态转移概率矩阵的元素必须满足如下约束：
$\begin{aligned} a_{ij} &\geq 0 \\ \sum_{j=1}^{n}a_{ij} &= 1 \end{aligned}$
第一条是因为概率值必须在 $\left [ 0，1 \right ]$ 之间，第二条是因为无论 $t$ 时刻的状态值是什么，在下一个时刻一定会转向 $n$ 个状态中的一个，因此它们的转移概率和必须为 $1$ 。以天气为例，假设状态转移矩阵为
$\begin{bmatrix} 0.7 & 0.2 & 0.1\\ 0.4 & 0.5 & 0.1\\ 0.3 & 0.4 & 0.3 \end{bmatrix}$
其对应的状态转移图（状态机）如下图所示，图中每个顶点表示状态，边表示状态转移概率，是有向图

有一个需要考虑的问题是系统初始时刻处于何种状态，这同样是随机的，可以用向量 $\pi$ 表示。以天气为例，假设初始时处于晴天的概率是 $0.5$ ，处于阴天的概率是 $0.4$ ，处于雨天的概率是 $0.1$ ，则 $\pi$ 为
$\begin{bmatrix} 0.5 & 0.4 & 0.1 \end{bmatrix}$
为简化表述，引入一个特殊的状态 $s_0$ 消掉 $\pi$ ，该状态的编号为 $0$ 。它是系统初始时所处的状态，即 $z_0=s_0$ ，在接下来的时刻从它转向其他状态，但在后续任何时刻都不会再进入此状态。加入初始状态之后，对状态转移矩阵也进行扩充，行和列的下标变为从 $0$ 开始。以天气问题为例，扩充后的状态转移矩阵为
$\begin{bmatrix} 0 & 0.5 & 0.4 &0.1 \\ 0 & 0.7& 0.2 & 0.1\\ 0 & 0.4 & 0.2 &0.1 \\ 0 & 0.3 &0.4 & 0.3 \end{bmatrix}$
给定一阶马尔可夫过程的参数，由该模型产生一个状态序列 $z_1,\cdots,z_T$ 的概率为
$\begin{aligned} p(z_{1},...,z_{T}) &=p\left ( z_{t}\mid z_{1},...,z_{t-1} \right )p\left ( z_{t-1}\mid z_{1},...,z_{t-2} \right )... \\ &=p\left ( z_{t}\mid z_{t-1} \right )p\left ( z_{t-1}\mid z_{t-2} \right ) ...\\ &= \prod_{t=1}^{T}a_{z_{t}z_{t-1}} \end{aligned}$
结果就是状态转移矩阵的元素乘积。在这里假设任何一个时刻的状态转移矩阵都是相同的，即状态转移矩阵与时刻无关。

对于上面的天气问题，连续3天全部为晴天的概率为
$\begin{aligned} &p\left ( z_{1}=1,z_{2}=1,z_{3}=1 \right )\\ &= p\left ( z_{1}=1\mid z_{0} \right )p\left ( z_{2}=1\mid z_{1}=1 \right )p\left ( z_{3}=1\mid z_{2}=1 \right )\\ &= a_{01}\times a_{11}\times a_{11}\\ &= 0.5\times 0.7\times 0.7\\ &= 0.245 \end{aligned}$
状态转移矩阵通过训练样本学习得到，采用最大似然估计。给定一个状态序列 $z$ ，马尔可夫过程的对数似然函数为
$\begin{aligned} L(A) &=\ln p(z;A) \\ &= \ln \prod_{t=1}^{T}a_{z_{t-1}\; z_{t}}\\ &=\sum_{t=1}^{T} \ln a_{z_{t-1}\; z_{t}}\\ &=\sum_{i=1}^{n}\sum_{j=1}^{n}\sum_{t=1}^{T}1\left \{ z_{t-1}=i\wedge z_{t}=j \right \}\ln a_{ij} \end{aligned}$
这里使用了指示变量来方便表述。因为状态转移矩阵要满足上面的两条约束，因此要求解的是如下带约束的最优化问题
$\begin{aligned} max_{A}L(A) \\ \sum_{j=1}^{n}a_{ij}&=1,i=1,...,n \\ a_{ij}\geq 0,i.j&=1,...,n \end{aligned}$
由于对数函数的定义域要求自变量大于 $0$ ，因此可以去掉不等式约束，上面的最优化问题变成带等式约束的优化问题，可以用拉格朗日乘数法求解。构造拉格朗日乘子函数
$L(A,\alpha )=\sum_{i=1}^{n}\sum_{j=1}^{n}\sum_{t=1}^{T}1\left \{ z_{t-1}=i\wedge z_{t}=j \right \}\ln a_{ij}+\sum_{i=1}^{n}\alpha _{i}\left ( 1-\sum_{j=1}^{n}a_{ij} \right )$
对求偏导数并令导数为 $0$ ，可以到得
$\frac{\sum_{t=1}^{T}1\left \{ z_{t-1}=i\wedge z_{t}=j \right \}}{a_{ij}}=\alpha _{i}$
解得
$a_{ij}=\frac{1}{\alpha _{i}}\sum_{t=1}^{T}1\left \{ z_{t-1}=i\wedge z_{t}=j \right \}$
对 $a_i$ 求偏导数并令导数为 $0$ ，可以得到
$1-\sum_{j=1}^{n}a_{ij}=0$
将 $a_{ij}$ 代入上式可以得到
$1-\sum_{j=1}^{n}\left ( \frac{1}{\alpha _{i}}\sum_{t=1}^{T}1\left \{ z_{t-1}=i\wedge z_{t}=j \right \} \right )=0$
解得
$\alpha _{i}=\sum_{j=1}^{n}\sum_{t=1}^{T}1\left \{ z_{t-1}=i\wedge z_{t}=j \right \}=\sum_{t=1}^{T}1\left \{ z_{t-1}=i \right \}$
合并后得到下面的结果
$a_{ij}=\frac{\sum_{t=1}^{T}1\left \{ z_{t-1}=i\wedge z_{t}=j \right \}}{\sum_{t=1}^{T}1\left \{ z_{t-1}=i \right \}}$
这一结果也符合我们的直观认识：从状态 $i$ 转移到状态 $j$ 的概率估计值就是在训练样本中，从状态 $i$ 转移到状态 $j$ 的次数除以从状态 $i$ 转移到下一个状态的总次数。对于多个状态序列，方法与单个状态序列相同。

隐马尔可夫模型

在实际应用中，有些时候我们不能直接观察到状态的值，即状态的值是隐含的，只能得到观测的值。为此对马尔可夫模型进行扩充，得到隐马尔可夫模型。

隐马尔可夫模型描述了观测变量和状态变量之间的概率关系。与马尔可夫模型相比，隐马尔可夫模型不仅对状态建模，而且对观测值建模。不同时刻的状态值之间，同一时刻的状态值和观测值之间，都存在概率关系。

首先定义观测序列
$X=\left \{ x_{1},...,x_{T} \right \}$
这是直接能观察或者计算得到的值。任一时刻的观测值来自有限的观测集
$V=\left \{ v_{1},...,v_{m} \right \}$
接下来定义状态序列
$Z=\left \{ z_{1},...,z_{T} \right \}$
任一时刻的状态值也来自有限的状态集
$S=\left \{ s_{1},...,s_{n} \right \}$
这与马尔可夫模型中的状态定义相同。在这里，状态是因，观测是果，即因为处于某种状态所以才有某一观测值。

例如，如果我们要识别视频中的动作，状态就是要识别的动作，有站立、坐下、行走等取值，在进行识别之前无法得到其值。观测是能直接得到的值如人体各个关节点的坐标，隐马尔可夫模型的作用是通过观测值推断出状态值，即识别出动作。

除之前已定义的状态转移矩阵之外，再定义观测矩阵 $B$ ，其元素为
$b_{ij}=p\left ( v_{j}\mid s_{i} \right )$
该值表示时刻状态值为时观测值为的概率。显然该矩阵也要满足和状态转移矩阵同样的约束条件：
$\begin{aligned} b_{ij} &\geq 0 \\ \sum_{j=1}^{n}b_{ij}&=1 \end{aligned}$
另外还要给出初始时状态取每种值的概率 $\pi$ 。隐马尔可夫模型可以表示为一个五元组
$\left \{ S,V,\pi ,A,B \right \}$
如果加上初始状态则可以消掉参数 $\pi$ ，只剩下 $A$ 和 $B$ 。在实际应用中，一般假设矩阵 $A$ 和 $B$ 在任何时刻都是相同的即与时间无关，这样简化了问题的计算。

任意一个状态序列可以看做是这样产生的：系统在 $1$ 时刻处于状态 $z_1$ ，在该状态下得到观测值 $x_1$ 。接下来从 $z_1$ 转移到 $x_2$ ，并在此状态下得到观测值 $x_2$ 。以此类推，得到整个观测序列。由于每一时刻的观测值只依赖于本时刻的状态值，因此在状态序列 $z$ 下出现观测序列 $x$ 的概率为
$\begin{aligned} p(z,x) &=p(z)p(x\mid z) \\ &= p(z_{t}\mid z_{t-1})p(z_{t-1}\mid z_{t-2})...p(z_{1}\mid z_{0})p(x_{t}\mid z_{t})p(x_{t-1}\mid z_{t-1})...p(x_{1}\mid z_{1})\\ &= \left ( \prod_{t=1}^{T}a_{z_{t}z_{t-1}} \right )\prod_{t=1}^{T}b_{z_{t}x_{t}} \end{aligned}$
这就是所有时刻的状态转移概率，观测概率的乘积。

以天气问题为例，假设我们不知道每天的天气，但能观察到一个人在各种天气下的活动，根据这一现象来推断天气。这里的活动有 $3$ 种情况，睡觉，跑步，逛街。对于这个问题，天气是状态值，活动是观测值。该隐马尔可夫模型如下图所示

这一问题的观测矩阵为
$\begin{bmatrix} 0.5 & 0.2 & 0.3\\ 0.1 & 0.7 & 0.2\\ 0.7& 0.1 & 0.2 \end{bmatrix}$
在隐马尔可夫模型中，隐藏状态和观测值的数量是根据实际问题人工设定的；状态转移矩阵和混淆矩阵通过样本学习得到。隐马尔可夫模型需要解决以下三个问题：

估值问题，给定隐马尔可夫模型的参数A和B，计算一个观测序列x出现的概率值p(x)。
解码问题，给定隐马尔可夫模型的参数A和B以及一个观测序列x，计算最有可能产生此观测序列的状态序列z。
学习问题，给定隐马尔可夫模型的结构，但参数未知，给定一组训练样本，确定隐马尔可夫模型的参数A和B。

按照定义，隐马尔可夫模型对条件概率 $p (x ∣ z)$ 建模，因此是一种生成模型。

中文分词问题

下面以中文分词问题为例，介绍隐马尔可夫模型如何用于实际问题，这是典型的序列标注问题。中文分词即断句，是自然语言处理中的核心、基础问题。因为中文和英文不同，各个词之间没有空格隔开。对于下面的句子

我是中国人

正确的分词结果为

我    是     中国人

在这里观测序列是输入的语句，每个字为每个时刻的观测值。状态序列为分词的结果，每个时刻的状态值有如下几种情况
$\left \{ B,M,E,S \right \}$
其中 $B$ 表示当前字为一个词的开始， $M$ 表示当前字是一个词的中间位置， $E$ 表示当前字是一个词的结尾， $S$ 表示单字词。则上面这个句子的分词标注结果为

我/S     是/S      中/B      国/M     人/E

显然，得到了这个标注结果，我们就可以得到分词结果，做法很简单：

遇到S，则为一个单字词；遇到B，则为一个词的开始，直到遇到下一个E，则为一个词的结尾。

分词问题为给定观测序列，计算出概率最大的状态序列，对应的就是分词的结果。这通过解码算法实现。隐马尔可夫模型的参数则通过用语料库训练得到。下图是分词的隐马尔可夫模型按时间线展开后的结果

对于中文分词，词性标注等问题，在《机器学习与应用》中有详细的讲解，包括如何用循环神经网络解决此问题，感兴趣的读者可以进一步阅读。

估值问题

估值问题需要计算隐马尔可夫模型产生一个观测序列 $x=\left \{ x_1,\cdots,x_T \right \}$ 的概率。因为任意一种状态序列取值都可能会导致出现此观测序列，根据全概率公式，其值为
$p(x)=\sum_{z}p(x\mid z)p(z)$
上式列举所有可能的状态序列，以及该状态序列产生此观测序列的概率，要对 $n^T$ 项求和。因为每一时刻的状态取值有种 $n$ 可能，因此长度为 $T$ 的状态序列总共有 $n^T$ 种可能。下图展示了这一过程

已经推导过，任意一个状态序列出现的概率为
$p(z)=\prod_{t=1}^{T}p(z_{t}\mid z_{t-1})$
由于每一时刻的观测值只依赖于本时刻的状态值，因此有
$p(x\mid z)=\prod_{t=1}^{T}p(x_{t}\mid z_{t})$
产生一个观测序列的概率为
$p(x)=\sum_{z}\prod_{t=1}^{T}p(z_{t}\mid z_{t-1})p(x_{t}\mid z_{t})=\sum_{z}\prod_{t=1}^{T}b_{z_{t}x_{t}}a_{z_{t}z_{t-1}}$
直接计算这个值的复杂度是 $O(n^TT)$ 。显然上面的公式有很多重复计算。例如要计算产生观测序列 $(x_1,\cdots,x_5)$ 的概率，产生它的状态序列为 $(z_1,\cdots,z_5)$ ，假设状态取值有 $3$ 种情况。无论 $z_5$ 取什么值，为了计算整个序列出现的概率，任何一个长度为 $4$ 的子序列 $(z_1,\cdots,z_4)$ 产生观测子序列 $(x_1,\cdots,x_4)$ 的概率都要被重复计算 $3$ 次。利用这一特点可以使用动态规划算法高效求解。

假设已经计算出了长度为 $t - 1$ 的观测序列的概率，现在要计算长度为 $t$ 的观测序列的概率。如果状态的取值有 $n$ 种可能，则 $z_t$ 的取值有种可能。定义变量
$\alpha _{i}(t)=p(x_{1},...,x_{t},z_{t}=i)$
这个变量是到时刻 $t$ 为止的观测序列，产生它的状态序列中，最后一个状态为 $i$ ，即 $z_t=i$ 的概率。因此有
$p(x)=p(x_{1},...,x_{T})=\sum_{i=1}^{n}p(x_{1},...,x_{T},z_{T}=i)=\sum_{i=1}^{n}\alpha _{i}(T)$
根据定义可以得到这个变量的递归计算公式
$\alpha _{j}(t)=\sum_{i=1}^{n}\alpha _{i}(t-1)\alpha _{ij}b_{jx_{t}},j=1,...,n,t=1,...,T$
由此得到计算观测序列概率的高效算法。

上面算法的时间复杂度为 $O(n^2T)$ ，这比之前大为减少。此算法称为前向算法，也可以实现后向算法，即从后向前计算。这需要定义变量 $\beta$ 然后反向递推计算，原理与前向算法相同。

下面给出前向算法的直观解释。如果将状态序列所有时刻的路径展开，可以形成如下图所示的树结构

前向变量是对上图中以某一节点为根的子树中所有路径求和的结果。在上图中在 $3$ 时刻的值 $z_3$ 经过值 $a$ 的所有路径构成的子树以蓝色表示，这一子树求和的结果即为 $\alpha_a(3)$ 。只要得到所有子树的求和结果，通过递推可以得到以它们的父节点为根的子树的结果。

解码问题

解码问题指已知一个观测序列，寻找出最有可能产生它的状态序列，这是实际应用时最常见的问题。根据贝叶斯公式，解码问题可以形式化的定义为如下最大后验概率问题
$\begin{aligned} \arg \max_{z}p(z\mid x) &=\arg \max_{z}\frac{p(x,z)}{p(x)} \\ &= \arg \max_{z}\frac{p(x,z)}{\sum_{z}p(x,z)}\\ &= \arg \max_{z}p(x,z) \end{aligned}$

和贝叶斯分类器相同，忽略掉分母，因为它对所有状态序列是相同的。贝叶斯分类器是已知特征向量计算类后验概率，这里是已知观测序列反算状态序列的条件概率。

最简单的方法是列举所有可能的状态序列，然后计算它们产生该观测序列的概率，找出概率最大的那个。但这是没有必要的，通过使用动态规划算法，可以高效的解决此问题。动态规划求解最优路径时的核心结论是：要保证一个解是全局最优解，其部分解也必须是最优的。根据这一结论，可以得到经典的维特比（Viterbi）算法。

要保证 $p(x_1,\cdots,x_T,z_1, \cdots,z_T)$ 的概率最大，就需要保证 $p(x_1,\cdots,x_{T-1},z_1,\cdots,Z_{T-1})$ 的概率最大，这相当于寻找一条产生最大概率的路径，这条路径对应着一个状态序列。这和前面的前向算法类似，只要把求和换成求最大值即可。

如果整体路径是最优的，那么子路径也是最优的。假设概率最大的路径是 $(z_1,\cdots,z_T)$ ，在时刻 $t$ 经过的节点为 $z_t$ ，路径序列 $z_t,\cdots,z_T$ 必须是最优的。假设它不是最优的，则存在另外一个序列 $z_t,\cdots,z_T$ 的概率值更大，这与 $(z_1,\cdots,z_T)$ 是最优解矛盾。下图是维特比算法求解的示意图

上图中最优路径用加粗线表示。如果得到了 $1$ 时刻到 $3$ 时刻的最优路径，根据递推公式可以得到更长的序列的最优路径。

基于这个思想，从 $1$ 时刻开始，递推的计算 $t$ 时刻状态 $z_t=i$ 的子序列的最大概率路径，最后就可以得到整个问题的最优解。这一过程与前向算法、后向算法类似，区别在于是求极大值而不是求和。定义如下变量
$\alpha _{i}(i)=max_{z_1,...,z_{t-1}}p\left (z_{t}=i,z_{t-1},...,z_{1},x_{t},...x_{1} \right ),i=1,2...T$
即产生观测序列 $(x_1,\cdots,x_t)$ 的所有状态序列 $(z_1,\cdots,z_t)$ 中， $t$ 时刻的状态 $z_t=i$ 的概率的最大值。根据它的定义，可以得到递推计算公式
$\alpha _{i}(i)=\max_j\left ( \alpha_{t-1}(j)a_{ji}b_{ix_{t}} \right ),j=1,...,n,t=1,...,T$
最后可以得到产生观测序列的最大概率为
$\max_{i}\alpha _{T}(i)$
上面的定义只能得到最大概率，但要求解的得到这个最大概率的状态序列，为此定义下面的变量记住这个最优路径
$\beta _{t}(i)=\arg \max_{j}\alpha _{t-1}(j)a_{ji},i=1,...,n,j=1,...,n$
即 $t$ 时刻的状态 $z_t=i$ 的概率最大的状态序列中， $t - 1$ 时刻的状态值。有了这两个变量，就可以得到维特比算法。

在算法实现时，需要存储所有的 $\beta_t(i)$ ，而只用存储当前步的 $\alpha_t(i)$ 。这个算法的时间复杂度为 $O (n T)$ 。

训练算法

训练时给定一组样本，确定状态转移矩阵和观测矩阵。目标是状态转移矩阵和观测矩阵能很好的解释这组样本，通过最大似然估计实现。如果已知训练样本集中每个观测序列对应的状态序列，则可以直接根据最大似然估计得到模型参数，具体方法已经介绍，不同的是增加了观测矩阵。

下面考虑第二种情况，训练样本集只有观测值而没有状态值。假设有 $l$ 个训练样本，第 $i$ 个样本的观测序列为 $x_i$ ，其对应的状态序列为 $z_i$ ，序列长度为 $T$ ， $z_i$ 未知，计算 $x_i$ 的边缘概率时要对其所有可能的取值求和。假设状态集的大小为 $n$ ，观测集的大小为 $m$ 。为简化表述，考虑对单个样本的情况，对数似然函数为
$\begin{aligned} L(A,B) &=\ln p(x;A,B)=\sum_{z}\ln p(x,z;A,B) \\ &= \sum_{z}(\ln p(z;A,B)p(x\mid z;A,B))\\ &= \sum_{z}\ln\left ( (\prod_{t=1}^{T}p(z_{t}\mid z_{t-1}))(\prod_{t=1}^{T}p(x_{t}\mid z_{t})) \right )\\ &=\sum_{z}\ln\left ( \left ( \prod_{t=1}^{T}a_{z_{t-1}z_{t}} \right )\left ( \prod_{t=1}^{T}b_{z_{t}x_{t}} \right ) \right )\\ &= \sum_{z}\sum_{t=1}^{T}(\ln a_{z_{t-1}z_{t}}+\ln b_{z_{t}x_{t}})\\ &= \sum_{z}\left ( \sum_{i=1}^{n}\sum_{j=1}^{n}\sum_{t=1}^{T}(1\left \{ Z_{t-1}=i\wedge z_{t}=j \right \}\ln a_{ij})+\sum_{j=1}^{n}\prod_{k=1}^{m}\sum_{t=1}^{T}(1\left \{ z_{t}=j\wedge x_{t}=k \right \}\ln b_{jk}) \right ) \end{aligned}$
这里含有隐变量（状态变量），因此需要用EM算法求解。EM算法的详细原理在SIGAI之前的公众号文章“理解EM算法”以及《机器学习与应用》一书中有详细的讲解。

按照EM算法框架，在E步根据参数 $A$ 和 $B$ 的当前估计值计算隐变量 $z$ 的条件概率
$Q(z)=p(z\mid x;A,B)$
在M步计算数学期望，构造下界函数
$\begin{aligned} &\sum_{z}Q(z)\ln \frac{p(x,z;A,B)}{Q(z)} \\ &= \sum_{z}Q(z)\left ( \sum_{i=1}^{n}\sum_{j=1}^{n}\sum_{t=1}^{T}(1\left \{ z_{t-1}=i\wedge z_{t}=j \right \}\ln a_{ij}) +\sum_{j=1}^{n}\sum_{k=1}^{m}\sum_{t=1}^{T}(1\left \{ z_{t}=j\wedge x_{t}=k \right \}\ln Q(z))\right ) \end{aligned}$
在这里 $l n Q (z)$ 是与 $A$ 和 $B$ 无关的常数，可以忽略。由于状态转移矩阵和观测矩阵满足等式约束，构造拉格朗日乘子函数
$L(A,B,\mu ,v)=\sum_{z}Q(z)\left ( \sum_{i=1}^{n}\sum_{j=1}^{n} \sum_{t=1}^{T}(1\left \{ z_{t-1=i\wedge z_{t}=j}\quad \right \}\ln a_{ij})+\sum_{j=1}^{n}\sum_{k=1}^{m}\sum_{t=1}^{T}(1\left \{ z_{t}=j\wedge x_{t}=k \right \}\ln b_{jk})\right )+\sum_{i=1}^{n}\mu _{i}(1-\sum_{j=1}^{n}a_{ij})+\sum_{j=1}^{n}v_{j}(1-\sum_{k=1}^{m}b_{jk})$
对 $a_{ij}$ 求偏导数并令其为 $0$ ，可以得到
$\frac{\partial L(A,B,\mu ,v)}{\partial a_{ij}}=\sum_{z}Q(z)\frac{1}{a_{ij}}\sum_{t=1}^{T}1\left \{ z_{t-1}=i\wedge z_{t} =j\right \}-\mu _{i}=0$
解得
$a_{ij}=\frac{1}{\mu _{i}}\sum_{z}Q(z)\sum_{t=1}^{T}1\left \{ z_{t-1}=i\wedge z_{t} =j\right \}$
对 $b_{ij}$ 求偏导数并令其为0，可以得到
$\frac{\partial L(A,B,\mu ,v)}{\partial b_{jk}}=\sum_{z}Q(z)\frac{1}{b_{jk}}\sum_{t=1}^{T}1\left \{ z_{t}=j\wedge x_{t} =k\right \}-v_{j}=0$
解得
$b_{jk}=\frac{1}{v_{j}}\sum_{z}Q(z)\sum_{t=1}^{T}1\left \{ z_{t}=j\wedge x_{t} =k\right \}$
对 $\mu_{i}$ 求偏导数，并令其为0，可以得到
$\begin{aligned} \frac{\partial L(A,B,\mu ,v)}{\partial \mu _{i}} &= 1-\sum_{j=1}^{n}a_{ij}\\ &= 1-\sum_{j=1}^{n}\frac{1}{\mu _{i}}\sum_{z}Q(z)\sum_{t=1}^{T}1\left \{ z_{t-1}=i\wedge z_{t}=j \right \}=0 \end{aligned}$
解得
$\begin{aligned} \mu _{i} &=\sum_{j=1}^{n}\sum_{z}Q(z)\sum_{t=1}^{T}1\left \{ z_{t-1}=i\wedge z_{t}=j \right \} \\ &= \sum_{z}Q(z)\sum_{t=1}^{T}1\left \{ z_{t-1} =i\right \} \end{aligned}$
对 $v_j$ 求偏导数，并令其为0，可以得到
$\begin{aligned} \frac{\partial L(A,B,\mu ,v)}{\partial v_{j}} &= 1-\sum_{k=1}^{m}b_{jk}\\ &= 1-\sum_{k=1}^{m}\frac{1}{v_{j}}\sum_{z}Q(z)\sum_{t=1}^{T}1\left \{ z_{t}=j\wedge x_{t}=k \right \}=0 \end{aligned}$
解得
$\begin{aligned} v_{j} &=\sum_{k=1}^{m}\sum_{z}Q(z)\sum_{t=1}^{T}1\left \{ z_{t}=j\wedge x_{t}=k \right \} \\ &= \sum_{z}Q(z)\sum_{t=1}^{T}1\left \{ z_{t} =j\right \} \end{aligned}$
将 $\mu_i$ 和 $v _j$ 的值分别代入 $a_{ij}$ 和 $b_{jk}$ 的解，可以得到
$a_{ij}=\frac{\sum_{z}Q(z)\sum_{t=1}^{T}1\left \{ z_{t-1}=i\wedge z_{t}=j \right \}}{\sum_{z}Q(z)\sum_{t=1}^{T}1\left \{ z_{t-1}=i \right \}} b_{jk}=\frac{\sum_{z}Q(z)\sum_{t=1}^{T}1\left \{ z_{t}=j\wedge x_{t}=k \right \}}{\sum_{z}Q(z)\sum_{t=1}^{T}1\left \{ z_{t}=j \right \}}$
但上面两个值直接计算的成本太高，状态序列 $z$ 的所有可能取值有 $n^T$ 种。这一问题可用估值问题中使用的技巧解决，递推的计算这两个值。
$\begin{aligned} \sum_{z}Q(z)\sum_{t=1}^{T}1\left \{ z_{t-1}=i\wedge z_{t}=j \right \} &= \sum_{t=1}^{T}\sum_{z}1\left \{ z_{t-1}=i\wedge z_{t}=j \right \}Q(z)\\ &= \sum_{t=1}^{T}\sum_{z}1\left \{ z_{t-1}=i\wedge z_{t}=j \right \}p(z\mid x;A,B)\\ &= \frac{1}{p(x;A,B)}\sum_{t=1}^{T}\sum_{z}1\left \{ z_{t-1}=i\wedge z_{t}=j \right \}p(z,x;A,B)\\ &= \frac{1}{p(x;A,B)}\sum_{t=1}^{T}\alpha _{i}(t)a_{ij}b_{jx_{t}}\beta _{j}(t+1) \end{aligned}$
类似的有
$\begin{aligned} &\sum_{z}Q(z)\sum_{t=1}^{T}1\left \{ z_{t-1}=i \right \}=\sum_{j=1}^{n}\sum_{z}Q(z)\sum_{t=1}^{T}1\left \{ z_{t-1}=i\wedge z_{t}=j \right \} \\ &= \frac{1}{p(x;A,B)}\sum_{j=1}^{n}\sum_{t=1}^{T}\alpha _{i}(t)a_{ij}b_{jx_{t}}\beta _{j}(t+1) \end{aligned}$
因此有
$a_{ij}=\frac{\sum_{t=1}^{T}\alpha _{i}(t)a_{ij}b_{jx_{t}}\beta _{j}(t+1)}{\sum_{j=1}^{n}\sum_{t=1}^{T}\alpha _{i}(t)a_{ij}b_{jx_{t}}\beta _{j}(t+1)}$
用同样的方法可以计算出 $b_{jk}$ 。由此得到求解隐马尔可夫模型训练问题的Baum-Welch算法。

用随机数初始化矩阵 $A$ 和 $B$ 的元素，矩阵元素要满足等式约束条件

参考文献

[1] Baum, L. E., Petrie, T. Statistical Inference for Probabilistic Functions of Finite State Markov Chains. The Annals of Mathematical Statistics. 37 (6): 1554–1563. 1966.

[2] Baum, L. E., Eagon, J. A. An inequality with applications to statistical estimation for probabilistic functions of Markov processes and to a model for ecology. Bulletin of the American Mathematical Society. 73 (3): 360. 1967.

[3] Baum, L. E., Petrie, T., Soules, G., Weiss, N. A Maximization Technique Occurring in the Statistical Analysis of Probabilistic Functions of Markov Chains. The Annals of Mathematical Statistics. 41: 164. 1970

[4] Baum, L.E. An Inequality and Associated Maximization Technique in Statistical Estimation of Probabilistic Functions of a Markov Process. Inequalities. 3: 1–8. 1972.

[5] Lawrence R. Rabiner. A tutorial on Hidden Markov Models and selected applications in speech recognition. Proceedings of the IEEE. 77 (2): 257–286. 1989.

你可能感兴趣的:(机器学习,人工智能,AI)

微信小程序跳转其他小程序以及跳转网站
一、跳转其他小程序1.1知道appid和页面路径wx.navigateToMiniProgram({appId:appid,//替换为目标小程序AppIDpath:pathWithParams,//小程序路径envVersion:'release',//开发版、体验版或正式版success(res){console.log("跳转到其他小程序成功！",res);},fail(err){consol
MCP-Proxy：开发多LLM & 多MCP 支持并安全访问MCP Server的秘密 IT古董技术杂谈安全 MCP MCP-Proxy
在构建多模型、多协议、可控可信的大模型接入平台时，MCP-Proxy扮演着关键中枢。它不仅要支持多个LLM接入，还要保障对后端MCPServer的安全访问、请求审计、能力切换与资源隔离。什么是MCP/MCP-Proxy？MCP（ModelCapabilityProtocol）是新一代模型能力调用协议，类似于OpenAI的API，但可支持：多厂商大模型（OpenAI、DeepSeek、Yi、Chat
构建医学文献智能助手：基于 LangChain 的专业领域 RAG 系统实践
前言在当今医疗科技快速发展的时代，每天都有数以千计的医学研究成果在全球范围内发表。从临床试验报告到基础研究论文，从流行病学调查到药物研发数据，这些专业文献承载着推动医学进步的重要知识。然而，面对如此海量且专业性极强的文献资料，医疗从业者往往感到力不从心。如何在有限的时间内，准确把握文献核心价值，并将其转化为临床实践的指导？这个问题一直困扰着整个医疗行业。1.项目背景与业务价值1.1医学文献阅读的困
Spring AI快速入门学java的cc spring 大数据 java
一、引入依赖org.springframework.aispring-ai-starter-model-openaiorg.springframework.aispring-ai-bom${spring-ai.version}pomimport二、配置模型spring：ai:openai:base-url:https://dashscope.aliyuncs.com/compatible-mode
Python爬虫实战：爬取知乎问答与用户信息 Python爬虫项目 python 爬虫 php 数据分析开发语言开源
简介随着网络信息量的爆炸，如何有效获取有价值的内容，成为了数据分析、机器学习等领域的基础之一。爬虫作为数据采集的基本工具之一，常常被用来获取互联网上的公开数据。在这篇博客中，我们将结合最新的Python爬虫技术，详细讲解如何爬取知乎问答与用户信息。本文将会介绍：Python爬虫的基础知识知乎问答网页结构分析使用Python进行知乎数据爬取爬取知乎问答内容与用户信息如何处理和存储爬取的数据使用最新的
【机器学习&深度学习】反向传播机制
目录一、一句话定义二、类比理解三、为什重要？四、用生活例子解释：神经网络=烹饪机器人4.1第一步：尝一口（前向传播）4.2第二步：倒着推原因（反向传播）五、换成人工智能流程说一遍六、图示类比：找山顶（最优参数）七、总结一句人话八、PyTorch代码示例：亲眼看到每一层的梯度九、梯度=损失函数对参数的偏导数十、类比总结反向传播（Backpropagation）是神经网络中训练过程的核心机制，它就像“
.NET C# async/定时任务的异步线程池调度方案最大线程数‌ = 处理器核心数 × 250 专注VB编程开发20年 .net c#开发语言
关于.NET中Threading.Timer的线程机制，结合线程池特性和异步协作原理分析如下：一、线程复用机制‌共享进程级线程池‌Threading.Timer的回调任务‌不会每次新建线程‌，而是提交到.NET进程全局线程池统一调度，该线程池与async/await任务共享同一资源池。线程池维护可复用工作线程队列，避免频繁创建/销毁开销任务优先由空闲线程执行，无空闲线程则进入全局队列等待‌线程池扩
“自动化失败归因”测试集-Who&When liliangcsdn 自动化人工智能语言模型
在MAS(Multi-Agent系统)中，Agent之间自主协作、信息链条长，异常常见而且诊断困难。Who&When就是测者MAS系统异常诊断的benchmark。Who&When的prompt问题来源于GAIAandAssistantBench，包含了127个LLMMulti-Agent系统中收集的异常日志，并经过系统和人工处理。Who&When样本配有如下所示的细粒度标注：“谁”(Who)：哪
AIRIOT物联网低代码平台如何配置MQTT驱动？ AIRIOT 网络服务器物联网
MQTT驱动配置简介MQTT全称为消息队列遥测传输（英语：MessageQueuingTelemetryTransport），是ISO标准（ISO/IECPRF20922）下基于发布(Publish)/订阅(Subscribe)范式的消息协议，工作在TCP/IP协议族上。MQTT最大优点在于，可以用极少的数据和有限的带宽，为连接远程设备提供实时可靠的消息服务。作为一种低开销、低带宽占用的即时通讯协
鸿蒙 ArkTS 开发知识点全体系（HarmonyOS NEXT 架构）码农乐园 harmonyos 架构华为
一、基础知识：ArkTS语言与项目结构1.ArkTS基础语法（华为增强TypeScript）类型声明与推导函数与箭头函数类、接口、枚举、泛型模块导入与导出装饰器语法（@Entry、@Component等）异步编程（async/await）2.DevEcoStudio开发环境项目创建与构建模拟器配置与真机调试工程结构（entry、pages、resources、common、config.json）
GPT-4o重磅升级！只需一条指令，教你秒出SCI级专业科研图！智写AI AI学术写作指南信息可视化人工智能
经过数月爆肝，七哥终于完成专业的学术AI使用教程，估计也有个80万字的详细操作指南。分为多个细分的专业写作场景，跟着一步一步操作，借助ChatGPT做学术、干科研、写论文、课题申报都变得超简单。欢迎加我交流（yida985），祝你一臂之力。七哥之前写过关于用AI生成流程图的教程，不过需要借助其他软件才能搞定完美的流程图。近期GPT-4o全新推出了“生图功能”，这个生图的过程就更加方便轻松了，全能G
RAG 调优指南：Spring AI Alibaba 模块化 RAG 原理与使用 ApacheDubbo spring 人工智能架构 Spring AI RAG
>夏冬,SpringAIAlibabaContributorRAG简介什么是RAG（检索增强生成）RAG（RetrievalAugmentedGeneration，检索增强生成）是一种结合信息检索和文本生成的技术范式。核心设计理念RAG技术就像给AI装上了「实时百科大脑」，通过先查资料后回答的机制，让AI摆脱传统模型的"知识遗忘"困境。️四大核心步骤1.文档切割→建立智能档案库核心任务:将海量文档
华为云welink考试试题_华为内部开启WeLink项目，华为云是这样考虑的-通信/网络-与非网... weixin_39820437 华为云welink考试试题
协同办公市场竞争激烈华为云WeLink是华为旗下智能工作平台，它融合消息，邮件，会议、音视频、云空间、小程序等服务，可助力用户随时、随地、通过各类终端设备等实现协作办公。华为还宣布携手合作伙伴成立华为云WeLink生态联盟，金山办公、中软国际、致远互联、罗技、华为商旅、红圈营销、合思费控、Coremail论客、芯盾集团、视源股份、喜马拉雅等成为首批生态伙伴。IDC曾发布了《2018年下半年中国企业
潜入思维的海洋：SoftCoT++如何让语言模型更聪明步子哥智能涌现语言模型人工智能自然语言处理
在人工智能的浩瀚星空下，大型语言模型（LLMs）如同一颗颗璀璨的恒星，照亮了从文本生成到复杂推理的广阔领域。然而，这些模型在推理任务中往往像是在迷雾中航行——尽管它们能抵达目的地，却常常因为固定的思维路径而错过更优的航线。2025年5月，一篇题为《SoftCoT++:Test-TimeScalingwithSoftChain-of-ThoughtReasoning》的论文如同一盏明灯，照亮了如何让
PyWavelets shangjg3 PyTorch pytorch 人工智能 python
PyWavelets（pywt）是Python中用于小波变换的核心库，提供了丰富的信号处理和图像处理功能。以下是其核心功能的详细介绍：1.小波变换基础（1）离散小波变换（DWT）将信号分解为近似系数（Approximation）和细节系数（Detail）。importpywtimportnumpyasnp#示例信号signal=np.array([1
为什么90%企业的AI数据分析都失败了？奥威BI给出破局方案 qq_43696218 人工智能数据分析数据挖掘
一、引言：AI数据分析在数字化转型中的核心地位在当今企业全面数字化转型的背景下，‌AI数据分析已成为解锁业务增长潜力的关键钥匙。然而，市场上众多AI数据分析产品常陷入“伪需求场景”，看似前沿却难以真正落地。本文将深入探讨奥威BI如何通过其AI数据分析能力，突破伪需求，实现数据价值的最大化。二、AI数据分析：伪需求场景的挑战伪需求场景的定义与表现AI数据分析领域的伪需求场景，指的是那些表面创新实则难
BI+AI实战：我们如何用3秒完成车企供应链推演 qq_43696218 人工智能
一、BI+AI引领财务分析新纪元在财务数据分析领域，奥威BI+AI正以革命性的姿态颠覆传统。当金蝶、用友等工具仍深陷报表泥潭时，奥威BI+AI通过深度融合商业智能（BI）与人工智能（AI），实现了从滞后报表到实时洞察的飞跃。这不仅极大地提升了财务分析的效率，更为企业的战略决策提供了前所未有的精准支持。二、BI+AI的核心技术优势‌实时动态分析‌o奥威BI+AI摒弃了静态数据集，依托原始科目余额表实
Spring AI Alibaba 支持国产大模型的Spring ai框架程序员老陈头面试学习路线阿里巴巴 spring 人工智能 java
总计30万奖金，SpringAIAlibaba应用框架挑战赛开赛点此了解SpringAI：java做ai应用的最好选择过去，Java在AI应用开发方面缺乏一个高效且易于集成的框架，这限制了开发者快速构建和部署智能应用程序的能力。SpringAI正是为解决这一问题而生，它提供了一套统一的接口，使得AI功能能够以一种标准化的方式被集成到现有的Java项目中。此外，SpringAI与原有的Spring生
初中学习机推荐：从功能、内容到用户体验的深度解析资讯分享周 ux 人工智能
在教育信息化持续深化的背景下,初中阶段的学习辅助设备正逐步成为家长和学生关注的重点。尤其在“双减”政策推动下,传统补习班的作用被削弱,越来越多家庭开始依赖智能学习工具来提升学习效率和自主性。其中,初中学习机因其集视频课程、AI辅导、错题整理、学习反馈等多功能于一体,成为当前市场热度最高的教育硬件之一。本文将围绕市场上主流的几款初中学习机进行客观分析,重点介绍简单一百、学而思、科大讯飞、作业帮四款产
DeepSeek-V3 通俗详解：从诞生到优势，以及与 GPT-4o 的对比码事漫谈 AI ai
前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站1.DeepSeek的前世今生1.1什么是DeepSeek？DeepSeek是一家专注于人工智能技术研发的公司，致力于打造高性能、低成本的AI模型。它的目标是让AI技术更加普惠，让更多人能够用上强大的AI工具。1.2DeepSeek-V3的诞生DeepSeek-V3是DeepSeek公司推出的最新一代A
企业级AI开发利器：Spring AI框架深度解析与实战_spring ai实战 AI大模型-海文人工智能 spring python 算法开发语言 java 机器学习
企业级AI开发利器：SpringAI框架深度解析与实战一、前言：Java生态的AI新纪元在人工智能技术爆发式发展的今天，Java开发者面临着一个新的挑战：如何将大语言模型（LLMs）和生成式AI（GenAI）无缝融入企业级应用。传统的Java生态缺乏统一的AI集成方案，开发者往往需要为不同AI供应商（如OpenAI、阿里云、HuggingFace）编写大量重复的接口适配代码，这不仅增加了开发成本，
Python编程：使用Opencv进行图像处理
【参考】https://github.com/opencv/opencv/tree/4.x/samples/pythonPython使用OpenCV进行图像处理OpenCV(OpenSourceComputerVisionLibrary)是一个开源的计算机视觉和机器学习软件库。下面将从基础到高阶介绍如何使用Python中的OpenCV进行图像处理。一、安装首先需要安装OpenCV库：pipinst
Linux命令行操作基础 EnigmaCoder Linux linux 运维服务器
目录前言目录结构✍️语法格式操作技巧Tab补全光标操作基础命令登录和电源管理命令⚙️login⚙️last⚙️exit⚙️shutdown⚙️halt⚙️reboot文件命令⚙️浏览目录类命令pwdcdls⚙️浏览文件类命令catmorelessheadtail⚙️目录操作类命令mkdirrmdir⚙️文件操作类命令mvrmtouchfindgziptar⚙️cp前言大家好！我是EnigmaCod
图扑软件智慧云展厅，开启数字化展馆新模式智慧园区可视化 5g 人工智能大数据安全云计算
随着疫情的影响以及新兴技术的不断发展，展会的发展形式也逐渐从线下转向线上。通过“云”上启动、云端互动、双线共频的形式开展。通过应用大数据、人工智能、沉浸式交互等多重技术手段，构建数据共享、信息互通、精准匹配的高精度“云展厅”，突破时空壁垒限制。图扑软件运用HT强大的渲染功能，数字孪生“云展位”，1:1复现实际展厅内部独特的结构造型和建筑特色。也可以第一人称视角漫游，模拟用户在展厅内的参观场景，在保
webpack和vite对比解析（AI）秉承初心 AI创造 webpack 前端 node.js
以下是Webpack和Vite的对比解析，从核心机制、性能、配置扩展性、适用场景等维度进行详细说明：⚙️一、核心机制差异构建模式Webpack：采用打包器模式，启动时需遍历整个模块依赖图，将所有资源打包成Bundle，再启动开发服务器。Vite：基于ESModules原生支持，开发环境跳过打包，按需编译（浏览器请求时实时编译）。生产环境才用Rollup打包。依赖处理Webpack：冷启动时需全量打
转行要趁早！网络安全行业人才缺口大，企业招聘需求正旺！
网络安全行业具有人才缺口大、岗位选择多、薪资待遇好、学历要求不高等优势，对于想要转行的人员来说，是一个非常不错的选择。人才缺口大网络安全攻防技术手段日新月异，特别是现在人工智能技术飞速发展，网络安全形势复杂严峻，人才重要性凸显。教育部《网络安全人才实战能力白皮书》数据显示，到2027年，我国网络安全人员缺口将达327万。近期发布的《2024年网络安全产业人才发展报告》中提到，沿用ISC2的人才缺口
GO 语言学习之运算符号唯独不开心学习 go
算术运算符：二元的运算符：+-*/%四则运算没啥好说的，从小就开始学习，最后一个%表示求余数或者取模运算。packagemainimport"fmt"funcmain(){a:=1+2b:=a-1c:=a*bd:=c/ae:=c%3fmt.Println("a:=1+2的结果是：",a)fmt.Println("b:=a-1的结果是：",b)fmt.Println("c:=a*b的结果是：",c)
GO 语言学习之变量和常量唯独不开心 golang 学习开发语言
变量变量顾名思义，存储的内容是不确定，只有在执行赋值后那一刻是确定的，因为你也不知道赋值后会不会被修改。变量定义方式：var:=var(aint,b,c....)示例：packagemainimport"fmt"funcmain(){varaint//定义一个整型变量，默认是零值（整形的零值是0）b:=1//定义一个整型变量，并赋值为1fmt.Printf("a=%db=%d\n",a,b)//定
基于机器学习的智能文本分类技术研究与应用
在当今数字化时代，文本数据的爆炸式增长给信息管理和知识发现带来了巨大的挑战。从新闻文章、社交媒体帖子到企业文档和学术论文，海量的文本数据需要高效地分类和管理，以便用户能够快速找到所需信息。传统的文本分类方法主要依赖于人工规则和关键词匹配，这些方法不仅效率低下，而且难以应对复杂多变的文本内容。近年来，机器学习技术的快速发展为文本分类提供了一种高效、自动化的解决方案。一、机器学习在文本分类中的应用概述
HarmonyOS Next常用组件 TextInput harmonyos
InputType枚举说明Normal基本输入模式，无特殊限制Password密码输入模式。密码显示小眼睛图标，默认输入文字短暂显示后变成圆点Email邮箱地址输入模式。支持数字、字母、下划线、小数点、!、#、$、%、&、'、"、*、+、-、/、=、?、^、`、{、\、}、~，以及@字符（只能存在一个@字符）Number纯数字输入模式PhoneNumber电话号码输入模式。支持输入数字、空格、+、
Spring的注解积累 yijiesuifeng spring 注解
用注解来向Spring容器注册Bean。需要在applicationContext.xml中注册： <context:component-scan base-package=”pagkage1[,pagkage2,…,pagkageN]”/>。如：在base-package指明一个包 <context:component-sc
传感器百合不是茶 android 传感器
android传感器的作用主要就是来获取数据,根据得到的数据来触发某种事件下面就以重力传感器为例; 1,在onCreate中获得传感器服务 private SensorManager sm;// 获得系统的服务 private Sensor sensor;// 创建传感器实例 @Override protected void
[光磁与探测]金吕玉衣的意义 comsci
这是一个古代人的秘密:现在告诉大家信不信由你们: 穿上金律玉衣的人,如果处于灵魂出窍的状态,可以飞到宇宙中去看星星这就是为什么古代
精简的反序打印某个数沐刃青蛟打印
以前看到一些让求反序打印某个数的程序。比如：输入123，输出321。记得以前是告诉你是几位数的，当时就抓耳挠腮，完全没有思路。似乎最后是用到%和/方法解决的。而今突然想到一个简短的方法，就可以实现任意位数的反序打印（但是如果是首位数或者尾位数为0时就没有打印出来了）代码如下： long num, num1=0;
PHP：6种方法获取文件的扩展名 IT独行者 PHP 扩展名
PHP：6种方法获取文件的扩展名 1、字符串查找和截取的方法 1 $extension = substr ( strrchr ( $file , '.' ), 1); 2、字符串查找和截取的方法二 1 $extension = substr
面试111 文强chu 面试
1事务隔离级别有那些，事务特性是什么（问到一次） 2 spring aop 如何管理事务的，如何实现的。动态代理如何实现，jdk怎么实现动态代理的，ioc是怎么实现的，spring是单例还是多例，有那些初始化bean的方式，各有什么区别（经常问） 3 struts默认提供了那些拦截器（一次） 4 过滤器和拦截器的区别（频率也挺高） 5 final，finally final
XML的四种解析方式小桔子 dom jdom dom4j sax
在平时工作中，难免会遇到把 XML 作为数据存储格式。面对目前种类繁多的解决方案，哪个最适合我们呢？在这篇文章中，我对这四种主流方案做一个不完全评测，仅仅针对遍历 XML 这块来测试，因为遍历 XML 是工作中使用最多的（至少我认为）。　　预备　　测试环境：　　AMD 毒龙1.4G OC 1.5G、256M DDR333、Windows2000 Server
wordpress中常见的操作 aichenglong 中文注册 wordpress 移除菜单
1 wordpress中使用中文名注册解决办法 1)使用插件 2)修改wp源代码进入到wp-include/formatting.php文件中找到 function sanitize_user( $username, $strict = false
小飞飞学管理-1 alafqq 管理
项目管理的下午题，其实就在提出问题（挑刺），分析问题，解决问题。今天我随意看下10年上半年的第一题。主要就是项目经理的提拨和培养。结合我自己经历写下心得对于公司选拔和培养项目经理的制度有什么毛病呢？ 1，公司考察，选拔项目经理，只关注技术能力，而很少或没有关注管理方面的经验，能力。 2，公司对项目经理缺乏必要的项目管理知识和技能方面的培训。 3，公司对项目经理的工作缺乏进行指
IO输入输出部分探讨百合不是茶 IO
//文件处理在处理文件输入输出时要引入java.IO这个包； /* 1，运用File类对文件目录和属性进行操作 2，理解流，理解输入输出流的概念 3，使用字节/符流对文件进行读/写操作 4，了解标准的I/O 5，了解对象序列化 */ //1，运用File类对文件目录和属性进行操作 //在工程中线创建一个text.txt
getElementById的用法 bijian1013 element
getElementById是通过Id来设置/返回HTML标签的属性及调用其事件与方法。用这个方法基本上可以控制页面所有标签，条件很简单，就是给每个标签分配一个ID号。返回具有指定ID属性值的第一个对象的一个引用。语法： &n
励志经典语录 bijian1013 励志人生
经典语录1: 哈佛有一个著名的理论：人的差别在于业余时间，而一个人的命运决定于晚上8点到10点之间。每晚抽出2个小时的时间用来阅读、进修、思考或参加有意的演讲、讨论，你会发现，你的人生正在发生改变，坚持数年之后，成功会向你招手。不要每天抱着QQ/MSN/游戏/电影/肥皂剧……奋斗到12点都舍不得休息，看就看一些励志的影视或者文章，不要当作消遣；学会思考人生，学会感悟人生
[MongoDB学习笔记三]MongoDB分片 bit1129 mongodb
MongoDB的副本集(Replica Set)一方面解决了数据的备份和数据的可靠性问题，另一方面也提升了数据的读写性能。MongoDB分片(Sharding)则解决了数据的扩容问题，MongoDB作为云计算时代的分布式数据库，大容量数据存储，高效并发的数据存取，自动容错等是MongoDB的关键指标。本篇介绍MongoDB的切片(Sharding) 1.何时需要分片 &nbs
【Spark八十三】BlockManager在Spark中的使用场景 bit1129 manager
1. Broadcast变量的存储，在HttpBroadcast类中可以知道 2. RDD通过CacheManager存储RDD中的数据，CacheManager也是通过BlockManager进行存储的 3. ShuffleMapTask得到的结果数据，是通过FileShuffleBlockManager进行管理的，而FileShuffleBlockManager最终也是使用BlockMan
yum方式部署zabbix ronin47 yum方式部署zabbix
安装网络yum库#rpm -ivh http://repo.zabbix.com/zabbix/2.4/rhel/6/x86_64/zabbix-release-2.4-1.el6.noarch.rpm 通过yum装mysql和zabbix调用的插件还有agent代理#yum install zabbix-server-mysql zabbix-web-mysql mysql-
Hibernate4和MySQL5.5自动创建表失败问题解决方法 byalias J2EE Hibernate4
今天初学Hibernate4，了解了使用Hibernate的过程。大体分为4个步骤： ①创建hibernate.cfg.xml文件 ②创建持久化对象 ③创建*.hbm.xml映射文件 ④编写hibernate相应代码在第四步中，进行了单元测试，测试预期结果是hibernate自动帮助在数据库中创建数据表，结果JUnit单元测试没有问题，在控制台打印了创建数据表的SQL语句，但在数据库中
Netty源码学习-FrameDecoder bylijinnan java netty
Netty 3.x的user guide里FrameDecoder的例子，有几个疑问： 1.文档说：FrameDecoder calls decode method with an internally maintained cumulative buffer whenever new data is received. 为什么每次有新数据到达时，都会调用decode方法？ 2.Dec
SQL行列转换方法 chicony 行列转换
create table tb(终端名称 varchar(10) , CEI分值 varchar(10) , 终端数量 int) insert into tb values('三星' , '0-5' , 74) insert into tb values('三星' , '10-15' , 83) insert into tb values('苹果' , '0-5' , 93)
中文编码测试 ctrain 编码
循环打印转换编码 String[] codes = { "iso-8859-1", "utf-8", "gbk", "unicode" }; for (int i = 0; i < codes.length; i++) { for (int j
hive 客户端查询报堆内存溢出解决方法 daizj hive 堆内存溢出
hive> select * from t_test where ds=20150323 limit 2; OK Exception in thread "main" java.lang.OutOfMemoryError: Java heap space 问题原因： hive堆内存默认为256M 这个问题的解决方法为：修改/us
人有多大懒，才有多大闲 (评论『卓有成效的程序员』) dcj3sjt126com 程序员
卓有成效的程序员给我的震撼很大，程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可以那么勤奋，每天都孜孜不倦得做着重复单调的工作。在看这本书之前，我属于勤奋的人，而看完这本书以后，我要努力变成懒惰的人。不要在去庞大的开始菜单里面一项一项搜索自己的应用程序，也不要在自己的桌面上放置眼花缭乱的快捷图标
Eclipse简单有用的配置 dcj3sjt126com eclipse
1、显示行号 Window -- Prefences -- General -- Editors -- Text Editors -- show line numbers 2、代码提示字符 Window ->Perferences，并依次展开 Java -> Editor -> Content Assist，最下面一栏 auto-Activation
在tomcat上面安装solr4.8.0全过程 eksliang Solr solr4.0后的版本安装 solr4.8.0安装
转载请出自出处： http://eksliang.iteye.com/blog/2096478 首先solr是一个基于java的web的应用，所以安装solr之前必须先安装JDK和tomcat，我这里就先省略安装tomcat和jdk了第一步：当然是下载去官网上下载最新的solr版本，下载地址
Android APP通用型拒绝服务、漏洞分析报告 gg163 漏洞 android APP 分析
点评：记得曾经有段时间很多SRC平台被刷了大量APP本地拒绝服务漏洞，移动安全团队爱内测（ineice.com）发现了一个安卓客户端的通用型拒绝服务漏洞，来看看他们的详细分析吧。 0xr0ot和Xbalien交流所有可能导致应用拒绝服务的异常类型时，发现了一处通用的本地拒绝服务漏洞。该通用型本地拒绝服务可以造成大面积的app拒绝服务。针对序列化对象而出现的拒绝服务主要
HoverTree项目已经实现分层 hvt 编程 .net Web C#ASP.ENT
HoverTree项目已经初步实现分层，源代码已经上传到 http://hovertree.codeplex.com请到SOURCE CODE查看。在本地用SQL Server 2008 数据库测试成功。数据库和表请参考：http://keleyi.com/a/bjae/ue6stb42.htmHoverTree是一个ASP.NET 开源项目，希望对你学习ASP.NET或者C#语言有帮助，如果你对
Google Maps API v3: Remove Markers 移除标记天梯梦 google maps api
Simply do the following: I. Declare a global variable: var markersArray = []; II. Define a function: function clearOverlays() { for (var i = 0; i < markersArray.length; i++ )
jQuery选择器总结 lq38366 jquery 选择器
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40
基础数据结构和算法六：Quick sort sunwinner Algorithm Quicksort
Quick sort is probably used more widely than any other. It is popular because it is not difficult to implement, works well for a variety of different kinds of input data, and is substantially faster t
如何让Flash不遮挡HTML div元素的技巧_HTML/Xhtml_网页制作刘星宇 html Web
今天在写一个flash广告代码的时候，因为flash自带的链接，容易被当成弹出广告，所以做了一个div层放到flash上面，这样链接都是a触发的不会被拦截，但发现flash一直处于div层上面，原来flash需要加个参数才可以。让flash置于DIV层之下的方法，让flash不挡住飘浮层或下拉菜单，让Flash不档住浮动对象或层的关键参数：wmode=opaque。方法如下：
Mybatis实用Mapper SQL汇总示例 wdmcygah sql mysql mybatis 实用
Mybatis作为一个非常好用的持久层框架，相关资料真的是少得可怜，所幸的是官方文档还算详细。本博文主要列举一些个人感觉比较常用的场景及相应的Mapper SQL写法，希望能够对大家有所帮助。不少持久层框架对动态SQL的支持不足，在SQL需要动态拼接时非常苦恼，而Mybatis很好地解决了这个问题，算是框架的一大亮点。对于常见的场景，例如：批量插入/更新/删除，模糊查询，多条件查询，联表查询，