编著人

[综]隐马尔可夫模型Hidden Markov Model (HMM)

http://www.zhihu.com/question/20962240

Yang Eninala杜克大学生物化学博士线性代数

收录于编辑推荐 •2216 人赞同

×××××11月22日已更新×××××

隐马尔可夫（HMM）好讲，简单易懂不好讲。我认为 @者也的回答没什么错误，不过我想说个更通俗易懂的例子。我希望我的读者不是专家，而是对这个问题感兴趣的入门者，所以我会多阐述数学思想，少写公式。霍金曾经说过，你多写一个公式，就会少一半的读者。所以时间简史这本关于物理的书和麦当娜关于性的书卖的一样好。我会效仿这一做法，写最通俗易懂的答案。

还是用最经典的例子，掷骰子。假设我手里有三个不同的骰子。第一个骰子是我们平常见的骰子（称这个骰子为D6），6个面，每个面（1，2，3，4，5，6）出现的概率是1/6。第二个骰子是个四面体（称这个骰子为D4），每个面（1，2，3，4）出现的概率是1/4。第三个骰子有八个面（称这个骰子为D8），每个面（1，2，3，4，5，6，7，8）出现的概率是1/8。

假设我们开始掷骰子，我们先从三个骰子里挑一个，挑到每一个骰子的概率都是1/3。然后我们掷骰子，得到一个数字，1，2，3，4，5，6，7，8中的一个。不停的重复上述过程，我们会得到一串数字，每个数字都是1，2，3，4，5，6，7，8中的一个。例如我们可能得到这么一串数字（掷骰子10次）：1 6 3 5 2 7 3 5 2 4

这串数字叫做可见状态链。但是在隐马尔可夫模型中，我们不仅仅有这么一串可见状态链，还有一串隐含状态链。在这个例子里，这串隐含状态链就是你用的骰子的序列。比如，隐含状态链有可能是：D6 D8 D8 D6 D4 D8 D6 D6 D4 D8

一般来说，HMM中说到的马尔可夫链其实是指隐含状态链，因为隐含状态（骰子）之间存在转换概率（transition probability）。在我们这个例子里，D6的下一个状态是D4，D6，D8的概率都是1/3。D4，D8的下一个状态是D4，D6，D8的转换概率也都一样是1/3。这样设定是为了最开始容易说清楚，但是我们其实是可以随意设定转换概率的。比如，我们可以这样定义，D6后面不能接D4，D6后面是D6的概率是0.9，是D8的概率是0.1。这样就是一个新的HMM。

同样的，尽管可见状态之间没有转换概率，但是隐含状态和可见状态之间有一个概率叫做输出概率（emission probability）。就我们的例子来说，六面骰（D6）产生1的输出概率是1/6。产生2，3，4，5，6的概率也都是1/6。我们同样可以对输出概率进行其他定义。比如，我有一个被赌场动过手脚的六面骰子，掷出来是1的概率更大，是1/2，掷出来是2，3，4，5，6的概率是1/10。

其实对于HMM来说，如果提前知道所有隐含状态之间的转换概率和所有隐含状态到所有可见状态之间的输出概率，做模拟是相当容易的。但是应用HMM模型时候呢，往往是缺失了一部分信息的，有时候你知道骰子有几种，每种骰子是什么，但是不知道掷出来的骰子序列；有时候你只是看到了很多次掷骰子的结果，剩下的什么都不知道。如果应用算法去估计这些缺失的信息，就成了一个很重要的问题。这些算法我会在下面详细讲。

×××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××
如果你只想看一个简单易懂的例子，就不需要往下看了。
×××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××××
说两句废话，答主认为呢，要了解一个算法，要做到以下两点：会其意，知其形。答主回答的，其实主要是第一点。但是这一点呢，恰恰是最重要，而且很多书上不会讲的。正如你在追一个姑娘，姑娘对你说“你什么都没做错！”你要是只看姑娘的表达形式呢，认为自己什么都没做错，显然就理解错了。你要理会姑娘的意思，“你赶紧给我道歉！”这样当你看到对应的表达形式呢，赶紧认错，跪地求饶就对了。数学也是一样，你要是不理解意思，光看公式，往往一头雾水。不过呢，数学的表达顶多也就是晦涩了点，姑娘的表达呢，有的时候就完全和本意相反。所以答主一直认为理解姑娘比理解数学难多了。

回到正题，和HMM模型相关的算法主要分为三类，分别解决三种问题：

1）知道骰子有几种（隐含状态数量），每种骰子是什么（转换概率），根据掷骰子掷出的结果（可见状态链），我想知道每次掷出来的都是哪种骰子（隐含状态链）。
这个问题呢，在语音识别领域呢，叫做解码问题。这个问题其实有两种解法，会给出两个不同的答案。每个答案都对，只不过这些答案的意义不一样。第一种解法求最大似然状态路径，说通俗点呢，就是我求一串骰子序列，这串骰子序列产生观测结果的概率最大。第二种解法呢，就不是求一组骰子序列了，而是求每次掷出的骰子分别是某种骰子的概率。比如说我看到结果后，我可以求得第一次掷骰子是D4的概率是0.5，D6的概率是0.3，D8的概率是0.2.第一种解法我会在下面说到，但是第二种解法我就不写在这里了，如果大家有兴趣，我们另开一个问题继续写吧。

2）还是知道骰子有几种 （隐含状态数量） ，每种骰子是什么 （转换概率） ，根据掷骰子掷出的结果 （可见状态链） ，我想知道掷出这个结果的概率。
看似这个问题意义不大，因为你掷出来的结果很多时候都对应了一个比较大的概率。问这个问题的目的呢，其实是检测观察到的结果和已知的模型是否吻合。如果很多次结果都对应了比较小的概率，那么就说明我们已知的模型很有可能是错的，有人偷偷把我们的骰子給换了。

3）知道骰子有几种 （隐含状态数量） ，不知道每种骰子是什么 （转换概率） ，观测到很多次掷骰子的结果 （可见状态链） ，我想反推出每种骰子是什么 （转换概率） 。
这个问题很重要，因为这是最常见的情况。很多时候我们只有可见结果，不知道HMM模型里的参数，我们需要从可见结果估计出这些参数，这是建模的一个必要步骤。

问题阐述完了，下面就开始说解法。（0号问题在上面没有提，只是作为解决上述问题的一个辅助）

0.一个简单问题
其实这个问题实用价值不高。由于对下面较难的问题有帮助，所以先在这里提一下。

知道骰子有几种，每种骰子是什么，每次掷的都是什么骰子，根据掷骰子掷出的结果，求产生这个结果的概率。
解法无非就是概率相乘：
$P=P(D6)*P(D6\rightarrow 1)*P(D6\rightarrow D8)*P(D8\rightarrow 6)*P(D8\rightarrow D8)*P(D8\rightarrow 3)$
$=\frac{1}{3} *\frac{1}{6} *\frac{1}{3} *\frac{1}{8} *\frac{1}{3} *\frac{1}{8}$

1.看见不可见的，破解骰子序列
这里我说的是第一种解法，解最大似然路径问题。
举例来说，我知道我有三个骰子，六面骰，四面骰，八面骰。我也知道我掷了十次的结果（1 6 3 5 2 7 3 5 2 4），我不知道每次用了那种骰子，我想知道最有可能的骰子序列。

其实最简单而暴力的方法就是穷举所有可能的骰子序列，然后依照第零个问题的解法把每个序列对应的概率算出来。然后我们从里面把对应最大概率的序列挑出来就行了。如果马尔可夫链不长，当然可行。如果长的话，穷举的数量太大，就很难完成了。

另外一种很有名的算法叫做Viterbi algorithm. 要理解这个算法，我们先看几个简单的列子。

首先，如果我们只掷一次骰子：

看到结果为1.对应的最大概率骰子序列就是D4，因为D4产生1的概率是1/4，高于1/6和1/8.

把这个情况拓展，我们掷两次骰子：

结果为1，6.这时问题变得复杂起来，我们要计算三个值，分别是第二个骰子是D6，D4，D8的最大概率。显然，要取到最大概率，第一个骰子必须为D4。这时，第二个骰子取到D6的最大概率是
$P2(D6)=P(D4)*P(D4\rightarrow 1)*P(D4\rightarrow D6)*P(D6\rightarrow 6)$
$=\frac{1}{3} *\frac{1}{4} *\frac{1}{3} *\frac{1}{6}$
同样的，我们可以计算第二个骰子是D4或D8时的最大概率。我们发现，第二个骰子取到D6的概率最大。而使这个概率最大时，第一个骰子为D4。所以最大概率骰子序列就是D4 D6。

继续拓展，我们掷三次骰子：

同样，我们计算第三个骰子分别是D6，D4，D8的最大概率。我们再次发现，要取到最大概率，第二个骰子必须为D6。这时，第三个骰子取到D4的最大概率是 $P3(D4)=P2(D6)*P(D6\rightarrow D4)*P(D4\rightarrow 3)$
$=\frac{1}{216} *\frac{1}{3} *\frac{1}{4}$
同上，我们可以计算第三个骰子是D6或D8时的最大概率。我们发现，第三个骰子取到D4的概率最大。而使这个概率最大时，第二个骰子为D6，第一个骰子为D4。所以最大概率骰子序列就是D4 D6 D4。

写到这里，大家应该看出点规律了。既然掷骰子一二三次可以算，掷多少次都可以以此类推。我们发现，我们要求最大概率骰子序列时要做这么几件事情。首先，不管序列多长，要从序列长度为1算起，算序列长度为1时取到每个骰子的最大概率。然后，逐渐增加长度，每增加一次长度，重新算一遍在这个长度下最后一个位置取到每个骰子的最大概率。因为上一个长度下的取到每个骰子的最大概率都算过了，重新计算的话其实不难。当我们算到最后一位时，就知道最后一位是哪个骰子的概率最大了。然后，我们要把对应这个最大概率的序列从后往前推出来。

2.谁动了我的骰子？
比如说你怀疑自己的六面骰被赌场动过手脚了，有可能被换成另一种六面骰，这种六面骰掷出来是1的概率更大，是1/2，掷出来是2，3，4，5，6的概率是1/10。你怎么办么？答案很简单，算一算正常的三个骰子掷出一段序列的概率，再算一算不正常的六面骰和另外两个正常骰子掷出这段序列的概率。如果前者比后者小，你就要小心了。

比如说掷骰子的结果是：

要算用正常的三个骰子掷出这个结果的概率，其实就是将所有可能情况的概率进行加和计算。同样，简单而暴力的方法就是把穷举所有的骰子序列，还是计算每个骰子序列对应的概率，但是这回，我们不挑最大值了，而是把所有算出来的概率相加，得到的总概率就是我们要求的结果。这个方法依然不能应用于太长的骰子序列（马尔可夫链）。

我们会应用一个和前一个问题类似的解法，只不过前一个问题关心的是概率最大值，这个问题关心的是概率之和。解决这个问题的算法叫做前向算法（forward algorithm）。

首先，如果我们只掷一次骰子：

看到结果为1.产生这个结果的总概率可以按照如下计算，总概率为0.18：

把这个情况拓展，我们掷两次骰子：

看到结果为1，6.产生这个结果的总概率可以按照如下计算，总概率为0.05：

继续拓展，我们掷三次骰子：

看到结果为1，6，3.产生这个结果的总概率可以按照如下计算，总概率为0.03：

同样的，我们一步一步的算，有多长算多长，再长的马尔可夫链总能算出来的。用同样的方法，也可以算出不正常的六面骰和另外两个正常骰子掷出这段序列的概率，然后我们比较一下这两个概率大小，就能知道你的骰子是不是被人换了。

3.掷一串骰子出来，让我猜猜你是谁
（答主很懒，还没写，会写一下EM这个号称算法的方法）

上述算法呢，其实用到了递归，逆向推导，循环这些方法，我只不过用很直白的语言写出来了。如果你们去看专业书籍呢，会发现更加严谨和专业的描述。毕竟，我只做了会其意，要知其形，还是要看书的。

知乎用户人工智能，认知，心理学，永远的小白

收录于编辑推荐 •2904 人赞同

摘自我的博客http://blog.csdn.net/ppn029012

1. 赌场风云(背景介绍)

最近一个赌场的老板发现生意不畅，于是派出手下去赌场张望。经探子回报，有位大叔在赌场中总能赢到钱，玩得一手好骰子，几乎是战无不胜。而且每次玩骰子的时候周围都有几个保镖站在身边，让人不明就里，只能看到每次开局，骰子飞出，沉稳落地。老板根据多年的经验，推测这位不善之客使用的正是江湖失传多年的"偷换骰子大法”(编者注:偷换骰子大法，用兜里自带的骰子偷偷换掉均匀的骰子)。老板是个冷静的人，看这位大叔也不是善者，不想轻易得罪他，又不想让他坏了规矩。正愁上心头，这时候进来一位名叫HMM帅哥，告诉老板他有一个很好的解决方案。

不用近其身，只要在远处装个摄像头，把每局的骰子的点数都记录下来。

然后HMM帅哥将会运用其强大的数学内力，用这些数据推导出

1. 该大叔是不是在出千?

2. 如果是在出千，那么他用了几个作弊的骰子?　还有当前是不是在用作弊的骰子。

3. 这几个作弊骰子出现各点的概率是多少?

天呐，老板一听，这位叫HMM的甚至都不用近身，就能算出是不是在作弊，甚至都能算出别人作弊的骰子是什么样的。那么，只要再当他作弊时，派人围捕他，当场验证骰子就能让他哑口无言。

2. HMM是何许人也?

在让HMM开展调查活动之前，该赌场老板也对HMM作了一番调查。

HMM(Hidden Markov Model), 也称隐性马尔可夫模型，是一个概率模型，用来描述一个系统隐性状态的转移和隐性状态的表现概率。

系统的隐性状态指的就是一些外界不便观察(或观察不到)的状态, 比如在当前的例子里面, 系统的状态指的是大叔使用骰子的状态，即

{正常骰子, 作弊骰子1, 作弊骰子2,...}

隐性状态的表现也就是, 可以观察到的，由隐性状态产生的外在表现特点。这里就是说, 骰子掷出的点数.

{1,2,3,4,5,6}

HMM模型将会描述，系统隐性状态的转移概率。也就是大叔切换骰子的概率,下图是一个例子，这时候大叔切换骰子的可能性被描述得淋漓尽致。

很幸运的，这么复杂的概率转移图，竟然能用简单的矩阵表达, 其中a_{ij}代表的是从i状态到j状态发生的概率

当然同时也会有，隐性状态表现转移概率。也就是骰子出现各点的概率分布, (e.g. 作弊骰子1能有90%的机会掷到六，作弊骰子2有85%的机会掷到'小’). 给个图如下,

隐性状态的表现分布概率也可以用矩阵表示出来，

把这两个东西总结起来，就是整个HMM模型。

这个模型描述了隐性状态的转换的概率，同时也描述了每个状态外在表现的概率的分布。总之，HMM模型就能够描述扔骰子大叔作弊的频率(骰子更换的概率)，和大叔用的骰子的概率分布。有了大叔的HMM模型，就能把大叔看透，让他完全在阳光下现形。

3. HMM能干什么!

总结起来HMM能处理三个问题，

3.1 解码(Decoding)

解码就是需要从一连串的骰子中，看出来哪一些骰子是用了作弊的骰子，哪些是用的正常的骰子。

比如上图中，给出一串骰子序列(3,6,1,2..)和大叔的HMM模型, 我们想要计算哪一些骰子的结果(隐性状态表现)可能对是哪种骰子的结果(隐性状态).

3.2学习(Learning)

学习就是，从一连串的骰子中，学习到大叔切换骰子的概率，当然也有这些骰子的点数的分布概率。这是HMM最为恐怖也最为复杂的招数！！

3.3 估计(Evaluation)

估计说的是，在我们已经知道了该大叔的HMM模型的情况下，估测某串骰子出现的可能性概率。比如说，在我们已经知道大叔的HMM模型的情况下，我们就能直接估测到大叔扔到10个6或者8个1的概率。

4. HMM是怎么做到的?
4.1 估计

估计是最容易的一招，在完全知道了大叔的HMM模型的情况下，我们很容易就能对其做出估计。

现在我们有了大叔的状态转移概率矩阵A,B就能够进行估计。比如我们想知道这位大叔下一局连续掷出10个6的概率是多少? 如下

这表示的是，在一开始隐性状态(s0)为1，也就是一开始拿着的是正常的骰子的情况下，这位大叔连续掷出10个6的概率。

现在问题难就难在，我们虽然知道了HMM的转换概率，和观察到的状态V{1:T}, 但是我们却不知道实际的隐性的状态变化。

好吧，我们不知道隐性状态的变化，那好吧，我们就先假设一个隐性状态序列, 假设大叔前5个用的是正常骰子, 后5个用的是作弊骰子1.

好了，那么我们可以计算，在这种隐性序列假设下掷出10个6的概率.

这个概率其实就是，隐性状态表现概率B的乘积.

但是问题又出现了，刚才那个隐性状态序列是我假设的，而实际的序列我不知道，这该怎么办。好办，把所有可能出现的隐状态序列组合全都试一遍就可以了。于是,

R就是所有可能的隐性状态序列的集合。的嗯，现在问题好像解决了，我们已经能够通过尝试所有组合来获得出现的概率值，并且可以通过A,B矩阵来计算出现的总概率。

但是问题又出现了，可能的集合太大了, 比如有三种骰子，有10次选择机会, 那么总共的组合会有3^10次...这个量级O(c^T)太大了，当问题再大一点时候，组合的数目就会大得超出了计算的可能。所以我们需要一种更有效的计算P(V(1:T)概率的方法。
比如说如下图的算法可以将计算P(V1:T)的计算复杂度降低至O(cT).

有了这个方程，我们就能从t=0的情况往前推导，一直推导出P(V1:T)的概率。下面让我们算一算，大叔掷出3,2,1这个骰子序列的可能性有多大(假设初始状态为1, 也就是大叔前一次拿着的是正常的骰子)?

4.2 解码(Decoding)

解码的过程就是在给出一串序列的情况下和已知HMM模型的情况下，找到最可能的隐性状态序列。

用数学公式表示就是, (V是Visible可见序列, w是隐性状态序列, A,B是HMM状态转移概率矩阵)

(公式太多，请具体看我博客中的推导机器学习 --- 4. 大内密探HMM(隐马尔可夫)围捕赌场老千)

然后又可以使用估计(4.1)中的前向推导法，计算出最大的P(w(1:T), V(1:T)).

在完成前向推导法之后，再使用后向追踪法(Back Tracking)，对求解出能令这个P(w(1:T), V(1:T))最大的隐性序列.这个算法被称为维特比算法(Viterbi Algorithm).

4.3 学习(Learning)

学习是在给出HMM的结构的情况下(比如说假设已经知道该大叔有3只骰子，每只骰子有6面),计算出最有可能的模型参数.

(公式太多，请具体看我博客中的推导机器学习 --- 4. 大内密探HMM(隐马尔可夫)围捕赌场老千)

5. HMM 的应用

以上举的例子是用HMM对掷骰子进行建模与分析。当然还有很多HMM经典的应用，能根据不同的应用需求，对问题进行建模。

但是使用HMM进行建模的问题，必须满足以下条件,

1.隐性状态的转移必须满足马尔可夫性。(状态转移的马尔可夫性:一个状态只与前一个状态有关)

2. 隐性状态必须能够大概被估计。

在满足条件的情况下,确定问题中的隐性状态是什么,隐性状态的表现可能又有哪些.

HMM适用于的问题在于，真正的状态(隐态)难以被估计，而状态与状态之间又存在联系。

5.1 语音识别

语音识别问题就是将一段语音信号转换为文字序列的过程. 在个问题里面

隐性状态就是: 语音信号对应的文字序列

而显性的状态就是: 语音信号.

HMM模型的学习(Learning): 语音识别的模型学习和上文中通过观察骰子序列建立起一个最有可能的模型不同.　语音识别的HMM模型学习有两个步骤:

1. 统计文字的发音概率,建立隐性表现概率矩阵Ｂ

2. 统计字词之间的转换概率(这个步骤并不需要考虑到语音,可以直接统计字词之间的转移概率即可)

语音模型的估计(Evaluation): 计算"是十四”,"四十四"等等的概率,比较得出最有可能出现的文字序列.

5.2 手写识别

这是一个和语音差不多,只不过手写识别的过程是将字的图像当成了显性序列.

5.3 中文分词

“总所周知，在汉语中，词与词之间不存在分隔符（英文中，词与词之间用空格分隔，这是天然的分词标记），词本身也缺乏明显的形态标记，因此，中文信息处理的特有问题就是如何将汉语的字串分割为合理的词语序。例如，英文句子：you should go to kindergarten now 天然的空格已然将词分好，只需要去除其中的介词“to”即可；而“你现在应该去幼儿园了”这句表达同样意思的话没有明显的分隔符，中文分词的目的是，得到“你/现在/应该/去/幼儿园/了”。那么如何进行分词呢？主流的方法有三种：第1类是基于语言学知识的规则方法，如：各种形态的最大匹配、最少切分方法；第2类是基于大规模语料库的机器学习方法，这是目前应用比较广泛、效果较好的解决方案．用到的统计模型有N元语言模型、信道—噪声模型、最大期望、HMM等。第3类也是实际的分词系统中用到的，即规则与统计等多类方法的综合。”[1]使用HMM进行中文分词.

5.4 HMM实现拼音输入法

拼音输入法,是一个估测拼音字母对应想要输入的文字(隐性状态)的过程(比如, ‘pingyin’ -> 拼音)

使用HMM实现简单拼音输入法

知乎用户 @Wayne Laboratory. 长期处于做人的初级…

241 人赞同

(手机码字，继续欠修改)
WARNING：这篇文章是给零基础人士看的。目标是让普通初中生以及只有初中基础人士无障碍理解HMM框架。追求数学严谨性人士、追求用简洁符号表达模型的同学以及数理基础良好的大神请自行移步参阅文献。

讲这种东西就得先搞清HMM到底干了什么，初学者很容易对“模型在干嘛”这个问题上犯晕。我个人特别讨厌跟初学者上来就讲state space/transition matrix/emission probability云云的讲法(注：比如《统计学习方法》李航博士那种讲法。虽然用来准备面试很方便，但初学者肯定会被符号和几个概念绕晕了；另外，私以为他换掉符号和前人文献不保持一致的做法又会让初学者又多了一道坎去翻。总之，不太厚道)。因为初学时，对大多非理科出身的人而言，用抽象的名词与符号描述的“语言系统”还没固化在脑袋里。用抽象符号在那儿讲就好比“一群人还没学会走，就逼着他们快点跑”。这是不太现实的。

综上，用复杂抽象的语言描述不合适的，这个学习曲线过于陡峭，别人需要时间消化。基于此原因，我发现，对零基础小伙伴们用游戏的例子去类比地解释往往比较容易降低学习难度，比如这样讲:

我是一战士，修炼出了三种战斗形态，分别为 暴怒态， 正常状态和 防御态。同时我也会三个被动技能，分别是普通平A，爆击(攻击伤害翻倍)，吸血(生命汲取)。
我在暴怒状态下打出暴击的概率是80%,打出吸血概率为5%；
在平衡形态下，打出暴击的比率为30%，打出吸血的概率是20%；
在防御形态下，暴击成功概率为5%，吸血概率为60%。
总结一下， 战士在不同状态下能打出技能的概率不一样。

本来，战士这个职业在暴怒态时，身边会有一圈红光环；防御态时，会有一圈蓝光环。但是，现在我正在玩游戏，游戏突然出了个bug：有个傻x程序员改了游戏的代码，他给写崩了，从此战士身边光环都看不见了。那我没法通过看脚下的光环知道战士在爆什么状态了。

话说，现在问题来了：由于看不到脚下光环，我只能估计“战士”在爆什么状态；但我现在打一boss，砍10次，发现8次都是暴击，血哗哗地翻倍在掉，你觉得我这战士最可能是爆了什么状态？

(每次用这个不规范的例子和新手讲，他们立刻就懂了；而且他们接下来还会问："’暴怒状态’不能总持续吧？这不科学，应该限定个一段时间后，暴怒状态消失的概率为50%...."你瞧瞧连状态转换的transition prob自己都能假设出来了，都会抢答了都lol...“HMM的在干什么”的问题很容易地让他们就理解了)

综上，一个战士的状态会不断随时间变化；然后他的被动技能发动概率会因为所处不同状态而不同。这就是HMM想表达的东西。并且我们还可以通过它回答一些有趣的问题：通过战士发动的技能来推测战士所出的状态。

这个例子只是个感性认识， 它其实只是告诉了我们hmm比较“像什么东西”。显然，我们还需要更规范更严谨地去介绍什么是HMM，去规范化这个模型。这个例子里的“战士”可以换成其它答案里的天气，换成硬币等等。但无论用什么说法，我们已经能通过这个例子抓住核心问题了：HMM模型就是这样一个系统——它有一个能不断改变的 隐藏的状态（在这个例子里就是战士爆的状态。 它会变，而且由于一个码农的缘故， 状态变得不可见）在持续地影响它的 外在表现（在这个例子里就是战士打出的技能是暴击、平a、还是吸血的概率）。再重复一遍： HMM模型就是这样一个系统——它有一个会随时间改变的隐藏的状态，在持续地影响它的外在表现。

现在我们再继续规范一下这个例子，让它更贴近那种严谨描述。
因为我们知道战士打人总爆击，角色特别bug，这没法玩啊。所以我们要限制一下战士爆状态。
我们在游戏里做了个限制：
我们设定，战士一开始进入游戏世界时是 正常状态的。而且，每过一段时间（比如1分钟），战士就会自动爆一次状态。最后，每一次爆发还和上一次状态爆的状态是什么有关：
1.上一次如果是 正常状态，那下次变为暴怒的概率比较大。下次转换成 暴怒状态， 平衡状态或 防御状态的概率我们假设分别为 60%，30%,10%。这保证了战士职业下次能有较大的概率能打出暴击！
2.同理，若当我们上次在 暴怒态时，下次继续保持 暴怒态的概率就得限制一下。下次继续保持暴怒的概率就设为10%，而转换成 正常状态的概率是60%，转换成 防御态的概率是30%；
3.如果上次是 防御态，那么我们也让它下次也尽量变正常。（不然总吸血啊）那他下次转成其它三态的概率(三态和以上对应书写顺序一致)分别为为10%，60，30%。
这样服务器就能限制战士的爆 暴怒态的次数，让它不那么imba。

顺便提一下，其实以上的这种限定——让战士下一次爆不同状态的概率只和上次处在什么状态有关系——叫马尔可夫性质（markov property）。
经过这样的设定后，不仅仅战士这个职业不会那么imba，而且，我们可以靠以上这些数字来计算之前只能感性理解的问题了。比如： 我这个战士在第一分钟的时候是正常状态，那么我第二分钟赶去死亡谷打一个boss能暴击的概率是多少？（这个当作思考题 ，提示：想想两个问题，上一状态和下一状态间转换的概率是多少？不同状态下发不同技能的概率是多少？）

最后总结一下。以上例子中讲明了HMM的五样“要素”：
1.状态和状态间转换的概率
2.不同状态下，有着不同的外在表现的概率。
3.最开始设置的初始状态
4.能转换的所有状态的集合
5.能观察到外在表现的结合

Hidden 说明的是状态的不可见性；Markov说明的是状态和状态间是markov chain。这就是为什么叫Hidden Markov Model。

我相信你们再去看其它答案里写的就明白多了。

ps:懂了是什么之后再去看paper就好多了。没记错的话去，看《A tutorial on Hidden Markov Models and selected applications in Speech recognition》。另外，HMM除了上文提到的“五要素”，还有“三个基本问题”。这文章将hmm的三个基本问题讲得很清楚。

其它扯淡回答：
如何通俗易懂地介绍Gaussian Process？ - 知乎用户的回答
什么是狄利克雷分布？狄利克雷过程又是什么？ - 知乎用户的回答

编辑于 2016-05-24 24 条评论感谢收藏 • 没有帮助 • 举报 • 作者保留权利

作者：henry
链接：http://www.zhihu.com/question/20962240/answer/64187492
来源：知乎
著作权归作者所有，转载请联系作者获得授权。

在写论文的时候，知乎上的这个回答对我帮助颇大，从完全白痴到稍微明白一点点。本着投桃报李的精神，现在也将我所理解的隐形马尔可夫模型用尽可能通俗的语言，尽可能简单的例子，做一个讲解。

隐形马尔可夫模型，英文是 Hidden Markov Models，所以以下就简称 HMM。
既是马尔可夫模型，就一定存在马尔可夫链，该马尔可夫链服从马尔可夫性质：即无记忆性。也就是说，这一时刻的状态，受且只受前一时刻的影响，而不受更往前时刻的状态的影响。

在这里我们仍然使用非常简单的天气模型来做说明。
&lt;img src="https://pic4.zhimg.com/648a55725e67d718d97d6a475891d70b_b.png" data-rawwidth="600" data-rawheight="566" class="origin_image zh-lightbox-thumb" width="600" data-original="https://pic4.zhimg.com/648a55725e67d718d97d6a475891d70b_r.png"&gt;

在这个马尔可夫模型中，存在三个状态，Sunny， Rainy， Cloudy，同时图片上标的是各个状态间的转移概率（如果不明白什么是转移概率，那建议先去学习什么是马尔可夫再来看HMM）。

现在我们要说明什么是 HMM。既是隐形，说明这些状态是观测不到的，相应的，我们可以通过其他方式来『猜测』或是『推断』这些状态，这也是 HMM 需要解决的问题之一。

举个例子，我女朋友现在在北京工作，而我还在法国读书。每天下班之后，她会根据天气情况有相应的活动：或是去商场购物，或是去公园散步，或是回家收拾房间。我们有时候会通电话，她会告诉我她这几天做了什么，而闲着没事的我呢，则要通过她的行为猜测这几天对应的天气最有可能是什么样子的。

以上就是一个简单的 HMM，天气状况属于状态序列，而她的行为则属于观测序列。天气状况的转换是一个马尔可夫序列。而根据天气的不同，有相对应的概率产生不同的行为。在这里，为了简化，把天气情况简单归结为晴天和雨天两种情况。雨天，她选择去散步，购物，收拾的概率分别是0.1，0.4，0.5，而如果是晴天，她选择去散步，购物，收拾的概率分别是0.6，0.3，0.1。而天气的转换情况如下：这一天下雨，则下一天依然下雨的概率是0.7，而转换成晴天的概率是0.3；这一天是晴天，则下一天依然是晴天的概率是0.6，而转换成雨天的概率是0.4. 同时还存在一个初始概率，也就是第一天下雨的概率是0.6，晴天的概率是0.4.
&lt;img src="https://pic4.zhimg.com/792e033ff9b0418b3b6c9bbaef30fd83_b.png" data-rawwidth="623" data-rawheight="477" class="origin_image zh-lightbox-thumb" width="623" data-original="https://pic4.zhimg.com/792e033ff9b0418b3b6c9bbaef30fd83_r.png"&gt;

根据以上的信息，我们得到了 HMM的一些基本要素：初始概率分布 π，状态转移矩阵 A，观测量的概率分布 B，同时有两个状态，三种可能的观测值。

现在，重点是要了解并解决HMM 的三个问题。

问题1，已知整个模型，我女朋友告诉我，连续三天，她下班后做的事情分别是：散步，购物，收拾。那么，根据模型，计算产生这些行为的概率是多少。

问题2，同样知晓这个模型，同样是这三件事，我女朋友要我猜，这三天她下班后北京的天气是怎么样的。这三天怎么样的天气才最有可能让她做这样的事情。

问题3，最复杂的，我女朋友只告诉我这三天她分别做了这三件事，而其他什么信息我都没有。她要我建立一个模型，晴雨转换概率，第一天天气情况的概率分布，根据天气情况她选择做某事的概率分布。（惨绝人寰）

而要解决这些问题，伟大的大师们分别找出了对应的算法。问题一，Forward Algorithm，向前算法，或者 Backward Algo，向后算法。问题二，Viterbi Algo，维特比算法。问题三，Baum-Welch Algo，鲍姆-韦尔奇算法（中文好绕口）。

尽管例子有些荒谬（天气情况要复杂的多，而且不太可能满足马尔可夫性质；同时，女朋友要做什么往往由心情决定而不由天气决定。而从问题一来看，一定是天数越多，这个概率就会越低；从问题三来看，观察到的行为越多，模型才能更准确一些），但是应该已经简单却又详尽地解释了什么是 HMM。如果只是想了解个大概，到此为止。

===========================我是分割线====================================

分割线以下的，就是具体如何解决这三大问题。需要数学基础，概率基础。

问题1的解决1：遍历算法。

要计算产生这一系列行为的概率，那我们把每一种天气情况下产生这些行为都罗列出来，那每种情况的和就是这个概率。有三天，每天有两种可能的天气情况，则总共有

种情况.
举例其中一种情况： P（下雨，下雨，下雨，散步，购物，收拾）=P（第一天下雨）P（第一天下雨去散步）P（第二天接着下雨）P（下雨去购物）P（第三天还下雨）P（下雨回家收拾）=0.6X0.1X0.7X0.4X0.7X0.5=0.00588
当然，这里面的 P（第二天接着下雨）当然是已知第一天下雨的情况下，第二天下雨的概率，为0.7.
将八种情况相加可得，三天的行为为{散步，购物，收拾}的可能性为0.033612. 看似简单易计算，但是一旦观察序列变长，计算量就会非常庞大（

的复杂度，T 为观测序列的长度）。

问题1 的解决2：向前算法。

先计算 t=1时刻，发生『散步』一行为的概率，如果下雨，则为 P(散步，下雨)=P（第一天下雨）X P（散步 | 下雨）=0.6X0.1=0.06；晴天，P（散步，晴天）=0.4X0.6=0.24

t=2 时刻，发生『购物』的概率，当然，这个概率可以从 t=1 时刻计算而来。

如果t=2下雨，则 P（第一天散步，第二天购物，第二天下雨）= 【P（第一天散步，第一天下雨）X P（第二天下雨 | 第一天下雨）+P（第一天散步，第一天晴天）X P(第二天下雨 | 第一天晴天)】X P（第二天购物 | 第二天下雨）=【0.06X0.7+0.24X0.3】X0.4=0.0552

如果 t=2晴天，则 P（第一天散步，第二天购物，第二天晴天）=0.0486 （同理可得，请自行推理）

如果 t=3，下雨，则 P（第一天散步，第二天购物，第三天收拾，第三天下雨）=【P（第一天散步，第二天购物，第二天下雨）X P（第三天下雨 | 第二天下雨）+ P（第一天散步，第二天购物，第二天天晴）X P（第三天下雨 | 第二天天晴）】X P（第三天收拾 | 第三天下雨）=【0.0552X0.7+0.0486X0.4】X0.5= 0.02904

如果t=3，晴天，则 P（第一天散步，第二天购物，第三天收拾，第三天晴天）= 0.004572

那么 P（第一天散步，第二天购物，第三天收拾），这一概率则是第三天，下雨和晴天两种情况的概率和。0.02904+0.004572=0.033612.

以上例子可以看出，向前算法计算了每个时间点时，每个状态的发生观测序列的概率，看似繁杂，但在 T 变大时，复杂度会大大降低。
&lt;img src="https://pic4.zhimg.com/489523ae4ffe659de5f7c73c074cef6f_b.png" data-rawwidth="340" data-rawheight="269" class="content_image" width="340"&gt;

问题1的解决3：向后算法

顾名思义，向前算法是在时间 t=1的时候，一步一步往前计算。而相反的，向后算法则是倒退着，从最后一个状态开始，慢慢往后推。

初始化： $\beta_3(Rainy)=1$ （第一次使用知乎的公式编辑，还蛮靠谱的嘛）
$\beta_3(Sunny)=1$

递推： $\beta_2(Rainy)=a_{Rainy\to Rainy}b_{Rainy}(O_3=Clean)\beta_3(Rainy)+a_{Rainy\to Sunny}b_{Sunny}(O_3=Clean)\beta_3(Sunny)$
=0,.7x0.5x1+0.3x0.1x1=0.38
其中第一项则是转移概率，第二天下雨转到第三天下雨的概率为0.7；第二项则是观测概率，第三天下雨的状况下，在家收拾的概率为0.5；第三项就是我们定义的向后变量（backward variable）。
同理推得 $\beta_2(Sunny)=0.26\\ \beta_1(Rainy)=0.1298\\ \beta_1(Sunny)=0.1076$

结束：P(散步，购物，收拾) = $\pi_{Rainy}b_{Rainy}(O_1=Walke)\beta_1(Rainy)+\pi_{Sunny}b_{Sunny}(O_1=Walke)\beta_1(Sunny)$ =0.6×0.1×0.1298+0.4×0.6×0.1076

=0.033612

&lt;img src="https://pic3.zhimg.com/1a89bf925b4c1af2cc17416764d1d60e_b.png" data-rawwidth="340" data-rawheight="295" class="content_image" width="340"&gt;

三种算法的答案是一致的。

问题2的解决：维特比算法

维特比算法致力于寻找一条最佳路径，以便能最好地解释观测到的序列。

初始化： $\delta_1(Rainy)=\pi_R\times b_R(O_1=Walk)=0.06\\ \delta_1(Sunny)=\pi_S\times b_S(O_1=Walk)=0.24$

初始路径： $\phi_1(Rainy)=0\\ \phi_1(Sunny)=0$

递推，当然是要找出概率比较大的那条路径。

$\delta_2(Rainy)=max[\delta_1(R)\times a_{R\to R},\delta_1(S)\times a_{S\to R}]\times b_R(O_2=Shop)=0.0384$

那么，到达第二天下雨这一状态的最佳路径，应该是：

$\phi_2(Rainy)=\arg\max[\delta_1(R)\times a_{R\to R},\delta_1(S)\times a_{S\to R}]=Sunny$

也就是说，第一天是晴天的可能性更大。

同样地，可以推得， $\delta_2(Sunny)=0.0432\\ \phi_2(Sunny)=Sunny\\ \delta_3(Rainy)=0.01344\\ \phi_3(Rainy)=Rainy\\ \delta_3(Sunny)=0.002592\\ \phi_3(Sunny)=Sunny$

结束：比较 $\delta_3(Rainy) \quad and \quad \delta_3(Sunny)$ 的大小，发现前者较大，则最后一天的状态最有可能是下雨天。

回推：根据 $\phi_3(Rainy)=Rainy$ 可知，到达第三天下雨这一状态，最有可能是第二天也下雨，再根据 $\phi_2(Rainy)=Sunny$ 可知，到达第二天下雨这一状态，最有可能是第一天是晴天。

由此，我们得到了最佳路径，即，晴天，雨天，雨天。

问题3的解决：Baum-Welch 算法。
此问题的复杂度要远远高于前两种算法，不是简单解释就能说的清楚的了。若有兴趣，可以私信我。

我非常赞同霍金老头的『多一个公式，少十个读者』的说法，但是自己写起来，却发现用英文的这些公式好像比中文更简洁易懂，中文好像更罗里吧嗦一些。

依然怀着非常感恩的心，再次感谢这个问题以及回答问题的这些热心的人们给我带来的帮助。

作者：冰炭
链接：http://www.zhihu.com/question/20962240/answer/48444087
来源：知乎
著作权归作者所有，转载请联系作者获得授权。

楼上的大神都说得很好了，我来补充一个有意思HMM的用法，是用来 给定钢琴谱，自动决定指法的用法。

这个HMM的应用是来自于東京大学（東大真是所神奇的学校）的一个研究组在IJCAI 2007年的一篇文章，日文版的标题是《隠れマルコフモデルに基づくピアノ運指の自動決定》，英文版的标题是《Automatic Determination of Piano Fingering based on Hidden Markov Model》，论文的网页在这里： Sagayama & Ono Lab。从网页可以知道，这篇文中的工作其实至少从2005年就开始了。

愚以为在我目前能做到的范围内最好的学习一篇论文并让其对自己有用的方法就是重现之，所以此答案也按照现在回看当时重现过程的过程的顺序写。对于这个问题，我觉得比较重要的一点是“如何将HMM模型套用到这个问题上”，什么是HMM中的“因”，什么是HMM中的“果”，这个HMM在解决与琴键指法有关的问题是如何对应到HMM的三大任务=Scoring, Matching, Training的。然后你就很容易知道问题的输入是什么、输出是什么，然后将其转化为一个用程序员思维能解决的问题。

所以就开始俺们的钢琴运指自动决定之旅吧：

为了先有一个印象并明确问题的背景和定义，先看开门见山的介绍图：
&lt;img data-rawheight="338" data-rawwidth="450" src="https://pic1.zhimg.com/7499958e318dbb13f88a64fb74678794_b.jpg" class="origin_image zh-lightbox-thumb" width="450" data-original="https://pic1.zhimg.com/7499958e318dbb13f88a64fb74678794_r.jpg"&gt;
这个图的意思是说，“你有一个HMM模型，往里面丢入琴谱，它就能给你输出指法。”
这图，首先大致说明了这个HMM里面有哪些变量：
・HMM中的“ Hidden State（隐藏状态）”的是右手的五个手指编号（1=大拇指，2=食指，3=中指，4=无名指，5=小指）。
・HMM的“ Emission（可见输出状态链）”是“所弹奏出来的音符”。
在这篇论文的问题描述中，“弹奏的音符”是知道的，“所用的指法”是不知道的。因为不知道，所以就需要用算法去算出来。所以这里和事实上的过程其实是 反过来的：在此论文中，“指法”是原因，“音符”是结果，“事情发生”就是“指法导致了弹奏出这些音符”；这个过程在英文版论文中称为“fingering-to-performance conversion”，与事情看起来发生的顺序是相反的（一个人是先看到琴谱，然后才有指法的，这种现实中的发生顺序来说的过程在英文版论文中称为“score-to-fingering conversion”）。此论文中的概率用贝叶斯术语的名字来说就是：
　　・P(指法)是先验概率（Prior Probability／事前確率＝じぜんかくりつ）、
　　・P(音符|指法)是似然度（Likelihood／尤度関数＝ゆうどかんすう）、
　　・P(音符，指法)是联合概率（Joint Probability／結合確率＝けつごうかくりつ）、
　　・P(音符)是边缘概率（Marginal Probability／周辺確率＝しゅうへんかくりつ）、
　　・P(指法|音符)是后验概率（Posterior Probability／事後確率＝じごかくりつ）。【通过改变指法来最大化这个概率的过程，就是MAP，即Maximum A-Posteriori过程，即是Viterbi Search法做的事情。】

然后，它说明了这个HMM的性质：
・这个HMM是一个“Mealy Machine”，因为它是在转换的过程中输出的，而不是当处于某个状态时输出的（在某个状态输出，就应是Moore Machine）。“Mealy Machine”的输出概率函数是关于边的起始结点和终止结点的函数。所以，图右方的“High probability emission”意思是，“当我先用右手无名指弹奏了#F之后，再用右手小指弹奏#F右边的G的概率比较高”；图右下角的“Low probability emission”的意思是，“当我先用右手的无名指弹奏了G之后，再用右手小指弹奏G左边的#F的概率比较低”。
・也就是说，输出某个音符的概率可以写成 $P(y_i | (y_{i-1}, f_i, f_{i-1}))$ ，用语言解释就是“在我现在用第f_{i-1}个手指弹奏y_{i-1}这个音时，我接下来要用第f_i个手指奏y_i这个音的概率”。[1]
・至于状态转换概率则是不分Moore Machine和Mealy Machine的，都是 $P(f_i | f_{i-1})$ ，也就是当前用了某个手指之后，会转而使用下一个手指的概率。这个概率表可以用来对某些现象进行建模，譬如说：“中指和无名指连续交替按键很不灵活”，就可以通过使得赋给

与

更低的值来达成。

有了这些定义，我们就能知道如何完成HMM中的 三个任务：
　　・Scoring：给定一个指法，通过打分看它好弹还是不好弹。输入是指法，输出是分数。
　　・Matching：给定一个琴谱，给出最好的指法。输入是琴谱，输出是指法。
　　・Training：给定琴谱和指法组成的测试用例，通过改变HMM中的参数，来使得这个HMM能“学习”到测试用例中潜藏的规则。

首先是 Scoring，就是这个HMM是如何计算某个指法安排出现的概率的，以上面的图为例：
・图中的红箭头经过的结点表示状态转换，也就是“5、2、3、1、4、2、1”。在处于某个状态时，所进行的状态转换只依赖于当前的状态是什么。
・红箭头经过的边表示所输出的可见状态，也就是右上角的音符：E5, B4, C5, A4, B4, #G4, E。
・除了第一个音符以外，其它的音符都是按照上面的输出概率公式计算的。比如说用此指法弹奏第二个B4的条件概率就是

。
这就是“给定一个指法和所弹奏的音符，计算出它被弹奏出来的概率是多少”的过程。如果只给定音符，再罗列出所有可能的指法，就能从中计算出概率最大的指法。但是直接罗列速度会慢，所以可以用Viterbi Search来更快地计算出来。

那么就来到了第二点， Matching，就是给定一个谱子后，如何知道在当前的HMM中，最好的指法是什么？这是计算最大后验概率 P(指法|音符) 的问题。如前所述这其实是一个通过动态规划来达到比枚举高效很多的编程问题，其基本的样子是从给定的谱子的第一个音符开始，一直往后走，在每一步都保存“弹到当前的音符时最好的指法是什么”的信息供下一步使用，省掉计算时间的。此算法称为Viterbi Search（ Viterbi algorithm），它所搜索的空间可称为Trellis Graph （ Trellis (graph)）。因为维基百科上的Viterbi算法的Python代码是可以直接拷贝下来运行的，为了有所不同，以下就以图中的片段来举个例子，运行一遍论文中所述的演算法（这里强制第一个音符必须用5指，所以开始概率是设成了{0.01, 0.01, 0.01, 0.01, 1.00}）：

图中t表示输出状态链的“时间”，也就是音符的下标，从0开始。
当t=0的时候弹奏的概率就是开始概率。t>0时弹奏的概率就涉及输出概率与转换概率。
以下和论文中一样，只考虑只用右手、只有单音（没有和弦）的情况。
&lt;img data-rawheight="392" data-rawwidth="658" src="https://pic3.zhimg.com/a694b1d7f89b5b7e45c77e582552b4be_b.jpg" class="origin_image zh-lightbox-thumb" width="658" data-original="https://pic3.zhimg.com/a694b1d7f89b5b7e45c77e582552b4be_r.jpg"&gt;t=[0, 1]时的概率，就表示弹奏前两个音符所用的各种指法的概率。图中的网状图就是一个Trellis graph，每条边对应一次HMM状态转换同时也对应着（在t&amp;gt;0时的）弹出一个音符的动作；每个结点对应着一个手指，也就是能够用以弹奏某个音的某个手指。每条有颜色的路径就表示某个片段中的指法安排。Viterbi算法是一种动态规划，所以它在每一步时都需要把“对于每个手指，从开始到这一步时，这一步必用这个手指的最高的概率和对应的指法”存在动态规划表里，以供下一步的计算使用。 t=[0, 1]时的概率，就表示弹奏前两个音符所用的各种指法的概率。图中的网状图就是一个Trellis graph，每条边对应一次HMM状态转换同时也对应着（在t>0时的）弹出一个音符的动作；每个结点对应着一个手指，也就是能够用以弹奏某个音的某个手指。每条有颜色的路径就表示某个片段中的指法安排。Viterbi算法是一种动态规划，所以它在每一步时都需要把“对于每个手指，从开始到这一步时，这一步必用这个手指的最高的概率和对应的指法”存在动态规划表里，以供下一步的计算使用。
从这个图所反映的动态规划表中可以看出，用右手小拇指弹第一个音E5，然后再用右手食指弹第二个音B4的概率是所有25种可能中概率最高的，其概率高达10^(-2.31009)。这个概率并没有什么实际意义，只在对所有指法间进行比较有意义。相比起来，用右手大拇指弹奏第一个音E5再用右手小拇指弹奏第二个音B4的概率就低多了，只有10^(-13.0603)，这是个穿指的动作，而穿指从大拇指穿到小拇指也比从食指、中指和无名指穿到小指要简单，所以指向t=1时的5的箭头是从1指向5的。这是Viterbi算法在构建动态规划表中的规则。
这个表的内容会用到t=[0,1,2]的情况，如下：
&lt;img data-rawheight="285" data-rawwidth="499" src="https://pic1.zhimg.com/a114926515f1fd8ca6cb448faf904938_b.jpg" class="origin_image zh-lightbox-thumb" width="499" data-original="https://pic1.zhimg.com/a114926515f1fd8ca6cb448faf904938_r.jpg"&gt;指的就是此图在t=[0,1]中的箭头都是在上一张中出现过的箭头的意思。指的就是此图在t=[0,1]中的箭头都是在上一张中出现过的箭头的意思。

再继续一步：
&lt;img data-rawheight="285" data-rawwidth="502" src="https://pic2.zhimg.com/c6c00a9d5d305db03fa00eedc0ab6c95_b.jpg" class="origin_image zh-lightbox-thumb" width="502" data-original="https://pic2.zhimg.com/c6c00a9d5d305db03fa00eedc0ab6c95_r.jpg"&gt;
将这个过程重复到最后，就得到了这一段谱子的指法：
&lt;img data-rawheight="283" data-rawwidth="803" src="https://pic2.zhimg.com/4f3f7f542c3b209ab07d193103048319_b.jpg" class="origin_image zh-lightbox-thumb" width="803" data-original="https://pic2.zhimg.com/4f3f7f542c3b209ab07d193103048319_r.jpg"&gt;在这张动态规划表中，概率最大的是[5231421]这个指法，也就是图中所示的。在这张动态规划表中，概率最大的是[5231421]这个指法，也就是图中所示的。
以上就是这篇论文中所描述的“用HMM来计算给定的一段乐谱的最佳指法”的方法。

最后，就是 Training阶段——如何通过训练HMM参数的方法来“学到”测试用例呢？
在实现此论文的过程中我对于具体计算输出概率的方法是用了一些猜测的，所以与原文可能有所不符，所以将论文中所出现的7个乐谱片段输入后，有3、4个音符的指法与文中提及的结果不同。所以我想通过调整参数的方法让我的HMM的输出结果能与论文中相符。
说是Bonus阶段是，因为论文中没有明示这一阶段是如何做的，但是有提及根据常理是可以把这个训练过程做成的。
这回用于训练用的是随机梯度下降法（ Stochastic gradient descent），这种方法可以用于参数都是连续变量、目标函数也是连续变量的模型。其最基本的更新规则是 $w = w - \alpha \nabla p(w)$ ，其中w是参数，alpha是学习速率，p是Viterbi算法算出的最佳指法与训练用例指法的分数之差，当梯度下降完成时，训练用例中的指法就会变成所有指法中最优的并被Viterbi找到，也就是p会等于0 。
训练过程中给HMM模型不停地出示正确的指法就像是不停背诵英语单词强化记忆一样。以下示出用论文中出现的7个片段用作训练的样子。训练中能修正的HMM参数有以下这些：
　　・转换概率（25个）
　　・五个手指与黑／白键的接触点的Y轴坐标（10个）
一共是35个可以调整的参数。

在训练前，我们猜测出来的参数做成的HMM输出的指法能够符合这7个训练用例中的5个（以下为论文中的谱子的截图，黑色的圈是在论文中用作指法合理性的讨论的，和此回需要进行的重现算法的任务没有关系）：
&lt;img data-rawheight="574" data-rawwidth="429" src="https://pic1.zhimg.com/31a8e86dfb2286ac9f726370a1a93624_b.jpg" class="origin_image zh-lightbox-thumb" width="429" data-original="https://pic1.zhimg.com/31a8e86dfb2286ac9f726370a1a93624_r.jpg"&gt;
可以看到图中有两处红字是我们当前的HMM输出的指法与训练用例的指法不同之处。现在将这七个片段放入Stochastic Descent过程中，随着其进行，可以将参数的变化和目标函数的变化画在下图中：
&lt;img data-rawheight="964" data-rawwidth="748" src="https://pic2.zhimg.com/6247ceec36a100c1c42519cc72615a01_b.jpg" class="origin_image zh-lightbox-thumb" width="748" data-original="https://pic2.zhimg.com/6247ceec36a100c1c42519cc72615a01_r.jpg"&gt;三栏中，最上栏是分数之差，也就是对每个训练用例，给定的训练指法与当前最好的指法的分数之差，为0表示给定的训练指法就是最佳指法。中间栏是转换概率。最下栏是10个接触点的Y轴坐标。三栏中，最上栏是分数之差，也就是对每个训练用例，给定的训练指法与当前最好的指法的分数之差，为0表示给定的训练指法就是最佳指法。中间栏是转换概率。最下栏是10个接触点的Y轴坐标。
可以看到分数之差随着训练的进行总体上的趋势是在接近0。当训练完成后，这个HMM就能复制出图中所示的7个片段中的指法啦！　＼＾O＾／

如果再展开还有许多问题：对于Stochastic Descent还可以通过自动调整学习速率的方法来加快计算；训练过程不一定是Consistent的，意即总会到某个时候不可能完全复制出训练用例中的指法；和弦和双手两个声部的处理，但是这些就是不同于此问题的另一问题了，而且我也不是非常理解，所以就不在这里写啦。

[1]：在重现这篇论文的结果时我们认为尽管原论文并没有说，但是y_{i-1}还是有必要出现在竖线的右边的。按我们的理解，原文并非是完全没有说，而是隐含地用了y_{i-1}来得到计算输出概率时高斯分布的中心点的位置。

作者：者也
链接：http://www.zhihu.com/question/20962240/answer/24641399
来源：知乎
著作权归作者所有，转载请联系作者获得授权。

隐马尔科夫模型（Hidden Markov Model）经常被用在时间序列（例如一段时间内的声音信号，运动物体的位置等你所感兴趣的物理量）的建模与分析。
它有三个要素，
1. 可见随机变量：用来描述你所感兴趣的物理量，随时间变化
2. 隐含的状态变量：一个假设的存在，每个时间点的物理量背后都对应一个状态量
3. 变量间的关系：用概率的方法（通常是概率密度函数）描述以下三个关系或变量：初始状态量，当前的隐含状态量与下一个隐含状态量间关系（此处还用到马尔科夫假设：当前隐含状态只取决于前一个隐含状态），当前的隐含状态量与可见随机量间关系

举例说，我用HMM去描述一组不同类型的手部动作，每个动作有一种特定的模式，例如用手打拍子，2/4拍（上下上），3/4拍（上下右上），4/4拍（上下左右上），现实中，即使重复同样的拍子，手所划过的轨迹还是会有差别，但不同的拍子，其模式完全不同，用HMM去描述一种动作，所对应的可见随机变量就是手的位置，隐含状态变量就是上下左右四个大致位置，变量间关系用你假设的的概率密度函数描述。至于参数估计，推断等技术问题，有成熟高效的算法可以处理，这也是HMM受欢迎的原因。详细内容参考Rabiner的经典论文：An introduction to hidden Markov models。

补充：
1. 隐含状态变量是假设的存在，并不一定有对应的物理解释，此例状态值取上下左右四个值是为了好理解，实现模型时可以取任意数量的状态值，是一个可调参数。
2. 隐含状态变量通常是离散的，可见状态变量可离散可连续。

作者：raulista
链接：http://www.zhihu.com/question/20962240/answer/61025758
来源：知乎
著作权归作者所有，转载请联系作者获得授权。

之前上汉语语音课准备语音识别部分时一位朋友发给我的，作为理工科白痴我也看懂了。找不到原链，侵立删

1.题目背景：

从前有个村儿，村里的人的身体情况只有两种可能：健康或者发烧。
假设这个村儿的人没有体温计或者百度这种神奇东西，他唯一判断他身体情况的途径就是到村头我的偶像金正月的小诊所询问。
月儿通过询问村民的感觉，判断她的病情，再假设村民只会回答正常、头晕或冷。
有一天村里奥巴驴就去月儿那去询问了。
第一天她告诉月儿她感觉正常。
第二天她告诉月儿感觉有点冷。
第三天她告诉月儿感觉有点头晕。
那么问题来了，月儿如何根据阿驴的描述的情况，推断出这三天中阿驴的一个身体状态呢?
为此月儿上百度搜 google ，一番狂搜，发现维特比算法正好能解决这个问题。月儿乐了。

2.已知情况：

隐含的身体状态 = { 健康 , 发烧 }

可观察的感觉状态 = { 正常 , 冷 , 头晕 }

月儿预判的阿驴身体状态的概率分布 = { 健康：0.6 , 发烧： 0.4 }

月儿认为的阿驴身体健康状态的转换概率分布 = {
健康->健康： 0.7 ,
健康->发烧： 0.3 ,
发烧->健康：0.4 ,
发烧->发烧： 0.6
}

月儿认为的在相应健康状况条件下，阿驴的感觉的概率分布 = {
健康，正常：0.5 ，冷：0.4 ，头晕： 0.1 ；
发烧，正常：0.1 ，冷：0.3 ，头晕： 0.6
}
阿驴连续三天的身体感觉依次是：正常、冷、头晕。

3.题目：

已知如上，求：阿驴这三天的身体健康状态变化的过程是怎么样的？

4.过程：

根据 Viterbi 理论，后一天的状态会依赖前一天的状态和当前的可观察的状态。那么只要根据第一天的正常状态依次推算找出到达第三天头晕状态的最大的概率，就可以知道这三天的身体变化情况。
传不了图片，悲剧了。。。
1.初始情况：

P(健康) = 0.6，P(发烧)=0.4。

2.求第一天的身体情况：
计算在阿驴感觉正常的情况下最可能的身体状态。

P(今天健康) = P(健康|正常)*P(健康|初始情况) = 0.5 * 0.6 = 0.3

P(今天发烧) = P(发烧|正常)*P(发烧|初始情况) = 0.1 * 0.4 = 0.04

那么就可以认为第一天最可能的身体状态是：健康。
3.求第二天的身体状况：
计算在阿驴感觉冷的情况下最可能的身体状态。
那么第二天有四种情况，由于第一天的发烧或者健康转换到第二天的发烧或者健康。

P(前一天发烧，今天发烧) = P(发烧|前一天)*P(发烧->发烧)*P(冷|发烧) = 0.04 * 0.6 * 0.3 = 0.0072

P(前一天发烧，今天健康) = P(健康|前一天)*P(发烧->健康)*P(冷|健康) = 0.04 * 0.4 * 0.4 = 0.0064

P(前一天健康，今天健康) = P(发烧|前一天)*P(健康->健康)*P(冷|健康) = 0.3 * 0.7 * 0.4 = 0.084

P(前一天健康，今天发烧) = P(健康|前一天)*P(健康->发烧)*P(冷|发烧) = 0.3 * 0.3 *.03 = 0.027

那么可以认为，第二天最可能的状态是：健康。
4.求第三天的身体状态：
计算在阿驴感觉头晕的情况下最可能的身体状态。

P(前一天发烧，今天发烧) = P(发烧|前一天)*P(发烧->发烧)*P(头晕|发烧) = 0.027 * 0.6 * 0.6 = 0.00972

P(前一天发烧，今天健康) = P(健康|前一天)*P(发烧->健康)*P(头晕|健康) = 0.027 * 0.4 * 0.1 = 0.00108

P(前一天健康，今天健康) = P(发烧|前一天)*P(健康->健康)*P(头晕|健康) = 0.084 * 0.7 * 0.1 = 0.00588

P(前一天健康，今天发烧) = P(健康|前一天)*P(健康->发烧)*P(头晕|发烧) = 0.084 * 0.3 *0.6 = 0.01512

那么可以认为：第三天最可能的状态是发烧。

5.结论

作者：Shun Zhang
链接：http://www.zhihu.com/question/20962240/answer/34079435
来源：知乎
著作权归作者所有，转载请联系作者获得授权。

考虑你和妹子在一起的时候，

：妹子在时间 t 的心情。

：妹子在时间 t 的表现。
你知道的是：
$P(S_{t+1}|S_t)$ ：妹子心情变化的概率。比如说，现在生气，接下来还生气的概率。
$P(O_{t}|S_t)$ ：妹子在一定心情下，可以有什么样的表现。比如说，现在生气，表现为不想理你的概率。

HMM 研究的问题有，比如说，我们连续观察妹子的表现（ $o_1, o_2, \cdots, o_t$ ），我们来猜她最可能的心情（ $s_1, s_2, \cdots, s_t$ ）是什么。

举个例子。如果我们知道妹子的表现（

）依次为
"不理你 -> 不理你 -> 不理你 -> 戳了你一下"
那么，我们求出最有可能的心情（

）序列是
"生气 -> 生气 -> 在考虑要不要原谅你 -> 决定原谅你" (*)

其实到这里就可以了，下面我试着直观地解释下我们是如何求出来这个最可能的心情序列的。
妹子的表现是已知的。我们求最可能的心情序列时，需要试着同时最大化两个量：

这个心情序列本身的可能性。如果你告诉我最大可能的心情序列是
"生气 -> 开心 -> 生气 -> 开心"
……这个序列的可能性本身就太小了吧。
在这个心情序列下观察到表现的可能性。如果你告诉我最大可能的心情序列是
"开心 -> 开心 -> 开心 -> 开心 "
这个序列的可能性倒是不小，妹子一直很开心倒是很常见的。可是心情是开心表现为不理我的概率也太小了吧……

所以说，上面(*)不单是个可能的序列，而且符合我们观察到的表现。

作者：傅睿卿
链接：http://www.zhihu.com/question/20962240/answer/34202445
来源：知乎
著作权归作者所有，转载请联系作者获得授权。

粗略的看了一遍，觉得必须要说两句，之前几乎所有人答案都是在没有具体应用方法的背景下讲理论，在实际应用中反而会让人迷糊，HMM用途大多数情况下不会是求隐变量的场合，隐变量具体是什么在很多的学习、分类问题下都是无关紧要的！
---------------以下正题----------------
首先说马尔科夫，这是基础，没有这个一切都是胡闹，之前很多答案并没有过多的顾及马尔科夫模型的问题，答案只能说是个隐概率模型。马尔科夫模型描述的是当前状态只和前一状态相关的情况。
【先打比方】打麻将坐庄，比如现在是东风庄，那么（理想情况下）下把有75%的概率是北风（被胡牌），25%还是东风（自己胡牌），而跟上一把是不是东风庄没有任何关系。这就是一个标准的马尔科夫过程，（考虑心里因素时也可能不是，这里不谈）
【再说不恰当的案例】而最多举得天气的例子，就不是很合适，第一，明天下雨的概率现实中绝对不仅依赖于今天是不是晴天，这在建模时需要首先考虑模型的精度，注意，概率模型是以[你所认知的]世界为基础的，在某个问题下，你可以认为全人类得癌症的概率是多少多少，在其他问题下，你可能认为男性女性得癌症的概率分别是多少，这取决于模型的精度和你掌握的信息来定。绝大部分问题不是天生就是马尔科夫的，首先，夏天冬天不一样，梅雨季节更不一样，用术语说，这是时变的，当然你可以在你的模型中忽略这些，”假装”他是马尔科夫的。
【再说具体点】作为马尔科夫的过程，就和HMM应用会扯上关系的问题来说，要注意，任何时候，当系统出于某一状态时（也可以是以某一概率处于某些状态），下周期处于状态的概率要是确定的（比如刚说的75%，和25%， 数值可以不知道，但一定是不会变的某个值），而不依赖于之前的状态（前天）或系统的其他状态（冬季）。
【如果数学一些】由于任何状态迁移到其他状态的概率是确定的，所以我们如果知道本周期的概率分布，就可以求出下周期的分布，方法用中学时代的描述就是分类讨论，而本科阶段开始就用矩阵乘简单处理，这个就不多说了。要注意，能够写成矩阵（也就说概率是确定的）很重要。如果不是，那么就是其他问题了，比如半隐马尔科夫，如果有时间我下面会说，没有的话先坑着。
----------------开始HMM，之后讨论有什么用，因为你看完这段肯定不知道怎么用-----------------------
HMM针对的问题，必须是一个上面规范定义的过程，为什么？ 因为数学的求解能力是非常有限的，或许看似简单的变化，导致的可能是不可接受的计算量，
【先说定义】所谓的隐，就是看不见的意思。借用一句有切身感觉的话说”当看到方便面中油包变成固体的时候，宅男知道，冬天来了“。这里的季节（冬天）就是隐藏起来的变量，宅男（观察者）不出屋，所以看不到天气，他只可以看到方便面调料（这叫观测）。所谓的HMM，用来描述一个我们看不到系统状态，只能看到观测（但观测和状态之间有确定性的概率关系）的状态。
【需要强调的】第一就是刚刚的最后一句，观测和系统的状态之间必须有确定的概率关系，这个关系和系统的运行时间，之前的观测，之前的状态等等都不能有任何关系。也就是任何时候我看到固体的调料包，就代表（90%冬天，10%刚刚春天）。第二就是刚说到的，HMM是用来描述这样一个系统使用的工具，就好像我们可以用矩阵代表一个线性方程组一样。我们可以用HMM模型来表示一个这样的系统，定义它的量包括：（1）每个观测下，系统处于某状态的概率，共计观测类型*系统状态类型个，（由于概率总和为1，有效的量少观测类型个）。（2）本周期系统处于某状态时，下周期各状态的概率分布（就是刚刚马尔科夫中的那个矩阵），数量为状态类型 * 状态类型个（同上，有效的略少）。（3）系统的初始状态分布，就是第一周期时候系统是什么样子，这样我们就可以计算出每周期的概率了。这个值一共有状态类型个（有效的少一个）
----------------------------下面是怎么用HMM-----------------------------
刚刚已经说过什么是HMM了，就和高斯分布一样，HMM是描述系统分布的一种手段，那我们怎么用呢？（这里我们只谈用法思路，计算办法网上很多，思路和模型本身关系不是那么密切，就是算了）
【最常见的使用方法】我们说使用HMM时，一般时在解决这样的一个问题：当我有一个观测序列（样本）时，它和我所有已经知道的HMM模型哪个最匹配。我们通常会为每个我们预计要检测的东西训练一个HMM（用该类的大量样本）。
【沿用刚刚的例子】刚在举例子的时候没想太周全，这里就将就看吧。如果说我们可以用一个HMM描述宅男看方便面的问题的话，那么我们最可能干的事情就是，通过观察方便面油包状态，估计宅男所处的城市。是不是有点意外？居然不是看季节？其实HMM使用时最容易犯的错误就是弄混隐变量和我们的分类结果的关系了，关系就是没有关系！我们首先选取了世界各地宅男看到的油包状态，比如北京的1万个宅男，深圳的1万个，北冰洋的1万个宅男各3年的观察，作为样本，这时，我们系统一共涉及到了这样几个信息：（1）我们预计有3个HMM模型，分别是北京，深圳，北冰洋（2）我们只有2个观测结果，即油包是固态还是液态（3）我们的隐变量通常并不明确，但本例中我们估计系统状态可能是4季，所以我们设定4个隐变量， 注意：这4个就代表四季在实际应用中完全就是猜的，而且不见得训练的结果就是四季！
【解决例子中的问题】为了完成这个工作，我们要干以下几步：（1）分别利用每个地区的1万个样本，各自训练一个HMM，方法可参考网上各种文章。（2）在实际判断一个宅男的地理位置时，拿到一个观察序列，然后分别计算北京、深圳、北冰洋的HMM能够得到这个观测序列的概率。概率最大的，就是该宅男的所在提。
--------------------------------------最后多说几句------------------------------------
HMM的求解是一个非常麻烦的事情，可以看成是一个EM迭代的过程，而且求解的变量非常多，这就直接导致了一些约束：（1）观测的种类不能很多，尤其不能是连续过程（2）系统隐状态也不宜太多（3）要检测的目标，也就是HMM的数量，倒不是大问题，因为这是线性增长的，多一倍求解时间只多一倍，一般都能接受

有个黑屋子关了一个小妖怪，并且里面有N个坛子，每个坛子里有M种不同颜色的小球。
小妖怪随意碰到一个坛子，从里面拿出一个小球出来，把小球从窗子递出来，外面能看到小球的颜色。之后把小球放回去，再重复这个过程，就能得到一个序列。
在这个过程中存在两个随机过程，选择坛子和从坛子里选择小球，而中间的状态转移过程是被隐藏的。
其中重要的参数包含：一组状态的集合（不同坛子）；输出符号的集合（不同颜色的小球）；状态转移矩阵（从某个坛子跑到下一个坛子的概率）；输出符号的概率分布（某个坛子抓出某种颜色小球的概率）；初始状态概率分布（随机选择第一个坛子的概率）。

在课上听老师这么讲的……

作者：张哥华
链接：http://www.zhihu.com/question/20962240/answer/73054935
来源：知乎
著作权归作者所有，转载请联系作者获得授权。

假设你有一个住得很远的朋友,他每天跟你打电话告诉你他那天做了什么.你的朋友仅仅对三种活动感兴趣:公园散步,购物以及清理房间.他选择做什么事情只凭天气.你对于他所住的地方的天气情况并不了解,但是你知道总的趋势.在他告诉你每天所做的事情基础上,你想要猜测他所在地的天气情况.你认为天气的运行就像一个马尔可夫链.其有两个状态 "雨"和"晴",但是你无法直接观察它们,也就是说,它们对于你是隐藏的.每天,你的朋友有一定的概率进行下列活动:"散步", "购物", 或 "清理". 因为你朋友告诉你他的活动,所以这些活动就是你的观察数据.这整个系统就是一个隐马尔可夫模型HMM.
你知道这个地区的总的天气趋势,并且平时知道你朋友会做的事情.也就是说这个隐马尔可夫模型的参数是已知的.你可以用程序语言(Python)写下来:

states = ('Rainy', 'Sunny') observations = ('walk', 'shop', 'clean') start_probability = {'Rainy': 0.6, 'Sunny': 0.4} transition_probability = { 'Rainy' : {'Rainy': 0.7, 'Sunny': 0.3}, 'Sunny' : {'Rainy': 0.4, 'Sunny': 0.6}, } emission_probability = { 'Rainy' : {'walk': 0.1, 'shop': 0.4, 'clean': 0.5}, 'Sunny' : {'walk': 0.6, 'shop': 0.3, 'clean': 0.1}, }

在这些代码中,start_probability代表了你对于你朋友第一次给你打电话时的天气情况的不确定性(你知道的只是那个地方平均起来下雨多些).在这里,这个特定的概率分布并非平衡的,平衡概率应该接近（在给定变迁概率的情况下）{'Rainy': 0.571, 'Sunny': 0.429}< transition_probability 表示基于马尔可夫链模型的天气变迁,在这个例子中,如果今天下雨,那么明天天晴的概率只有30%.代码emission_probability 表示了你朋友每天做某件事的概率.如果下雨,有 50% 的概率他在清理房间;如果天晴,则有60%的概率他在外头散步.

全部来自维基百科。解释的非常清楚。

引用维基百科的实例
Alice 和 Bob 是异地
Bob 那边的天气包括晴天和雨天，但是每天的天气与之前一天的天气相关
Bob 每天可能做三种事情，出游，购物和扫地
但是 Bob 某天具体做什么的概率与当天天气相关
Alice 每天问 Bob, 你今天做什么
Alice 并不清楚 Bob 那边的天气，Bob 不用告诉她，她也不用看天气预报
但是她可以根据 Bob 每天做的事情，天气的先验概率，和天气的转化规律等因素估计 Bob 那边这几天的天气规律。

作者：小小的寂寞
链接：http://www.zhihu.com/question/20962240/answer/100355680
来源：知乎
著作权归作者所有，转载请联系作者获得授权。

作者：Dreamer
链接：http://www.zhihu.com/question/20962240/answer/110582360
来源：知乎
著作权归作者所有，转载请联系作者获得授权。

计算机初学者，接触这个模型只有一个月，大家帮忙看看对不对:
比如声音识别，我说"你好吗"，计算机接受的声学信号波段是123，计算机要根据隐性马尔可夫模型逆推回"你好吗"，已知123，以及已知在数据库里你是1的概率是0.5，已知好是2的概率是0.6，吗是3的概率是0.7，我们知道语音识别是和上下文相关的，所以2好跟在1你后面的概率是0.8，3吗跟在2好的概率是0.9，这样利用123推测是你好吗的概率是0.5*0.6*0.7*0.8*0.9，这个值作为一个训练结果的参数。但是计算机在求出最优解前还要尝试别的可能。利用隐性马尔可夫模型训练时，每次都产生一个这样的参数，比如也可能是"您好妈"，或者"泥郝嘛"，因为上下文的关系前者的概率值肯定比后者大，后者就被淘汰，然后再对比，再淘汰，这样一次次训练算出概率最大的值就是"你好吗"。当然解码时一条条算太慢，配合用维特比算法根据上下文的关系来提高效率会快一点，但那就和HMM模型无关了。

为什么叫"隐性"马尔可夫模型:
因为123是未知的波形图，不能根据数据库里没有的声波段内容来推测和数据的配对，也就是说无法做到推测1是你的概率。但是我们数据库里有汉字，所以可以根据汉字的声波数据来推测和未知声波的重合程度，也就是你是1的概率。也就是先知道你，才能推测出你是1的概率。因为不知道1，所以无法推测出1是你的概率。这样一来，马尔可夫链就变成隐性的了。

欢迎批评指正！

维基百科上的例子——通过朋友的行为去预测当地天气的变化
英文网址： Hidden Markov model
中文网址：隐马尔可夫模型
&lt;img src="https://pic4.zhimg.com/18e6b6f6bb68bfbda079e555722dc75b_b.jpg" data-rawwidth="600" data-rawheight="463" class="origin_image zh-lightbox-thumb" width="600" data-original="https://pic4.zhimg.com/18e6b6f6bb68bfbda079e555722dc75b_r.jpg"&gt;

其实 Hagnesta 已在题目的评论里提到了。

作者：song wang
链接：http://www.zhihu.com/question/20962240/answer/33547346
来源：知乎
著作权归作者所有，转载请联系作者获得授权。

http://www.ilovematlab.cn/thread-91366-1-1.html

统计工具箱包含5个与隐马尔可夫模型相关的函数：
hmmgenerate 从一个马尔可夫模型产生一个状态序列和输出序列；
hmmestimate 计算转移和输出的极大似然估计；
hmmtrain 从一个输出序列计算转移和输出概率的极大似然估计；
hmmviterbi 计算一个隐马尔可夫模型最可能的状态变化过程；
hmmdecode 计算一个给定输出序列的后验状态概率。

下面部分介绍如何使用这些函数来分析隐马尔可夫模型。

1. 产生一个测试序列

下面代码产生上面简介中模型的转移和输出矩阵：
TRANS = [.9 .1; .05 .95;];
EMIS = [1/6, 1/6, 1/6, 1/6, 1/6, 1/6;...
7/12, 1/12, 1/12, 1/12, 1/12, 1/12];

要从模型产生一个随机的状态序列和输出序列，使用hmmgenerate：
[seq,states] = hmmgenerate(1000,TRANS,EMIS);

输出中，seq是输出序列，states是状态序列。hmmgenerate在第0步从状态1开始，在第一步转移到状态i1
，并返回i1作为状态的第一个入口。

2. 估计状态序列

给定了转移和输出矩阵TRANS和EMIS，函数hmmviterbi使用Viterbi算法计算模型给定输出序列seq最有可能
通过的状态序列：
likelystates = hmmviterbi(seq, TRANS, EMIS);

likelystates是和seq一样长的序列。计算hmmvertibi的精度如下：
sum(states == likelystates) / length(states)
ans =
0.8680

3. 估计转移和输出矩阵
函数hmmestimate和hmmtrain用于估计给定输出序列seq的转移和输出矩阵TRANS和EMIS。

使用hmmestimate
[TRANS_EST, EMIS_EST] = hmmestimate(seq, states)
TRANS_EST =
0.9065 0.0935
0.0406 0.9594
EMIS_EST =
0.1452 0.1516 0.1581 0.1968 0.1581 0.1903
0.5841 0.0754 0.0986 0.0812 0.0841 0.0768
由上面使用方式可知，hmmestimate函数需要事先知道了得到输出序列seq，以及得到此结果的状态变化序
列。

使用hmmtrain
如果不知道状态序列，但是知道TRANS和EMIS的初始猜测，那就可以使用hmmtrain来估计TRANS和EMIS。

假设已知如下初始猜测：
TRANS_GUESS = [.85 .15; .1 .9];
EMIS_GUESS = [.17 .16 .17 .16 .17 .17;.6 .08 .08 .08 .08 08];

TRANS和EMIS的估计如下：
[TRANS_EST2, EMIS_EST2] = hmmtrain(seq, TRANS_GUESS, EMIS_GUESS)
TRANS_EST2 =
0.9207 0.0793
0.0370 0.9630
EMIS_EST2 =
0.1792 0.1437 0.1436 0.1855 0.1509 0.1971
0.5774 0.0775 0.1042 0.0840 0.0859 0.0710

hmmtrain使用迭代算法来不断修改TRANS_GUESS和EMIS_GUESS，使得每一步修改得到的矩阵都更加可能产生观测序列seq。当前后两个两次迭代矩阵的变化在一个小的容错范围内时，迭代停止。如果算法无法达到容错的范围，则迭代到达一定次数时就会停止，并返回一个警告提示。默认的最大迭代次数为100。

如果算法达不到目标误差范围，则可以通过增加迭代次数和/或加大容错误差值来使其获得较合适结果：
改变迭代次数maxiter：hmmtrain(seq,TRANS_GUESS,EMIS_GUESS,'maxiterations',maxiter)
改变容错误差tol：hmmtrain(seq, TRANS_GUESS, EMIS_GUESS, 'tolerance', tol)

影响hmmtrain输出的矩阵可靠性的两点因素：
（1）算法收敛于局部极值，这点可以使用不同的初始猜测矩阵来尝试解决；
（2）序列seq太短而无法很好的训练矩阵，可以尝试使用较长的序列。

4. 估计后验状态概率（不太理解）
一个输出序列seq的后验状态概率是在特定状态下的模型产生在seq中一个输出的条件概率。假定seq已经给出，你可以使用hmmdecode得到后验状态概率。

PSTATES = hmmdecode(seq,TRANS,EMIS)

输出为一个M * N的矩阵。M是状态的个数，L是seq的长度。PSTATES(i, j)是模型在状态i时，产生seq第j个输出的条件概率。

楼上这个是matlab自带的统计工具箱里的吧？可是这个只能用于离散HMM。

和楼主一样的问题，我下了Kevin Murphy 的Hidden Markov Model (HMM) Toolbox for Matlab，可是他给的介绍有点太少了，也不怎么看得懂。有没有高手做过这方面研究呢？

你可能感兴趣的:([综]隐马尔可夫模型Hidden Markov Model (HMM))

WPF 表格列表数据绑定起风了1024 C#学习日志 wpf
前端代码方法1通过DataTable类进行绑定usingSystem.Data;usingSystem.Windows;usingSystem.Collections.ObjectModel;usingSystem.Windows.Controls;//////MainWindow.xaml的交互逻辑///publicpartialclassMainWindow:Window{DataTabled
嵌入式领域机器学习入门指南 AI嵌入式 Python 机器学习机器学习人工智能
基本概念机器学习是一门使计算机无需进行明确编程即可学习的科学。它主要利用数据或以往的经验，以此来改进计算机自身的性能。以下是一些核心概念：监督学习:训练数据包含输入和预期输出，模型的目的是学习这两者之间的映射关系。无监督学习:训练数据只包含输入，没有标签的情况下，模型需要自己找出数据的结构或模式。强化学习:通过与环境交互，采取行动以最大化某种累积奖励。深度学习:一种特殊的机器学习方法，通过使用具有
【WPF】MVVM模式实现数据绑定以及Command事件绑定加号3 wpf
1.引用类usingSystem.ComponentModel2.创建Command自定义类publicclassDelegateCommand:ICommand{publicboolCanExecute(objectparameter){if(CanExecuteFunc==null)returntrue;returnthis.CanExecuteFunc(parameter);}publice
OpenAI推出新一代语音与转录AI模型未来智慧谷人工智能 OpenAI 多模态语音AI
3月20日，人工智能领域迎来重要进展——OpenAI正式推出三款新一代语音与转录AI模型，Whisper-Enhanced、VoiceFlow和TranscribePro。这些模型在语音识别准确率、噪声环境适应性及多语言处理能力上实现突破，标志着AI语音技术从实验室走向规模化商业应用的步伐进一步加快。一、技术突破：从实验室到工业级场景的跨越OpenAI此次发布的模型围绕两大核心能力升级：高精度语音
NVIDIA Cosmos-Transfer1：重塑物理AI训练的革命性“世界生成器” 未来智慧谷人工智能 Cosmos Transfer1 英伟达 NVIDIA
2025年3月22日在2025年GPU技术大会（GTC）上，英伟达（NVIDIA）重磅发布了其最新AI模型Cosmos-Transfer1，这一突破性技术通过多模态空间控制输入生成高度逼真的虚拟世界，为机器人、自动驾驶等物理AI系统的训练开辟了全新范式。结合开源策略与硬件加速能力，Cosmos-Transfer1不仅解决了模拟环境与真实场景的鸿沟问题，更将AI训练的效率和可控性提升至前所未有的水平
Vidu 5.0 视频生成模型深度解析 Liudef06 AI生成视频音视频计算机视觉人工智能深度学习
Vidu5.0视频生成模型深度解析（2025年3月）一、核心技术架构多模态动态建模基于DiT（DiffusionTransformer）架构：结合3D时空注意力机制，实现动态场景的精准建模。视频生成能力：支持生成最长16秒、1080P分辨率的视频，并具备多镜头切换能力。物理特性模拟：模拟真实物理特性，如光影反射、流体运动。角色一致性控制三视图角色生成：用户上传角色三视图图片，模型可生成360度动态
通义万相LoRA模型训练指南 Liudef06 AI生成视频人工智能
一、训练准备素材规范收集：100-200张1024×768像素的清晰图片。主体要求：占画面70%以上，包含多角度/多表情/多动作样本，避免重复构图。获取方式：建议使用专业摄影设备或游戏引擎渲染获取高精度素材。数据处理标注：使用阿里云百炼平台的智能标注工具自动生成自然语言描述。人物类模型：需包含正脸、侧脸、半身、全身等多样化角度。视频类模型：需准备10-15秒短视频片段（建议25fps）。二、环境配
音视频基础能力之 Android 音频篇（三）：高性能音频采集声知视界音频音视频 android
涉及硬件的音视频能力，比如采集、渲染、硬件编码、硬件解码，通常是与客户端操作系统强相关的，就算是跨平台的多媒体框架也必须使用平台原生语言的模块来支持这些功能本系列文章将详细讲述移动端音视频的采集、渲染、硬件编码、硬件解码这些涉及硬件的能力该如何实现。本文为该系列文章的第3篇，也是有关音频采集的最后一篇，将详细讲述在Android平台如何实现高性能音频采集。往期精彩内容，可参考：音视频基础能力之An
开源图生视频模型技术全景解析 Liudef06 开源音视频
一、核心架构与技术演进（一）模型基础框架多模态融合架构腾讯混元模型采用统一的全注意力机制，集成3D变分自编码器（VAE）实现图像到视频的时空特征编码。U-ViT3.0架构引入分层式时空注意力模块，支持4096×2160超清视频生成。阿里Wan2.1通过图像-视频联合训练策略，构建双塔结构分别处理静态特征提取与动态序列生成。实现中英文文本与视频内容同步生成。动态生成技术：Step-Video-TI2
DeepSeek-V3-0324 模型发布：开源 AI 性能再攀高峰，推理与编码能力逼近顶级闭源模型未来智慧谷开源人工智能 deepseek DeepSeek-V3
2025年3月24日，国内AI公司深度求索（DeepSeek）悄然推出V3模型的升级版本DeepSeek-V3-0324。尽管此次更新并非市场期待的V4或R2版本，但其在推理速度、编码能力、数学推理及开源生态上的突破，仍迅速引发全球开发者社区的关注与热议。核心升级：效率与性能的双重飞跃V3-0324延续了初代V3的“极致性价比”路线，参数规模提升至6850亿，并继续以MIT开源协议开放完整权重下载
算力网一体化构筑绿色数字基座智能计算研究中心其他
内容概要作为数字经济发展的核心引擎，全国一体化算力网通过整合异构计算资源与边缘节点，构建起跨地域、多层级的技术架构。其核心目标在于实现算力的动态调度与集约化供给，满足从工业互联网到元宇宙等场景的差异化需求。通过“东数西算”工程优化资源配置，结合芯片架构创新与模型压缩技术，算力网络的响应效率提升35%以上（国家超算中心数据），同时单位算力能耗降低22%。关键维度技术特征典型应用场景算力调度动态负载均
H100赋能生成式AI算力革新智能计算研究中心其他
内容概要NVIDIAH100GPU的推出标志着AI算力架构的范式革新。其核心突破在于第四代TensorCore与Transformer引擎的协同设计，通过动态稀疏计算与混合精度支持，将大规模矩阵运算效率提升至新高度。根据公开测试数据，H100在生成式AI模型的训练场景中，相比前代产品实现了6倍的吞吐量跃升，单卡可支持每秒4PB量级的张量处理能力。这一技术演进不仅显著缩短了千亿参数模型的开发周期，更
H20高效节水方案实践智能计算研究中心其他
内容概要《H20高效节水方案实践》聚焦水资源管理领域的创新技术整合与场景化应用，系统梳理智能节水技术在市政、农业及工业三大核心领域的落地路径。通过构建智能调控系统与循环工艺优化模型，该方案实现了用水效率的动态监测与资源再分配，典型案例数据显示整体节水率提升35%-48%。文章基于12个实际应用场景，从渗漏实时监测、分级用水策略到AI驱动的需水量预测，逐层解析关键技术模块的运行逻辑。此外，文中通过对
深度学习框架演进与智能应用实践智能计算研究中心其他
内容概要深度学习框架的迭代升级正重塑智能应用开发范式。从TensorFlow的静态图架构到PyTorch的动态计算图设计，工具链的持续优化显著提升了模型训练效率与部署灵活性。与此同时，模型压缩技术通过剪枝、量化和知识蒸馏等手段，在保持精度的前提下降低计算资源需求，而超参数优化与迁移学习策略则进一步增强了模型在不同场景的适应能力。值得关注的是，边缘计算与联邦学习的深度融合，正推动医疗影像诊断、金融风
探索AI的无限可能，体验智能对话的未来，大模型 API 演示 Southern Wind AI Vue3 TS 人工智能 typescript vue 前端
探索AI的无限可能，体验智能对话的未来，大模型API演示效果展示：项目概述这是一个基于Vue3+TypeScript+Vite构建的VistaAI演示项目，旨在提供一个简洁易用的界面来展示VistaAI大语言模型的能力。项目包含API演示和交互式游戏两个主要功能模块，同时支持两种不同风格的API调用方式。最新更新2025.03.25:游戏UI全面升级，添加游戏结束机制实现了游戏进度达到100%时的
YOLOv5改进策略|YOLOv5草莓成熟度检测,YOLOv5s-Straw在未成熟模型中的平均精度为82.1% 其中，近成熟级为73.5%，成熟级为86.6%，分别提高2.3%和3.7% 人工智能_SYBH YOLOv5模型改进 YOLO实战项目模型改进 YOLO 人工智能 YOLOv5 目标检测计算机视觉草莓检测成熟度检测
草莓检测是视觉引导机器人采摘过程中的关键步骤之一，为采摘操纵系统提供水果的精确位置、姿态和成熟度。对具有多个成熟度级别的草莓的错误检测和/或定位会导致质量不佳机器人采摘的性能和/或导致水果损伤或不必要的错误采摘水果机器人收获期间处于未成熟或接近成熟阶段的成熟度。本研究提出了一个基于YOLOv5的自定义对象检测模型，用于检测室外环境中的草莓。YOLOv5s原有架构进行修改，将C3模块替换为C2f主干
V100架构深度优化指南智能计算研究中心其他
内容概要作为NVIDIAVolta架构的旗舰产品，TeslaV100通过创新硬件设计与软件生态的协同优化，为深度学习与高性能计算场景提供了突破性的加速能力。本指南聚焦架构层面的核心优化要素，系统梳理从TensorCore矩阵运算加速原理到NVLink多卡通信协议的底层工作机制，同时深入探讨CUDA任务调度模型与显存子系统的协同优化路径。通过解析混合精度训练中动态缩放因子配置、显存访问模式重构等关键
Manus产品介绍及部署使用指南极客奇点 AI工具集的应用及实操人工智能 AIGC
一、ManusAgent是什么？ManusAgent是Manus公司基于其高精度动作捕捉技术开发的自主智能体系统。它结合人工智能（AI）算法与实时动作捕捉数据，能够实现以下核心功能：自主决策：通过机器学习模型分析环境信息，动态调整行为（如避障、路径规划）。人机协作：与人类用户自然交互，例如辅助操作或学习人类动作模式。多设备协同：控制虚拟角色、机器人、无人机等设备，形成智能协作网络。技术基础：硬件支
解读目前AI就业岗位——大语言模型（LLM）应用工程师学习路线、就业前景及岗位全解析 AI敲代码的手套 AI岗位介绍人工智能语言模型学习
文章目录前言什么是大语言模型（LLM）应用工程师？岗位职责就业前景如何？行业分布：岗位薪资：未来发展学习路线及所需技能1.基础技能学习2.深入AI技术3.专攻自然语言处理（NLP）4.掌握大语言模型（LLM）开发5.项目部署与性能优化适合本科/研究生什么专业的学生？本科推荐专业研究生推荐方向面试问题总结1.技术基础2.实践问题3.编程面试4.系统设计如何快速入门？1.学习课程：薪资的决定性因素总结
深入理解Aider sends a repo map 超级小龙虾 python
你提到的这个链接（https://aider.chat/2023/10/22/repomap.html）是Aider的官方文档，介绍了一种叫做“RepoMap”（仓库地图）的功能。Aider是一个AI编程辅助工具，主要通过与大语言模型（如GPT或Claude）协作来帮助开发者编辑代码。RepoMap是它提供给LLM的上下文机制，用于提升模型对代码库的理解能力。以下是对这段内容的理解和使用方式的详细
MySQL 关于 zip安装 lyz3191919 mysql
MySQL关于zip安装、下载zip安装包1、MySQL官网下载地址：MySQL::MySQLCommunityDownloads2、直接下载或选择其他版本下载。2、解压到自定义的安装目录3、（可跳过）配置环境变量4、新建并配置my.ini文件（要在刚刚解压后的目录下新建）在比较新的版本，下载的zip中是没有my.ini文件的，需要自己新建一个my.ini。(my.ini是MySQL的一些配置，比
医生培训迎来 DeepSeek 外挂！上体/上交/清华合作研究证实大模型可成为基层医生培训「黄金搭档」 hyperai
在全球健康版图上，糖尿病正以「海啸级」的凶猛态势侵袭着人类的健康防线。过去30年，这场悄无声息却异常残酷的健康之战，已致使8.4亿人患病，也就是说，平均每9个人当中，就有1人不幸被糖尿病确诊。「柳叶刀」发布的最新预警更是拉响了警报：预计到2050年，全球糖尿病患者数量将突破13.1亿，这意味着平均每2.3秒，就有1人无奈地加入糖尿病的庞大队伍。糖尿病这一慢性疾病，犹如一台冷酷无情的「健康收割机」。
Aider + Llama 3.1：无需编码开发全栈APP 七哥的AI日常 llama
Llama3.1在代码生成方面的卓越表现在代码生成领域，Llama3.1的表现尤为出色，几乎成为了开源模型中的佼佼者。它不仅在代码自动化和生成方面表现突出，还可以作为AI编程助手，帮助调试代码和开发完整的应用程序。在多个基准测试中，Llama3.1的表现几乎与GBT-4Omni和Claude3.5Sonic持平，甚至在某些情况下超越了这些模型。今天我们将展示如何将新的Llama3.1与Aider搭
MATLAB 2024b深度学习工具箱新特性全面解析与DeepSeek大模型集成开发：卷积神经网络、迁移学习算法、时间卷积网络、生成式对抗网络、自编码器、目标检测YOLO模型、语义分割、注意力机制等 WangYan2022 DeepSeek ChatGPT 机器学习/深度学习数据语言 matlab 深度学习 MATLAB 2024b DeepSeek 本地化部署
随着人工智能技术的飞速发展，其与多学科的交叉融合以及在工程实践领域的纵深拓展已成为时代潮流。在这一背景下，MATLAB2024b深度学习工具箱应运而生，凭借架构创新与功能强化，为科研工作者提供了一套全栈式的科研创新与行业应用解决方案，具有重要的时代意义。本教程紧密围绕该版本工具链的三大革新方向展开，致力于助力科研工作者在深度学习领域取得突破性进展。首先，构建了覆盖经典模型与前沿架构的体系化教程，从
全流程ROMS海洋数值建模与多尺度耦合模拟——从Linux开发、模式调试到风暴潮-示踪剂综合应用赵钰老师生态环境水环境气象算法机器学习人工智能深度学习数据分析
ROMS（RegionalOceanModelingSystem）是一种用于模拟区域海洋动力过程的高性能数值模型。它由美国罗格斯大学、加州大学洛杉矶分校等机构联合开发，广泛应用于海洋科学研究、海岸带管理、气候变化评估等领域。ROMS能够模拟海洋环流、温度、盐度、波浪、生态系统等多种过程。以下是ROMS的核心内容：1.ROMS的基本原理控制方程：基于Navier-Stokes方程，考虑地球旋转效应（
全自动蓝光三维扫描测量仪汽车零部件3D自动检测尺寸-CASAIM IS CASAIM 汽车 3d 经验分享制造
在汽车零部件的生产制造中，质量控制始终是重中之重。汽车零部件种类繁多，且呈现形状复杂、曲面多、孔位细节多的特征，在设计端、模具制造、冲压成型、焊装、首件检测、系列检测等环节，批量化检测发挥着至关重要的作用，需要高精度、高效率、检测结果直观的质量控制方式，保证汽车装配精度。CASAIMIS基于全自动蓝光三维扫描测量仪的全自动化作业功能，采用非接触式自动检测汽车零部件，可快速获取汽车零部件的三维数据，
风暴潮、潮汐潮流模拟：ROMS模型如何精准预测海洋现象？ WangYan2022 水文水资源 ROMS 海洋数值模拟潮汐潮流模拟风暴潮耦合模拟示踪剂模拟
海洋数值模拟的崛起与ROMS的关键角色在海洋科学的浪潮中，海洋数值模拟正以迅猛之势崛起，成为科研与实际应用领域不可或缺的利器。ROMS（RegionalOceanModelingSystem）作为其中的佼佼者，凭借其高效、灵活且高度可定制的特性，在海洋动力学、环境保护、资源管理等多个关键领域大放异彩。本教程将深入剖析ROMS在海洋研究中的应用，尤其是其在潮汐潮流模拟、风暴潮耦合模拟以及示踪剂模拟等
如何设计有效的用户反馈闭环机制产品设计
设计有效的用户反馈闭环机制关键包括明确反馈渠道、及时响应反馈、反馈处理流程标准化、跟踪反馈处理结果以及持续优化反馈机制。其中，及时响应反馈尤为重要。研究显示，及时响应用户反馈可提升用户满意度超过30%。通过及时回应用户的反馈，企业不仅表现出对用户意见的重视，也能增强用户的参与感和忠诚度。一、明确反馈渠道明确的反馈渠道是实现反馈闭环的基础。企业应提供多样且易用的反馈渠道，包括官方网站、移动应用、社交
java堆栈区别和垃圾回收机制总结 super_sjh 面试题 java 数据结构与算法操作系统
1Java中堆和栈的区别、堆和栈都是内存中的一部分；2、栈的空间比较小，用来存放对象的引用3、堆的空间比较大，一般新建的对象都存放在堆里4、栈是一个先进后出的数据结构，通常保存方法中的参数和局部变量5、在java中所有的基本变量和引用变量都存储在栈中，栈中数据的生命周期是“{。。。}”之间6、堆是一个可动态申请分配内存空间(其记录空间的记录由操作系统控制)Java中所有new的对象都存在于堆中；7
Python和R统计检验比较各组之间的免疫浸润亚图跨际 Python R 编程 python r语言统计检验
统计检验用于比较各组间的免疫浸润差异，通过定量分析特定免疫细胞的浸润水平，评估它们在不同条件或组别下的显著性变化。常用方法包括t检验、Mann-WhitneyU检验、ANOVA或Kruskal-Wallis检验，选择依据数据分布及样本特点。这些分析可揭示免疫微环境特征，助力探索疾病机制、预测治疗效果或筛选潜在生物标志物，为精准医学提供数据支持。Python片段在Python中，统计检验可用于比较不
TOMCAT在POST方法提交参数丢失问题 357029540 java tomcat jsp
摘自http://my.oschina.net/luckyi/blog/213209 昨天在解决一个BUG时发现一个奇怪的问题，一个AJAX提交数据在之前都是木有问题的，突然提交出错影响其他处理流程。检查时发现页面处理数据较多，起初以为是提交顺序不正确修改后发现不是由此问题引起。于是删除掉一部分数据进行提交，较少数据能够提交成功。恢复较多数据后跟踪提交FORM DATA ，发现数
在MyEclipse中增加JSP模板删除-2008-08-18 ljy325 jsp xml MyEclipse
在D:\Program Files\MyEclipse 6.0\myeclipse\eclipse\plugins\com.genuitec.eclipse.wizards_6.0.1.zmyeclipse601200710\templates\jsp 目录下找到Jsp.vtl，复制一份，重命名为jsp2.vtl,然后把里面的内容修改为自己想要的格式，保存。然后在 D:\Progr
JavaScript常用验证脚本总结 eksliang JavaScript javaScript表单验证
转载请出自出处：http://eksliang.iteye.com/blog/2098985 下面这些验证脚本，是我在这几年开发中的总结，今天把他放出来，也算是一种分享吧，现在在我的项目中也在用！包括日期验证、比较，非空验证、身份证验证、数值验证、Email验证、电话验证等等...! &nb
微软BI（4） 18289753290 微软BI SSIS
1） Q:查看ssis里面某个控件输出的结果： A MessageBox.Show(Dts.Variables["v_lastTimestamp"].Value.ToString()); 这是我们在包里面定义的变量 2):在关联目的端表的时候如果是一对多的关系，一定要选择唯一的那个键作为关联字段。 3) Q：ssis里面如果将多个数据源的数据插入目的端一
定时对大数据量的表进行分表对数据备份酷的飞上天空大数据量
工作中遇到数据库中一个表的数据量比较大，属于日志表。正常情况下是不会有查询操作的，但如果不进行分表数据太多，执行一条简单sql语句要等好几分钟。。分表工具：linux的shell + mysql自身提供的管理命令原理：使用一个和原表数据结构一样的表，替换原表。 linux shell内容如下： =======================开始
本质的描述与因材施教永夜-极光感想随笔
不管碰到什么事,我都下意识的想去探索本质,找寻一个最形象的描述方式。我坚信,世界上对一件事物的描述和解释,肯定有一种最形象,最贴近本质,最容易让人理解 &
很迷茫。。。随便小屋随笔
小弟我今年研一，也是从事的咱们现在最流行的专业（计算机）。本科三流学校，为了能有个更好的跳板，进入了考研大军，非常有幸能进入研究生的行业（具体学校就不说了，怕把学校的名誉给损了）。先说一下自身的条件，本科专业软件工程。主要学习就是软件开发，几乎和计算机没有什么区别。因为学校本身三流，也就是让老师带着学生学点东西，然后让学生毕业就行了。对专业性的东西了解的非常浅。就那学的语言来说
23种设计模式的意图和适用范围 aijuans 设计模式
Factory Method 意图定义一个用于创建对象的接口，让子类决定实例化哪一个类。Factory Method 使一个类的实例化延迟到其子类。　　适用性当一个类不知道它所必须创建的对象的类的时候。　　当一个类希望由它的子类来指定它所创建的对象的时候。　　当类将创建对象的职责委托给多个帮助子类中的某一个，并且你希望将哪一个帮助子类是代理者这一信息局部化的时候。 Abstr
Java中的synchronized和volatile aoyouzi java volatile synchronized
说到Java的线程同步问题肯定要说到两个关键字synchronized和volatile。说到这两个关键字，又要说道JVM的内存模型。JVM里内存分为main memory和working memory。 Main memory是所有线程共享的，working memory则是线程的工作内存，它保存有部分main memory变量的拷贝，对这些变量的更新直接发生在working memo
js数组的操作和this关键字百合不是茶 js 数组操作 this关键字
js数组的操作; 一:数组的创建: 1、数组的创建 var array = new Array();　//创建一个数组 var array = new Array([size]);　//创建一个数组并指定长度，注意不是上限，是长度 var arrayObj = new Array([element0[, element1[, ...[, elementN]]]
别人的阿里面试感悟 bijian1013 面试分享工作感悟阿里面试
原文如下：http://greemranqq.iteye.com/blog/2007170 一直做企业系统，虽然也自己一直学习技术，但是感觉还是有所欠缺，准备花几个月的时间，把互联网的东西，以及一些基础更加的深入透析，结果这次比较意外，有点突然，下面分享一下感受吧！ &nb
淘宝的测试框架Itest Bill_chen spring maven 框架单元测试 JUnit
Itest测试框架是TaoBao测试部门开发的一套单元测试框架，以Junit4为核心，集合DbUnit、Unitils等主流测试框架，应该算是比较好用的了。近期项目中用了下，有关itest的具体使用如下： 1.在Maven中引入itest框架： <dependency> <groupId>com.taobao.test</groupId&g
【Java多线程二】多路条件解决生产者消费者问题 bit1129 java多线程
package com.tom; import java.util.LinkedList; import java.util.Queue; import java.util.concurrent.ThreadLocalRandom; import java.util.concurrent.locks.Condition; import java.util.concurrent.loc
汉字转拼音pinyin4j 白糖_ pinyin4j
以前在项目中遇到汉字转拼音的情况，于是在网上找到了pinyin4j这个工具包，非常有用，别的不说了，直接下代码： import java.util.HashSet; import java.util.Set; import net.sourceforge.pinyin4j.PinyinHelper; import net.sourceforge.pinyin
org.hibernate.TransactionException: JDBC begin failed解决方案 bozch ssh 数据库异常 DBCP
org.hibernate.TransactionException: JDBC begin failed: at org.hibernate.transaction.JDBCTransaction.begin(JDBCTransaction.java:68) at org.hibernate.impl.SessionImp
java-并查集（Disjoint-set）-将多个集合合并成没有交集的集合 bylijinnan java
import java.util.ArrayList; import java.util.Arrays; import java.util.HashMap; import java.util.HashSet; import java.util.Iterator; import java.util.List; import java.util.Map; import java.ut
Java PrintWriter打印乱码 chenbowen00 java
一个小程序读写文件，发现PrintWriter输出后文件存在乱码，解决办法主要统一输入输出流编码格式。读文件： BufferedReader 从字符输入流中读取文本，缓冲各个字符，从而提供字符、数组和行的高效读取。可以指定缓冲区的大小，或者可使用默认的大小。大多数情况下，默认值就足够大了。通常，Reader 所作的每个读取请求都会导致对基础字符或字节流进行相应的读取请求。因
[天气与气候]极端气候环境 comsci 环境
如果空间环境出现异变...外星文明并未出现,而只是用某种气象武器对地球的气候系统进行攻击,并挑唆地球国家间的战争,经过一段时间的准备...最大限度的削弱地球文明的整体力量,然后再进行入侵...... 那么地球上的国家应该做什么样的防备工作呢? &n
oracle order by与union一起使用的用法 daizj UNION oracle order by
当使用union操作时，排序语句必须放在最后面才正确，如下：只能在union的最后一个子查询中使用order by，而这个order by是针对整个unioning后的结果集的。So：如果unoin的几个子查询列名不同，如 Sql代码 select supplier_id, supplier_name from suppliers UNI
zeus持久层读写分离单元测试 deng520159 单元测试
本文是zeus读写分离单元测试,距离分库分表,只有一步了.上代码: 1.ZeusMasterSlaveTest.java package com.dengliang.zeus.webdemo.test; import java.util.ArrayList; import java.util.List; import org.junit.Assert; import org.j
Yii 截取字符串(UTF-8) 使用组件 dcj3sjt126com yii
1.将Helper.php放进protected\components文件夹下。 2.调用方法： Helper::truncate_utf8_string($content,20,false); //不显示省略号 Helper::truncate_utf8_string($content,20); //显示省略号 &n
安装memcache及php扩展 dcj3sjt126com PHP
安装memcache tar zxvf memcache-2.2.5.tgz cd memcache-2.2.5/ /usr/local/php/bin/phpize (?) ./configure --with-php-confi
JsonObject 处理日期 feifeilinlin521 java json JsonOjbect JsonArray JSONException
写这边文章的初衷就是遇到了json在转换日期格式出现了异常 net.sf.json.JSONException: java.lang.reflect.InvocationTargetException 原因是当你用Map接收数据库返回了java.sql.Date 日期的数据进行json转换出的问题话不多说直接上代码 &n
Ehcache（06）——监听器 234390216 监听器 listener ehcache
监听器 Ehcache中监听器有两种，监听CacheManager的CacheManagerEventListener和监听Cache的CacheEventListener。在Ehcache中，Listener是通过对应的监听器工厂来生产和发生作用的。下面我们将来介绍一下这两种类型的监听器。
activiti 自带设计器中chrome 34版本不能打开bug的解决 jackyrong Activiti
在acitivti modeler中，如果是chrome 34，则不能打开该设计器，其他浏览器可以，经证实为bug，参考 http://forums.activiti.org/content/activiti-modeler-doesnt-work-chrome-v34 修改为，找到 oryx.debug.js 在最头部增加 if (!Document.
微信收货地址共享接口-终极解决 laotu5i0 微信开发
最近要接入微信的收货地址共享接口，总是不成功，折腾了好几天，实在没办法网上搜到的帖子也是骂声一片。我把我碰到并解决问题的过程分享出来，希望能给微信的接口文档起到一个辅助作用，让后面进来的开发者能快速的接入，而不需要像我们一样苦逼的浪费好几天，甚至一周的青春。各种羞辱、谩骂的话就不说了，本人还算文明。如果你能搜到本贴，说明你已经碰到了各种 ed
关于人才 netkiller.github.com 工作面试招聘 netkiller 人才
关于人才每个月我都会接到许多猎头的电话，有些猎头比较专业，但绝大多数在我看来与猎头二字还是有很大差距的。与猎头接触多了，自然也了解了他们的工作，包括操作手法，总体上国内的猎头行业还处在初级阶段。总结就是“盲目推荐，以量取胜”。目前现状许多从事人力资源工作的人，根本不懂得怎么找人才。处在人才找不到企业，企业找不到人才的尴尬处境。企业招聘，通常是需要用人的部门提出招聘条件，由人
搭建 CentOS 6 服务器 - 目录 rensanning centos
(1) 安装CentOS ISO（desktop/minimal）、Cloud（AWS/阿里云）、Virtualization（VMWare、VirtualBox）详细内容 (2) Linux常用命令 cd、ls、rm、chmod...... 详细内容 (3) 初始环境设置用户管理、网络设置、安全设置...... 详细内容 (4) 常驻服务Daemon
【求助】mongoDB无法更新主键 toknowme mongodb
Query query = new Query(); query.addCriteria(new Criteria("_id").is(o.getId())); &n
jquery 页面滚动到底部自动加载插件集合 xp9802 jquery
很多社交网站都使用无限滚动的翻页技术来提高用户体验，当你页面滑到列表底部时候无需点击就自动加载更多的内容。下面为你推荐 10 个 jQuery 的无限滚动的插件： 1. jQuery ScrollPagination jQuery ScrollPagination plugin 是一个 jQuery 实现的支持无限滚动加载数据的插件。 2. jQuery Screw S