qqh19910525

隐马尔科夫模型

总结（Summary）

我们为了找到随时间变化的模式，就试图去建立一个可以产生模式的过程模型。我们使用了具体的时间步骤、状态、并且做了马尔科夫假设。有了这些假设，这个能产生模式系统就是一个马尔科夫过程。一个马尔科夫过程包括一个初始向量和一个状态转移矩阵。关于这个假设需要注意的一点是状态转移概率不随时间变化。

介绍（introduction)
生成模式（Generating Patterns）
隐含模式（Hidden Patterns）
隐马尔科夫模型（Hidden Markov Models）
前向算法（Forward Algorithm）
维特比算法（Viterbi Algorithm）
前向后向算法（Forward-Backward Algorithm）
总结

介绍（introduction）

通常我们总是对寻找某一段时间上的模式感兴趣，这些模式可能出现在很多领域：一个人在使用电脑的时候使用的命令的序列模式；一句话中的单词的序列；口语中的音素序列。总之能产生一系列事件的地方都能产生有用的模式。

考虑一个最简单的情况：有人(柯南？)试图从一块海藻来推断天气的情况。一些民间的传说认为“soggy”的海藻意味着潮湿（wet）的天气，“dry”的海藻预示着晴朗（sun）。如果海藻处于中间状态“damp”，那就无法确定了。但是，天气的情况不可能严格的按照海藻的状态来变化，所以我们可以说在一定程度上可能是雨天或是晴天。另一个有价值的信息是之前某些天的天气情况，结合昨天的天气和可以观察到的海藻的状态，我们就可以为今天的天气做一个较好的预报。

这是在我们这个系列的介绍中一个非常典型的系统。

首先我们介绍一个可以随时间产生概率性模型的系统，例如天气在晴天或者雨天之间变动。
接下来我们试图去预言我们所不能观察到的"隐形"的系统状态，在上面的例子中，能被观察到的序列就是海藻的状态吗，隐形的系统就是天气情况
然后我们看一下关于我们这个模型的一些问题，在上面那个例子中，也许我们想知道

如果我们观察一个星期每一天的海藻的状态，我们是否能知相应的其天气情况
如果给出一个海藻状态的序列，我们是否能判断是冬天还是夏天？我们假设，如果海藻干（dry）了一段时间，那就意味着是夏天如果海藻潮湿（soggy）了一段时间，那可能就是冬天。

生成模式（Generating Patterns）

确定的模式（Deterministic Patterns）

考虑交通灯的例子，一个序列可能是红-红/橙-绿-橙-红。这个序列可以画成一个状态机，不同的状态按照这个状态机互相交替

我们可以注意到，每一个状态都只依赖于此前的状态，如果当前的是绿灯，那么接下来就是橙灯，这就是一个确定型的系统。确定型的系统更容易理解和分析，只要这些状态转移都是已知的。

不确定的模式（Non-Deterministic Patterns）

为了让之前那个天气的例子更贴近现实，我们可以添加一个状态-多云。和交通灯的例子不同，我们不能得到一个确定的状态转移系统，但是我们还是希望能得到一个天气的模式。

一种办法就是假设这个模型的每个状态都只依赖于之前的状态，这个假设被称为马尔科夫假设，这个假设可以大大的简化这个问题。显然，这个假设可能是一个非常糟糕的假设，导致很多重要的信息都丢失了。

当涉及到天气的时候，马尔科夫假设假设如果我们知道之间一些天的天气的信息，不考虑风力、气压等因素，那么我们就能预言今天的天气。当然，和其他许多例子一样，这个列子也是不合实际的。但是，这样一个简化的系统可以有利于我们的分析，所以我们通常接受这样的假设，因为我们知道这样的系统能让我们获得一些有用的信息，尽管不是十分准确的。

一个马尔科夫过程就是指过程中的每个状态的转移只依赖于之前的n个状态，这个过程被称为1个n阶的模型，其中n是影响转移的状态的数目。最简单的马尔科夫过程就是一阶过程，每一个状态的转移只依赖于其之间的那一个状态。注意这和确定型的系统不一样，因为这种装因是有概率的，而不是确定的。下面这个图展示了天气这个例子中所有可能的一阶转移：

注意一个含有M个状态的一阶过程有M的平方个状态转移。每一个转移的概率叫做状态转移概率（state transition probability），就是从一个状态转移到另一个状态的概率。这所有的M的平方个概率可以用一个状态转移矩阵来表示。注意这里有一个假设，概率不随时间的变化而变化，这又是一个不现实但很重要的假设。下面就是一个状态转移矩阵的列子：

这个矩阵的意思是，如果昨天是晴天，那么今天又50%的可能是晴天，37.5%的概率是阴天，12.5%的概率会下雨，很明显，每一行的和都是1。

为了初始化这样一个系统，我们需要一个初始的概率向量：

这个向量表示第一天是晴天。

到这里，我们就为一阶马尔科夫过程定义了以下三个部分:

状态：晴天、阴天和下雨
初始向量：定义系统在时间为0的时候的状态的概率
状态转移矩阵：每种天气转换的概率

所有的能被这样描述的系统都是一个马尔科夫过程。

总结（Summary）

总结（Summary）

生成模式（Generating Patterns）

确定的模式（Deterministic Patterns）

考虑交通灯的例子，一个序列可能是红-红/橙-绿-橙-红。这个序列可以画成一个状态机，不同的状态按照这个状态机互相交替

不确定的模式（Non-Deterministic Patterns）

这个矩阵的意思是，如果昨天是晴天，那么今天又50%的可能是晴天，37.5%的概率是阴天，12.5%的概率会下雨，很明显，每一行的和都是1。

为了初始化这样一个系统，我们需要一个初始的概率向量：

这个向量表示第一天是晴天。

到这里，我们就为一阶马尔科夫过程定义了以下三个部分:

状态：晴天、阴天和下雨
初始向量：定义系统在时间为0的时候的状态的概率
状态转移矩阵：每种天气转换的概率

所有的能被这样描述的系统都是一个马尔科夫过程。

总结（Summary）

总结（Summary）

隐含模式（Hidden Patterns）

当马尔科夫过程不够强大的时候，我们又该怎么办呢？

在某些情况下马尔科夫过程不足以描述我们希望发现的模式。回到之前那个天气的例子，一个隐居的人可能不能直观的观察到天气的情况，但是有一些海藻。民间的传说告诉我们海藻的状态在某种概率上是和天气的情况相关的。在这种情况下我们有两个状态集合，一个可以观察到的状态集合（海藻的状态）和一个隐藏的状态（天气的状况）。我们希望能找到一个算法可以根据海藻的状况和马尔科夫假设来预测天气的状况。

一个更现实的例子是语音识别，我们听到的声音是声带、喉咙和一起其他的发音器官共同作用的结果。这些因素相互作用，共同决定了每一个单词的声音，而一个语音识别系统检测的声音（可以观察的状态）是人体内部各种物理变化（隐藏的状态、引申一个人真正想表达的意思）产生的。

某些语音识别设备把内部的发音机制作为一个隐藏的状态序列，把最后的声音看成是一个和隐藏的状态序列十分相似的可以观察到的状态的序列。在这两个例子中，一个非常重要的地方是隐藏状态的数目和可以观察到的状态的数目可能是不一样的。在一个有三种状态的天气系统（sunny、cloudy、rainy）中，也许可以观察到四种潮湿程度的海藻（dry、dryish、damp、soggy）。在语音识别中，一个简单的发言也许只需要80个语素来描述，但是一个内部的发音机制可以产生不到80或者超过80种不同的声音。

在上面的这些情况下，可以观察到的状态序列和隐藏的状态序列是概率相关的。于是我们可以将这种类型的过程建模为又一个隐藏的马尔科夫过程和一个和这个马尔科夫过程概率相关的并且可以观察到的状态集合。

下图显示了天气的例子中隐藏的状态和可以观察到的状态之间的关系。我们假设隐藏的状态是一个简单的一阶马尔科夫过程，并且他们两两之间都可以相互转换。

隐藏的状态和可以观察到的状态之间有一种概率上的关系，也就是说某种隐藏状态H被认为是某个可以观察的状态O1是有概率的，假设为P（O1|H）。如果可以可以观察的状态有三种，那么很显然P（O1|H）+ P（O2|H）+ P（O3|H） = 1。这里我和原文的意思不太相同，原文说的意思是P（O1|H1）+ P（O1|H2）+P（O1|H3）= 1，但是这和下面的例子又不同。

这样，我们也可以得到一个另一个矩阵，称为混淆矩阵。这个矩阵的内容是某个隐藏的状态被分别观察成集中不同的可以观察的状态的概率，在天气的例子中，这个矩阵如下图：

注意到图中每一行的和为1，但是每一列的和不为1，这里我觉得可能是原文出错了，或者隐藏状态还有其他。

总结

我们已经看到有一些过程是和一个隐藏的马尔科夫过程概率相关的。在这种情况下，可以观察到的状态和隐藏的状态的数目可能是不一样的。我们可以把这种过程建模为隐马尔科夫模型（HMM）。这个模型包含两个状态集合和三个概率集合。

隐藏的状态：一个隐藏的马尔科夫过程
可以观察到的状态：如名
初始向量：初始状态的隐藏状态的概率
状态转移矩阵：隐藏状态的状态转移概率
混淆矩阵：隐藏状态被观察成各个可以观察到的状态的概率

我们可以认为隐马尔科夫模型是在一个不可观察的马尔科夫过程上添加了一个可以观察到的状态集合，加上这个过程到这个集合的一些概率关系得到的。

总结（Summary）

隐马尔科夫模型（Hidden Markov Models）

定义

隐马尔科夫模型可以用一个三元组(π,A,B)来定义:

π 表示初始状态概率的向量
A =（aij）（隐藏状态的）转移矩阵 P（Xit|Xj（t-1）） t-1时刻是j而t时刻是i的概率
B =（bij）混淆矩阵 P（Yi|Xj）在某个时刻因隐藏状态为Xj而观察状态为Yi的概率

值得注意的是，在状态转移矩阵中的每个概率都是时间无关的，也就是说我们假设这个概率是固定的，不随时间变化。当然，这是马尔科夫模型最不切合实际的一个假设。

隐马尔科夫模型的使用

如果一个模型可以被描述成一个隐马尔科夫模型，有三个问题可以得到解决。前两个是模式识别的问题：1）根据隐马尔科夫模型得到一个可观察状态序列的概率（评价）；2）找到一个隐藏状态的序列使得这个序列产生一个可观察状态序列的概率最大(解码)。第三个问题就是根据一个可以观察到的状态序列集产生一个隐马尔科夫模型（学习）。

1.评价

假设我们有很多隐马尔科夫模型（也就是说一个三元组的集合）描述不同的系统和一个可观察状态序列集。我们也许想知道哪一个隐马尔科夫模型最可能产生某个可观察状态序列。比如说，我们也许有一个海藻的“Summer”模型和一个“Winter”模型，因为海藻在夏天和冬天的状态应该是不同的，我们希望根据一个可观察状态（海藻的潮湿与否）序列来判断现在是夏天还是冬天。

我们可以使用前向算法来计算在某个特定的HMM下一个可观察序列的概率，然后据此找到最可能的模型。

这种类型的应用通常出现在语音设别中，通常我们会使用很多HMM，每一个针对一个特别的单词。一个可观察状态的序列是从一个可以听到的单词向前得到的，然后这个单词就可以通过找到满足这个可观察状态序列的最大概率的HMM来识别。

2.解码

根绝可观察状态的序列找到一个最可能的隐藏状态序列。

和上面一个问题相似的并且更有趣的是根据可观察序列找到隐藏序列。在很多情况下，我们队隐藏状态更有兴趣，因为其包含了一些不能被直接观察到的有价值的信息。比如说在海藻和天气的例子中，一个隐居的人只能看到海藻的状态，但是他想知道天气的状态。这时候我们就可以使用Viterbi算法来根据可观察序列得到最优可能的隐藏状态的序列，当然前提是已经有一个HMM。

另一个广泛使用Viterbi算法的领域是自然语言处中标引词性。句子中的单词是可以观察到的，词性是隐藏的状态。通过根据语句的上下文找到一句话中的单词序列的最有可能的隐藏状态序列，我们就可以得到一个单词的词性（可能性最大）。这样我们就可以用这种信息来完成其他一些工作。

3.学习

从一个观察集中得到一个隐马尔科夫模型。

第三个问题也是最困难的问题，根绝观察到的序列集来找到一个最有可能的HMM，也就是说确定一个最有可能的三元组(π,A,B）。当A，B矩阵都不是直观可测量（通过经验得到）的的时候，可以使用前向后向算法来解决这个问题。

总结

尽管做出了一些不太符合实际的假设，但是用三元组描述的HMMs在描述真实系统并进行分析的时候具有很大的价值，并且可以解决下面这些问题：

用前向算法找到最有可能的隐马尔科夫模型
用Viterbi算法根据观察序列找到最有可能的隐藏序列
用前向后向算法决定最有可能产生某个观察集的隐马尔科夫模型的参数

总结（Summary）

前向算法(Forward Algorithm)

一、如果计算一个可观察序列的概率？

1.穷举搜索

加入给定一个HMM，也就是说(,A,B)这个三元组已知，我们想计算出某个可观察序列的概率。考虑天气的例子，我们知道一个描述天气和海藻状态的HMM，而且我们还有一个海藻状态的序列。假设这个状态中的某三天是（dry，damp，soggy），在这三天中的每一天，天气都可能是晴朗，多云或者下雨，我们可以用下图来描述观察序列和隐藏序列：

在这个图中的每一列表示天气的状态可能，并且每个状态都指向相邻的列的每个状态，每个状态装换在状态转移矩阵中都有一个概率。每一列的下面是当天的可观察的海藻的状态，在每种状态下出现这种可观察状态的概率是由混淆矩阵给出的。

一个可能的计算可观察概率的方法是找到每一个可能的隐藏状态的序列，这里有3^3 = 27种，这个时候的可观察序列的概率就是 Pr(dry,damp,soggy | HMM) = Pr(dry,damp,soggy | sunny,sunny,sunny) + Pr(dry,damp,soggy | sunny,sunny ,cloudy) + Pr(dry,damp,soggy | sunny,sunny ,rainy) + . . . . Pr(dry,damp,soggy | rainy,rainy ,rainy)。

很显然，这种计算的效率非常低，尤其是当模型中的状态非常多或者序列很长的时候。事实上，我们可以利用概率不随时间变化这个假设来降低时间的开销。

2.使用递归来降低复杂度

我们可以考虑给定HMM的情况下，递归的计算一个可观察序列的概率。我们可以首先定义一个部分概率，表示达到某个中间状态的概率。接下来我们将看到这些部分概率是如何在time=1和time = n（n > 1）的时候计算的。

假设一个T时间段的可观察序列是：

2a.部分概率

下面这张图表示了一个观察序列（dry，damp，soggy）的一阶转移

我们可以通过计算到达某个状态的所有路径的概率和来计算到达某个中间状态的概率。比如说，t = 2时刻clody的概率用三条路径的概率之和来表示：

我们用t(j)来表示在t时刻是状态j的概率，t ( j )= Pr( observation | hidden state is j ) x Pr(all paths to state j at time t)。

最后一个观察状态的部分概率就表示了整个序列最后达到某个状态的所有可能的路径的概率和，比如说在这个例子中，最后一列的部分状态

是通过下列路径计算得到的：

因为最后一列的部分概率是所有可能的路径的概率和，所以就是这个观察序列在给定HMM下的概率了。

2b.计算 t = 1时候的部分概率

计算部分概率的公式是： t ( j )= Pr( observation | hidden state is j ) x Pr(all paths to state j at time t)

当t = 1的时候，没有路径到某个状态，所以这里是初始概率， Pr( state | t = 1) = (state)，这样我们就可以计算t=1时候的部分概率为：

因为在初始的时候，是状态j的概率不仅和这个状态本身相关，还和观察状态有关，所以这里用到了混淆矩阵的值，k1表示第一个观察状态，bjk1表示隐藏状态是j，但是观察成k1的概率。

2c.计算t > 1时候的部分概率

还是看计算部分概率的公式： t ( j )= Pr( observation | hidden state is j ) x Pr(all paths to state j at time t)

这个公式的左边是从混淆矩阵中已知的，我只需要计算右边部分，很显然右边是所有路径的和：

需要计算的路径数是和观察序列的长度的平方相关的，但是t时刻的部分概率已经计算过了之前的所有路径，所以在t+1时刻只需要根据t时刻的概率来计算就可以了：

这里简单解释下，bjkt+1 就是在t+1时刻的第j个隐藏状态被认为是当前的观察状态的概率，后面一部分是所有t时刻的隐藏状态到t+1时候的隐藏状态j的转移的概率的和。这样我们每一步的计算都可以利用上一步的结果，节省了很多时间。

2d.降低计算复杂度

我们可以比较穷举和递归算法的复杂度。假设有一个HMM l =(,A,B)，其中有n个隐藏状态，我们有一个长度为T的观察序列。

穷举算法的需要计算所有可能的隐藏序列：

需要计算：

很显然穷举算法的时间开销是和T指数相关的，而如果采用递归算法，由于我们每一步都可以利用上一步的结果，所以是和T线性相关的。（这里认为n是一个常数）

3.总结

这里我们的目的是在某个给定的HMM下，计算出某个可观察序列的概率。我们通过先计算部分概率的方式递归的计算整个序列的所有路径的概率，大大节省了时间。在t=1的时候，使用了初始概率和混淆矩阵的概率，而在t时刻的概率则可以利用t - 1时刻的结果。

二、前向算法的定义

我们使用前向算法去计算T长度序列的概率：

每一个y就是观察状态。在t=1时刻的中间节点的部分状态可以用下面的公式计算：

对于t>1的情况，部分概率的计算可以用下面的公式：

这里，我觉得是原作者的笔误，后面的应该是bjkt+1

这样我们就可以用递归的方式来计算所有可能的路径的概率和，最后，所有的部分概率的计算公式为

使用天气的例子，计算t = 2时刻的cloud状态的概率方法如图：

三、总结

我们使用前向算法在给定的一个HMM下计算某个可观察序列的概率。前向算法主要采用的是递归的思想，利用之前的计算结果。有了这个算法，我们就可以在一堆HMM中，找到一个最满足当前的可观察序列的模型（前向算法计算出来的概率最大）。

总结（Summary）

维特比算法(Viterbi Algorithm)

找到可能性最大的隐藏序列

通常我们都有一个特定的HMM，然后根据一个可观察序列去找到最可能生成这个可观察序列的隐藏序列。

1.穷举搜索

我们可以在下图中看到每个状态和观察的关系。

通过计算所有可能的隐藏序列的概率，我们可以找到一个可能性最大的隐藏序列，这个可能性最大的隐藏序列最大化了Pr(observed sequence | hidden state combination)。比如说，对于上图中的可观察序列（dry damp soggy），最可能的隐藏序列就是下面这些概率中最大的：

Pr(dry,damp,soggy | sunny,sunny,sunny), Pr(dry,damp,soggy | sunny,sunny,cloudy), Pr(dry,damp,soggy | sunny,sunny,rainy), . . . . Pr(dry,damp,soggy | rainy,rainy,rainy)

这个方法是可行的，但是这种计算的代价是昂贵。和前向算法一样，我们可以利用转移概率在时间上的不变性来降低计算的复杂度。

2.使用递归降低复杂度

在给定了一个可观察序列和HMM的情况下，我们可以考虑递归的来寻找最可能的隐藏序列。我们可以先定义一个部分概率，既是到达某个中间状态的概率。接下来我们将讨论如果计算t = 1和t = n（ n > 1）的部分概率。

注意这里的部分概率和前向算法中的部分概率是不一样的，这里的部分概率表示的是在t时刻最可能到达某个状态的一条路径的概率，而不是所有概率之和。

2a.部分概率和部分最优路径

考虑下面这个图以及可观察序列（dry，damp，soggy）的一阶转移

对于每一个中间状态和终止状态（t = 3）都有一个最可能的路径。比如说，在t=3时刻的三个状态都有一个如下的最可能的路径：

我们可以称这些路径为部分最优路径。这些部分最优路径都有一个概率，也就是部分概率。和前向算法中的部分概率不一样，这里的概率只是一个最可能路径的概率，而不是所有路径的概率和。

我们可以用 (i,t)来表示在t时刻，到状态i的所有可能的序列（路径）中概率最大的序列的概率，部分最优路径就是达到这个最大概率的路径，对于每一个时刻的没一个状态都有这样一个概率和部分最优路径。

最后，我们通过计算t = T时刻的每一个状态的最大概率和部分最优路径，选择其中概率最大的状态和它的部分最优路径来得到全局的最优路径。

2b.计算t = 1时刻的部分概率

当t=1时刻的时候，到达某个状态最大可能的路径还不存在，但是我们可以直接使用在t=1时刻某个状态的概率和这个状态到可观察序列k1的转移概率：

2c.计算t >1 时刻的部分概率

接下来我们可以根据t - 1时刻的部分概率来求t 时刻的部分概率

我们可以计算所有到状态X的路径的概率，找到其中最可能的路径，也就是局部最优路径。注意到这里，到达X的路径必然会经过t - 1时刻的A、B和C，所以我们可以利用之前的结果。达到X的最可能的路径就是下面三个之一：

(sequence of states), . . ., A, X (sequence of states), . . ., B, X or (sequence of states), . . ., C, X

我们需要做的就是找到以AX、BX和CX结尾的路径中概率最大的那个。

根据一阶马尔科夫的假设，一个状态的发生之和之前的一个状态有关系，所以X在某个序列的最后发生的概率只依赖于其之前的一个状态：

Pr (most probable path to A) . Pr (X | A) . Pr (observation | X)

有个了这个公式，我们就可以利用t - 1时刻的结果和状态转移矩阵和混淆矩阵的数据：

将上面这个表达式推广一下，就可以得到t时刻可观察状态为kt的第i个状态的最大部分概率的计算公式：

其中aji表示从状态j转移到状态i的概率，bikt表示状态i被观察成kt的概率。

2d.后向指针

考虑下图

在每一个中间状态和结束状态都有一个部分最优概率 (i,t)。但是我们的目的是找到最可能的隐藏状态序列，所以我们需要一个方法去记住部分最优路径的每一个节点。

考虑到要计算t时刻的部分概率，我们只需要知道t-1时刻的部分概率，所以我们只需要记录那个导致了t时刻最大部分概率的的状态，也就是说，在任意的时刻，系统都必须处在一个能在下一时刻产生最大部分概率的状态。我们可以利用一个后向指针来记录导致某个状态最大部分概率的上一个状态，形式化的描述为：

这里argmax表示能最大化后面公式的j值，同样可以发现这个公式之和t-1时刻的部分概率和转移概率有关，因为后向指针只是为了找到“我从哪里来”，这个问题和可观察没有关系，所以这里不需要再乘上混淆因子。

2e.优点

使用viterbi算法对一个可观察状态进行解码有两个重要的优点：

通过使用递归来减少复杂度，这点和之前的前想算法是一样的
可以根据可观察序列找到最优的隐藏序列，这个的计算公式是：

where

这里就是一个从左往右翻译的过程，通过前面的翻译结果得到后面的结果，起始点是初始向量。

2.补充

但在序列某个地方有噪声干扰的时候，某些方法可能会和正确答案相差的较远。

但是Viterbi算法会查看整个序列来决定最可能的终止状态，然后通过后向指针来找到之前的状态，这对忽略孤立的噪声非常有用。

3.总结

Viterbi算法提供了一个根据可观察序列计算隐藏序列的很高效的方法，它利用递归来降低计算复杂度，并且使用之前全部的序列来做判断，可以很好的容忍噪声。

在计算的过程中，这个算法计算每一个时刻每一个状态的部分概率，并且使用一个后向指针来记录达到当前状态的最大可能的上一个状态。最后，最可能的终止状态就是隐藏序列的最后一个状态，然后通过后向指针来查找整个序列的全部状态。

前向后向算法（Forward-Backward Algorithm）

和隐马尔科夫模型相关的有趣的问题就是判断一个模型的实用性（前向算法）和找到一个隐藏在可观察序列背后的隐藏序列（Viterbi算法）。当然，这两个过程都需要知道HMM的一些信息，比如转移矩阵，混淆矩阵以及初始的π向量。

但是在很多实际的情况下，HMM不能被直接的判断，这就变成了一个学习问题，前向后向算法可以根据一系列可观察序列来对HMM进行评测。一个可能的例子就是一个很大的语音处理数据库，语音序列可能被建模为一个马尔科夫链，可观察的序列可以被建模为可识别的状态，但是不能直接获得一些其他的相关信息。

前向后向算法理解起来并不困难，但是却要比前向算法和Viterbi算法要复杂，所以这里我们不再详细的介绍。总的来说，这个算法先对一些参数进行猜测，然后再通过评估这些参数的价值来修改这些参数，使得和给定的训练数据的误差变小，这其实是机器学习中的梯度下降的思想。

前向后向算法的名称来源于对于每一个状态，这个算法既要计算到达这一状态的前一个状态的概率，也要计算产生终止状态的后向状态的概率，这两个概率都可以通过递归的方法来实现。对HMM参数的调整可以提高中间概率的准确性，并且这些调整是算法迭代的基础。

总结（summary）

通常一个特别的模式不是单独的出现，而是作为某一个时间段下的序列出现。对于以时间为单位的过程有一个假设，一个状态的出现之和其前N个时间单位的状态有关系，这样就是一个N阶马尔科夫链，最简单的情况就是一阶马尔科夫链。

很多情况下，真实的状态序列是不能被直接观察到的，但是可以在一定概率下被间接观察到，这个观察的结果就是另一个可观察的序列，这样我们就可以定义一个隐马尔科夫模型，这个模型在现在的某些领域体现了很大的价值，尤其是语音识别。

这种关于真实序列的模型有三个相关的问题：

评价：一个给定的模型在多大的概率下能产生某个可观察的序列，这个问题可以用前向算法来解决。
解码：给定一个模型和某个可观察序列，最可能的隐藏序列是什么，这个问题可以用Viterbi算法来解决。
学习：给定某个可观察序列，怎么知道这个模型的一些参数，这个问题可以用前向后向算法来解决。

隐马尔科夫模型在分析真实系统的时候表现出了巨大的价值，但是它也有一些缺点，一个最大的缺点就是由于之前的假设导致的过于简化——一个状态只依赖其之间的状态，而且这种依赖是时间无关的。

一个更详细的关于HMMs的介绍可以参见

L R Rabiner and B H Juang, `An introduction to HMMs', iEEE ASSP Magazine, 3, 4-16.

总结（Summary）

你可能感兴趣的:(隐马尔科夫模型)

HMM 隐马尔可夫模型初学（二）小贝学生信
1、HMM，HiddenMarkovmodel隐马尔科夫模型（1）天气举例假设不能直接观察天气阴晴雨情况，只能看到地面的潮湿情况（假如分为非常潮湿，一般潮湿，不潮湿三种对应A，B，C三种评级）。现在我一连观察了一周的地面潮湿情况（AABBCBA），是否能够判断这一周的天气？如上所述，有两类状态：一类是地面潮湿状态observationstata（A、B、C）；一类是天气情况latentstata（
隐马尔科夫模型1（了解整体知识架构） -麦_子- 人工智能
当你去学习一个算法的时候，你首先要去搞清楚它是什么，能用来做什么。如果上来就进行公式推导，那样只会让你更加迷糊，只有彻底了解了之后学起来才会事半功倍。本篇文章主要有两个目的：1、让大家了解什么是隐马尔科夫模型。为了让大家深入理解，会先介绍什么是马尔科夫模型，然后介绍什么是隐马尔可夫模型，然后总结两者的联系和区别。2、带大家认识马尔可夫模型的三种应用场景。大家可以理解为能解决哪三种问题，以及三种场景
【大道至简】机器学习算法之隐马尔科夫模型(Hidden Markov Model, HMM)详解（3）---预测问题：维特比算法（Viterbi Algorithm）详解及Python代码实现五点钟科技大道至简系列 #机器学习算法系列人工智能自然语言处理机器学习隐马尔科夫模型维特比算法
❤️本篇相关往期文章汇总：（1）HMM开篇：基本概念和几个要素（2）HMM计算问题：前后向算法（3）HMM学习问题：Baum-Welch算法❤️本文隶属专栏：大道至简之机器学习系列❤️更多精彩文章持续发布，敬请关注本人主页~目录写在前面一、从青蛙跳台阶问题引入动态规划思想二、从序列标注到维特比算法三、维特比算法四、代码实现五、总结写在前面其实到本篇文章，关于HMM三个基本问题中最难的部分已经在前两
序列比对（十七）——第二部分的小结生信了
原创：hxj7序列比对的系列文章第二部分主要介绍了HMM（隐马尔科夫模型），包含了八篇文章：《序列比对（九）从掷骰子说起HMM》《序列比对（十）viterbi算法求解最可能路径》《序列比对（11）计算符号序列的全概率》《序列比对（12）：计算后验概率》《序列比对（13）后验解码》《序列比对（14）viterbi算法和后验解码的比较》《序列比对（15）EM算法以及Baum-Welch算法的推导》《序
统计学习方法（一）生成模型与判别模型 shijiatongxue
1定义监督学习方法分为生成方法（generativeapproach）和判别方法（discriminativeapproach），所学到的模型分别为生成模型和判别模型。生成方法由数据学习联合概率分布，然后求出条件概率分布作为预测模型，即生成模型：这样的方法之所以被称为生成方法，是因为模型表示了给定输入产生输出的生成关系。典型的生成模型有：朴素贝叶斯和隐马尔科夫模型。判别方法由数据直接学习决策函数或
HMM隐马尔可夫模型评估观察序列概率 Gowi_fly 机器学习机器学习
隐马尔可夫模型定义隐马尔科夫模型(HiddenMarkovModel,HMM)是建模序列数据的图模型在HMM模型存在隐藏状态{…,x(t−1),x(t),x(t+1),… }\{\dots,x(t-1),x(t),x(t+1),\dots\}{…,x(t−1),x(t),x(t+1),…}，以及观测状态{…,y(t−1),y(t),y(t+1),… }\{\dots,y(t-1),y(t),y(t
基于主成分分析和神经网络的人脸识别研究 ZT-Brillly 神经网络深度学习人工智能
1引言1.1文献综述近年来，随着人脸识别技术的发展和研究的深入提出了很多成熟的识别算法如基于人工神经网络算法、基于模板匹配的算法、基于隐马尔科夫模型的算法等各种算法都有各自的优缺点。多种算法结合是目前人脸识别领域最受关注的方法，其优势在于综合利用了人脸面部的各种特征信息将各种成熟算法的优势相结合与单一算法相比，大大提高了人脸识别的效率和准确率。1.2研究思路任务一:使用ORL人脸数据集，将数据集切
【生物信息】一阶马尔科夫链和隐马尔科夫模型上弦同学
Markov-HMM一阶马尔科夫链和隐马尔科夫模型程序功能：在网上收集50条细胞色素C的核心功能区域碱基序列作为正训练集，然后再收集50条碱基序列作为负训练集。收集一些数据作为测试集，通过一阶马尔科夫和隐马模型对测试集中的序列进行识别。一阶马尔科夫模型:给定一段DNA序列片段，判别它是否为胞色素C的核心功能区域。（整体判别问题）隐马尔科夫模型:给定一段DNA序列片段，识别细胞色素C的核心功能区域部
自然语言处理相关词条 beck_zhou 算法研究(数据挖掘机器学习自然语言深度学习搜索引擎)自然语言处理语言
NLP领域自然语言处理计算语言学自然语言理解自然语言生成机器翻译文本分类语音识别语音合成中文分词信息检索信息抽取句法分析问答系统自动摘要拼写检查统计机器翻译[编辑]NLP专题隐马尔科夫模型最大熵模型条件随机场数学之美支持向量机机器学习SRILMMoses知网IRSTLMNLTK[编辑]NLP人物冯志伟俞士汶董振东黄昌宁黄曾阳周明姚天顺刘群宗成庆赵铁军詹卫东常宝宝刘挺王海峰哈工大中文信息处理人物谱中
条件随机场之浅出杨天超 NLP 机器学习
1.随机场当给每个位置中，按照某种分布随机赋予相空间(值空间)的值，其全体就叫做随机场。简单说就是给定一些候选值，然后随机的把这些候选值填入到每个位置。2.概率图模型概率图模型就是用图来表示变量概率的依赖关系，如下图所示我们看到概率图模型主要分为有向图模型和无向图模型。有向图模型如我们之前所介绍过的贝叶斯网络和隐马尔科夫模型；无向图网络如马尔科夫随机场、条件随机场等；3.马尔科夫随机场马尔科夫随机
初学者也能看懂的隐马尔科夫模型介绍小白学视觉算法 python 机器学习人工智能 java
点击上方“小白学视觉”，选择加"星标"或“置顶”重磅干货，第一时间送达隐马尔科夫模型是（hiddenMarkovmodel，HMM）是可用于标注问题的统计学习模型，描述由隐藏的马尔科夫链随机生成观测序列的过程。隐马尔可夫模型（hiddenMarkovmodel，HMM）是时间序列的概率模型，常用于词性标注，语音识别，文本分析等领域。HMM是基于马尔科夫链进行标注的，我们对已经观察的数据序列O进行标
第十六章隐马尔科夫模型小酒馆燃着灯机器学习手写AI 深度学习机器学习
文章目录简介概念随机变量与随机过程马尔可夫链隐含马尔可夫模型两个基本假设三个基本问题算法观测序列生成算法概率计算算法前向概率与后向概率前向算法后向算法小结概率与期望学习问题监督学习方法Baum-Welch算法预测算法近似算法(MAP)维特比算法(Viterbi)简介动态贝叶斯网络的最简单实现隐马尔可夫模型。HMM可以看成是一种推广的混合模型。序列化建模，打破了数据独立同分布的假设。有些关系需要理清
基因家族分析1 雪碧好喝吗
1.数据下载1）基因家族模型下载在pfam（http://pfam.xfam.org/）中下载已知的蛋白保守结构域的隐马尔科夫模型（HMM）model.pnghmm下载.png2）基因组数据下载1.下载基因组文件fahttp://www.maizesequence.org/index.html2.下载基因组注释文件（gtf,gff3,gff）ftp://ftp.ensemblgenomes.org
SnowNLP使用自定义语料进行模型训练 qq_30895747 python智能算法 python snowNLP 情感分析
SnowNLP是一个功能强大的中文文本处理库，它囊括了中文分词、词性标注、情感分析、文本分类、关键字/摘要提取、TF/IDF、文本相似度等诸多功能，像隐马尔科夫模型、朴素贝叶斯、TextRank等算法均在这个库中有对应的应用。如果大家仔细观察过博主的博客，就会发现博主使用了摘要提取这一功能来增强博客的sEO，即通过自然语言处理(NLP)技术，提取每一篇文章中的摘要信息。因为SnowNLP本身使用的
28丨EM聚类：用EM算法对王者荣耀英雄进行划分张九日zx
EM算法是一种求解最大似然估计的方法，通过观测样本，来找出样本的模型参数。最大似然估计是一种通过已知结果，估计参数的方法。EM聚类的工作原理E步和M步：E步相当于通过初始化的参数来估计隐含变量，M步是通过隐含变量来反推优化参数。最后通过EM步骤的迭代得到最终的模型参数。EM算法相当于一个框架，可以采用不同的模型来进行聚类，比如GMM（高斯混合模型），或者HMM（隐马尔科夫模型）来进行聚类。HMM在
基于深度学习的聊天机器人 Chiancc 深度学习自然语言处理 tensorflow 深度学习
基于深度学习的聊天机器人-项目前期知识准备文章目录基于深度学习的聊天机器人-项目前期知识准备一、TensorFlow框架简介二、NLP基础1.常用的神经网络模型2.词法分析3.贝叶斯和朴素贝叶斯4.隐马尔科夫模型5.语料相关6.语言模型7.词向量Word2vec一、TensorFlow框架简介TensorFlow是一个基于数据流编程（dataflowprogramming）的符号数学系统，被广泛应
5分钟了解AI算法之隐式马尔可夫模型（Hidden Markov Model）千年奇葩 AI 人工智能视觉推理算法人工智能算法
一、隐式马尔可夫模型简介（HiddenMarkovModel）在之前的文章中已经介绍了马尔可夫链，马尔可夫模型与马尔可夫链的区别在于，隐马尔科夫模型多了一条不可见的时序状态。通过对该模型各参数的推导即可解决当前AI领域比较常见的三大基石问题：概率、学习、回归二、隐式马尔科夫模型的基本元素以小狗的日常行为为例，小狗的状态有高兴，恐惧和焦急，它表现的行为有摇尾巴、转圈、吠叫。状态集合Q：小狗的状态集合
机器学习之隐马尔科夫 shtahal
一、序言重新复习隐马尔科夫模型，重点是HMM模型的三个问题及前向、后向和维特比算法。二、基本概念2.1定义definition隐马尔可夫模型由初始概率分布、状态转移概率分布以及观测概率分布确定。隐马尔可夫模型的形式定义如下:设Q是所有可能的状态的集合,V是所有可能的观测的集合。其中,是可能的状态数,是可能的观测数。设是长度为的状态序列,是对应的观测序列:是状态转移概率矩阵:其中,是在时刻处于状态的
语音识别——kaldi安装与编译傲娇的程序猿语音识别 kaldi安装
1、安装下载源代码：gitclonehttps://github.com/kaldi-asr/kaldi.git各目录功能:./tools目录下面全部都是Kaldi依赖的包。其中主要有：OpenFST：WeightedFiniteStateTransducerlibrary，是一个用来构造有限状态自动机的库。我们知道隐马尔科夫模型就可以看成是一个有限状态自动机的。这是最终要的一个包，Kaldi的文
隐马尔科夫模型（三）影醉阏轩窗
上两篇文章我们了解了隐马尔可夫模型的基本工作原理和暴力求解观测概率问题。这篇文章咱们就推导一下常用的前向传播和后项传播、EM算法等原理定义前向定义前向公式由上一篇文章我们知道，暴力求解的思路是：非独立性求解！就是全部一起去求解，比如观测值为：A、A、B、C，那么我们就去求解P(C|AAB)的概率，这样的结果就是乘积，一直乘积！那么问题来了，它的时间复杂度那么大怎么办？于是前向传播算法就来了，前向求
【NLP入门教程】十九、隐马尔科夫模型（Hidden Markov Models）晨星同行 NLP入门教程自然语言处理人工智能
简介隐马尔科夫模型（HiddenMarkovModels，HMM）是一种统计模型，用于对观测序列和状态序列之间的潜在关系进行建模。它在自然语言处理领域中被广泛应用于语音识别、语言生成、机器翻译等任务。HMM的基本思想是将系统建模为一个马尔科夫过程，其中系统的状态不可见（隐藏状态），但可以通过观测到的数据（观测状态）进行间接推断。模型结构HMM由三个关键组件组成：状态集合、状态转移概率矩阵和观测概率
【NLP】NLP全路径学习推荐风度78 人工智能大数据编程语言 python 机器学习
我跟几位BAT老哥聊了下NLP全路径学习的事情，总结出以下内容，包含：学习NLP需要具备哪些基础NLP全路径各任务学习的项目01学习NLP需要具备的基础01机器学习熟悉简单的机器学习模型。例如：逻辑回归、决策树、朴素贝叶斯、隐马尔科夫模型、K-Means、正则化方法等；有部分高级机器学习基础更好。例如：集成学习（随机森林、GBDT、XGB、Stacking等）、条件随机场CRF、贝叶斯网络、支持向
【随机过程】 17 -离散时间马氏链典型应用 Ciaran-byte 数学基础算法机器学习自然语言处理
离散时间马尔科夫链的典型应用文章目录离散时间马尔科夫链的典型应用0.概述1.PageRank1.1背景1.2模型建立1.3模型求解2.MCMC2.1概述2.2实现思路2.3具体实现2.3.1第一步：细致平衡2.3.2第二步：构成一步转移矩阵P2.3.3第三步：运行马氏链3.隐马尔科夫模型3.1概述3.2计算隐马尔科夫模型观测数据的概率3.2.1直接计算方法3.2.2前向递推3.3计算状态的条件概率
【大道至简】机器学习算法之隐马尔科夫模型(Hidden Markov Model, HMM)详解（3）---学习问题：Baum-Welch算法推导及Python代码实现尚拙谨言大道至简系列 #机器学习算法系列算法人工智能自然语言处理隐马尔科夫模型 Baum Welch
☕️本文系列文章汇总：（1）HMM开篇：基本概念和几个要素（2）HMM计算问题：前后向算法（3）HMM学习问题：Baum-Welch算法（4）HMM预测问题：维特比算法☕️本文来自专栏：大道至简之机器学习系列专栏❤️欢迎各位小伙伴们关注我的大道至简之机器学习系列专栏，一起学习各大机器学习算法❤️还有更多精彩文章（NLP、热词挖掘、经验分享、技术实战等），持续更新中……欢迎关注我，个人主页：http
隐马尔科夫模型(HMM) SrdLaplaceGua 机器学习实用技巧机器学习算法人工智能 EM算法无监督学习 HMM
隐马尔可夫模型（HiddenMarkovModel，HMM）是含有隐藏状态的马尔可夫过程的模型。隐马尔可夫模型有两种变量，不可观察到的状态和可观察到的观测。隐马尔可夫模型有两个基本假设：齐次马尔可夫性假设，即假设隐藏的马尔科夫链在任意时刻t的状态只依赖于其前一时刻的状态，与其他时刻的状态及观测无关观测独立性假设，即假设任意时刻的观测只依赖于该时刻的马尔可夫链的状态，与其他观测及状态无关.HMM的参
EM算法实现之隐马尔科夫模型HMM的python实现 babyai997 算法数学建模 python
1基本概念1.1马尔科夫链（维基百科）马尔可夫链（英语：Markovchain），又称离散时间马尔可夫链（discrete-timeMarkovchain，缩写为DTMC），因俄国数学家安德烈·马尔可夫得名，为状态空间中经过从一个状态到另一个状态的转换的随机过程。该过程要求具备“无记忆”的性质：下一状态的概率分布只能由当前状态决定，在时间序列中它前面的事件均与之无关。这种特定类型的“无记忆性”称作
隐马尔科夫模型 P-ShineBeam NLP基础知识基础 python统计模型机器学习算法线性代数
隐马尔可夫模型隐马尔可夫模型(HiddenMarkovModel,HMM)可以由观测序列推断出概率最大的状态序列.HMM中的变量可分为两组:状态变量(隐变量):{y1,y2,...,yn}\left\{y_{1},y_{2},...,y_{n}\right\}{y1,y2,...,yn};序列标注问题中的标注.观察变量:{x1,x2,...,xn}\left\{x_{1},x_{2},...,x_
NLP作业01：利用HMM实现词性标注风逸尘_lz NPL自然语言处理自然语言处理机器学习算法
作业头这个作业属于哪个课程自然语言处理这个作业要求在哪里利用HMM实现词性标注作业要求我在这个课程的目标实现词性标注这个作业在哪个具体方面帮助我实现目标代码实现参考文献1.隐马尔科夫模型 2.基于HMM的词性标注 3.基于HMM+Viterbi算法的词性标注Python文章目录作业内容HMM模型介绍✨维特比算法介绍代码展示作业内容1.利用“1998人民日报词性标注语料库”进行模型的训练。2.根据数
从马尔可夫模型到隐马尔可夫模型 Milkmilkmilk
马尔可夫模型简介：马尔可夫模型个人认为这个概念应该是从随机过程里面提出来的，由马尔可夫过程过来的概念。实际上掌握了随机过程里面对马尔可夫过程的特殊情况：离散参数离散状态的马尔可夫链的数学运算的话。就能够很好解决马尔可夫模型上面的计算问题，包括隐马尔科夫模型。讲马尔可夫模型以及过程重点在于其满足的性质-马尔可夫性。随机过程：现实中时常出现，某个事物满足一定的随机分布，但是其随机分布会随着时间的变化而
动态规划算法练习 (1) 生信编程日常
动态规划（英语：Dynamicprogramming，简称DP）是一种在数学、计算机科学、经济学和生物信息学中使用的，通过把原问题分解为相对简单的子问题的方式求解复杂问题的方法。在生物信息领域，比如在序列比对的时候，就用到了动态规划的思想。在隐马尔科夫模型中的维特比(Viterbi)算法也使用了动态规划算法。对于一个问题，我们分析出初始状态和递推公式是解出的关键。比如以下几个经典题目：1.爬楼梯(
用MiddleGenIDE工具生成hibernate的POJO（根据数据表生成POJO类） AdyZhang POJO eclipse Hibernate MiddleGenIDE
推荐:MiddlegenIDE插件, 是一个Eclipse 插件. 用它可以直接连接到数据库, 根据表按照一定的HIBERNATE规则作出BEAN和对应的XML ，用完后你可以手动删除它加载的JAR包和XML文件! 今天开始试着使用
.9.png Cb123456 android
“点九”是andriod平台的应用软件开发里的一种特殊的图片形式，文件扩展名为：.9.png 　　智能手机中有自动横屏的功能,同一幅界面会在随着手机(或平板电脑)中的方向传感器的参数不同而改变显示的方向,在界面改变方向后,界面上的图形会因为长宽的变化而产生拉伸,造成图形的失真变形。　　我们都知道android平台有多种不同的分辨率，很多控件的切图文件在被放大拉伸后，边
算法的效率天子之骄算法效率复杂度最坏情况运行时间大O阶平均情况运行时间
算法的效率效率是速度和空间消耗的度量。集中考虑程序的速度，也称运行时间或执行时间，用复杂度的阶(O)这一标准来衡量。空间的消耗或需求也可以用大O表示，而且它总是小于或等于时间需求。以下是我的学习笔记： 1.求值与霍纳法则，即为秦九韶公式。 2.测定运行时间的最可靠方法是计数对运行时间有贡献的基本操作的执行次数。运行时间与这个计数成正比。
java数据结构何必如此 java 数据结构
Java 数据结构 Java工具包提供了强大的数据结构。在Java中的数据结构主要包括以下几种接口和类：枚举（Enumeration）位集合（BitSet）向量（Vector）栈（Stack）字典（Dictionary）哈希表（Hashtable）属性（Properties）以上这些类是传统遗留的，在Java2中引入了一种新的框架-集合框架(Collect
MybatisHelloWorld 3213213333332132
//测试入口TestMyBatis package com.base.helloworld.test; import java.io.IOException; import org.apache.ibatis.io.Resources; import org.apache.ibatis.session.SqlSession; import org.apache.ibat
Java|urlrewrite|URL重写|多个参数 7454103 java xml Web 工作
个人工作经验！如有不当之处，敬请指点 1.0 web -info 目录下建立 urlrewrite.xml 文件类似如下： <?xml version="1.0" encoding="UTF-8" ?> <!DOCTYPE u
达梦数据库+ibatis darkranger sql mysql ibatis SQL Server
--插入数据方面如果您需要数据库自增... 那么在插入的时候不需要指定自增列. 如果想自己指定ID列的值, 那么要设置 set identity_insert 数据库名.模式名.表名; ----然后插入数据; example: create table zhabei.test( id bigint identity(1,1) primary key, nam
XML 解析四种方式 aijuans android
XML现在已经成为一种通用的数据交换格式,平台的无关性使得很多场合都需要用到XML。本文将详细介绍用Java解析XML的四种方法。 XML现在已经成为一种通用的数据交换格式,它的平台无关性,语言无关性,系统无关性,给数据集成与交互带来了极大的方便。对于XML本身的语法知识与技术细节,需要阅读相关的技术文献,这里面包括的内容有DOM(Document Object
spring中配置文件占位符的使用 avords
1.类 <?xml version="1.0" encoding="UTF-8"?><!DOCTYPE beans PUBLIC "-//SPRING//DTD BEAN//EN" "http://www.springframework.o
前端工程化-公共模块的依赖和常用的工作流 bee1314 webpack
题记：一个人的项目，还有工程化的问题嘛？我们在推进模块化和组件化的过程中，肯定会不断的沉淀出我们项目的模块和组件。对于这些沉淀出的模块和组件怎么管理？另外怎么依赖也是个问题？你真的想这样嘛？ var BreadCrumb = require(‘../../../../uikit/breadcrumb’); //真心ugly。
上司说「看你每天准时下班就知道你工作量不饱和」，该如何回应？ bijian1013 项目管理沟通 IT职业规划
问题：上司说「看你每天准时下班就知道你工作量不饱和」，如何回应正常下班时间6点，只要是6点半前下班的，上司都认为没有加班。 Eno-Bea回答，注重感受，不一定是别人的虽然我不知道你具体从事什么工作与职业，但是我大概猜测，你是从事一项不太容易出现阶段性成果的工作
TortoiseSVN，过滤文件征客丶 SVN
环境： TortoiseSVN 1.8 配置：在文件夹空白处右键选择 TortoiseSVN -> Settings 在 Global ignote pattern 中添加要过滤的文件：多类型用英文空格分开 *name ：过滤所有名称为 name 的文件或文件夹 *.name ：过滤所有后缀为 name 的文件或文件夹 --------
【Flume二】HDFS sink细说 bit1129 Flume
1. Flume配置 a1.sources=r1 a1.channels=c1 a1.sinks=k1 ###Flume负责启动44444端口 a1.sources.r1.type=avro a1.sources.r1.bind=0.0.0.0 a1.sources.r1.port=44444 a1.sources.r1.chan
The Eight Myths of Erlang Performance bookjovi erlang
erlang有一篇guide很有意思： http://www.erlang.org/doc/efficiency_guide 里面有个The Eight Myths of Erlang Performance： http://www.erlang.org/doc/efficiency_guide/myths.html Myth: Funs are sl
java多线程网络传输文件(非同步)-2008-08-17 ljy325 java 多线程 socket
利用 Socket 套接字进行面向连接通信的编程。客户端读取本地文件并发送；服务器接收文件并保存到本地文件系统中。使用说明:请将TransferClient, TransferServer, TempFile三个类编译，他们的类包是FileServer. 客户端: 修改TransferClient: serPort, serIP, filePath, blockNum,的值来符合您机器的系
读《研磨设计模式》-代码笔记-模板方法模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.sql.Connection; import java.sql.DriverManager; import java.sql.PreparedStatement; import java.sql.ResultSet;
配置心得 chenyu19891124 配置
时间就这样不知不觉的走过了一个春夏秋冬，转眼间来公司已经一年了，感觉时间过的很快，时间老人总是这样不停走，从来没停歇过。作为一名新手的配置管理员，刚开始真的是对配置管理是一点不懂，就只听说咱们公司配置主要是负责升级，而具体该怎么做却一点都不了解。经过老员工的一点点讲解，慢慢的对配置有了初步了解，对自己所在的岗位也慢慢的了解。做了一年的配置管理给自总结下： 1.改变从一个以前对配置毫无
对“带条件选择的并行汇聚路由问题”的再思考 comsci 算法工作软件测试嵌入式领域模型
2008年上半年，我在设计并开发基于”JWFD流程系统“的商业化改进型引擎的时候，由于采用了新的嵌入式公式模块而导致出现“带条件选择的并行汇聚路由问题”(请参考2009-02-27博文)，当时对这个问题的解决办法是采用基于拓扑结构的处理思想，对汇聚点的实际前驱分支节点通过算法预测出来，然后进行处理，简单的说就是找到造成这个汇聚模型的分支起点，对这个起始分支节点实际走的路径数进行计算，然后把这个实际
Oracle 10g 的clusterware 32位下载地址 daizj oracle
Oracle 10g 的clusterware 32位下载地址 http://pan.baidu.com/share/link?shareid=531580&uk=421021908 http://pan.baidu.com/share/link?shareid=137223&uk=321552738 http://pan.baidu.com/share/l
非常好的介绍：Linux定时执行工具cron dongwei_6688 linux
Linux经过十多年的发展，很多用户都很了解Linux了，这里介绍一下Linux下cron的理解，和大家讨论讨论。cron是一个Linux 定时执行工具，可以在无需人工干预的情况下运行作业，本文档不讲cron实现原理，主要讲一下Linux定时执行工具cron的具体使用及简单介绍。新增调度任务推荐使用crontab -e命令添加自定义的任务（编辑的是/var/spool/cron下对应用户的cr
Yii assets目录生成及修改 dcj3sjt126com yii
assets的作用是方便模块化，插件化的，一般来说出于安全原因不允许通过url访问protected下面的文件，但是我们又希望将module单独出来，所以需要使用发布，即将一个目录下的文件复制一份到assets下面方便通过url访问。 assets设置对应的方法位置 \framework\web\CAssetManager.php assets配置方法在m
mac工作软件推荐 dcj3sjt126com mac
mac上的Terminal + bash ＋ screen组合现在已经非常好用了，但是还是经不起iterm＋zsh＋tmux的冲击。在同事的强烈推荐下，趁着升级mac系统的机会，顺便也切换到iterm＋zsh＋tmux的环境下了。我为什么要要iterm2 切换过来也是脑袋一热的冲动，我也调查过一些资料，看了下iterm的一些优点： * 兼容性好，远程服务器 vi 什么的低版本能很好兼
Memcached(三)、封装Memcached和Ehcache frank1234 memcached ehcache spring ioc
本文对Ehcache和Memcached进行了简单的封装，这样对于客户端程序无需了解ehcache和memcached的差异，仅需要配置缓存的Provider类就可以在二者之间进行切换，Provider实现类通过Spring IoC注入。 cache.xml <?xml version="1.0" encoding="UTF-8"?>
Remove Duplicates from Sorted List II hcx2013 remove
Given a sorted linked list, delete all nodes that have duplicate numbers, leaving only distinct numbers from the original list. For example,Given 1->2->3->3->4->4->5,
Spring4新特性——注解、脚本、任务、MVC等其他特性改进 jinnianshilongnian spring4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
MySQL安装文档 liyong0802 mysql
工作中用到的MySQL可能安装在两种操作系统中，即Windows系统和Linux系统。以Linux系统中情况居多。安装在Windows系统时与其它Windows应用程序相同按照安装向导一直下一步就即，这里就不具体介绍，本文档只介绍Linux系统下MySQL的安装步骤。 Linux系统下安装MySQL分为三种：RPM包安装、二进制包安装和源码包安装。二
使用VS2010构建HotSpot工程 p2p2500 HotSpot OpenJDK VS2010
1. 下载OpenJDK7的源码： http://download.java.net/openjdk/jdk7 http://download.java.net/openjdk/ 2. 环境配置 ▶
Oracle实用功能之分组后列合并 seandeng888 oracle 分组实用功能合并
1 实例解析由于业务需求需要对表中的数据进行分组后进行合并的处理，鉴于Oracle10g没有现成的函数实现该功能，且该功能如若用JAVA代码实现会比较复杂，因此，特将SQL语言的实现方式分享出来，希望对大家有所帮助。如下：表test 数据如下： ID,SUBJECTCODE,DIMCODE,VALUE 1&nbs
Java定时任务注解方式实现 tuoni java spring jvm xml jni
Spring 注解的定时任务，有如下两种方式：第一种： <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi="http
11大Java开源中文分词器的使用方法和分词效果对比 yangshangchuan word分词器 ansj分词器 Stanford分词器 FudanNLP分词器 HanLP分词器
本文的目标有两个： 1、学会使用11大Java开源中文分词器 2、对比分析11大Java开源中文分词器的分词效果本文给出了11大Java开源中文分词的使用方法以及分词结果对比代码，至于效果哪个好，那要用的人结合自己的应用场景自己来判断。 11大Java开源中文分词器，不同的分词器有不同的用法，定义的接口也不一样，我们先定义一个统一的接口： /** * 获取文本的所有分词结果, 对比