天真的和感伤的想象家

机器学习中隐马尔可夫模型（Hidden Markov Model, HMM）理论

隐马尔可夫模型（Hidden Markov Model, HMM）

前言：内容从实际案例到模型提取、建立、求解以及应用，侧重于该模型在机器学习中的研究和应用。

参考书：

《统计学习方法》

《The Model Thinker》

文章目录

隐马尔可夫模型（Hidden Markov Model, HMM）
- 1. 马尔可夫宿命论
- - 1.1 案例
  - 1.2 宿命
- 2. 马尔可夫过程
- 3. 隐马尔可夫模型
- - 3.1 从 EM 算法
  - 3.2 从马尔可夫过程
  - 3.3 到隐马尔可夫模型（HMM）
  - - 3.3.1 形式定义
    - 3.3.2 模型建立
    - 3.3.3 基本性质
  - 3.4 图例示意
- 4. 模型求解
- - 4.1 似然函数计算
  - - 4.1.1 直接计算
    - 4.1.2 前向算法
    - 4.1.3 后向算法
  - 4.2 模型参数估计
  - - 4.2.1 Baum-Welch 算法
  - 4.3 状态序列预测
  - - 4.3.1近似算法
    - 4.3.2 维特比算法
- 5. 代码实现

1. 马尔可夫宿命论

History is a cyclic poem written by time upon the memories of man. ------Percy Bysshe Shelley

1.1 案例

课堂注意力

假设课堂上学生听课有两种状态：集中和开小差。且学生集中和开小差之间转换概率是固定的，具体为：今天如果认真听讲，第二天仍认真听讲的概率为90%，开小差的概率为10%；如果今天开小差，第二天会认真听讲的概率为30%，仍旧开小差的概率为70%

如果转换概率不变，最终认真听讲和开小差人数会达到一个稳定状态。

推演整个变化过程如下（假设有100名同学）：

第一天：假设认真听讲和开小差人数各占一半（各50人）>>>>> [50, 50]

第二天：认真听讲的人中，5人（10%）变为开小差; 开小差的人中有15人认真听讲 >>>>> [60, 40]

此后，同第二天中推理一样，直到有一天，认真听讲的人有 75 人，开小差有 25 人，那么对于下一天认真听讲中，7.5（10%）变为开小差，开小差中，同样 7.5（10%）变为认真听讲。自此，认真听讲与开小差的人数达到固定（稳定状态）。

事实上，初始条件的改变、中途的干预也不会影响最终的结果，只要状态之间的转换概率不变。譬如通过课堂活动、增强监督来增加认真听讲的人数，但一旦这种干预停止，那么最终还是会回到 75 人认真，25 人开小差的境况。就像某种宿命。

情绪转变

对于一个人，假设情绪包含着三种状态：低落、平静、兴奋，且它们间转换的概率固定（由性格和环境确定），人最终会达到一个上述情绪状态占比稳定的状态。例如某人情绪达到稳定状态后低落占比较大，那么生活中的一次 party 所带来的全天兴奋是改变不了最终状态的，慢慢地人还是会回归到情绪低落之中。

精准扶贫

扶贫先扶智，就在于改变转换概率，而非直接发钱干预初始条件，因为这种干预对于改变最终状态没有用处。提高穷人技能、认知、态度才是要义。

纳什均衡与马尔可夫过程的异同

两者的最终结果都是达到平衡，回归到一种均衡态。但这两种均衡在原理和过程上有着本质上的区别。

纳什均衡见诸于博弈论中，是各方为了达到自己期望收益最大值而做出一系列努力和决策，最终达到了一种平衡态，而这种平衡态是一种不得不接受的结果，一旦有一方做出改变，那么只会让自身利益受损。譬如同类商铺总会扎堆出现。

马尔可夫过程，最终也是回归到一个均衡态，而这种均衡态是有一种宿命的味道。关键因素不加以改变，最终的结果始终如一，有着一种因果关系。

纳什均衡是各方博弈，且是非合作博弈，最终达到对峙妥协；马尔可夫过程则是系统根据自身特性，演变出的必然结果。

一些相关俗语

扶贫先扶智

江山易改，本性难移

授人以鱼不如授人以渔

1.2 宿命

一个系统如果满足如下条件

系统中有有限多个状态
状态之间切换的概率是固定的
从任何一个状态出发都能找到一条路切换到任何一个其他状态
系统中不能有单独几个状态形成闭环而把其他状态排斥在外

该系统就将陷入马尔可夫宿命当中，即无论外部做出多大努力，该系统都会最终演变到一个固定平衡态。

参考:

有趣视频

【薛饿】冲出僵尸岛
【看懂村】纳什均衡

2. 马尔可夫过程

以上从实际案例中引入了马尔克夫过程。

针对案例1中的系统马尔可夫过程可以用图示描述

将其抽象为一般数学模型：

对于一个随机过程 $q_1, q_2, \cdots, q_N$ ，每个 $q_t$ 就是一个随机变量，每个随机变量在一个观测集合 $\{v_1, v_2, \cdots, v_n\}$ 中取值，即 $q_t \in v$

在案例 1 中，随机过程 $ q_t$ 对应于某个学生的第 t 天的上课状态，观测集合 v 对应取值为 ${认真，开小差\}$ 。

某一同学的具体随机过程可表示诸如：开小差，开小差，认真，认真，认真，认真……

根据马尔可夫过程特点，状态间存在转化，考虑第 t 与 t+1 过程

记从 $v_i$ 转移到状态 $v_j$ 概率为
$P(q_{t+1}=v_{j}|q_{t}=v_i) = P_{ij}$
使用转移矩阵
$[P_{ij}]_{n\times n}$
该矩阵包含了任意两个状态间的转化概率。转移矩阵性质：

$0\leq P_{ij} \leq 1 \\ \sum\limits_{j=1}^n P_{ij} = 1 \\ P(q_{t+1}=v_{t+1}|q_t=v_t,q_{t-1}=v_{t-1},\cdots,q_0=v_0) =P(q_{t+1}=v_{t+1}|q_t=v_t)$

在案例 1 中，状态转移

（到）认真（到）开小差

（从）认真 90% 10%

（从）开小差 30% 70%

即转移矩阵
$A_1 =\left[ \begin{matrix} 90\% & 10\% \\ 30\% & 70\% \end{matrix} \right]$

	（到）认真	（到）开小差
（从）认真	90%	10%
（从）开小差	30%	70%

3. 隐马尔可夫模型

3.1 从 EM 算法

参考：EM 算法

复现三硬币模型

A, B, C 为三枚硬币，正面朝上的概率假设分别为 $π, p, q$ ，进行投掷硬币实验：先投掷 A 硬币，结果用 x 表示，如果朝上(x=1)，投掷 B 硬币，否则(x=0)，投掷 C 硬币。最终结果记为 y，正面 y=1, 反面 y=0

假设经过 n 次实验，观测到结果 $y_1, y_2, \cdots, y_n$

该模型是基于独立实验进行的，确切说是，每次是通过投掷 A 来选择决定后面操作，而每次投掷 A 硬币结果是独立同分布的（independentity identically distribution, iid），因此作出选择（选择投掷 B 或 C）的概率也是固定且无联系的。但现实中很多情况下，选择往往是相互联系的，即前一次的结果会对后一次结果产生影响。

假设去除掉 B 和 C 硬币投掷过程，将投掷 A 的结果显式提取出来，假设经过 10 次实验，考虑如下两种情况下的结果（选择B记为B，选择C记为C；为说明问题，数据比较极端）

	1	2	3	4	5	6	7	8	9	10
第一种情况	B	C	B	B	C	B	C	C	B	C
第二种情况	B	B	B	B	B	C	C	C	C	C

在之前 EM 算法视角下，这两种情况其实是等价的，因为两种情况下，都有 5 次选择了 B，5 次选择了 C，会得到相同的似然函数，因此参数估计也会是相同的。

但实际上，这两种情况下的结果明显是有差异的，第一种结果显示出一种随机性，而第二种结果像是有种惯性效果（i.e. 保持与前次结果相同的概率较大，变为另一种情况的概率小），之前对于第二种结果的解释和预测就会显现出局限性。而这就是隐马尔可夫要解决的问题。

在之前引入 EM 算法时，模型是通过隐藏层的选取（三硬币模型中的 $\pi$ ，高斯混合模型中的 $\alpha_k$ ），以及观测层的观察（三硬币模型中的 $p, q$ ，高斯模型中的 $P(y_i|\theta)$ ）确定。

而类比之前，建立可解决问题的隐马尔可夫模型，需要隐藏层的选取（转移概率矩阵），需要观测层的观察（观测概率矩阵），因为模型具有时序性，需要给定一个初始值，才能生成后续值，因此还需要一个“导火索”，即 t=0 时刻下，取隐藏层第一值 $q_i$ 的概率（初始状态概率向量）

3.2 从马尔可夫过程

对于上述三硬币模型，通过去除掉 B 和 C硬币投掷过程，显式展现了第一次投掷的结果，假设满足转移矩阵（参考上述第二种情况，使相同结果间相互转化概率较大），即显式展现了马尔可夫过程。

	到 B	到 C
从 B	90%	10%
从 C	10%	90%

但实际情况中，该过程是隐藏的，就类似于神经网络中的隐藏层，我们只能得到最终的投掷 B 或 C 后的结果，而选择 B 或 C 的这个过程是隐式进行的。

因此，对于一个包含马尔可夫过程，且该过程处于隐藏层的模型，就是隐马尔可夫模型。

3.3 到隐马尔可夫模型（HMM）

3.3.1 形式定义

名词

状态序列：隐藏的马尔可夫链随机生成的状态序列（对应于三硬币模型中，对B/C的选择；不可显式观测到）
观测序列：每个状态生成一个观测，由此产生的观测序列（对应于三硬币模型中，B/C投掷结果；最终能观测的结果）

隐藏层

设 $I$ 是长度为 T 的状态序列，Q 是所有可能状态的集合，
$\{i_1, i_2, \cdots, i_T\} \\ Q = \{q_1, q_2, \cdots, q_N\}$

对于三硬币模型，隐藏层（选择B/C）随机过程（状态序列）为 $i_1, i_2, \cdots, i_N$ ，也即对应于 B/C选择情况这一事件，对这一事件的结果在可能状态集合 Q 中取值，且 $Q=\{选择 B，选择 C\}$

假设第 1 个观测结果为需要选择B投掷，该概率事件可记为 $P(i_1 = B)$

该层为隐式进行，不可观察到。

观察层

设 O 是长度为 T 的观测序列，V 是所有可能的观测集合
$\{o_1, o_2, \cdots, o_T\} \\ V = \{v_1, v_2, \cdots, v_M\}$

对于三硬币模型，观察层（投掷B/C）随机过程（观测序列）为 $o_1, o_2, \cdots, o_T$ ，也即对应于最终能够观察到结果这一事件，对这一事件的观测结果在可能观测集合 V 中取值，且 $V = \{正面，反面\}$

假设第 1 个观测结果为正面，该概率时间可记为 $P=(o_1 = 正面)$

3.3.2 模型建立

在 3.1 中说明了隐马尔可夫模型需要三个要素：

初始状态概率向量

记 t=1 时刻，模型从隐状态 $q_i$ 开始，而这一事件概率记为
$\pi_i = P(i_1 = q_i)$
且 $q_i \in Q$ ，对于所有情况，用一向量 $\pi$ 表示
$\pi = (\pi_i), \ \ \ i=1,2,\cdots,N$
状态转移概率矩阵

选定了初始状态 $q_i$ , 需要确定向下一时刻的状态过渡情况

记隐马尔可夫过程中，t 时刻从状态 $q_i$ 到 t+1 时刻 $q_j$ 的概率为 $a_{ij}$ ，即
$P(i_{t+1}=q_j|i_t=q_i) = a_{ij}$
且 $q_i,q_j \in Q$ ，对所有状态转换（概率），用矩阵A表示
$[a_{ij}]_{N\times N}, \ \ \ i,j = 1,2,\cdots,N$
注：某时刻的状态只与前一时刻状态相关。

观测概率矩阵

选定了状态 $q_j$ ，在 $q_j$ 状态下，进行观察层的实验

在 t 时刻，处于状态 $q_j$ 的条件下，生成观测 $v_k$ 的概率用 $b_j(k)$ 表示
$P(O_t = v_k | i_t = q_j) = b_j(k)$
且 $v_k \in V, q_i \in Q$ ，对所有观测结果（概率），用矩阵B表示
$[b_j(k)]_{N\times M}, \ \ \ k=1,2,\cdots,M;\ j=1,2,\cdots,N$
马尔可夫模型

自此，由给定的初始状态向量 $\pi$ 、状态转移概率矩阵A、观测概率矩阵B即可确定隐马尔可夫模型 $\lambda$ ，即
$\lambda = (A,B,\pi)$

3.3.3 基本性质

隐马尔可夫过程的状态演变中，t 时刻的状态只与前时刻的状态相关，与其他时刻状态和观测无关
$P(i_t|i_{t-1},i_{t-2},\cdots,i_1,o_{t-1},o_{t-2},\cdots,o_1) = P(i_t|i_{t-1})$
该性质对应于状态转移概率矩阵
生成观测过程中，任意时刻的观测值只与该时刻选择的状态相关，与其他时刻状态和观测值无关
$P(o_t|i_T,\cdots,i_t,i_{t-1},\cdots,i_1,o_T,\cdots,o_t,o_{t-1},\cdots,o_1)$
该性质对应于观测概率矩阵。

3.4 图例示意

以具有马尔可夫过程的三硬币模型为例：

4. 模型求解

隐马尔可夫模型建立之后，又到了机器学习中喜闻乐见的问题求解过程。

值得说明的一点是，EM 算法是一种方法，可以用作为某一模型的学习算法，而隐马尔可夫模型是一个具体模型，并且是个生成模型，可以完成预测问题。且在模型问题求解的过程中，用到了 EM 算法这一方法思想。两者关系有着与朴素贝叶斯法（模型）和贝叶斯估计（方法）间关系异曲同工之处。

在完成预测问题的过程中，同之前 EM 算法模型求解过程一样，需要先构建极大似然函数，然后最大化似然函数来估计模型参数（之前EM算法推导止于此），最后根据已知参数的模型和观测序列来预测隐马尔可夫过程的状态序列。尽管前面部分跟之前求解过程相同，但实际求解计算，较之前基于EM算法的模型要复杂的多。

那么就对上述三个层层递进的基本问题进行求解：

概率问题：给定模型 $\lambda = (A,B,\pi)$ 和观测序列 $O=(o_1,o_2,\cdots,o_T)$ ，计算似然函数 $P(O|\lambda)$
学习问题：极大化上述似然概率函数 $P(O|\lambda)$ ，即使用极大似然估计来估计模型参数
预测问题：根据得到的已知参数的模型 $\lambda$ 和观测序列 $O=(o_1,o_2,\cdots,o_T)$ ，求解出与之对应的隐藏层最可能的状态序列 $I=(i_1,i_2,\cdots,i_T)$

4.1 似然函数计算

给定模型 $\lambda = (A,B,\pi)$ 和观测序列 $O=(o_1,o_2,\cdots,o_T)$ ，计算似然函数 $P(O|\lambda)$

4.1.1 直接计算

直接计算是基于穷举的算法思想。

不同于之前 EM 算法模型的一点在于，HMM 存在时序性，即状态序列 $I=(i_1,i_2,\cdots,i_T)$ 是根据状态转移矩阵确定的。

对于已知观测序列 O，每个时刻下的观测值 $o_t$ 对应的状态 $i_t$ 取值都会有 N 种，即 $i_t \in Q=(q_1,q_2,\cdots,q_N)$ ，那么对于整个观测序列 O 其实会对应着 $N^T$ 情况下的状态序列。

考虑对于每种状态序列（就假定为 $i_1,i_2,\cdots,i_T$ ）都可以直接写出该状态序列似然概率为
$\pi_{i_1}b_{i_1}(o_1)a_{i_1i_2}b_{i_2}(o_2)\cdots a_{i_{T-1}i_T}b_{i_T}(o_T)$

说明1

式子即为

$P = 初始序列状态 \times 初始观测值概率 \times 转换到第二序列状态概率 \times 第二观测值概率 \times . . . . . . \times 转换到第 T 序列状态概率 \times 第 T 观测值概率$

注意：在计算第二观测值 $o_2$ 概率时，不是常规的 $\pi_{i_1}a_{i_1i_2}b_{i_2}(o_2)$ ，换句话说，到达第二序列的概率不是通过 $\pi_{i_1}a_{i_1i_2}$ 计算，因为这样就体现不出时序性，体现不出序列这个词的意义。

我们要的是一个过程，而非每个结果的堆积。

说明2

如上，对应于图例3.4中，黑色箭头引导的一条路径 (B->C->B->B)，即为一个可能的状态序列取值。且该序列取值的概率为
$\pi_Ba_{BC}a_{CB}a_{BB}$
其中： $\pi_B$ 表示初始状态 $i_1$ 为B的概率， $a_{BC}$ 表示从 B 转换为 C 的概率。

如果最终观测O序列取值为（1,1,0,0），则可求出该种序列得到该种结果的概率为
$\pi_B\cdot b_B(1)\cdot a_{BC}\cdot b_C(1)\cdot a_{CB}\cdot b_B(0)\cdot a_{BB}\cdot b_B(0)$
其中， $b_B(1)$ 表示在选择投掷B的情况下，结果为正面的概率。

所有的状态序列，即是最上方四个时间段 {B,C} 的所有可能组合，有 $2\times2\times2\times2 = 2^4$ 种

对所有可能的状态序列（ $N^T$ 个）进行求和，即可得到最终的似然函数
$P(O|\lambda) = \sum\limits_{i_1,i_2,\cdots,i_T \in Q} \pi_{i_1}b_{i_1}(o_1)a_{i_1i_2}b_{i_2}(o_2)\cdots a_{i_{T-1}i_T}b_{i_T}(o_T)$
该种方法可能的状态序列个数为 $N^T$ ，每个状态序列有 T 个元素，计算量可表示为 $O(TN^T)$ 。这种计算复杂度不能容忍的。但确实，该方法求解思想比较直接。

4.1.2 前向算法

事实上，在上面直接计算的过程中，可以感受到，有大量数据是重复计算的，而这也是使得计算效率较低的一个重要因素。

就拿状态序列取值来讲，以三个序列取值为例
$(1)\ B \rightarrow C \rightarrow B \rightarrow B \\ (2)\ B \rightarrow C \rightarrow C \rightarrow B \\ (3)\ B \rightarrow C \rightarrow C \rightarrow C$
(1) 和 (2) 中前两个时刻序列取值是重复的，概率计算时，会重复计算；(2) 和 (3) 中前三个也是重复的，并且，对于前三个序列取值，只需在 (1) 中前两步 $B\rightarrow C$ 的基础上，再增加 C 取值即可，而不必从头计算。对于所有的 $N^T$ 个序列，类似重复计算的数量也是巨大的。

改进方法就是使用动态规划（DP）算法思想，即，将重复计算的值储存起来，下次使用时直接取值即可，而不重复计算。具体实现算法就是，前向算法。该算法是逐层计算，向后递推。

先定义根据时刻储存的、避免重复计算、可以递推的概率值：前向概率

具体为，对于给定模型，到某一时刻 t 部分观测序列为 $o_1, o_2,\cdots,o_t$ ，且状态为 $q_i$ 的概率为前向概率 $\alpha_t(i)$ ，即
$P(o_1,o_2,\cdots,o_t,i_t=q_i) = \alpha_t(i)$
具体实现为：

求解第一层 (t=1)
$\alpha_1(i) = \pi_ib_i(o_1),\ \ \ \ i=1,2,\cdots,N$
向后逐层递推 $(t\rightarrow t+1)$
$\alpha_{t+1}(i) = [\sum\limits_{j=1}^N \alpha_t(j)\alpha_{ji}]\ b_i(o_{t+1}), \ \ \ \ i=1,2,\cdots,N$
直到最后一层，得到最终结果

$P(O|\lambda) = \sum\limits_{i=1}^N \alpha_T(i)$

以三硬币模型为例：（假设最终观测结果为 $o_1,o_2,o_3,o_4$ ）

算法过程如下：

计算第一层
$\alpha_1(B) = \pi_B b_B(o_1) \\ \alpha_1(C) = \pi_C b_C(o_1)$

向后递推（以递推到第二层为例）

$\alpha_2(B) = \alpha_1(B)a_{BB}b_B(O_2) + \alpha_1(C)a_{CB}b_B(o_2) = [\sum\limits_{j\in {B,C}} \alpha_1(j)a_{jB}]\ b_B(o_2) \\ \alpha_2(C) = \alpha_1(B)a_{BC}b_C(O_2) + \alpha_1(C)a_{CC}b_C(o_2) = [\sum\limits_{j\in {B,C}} \alpha_1(j)a_{jC}]\ b_B(o_2)$

其中， $\alpha_2(B)$ 储存了到第二层 B 状态的概率， $\alpha_2(C)$ 储存了到达第二层 C 状态的概率，即包含了第二层所有情况，后续递推类似。

直到递推到最后一层，即可得到最终结果

该算法在两层递推时，计算量为 $N\times N = N^2$ 次（对应于上面图示的两层间的 2x2=4 个箭头指向），一共有 T 层，因此计算量表示为 $O(TN^2)$ ，相比较直接计算法，在一般 T 很大的情况下，少了很多计算量。

说明：AdaBoost 算法中也应用到了类似的思想。

4.1.3 后向算法

前向算法是从前向后递推，而后向算法是依据相同的思想，从后向前递推，步骤也很类似。

具体为，在时刻 t 状态为 $q_i$ 的条件下，从 $t + 1$ 到 T 的部分观测序列为 $o_{t+1},o_{t+2},\cdots,o_{T}$ 的概率为后向概率 $\beta_t(i)$
$\beta_t(i) = P(o_{t+1},o_{t+2},\cdots,o_T | i_t = q_i)$
实现为：

求解最后一层 (t=T)，
$\beta_T(i) = 1,\ \ \ \ i=1,2,\cdots,N$
向前逐层递推
$\beta_t(i) = \sum\limits_{j=1}^N\alpha_{ij}b_j(o_{t+1})\beta_{t+1}(j),\ \ \ \ i=1,2,\cdots,N$
直到第一层，乘上初始序列取值的概率
$P(O|\lambda) = \sum\limits_{i=1}^N \pi_i b_i(o_1)\beta_1(i)$

同样以三硬币模型为例：（假设最终观测结果为 $o_1,o_2,o_3,o_4$ ）

算法过程如下：

最后一层（t=4）
$\beta_4(B) = 1\\ \beta_4(C) = 1$
该层没有实际意义，下面递推两层为例。

向前递推（递推到倒数第二层）

$\beta_3(B) = a_{BB}b_B(o_4) + a_{BC}b_C(o_4) \\ \beta_3(C) = a_{CB}b_B(o_4) + a_{CC}b_C(o_4)$

（递推到倒数第三层）
$\beta_2(B) = a_{BB}b_B(o_3)\beta_3(B) + a_{BC}b_C(o_3)\beta_3(C) \\ \beta_2(C) = a_{CB}b_B(o_3)\beta_3(B) + a_{CC}b_C(o_3)\beta_3(C)$
其中， $\beta_3(B)$ 储存了第三层到第四层的 $B\rightarrow B$ 和 $B\rightarrow C$ 过程， $\beta_3(C)$ 储存了三四层的 $C\rightarrow B$ 和 $C\rightarrow C$ 过程，也即最后两层间的四个箭头。

$\beta_2(B)$ 和 $\beta_2(C)$ 同理，储存了从第二层到第四层的所有过程，而这一计算需要第三层到第四层的过程结果，也即上述结果。

$\beta_1(B)$ 和 $\beta_1(C)$ ，储存了从第一层到第四层的所有过程，除去初始观察值的选择概率 $\pi_Bb_B(o_1)$ 和 $\pi_Cb_C(o_1)$ 。

最终结果，即在 $\beta_1(B)$ 和 $\beta_1(C)$ 基础上乘以初始概率
$\pi_Bb_B(o_1)\beta_1(B) + \pi_Cb_C(o_1)$

前向与后向算法实际上是等价的。

4.2 模型参数估计

使用极大似然估计含有隐变量的HMM模型参数

4.2.1 Baum-Welch 算法

该算法本质上就是 EM 算法，确切地说，是EM算法在HMM模型上的具体应用。关于EM算法，具体可参考 EM 算法

算法过程：

初始化隐马尔可夫模型 $\lambda^{(0)}$ 的参数 $a_{ij}^{(0)}, b_j(k)^{(0)},\pi_i^{(0)}$
EM算法递推参数变化
$\pi_i^{(n+1)} = \frac{P(O,i_1=i)}{P(O)} \\ a_{ij}^{(n+1)} = \frac{\sum\limits_{t=1}^{T-1}P(O,i_t=i,i_{t+1}=j)}{\sum\limits_{t=1}^{T-1}P(O,i_t=i)} \\ b_j(k) = \frac{\sum\limits_{t=1,o_t=v_k}^T P(O,i_t=j)}{\sum\limits_{t=1}^TP(O,i_t=j)}$
迭代终止后，得到最终模型
$\lambda^{(n+1)} = (A^{(n+1)},B^{(n+1)},\pi^{(n+1)})$

4.3 状态序列预测

已知参数的模型 $\lambda=(A,B,\pi)$ 和观测序列 $O=(o_1,o_2,\cdots,o_T)$ ，求解出与之对应的隐藏层最可能的状态序列 $I=(i_1,i_2,\cdots,i_T)$

4.3.1近似算法

就是找每个时刻下状态取值中概率最大的那个，T个时刻组合起来就是结果。

根据前后向 $\alpha_t(i)，\beta_t(i)$ 定义，可以知道
$\alpha_t(i)\beta_t(i) = P(i_t=q_i,O)$
同样值得说明的是，之所以使用前后向概率来计算，是因为可以减少计算量。

全概率
$\sum\limits_{i=1}^N P(i_t=q_i,O) = \sum\limits_{i=1}^N\alpha_t(i)\beta_t(i)$
则在给定模型 $\lambda$ 和观测 O 的情况下，在时刻 t 处于状态 $q_i$ 的概率为 $\gamma_t(i)$
$\gamma_t(i) = P(i_t=q_i|O) = \frac{P(i_t=q_i,O)}{P(O)} = \frac{\alpha_t(i)\beta_t(i)}{\sum\limits_{i=1}^N\alpha_t(i)\beta_t(i)} \tag{4.3.1}$
根据上式计算出每个时刻对应 $q_i$ （N个）的 $\gamma_t(i)$ ，取最大值，作为该时刻最可能的状态
$i_t^* = \mathop{arg max}\limits_{i=1,2,\cdots,N}[\gamma_t(i)]$
最终得到状态序列
$I^* = (i_1^*,i_2^*,\cdots,i_T^*)$
该种做法局部割裂性的做法，还是由于HMM模型的时序性，确切说是转移矩阵（概率）的存在，使得该种结果并非一定是全局最优。

4.3.2 维特比算法

基于近似方法的缺点，去全面地考虑数据。最直接的方法是，穷举出所有可能序列，求出相应概率，概率最大的那个便是结果。但，这种做法同样存在计算量巨大的缺点，想法直接，却不可行。

类似地，依旧可以通过动态规划的思想来简化求解。其实该问题这就是动态规划常常用来解决的最优路径问题。在HMM模型中，使用DP求解该问题的方法叫维特比算法。

可行性

对于最优路径来说，从 t=1 到 t=T ，需要确保每条子路径拿出来在该时间区间段，都是最优的。因此只需要从 t=1 开始递推计算路径概率值，根据概率值最大的选择节点，这些节点就是最终最优路径所经过的节点值。

注意点

直观上，在计算每层所有节点概率值后，直接取最大概率，从而确定该层节点。但实际上，并不是，由于转换概率的存在，在计算第 t 层所有节点概率值后，并不能确定本层该选取哪个节点，只能通过该层概率计算值确定上一层要选择的节点。因为，该层的转移概率还没有计算。

比较有趣的同直观想象不同的一点。

为了便于表达，该算法引入了两个变量，

t 时刻状态为 i 的所有单个路径中概率最大值记为 $\delta_t(i)$ ，即
$\delta_t(i) = \mathop{max}\limits_{i_1,i_2,\cdots,i_{t-1}} P(i_t=i,i_{t-1},\cdots,i_1,o_{t+1},\cdots,o_1), \ \ \ i=1,2,\cdots,N$
t 时刻状态为 i 的所有单个路径中概率最大的路径的第 t-1 个节点记为 $\phi_t(i)$ ，且
$\phi_t(i) = \mathop{arg max}_{1\leq j\leq N} [\delta_{t-1}(j)a_{ji}], \ \ \ \ i=1,2,\cdots,N$
算法过程为：

初始化（第一层）
$\delta_1(i) = \pi_i b_i(o_1),\ \ \ \ i=1,2,\cdots,N \\ \phi_1(i) = 0$
递推计算 $\delta_t(i),\phi_t(i)$
$\delta_t(i) = \mathop{max}_{1\leq j\leq N} [\delta_{t-1}(j)a_{ji}] b_i(o_t), \ \ \ \ i=1,2,\cdots,N\\ \phi_t(i) = \mathop{arg max}_{1\leq j\leq N} [\delta_{t-1}(j)a_{ji}], \ \ \ \ i=1,2,\cdots,N$
选择每个时刻下概率最大对应的前一个节点作为最终最优路径的节点：递推终止和回溯确定路径 $I^*$

以上述三硬币模型为例，给定所有参数和观测序列，利用维特比算法求出最优路径。其中

初始状态概率向量为
$\pi = (0.5, 0.5)^T$

转换概率矩阵为
$\left[ \begin{matrix} 0.9 & 0.1 \\ 0.3 & 0.7 \end{matrix} \right]$
观测概率矩阵为
$\left[ \begin{matrix} 0.4 & 0.6 \\ 0.8 & 0.2 \end{matrix} \right]$
观测序列为
$O = (1, 1, 1, 0)$
求解过程如下：

t=1
$\delta_1(B) = \pi_Bb_B(o_1) = 0.5\times 0.6 = 0.3 \\ \delta_1(C) = \pi_Cb_C(o_1) = 0.5\times 0.8 = 0.4 \\$
t=2
$\delta_2(B) = max\{\delta_1(B)a_{BB},\delta_1(C)a_{CB}\}\ b_B(o_2) = max\{0.3\times0.9,0.4\times 0.3 \}\times 0.4 = 0.108 \\ \delta_2(C) = max\{\delta_1(B)a_{BC},\delta_1(C)a_{CC}\}\ b_C(o_2) = max\{0.3\times0.1,0.4\times 0.7 \}\times 0.8 = 0.224$
最大值计算路径为 $\delta_1(B)a_{BC}b_C(o_2)=0.224$ ，即 $B\rightarrow C$ ，确定第一个节点为 B

t=3
$\delta_3(B) = max\{\delta_2(B)a_{BB},\delta_2(C)a_{CB}\}\ b_B(o_3) = max\{0.108\times0.9,0.224\times 0.3 \}\times 0.4 = 0.03888 \\ \delta_3(C) = max\{\delta_2(B)a_{BC},\delta_2(C)a_{CC}\}\ b_C(o_3) = max\{0.108\times0.1,0.224\times 0.7 \}\times 0.8 = 0.12544$
最大计算路径为 $\delta_2(C)a_{CC}b_C(o_2) = 0.12544$ ，即 $B\rightarrow C \rightarrow C$ ，确定第二个节点为 C

t=4
$\delta_4(B) = max\{\delta_3(B)a_{BB},\delta_3(C)a_{CB}\}\ b_B(o_4) = max\{0.03888\times0.9,0.12544\times 0.3 \}\times 0.6 = 0.0225792 \\ \delta_4(C) = max\{\delta_3(B)a_{BC},\delta_3(C)a_{CC}\}\ b_C(o_4) = max\{0.03888\times0.1,0.12544\times 0.7 \}\times 0.2 =0.0175616$
最大计算路径为 $\delta_3(C)a_{CB}b_B(o_4) = 0.0225792$ ，即 $B\rightarrow C \rightarrow C \rightarrow B$ ，确定第三、四个节点C、B

因此最终最可能状态序列为 $I = (B, C, C, B)$

5. 代码实现

每个算法的实现都不算太难，实现关键在于一些公式的递推计算。

挖坑，有时间再填

博客字数和用时又创新高，完结撒花

你可能感兴趣的:(Machine,Learning,算法,机器学习,隐马尔可夫模型,hmm,em)

【AI论文】EmbRACE-3K: 复杂环境中的具身推理与行为研究
摘要：近期先进的视觉语言模型（Vision-LanguageModels，VLMs）在被动、离线的图像和视频理解任务中展现出了卓越的性能。然而，在具身场景中，这些模型的有效性仍较为有限。具身场景要求在线交互和主动的场景理解，在此类场景中，智能体以第一人称视角感知环境，且每一次动作都会动态地影响后续的观察结果。即便是像GPT-4o、Claude3.5Sonnet和Gemini2.5Pro这样的先进模
大数据技术是解决什么问题的？ @佳瑞大数据
基础知识1TB（太字节）=1024GB1PB（拍字节）=1024TB大数据核心框架HadoopHadoop作为大数据技术生态的核心框架，主要解决了海量数据（TB/PB级）的存储、处理和分析难题，尤其是在传统数据库（如MySQL）和单机计算无法应对的场景下，提供了低成本、高可靠、可扩展的解决方案。其核心解决的问题可归纳为以下几点：海量数据的存储问题传统痛点：单机存储容量有限（如单服务器硬盘通常在TB
IMO怒斥OpenAI自封夺金，网友：炒作无下限计算机科研圈资讯人工智能
OpenAI高调宣布其新模型在国际数学奥林匹克（IMO）中获得金牌，引发了轩然大波。然而，短短24小时内，剧情急转直下——多位IMO官方人士和学界大佬纷纷发声，直指OpenAI的做法“粗鲁且不恰当”。这不仅是一场关于AI能力的辩论，更牵扯出学术道德、商业炒作与人类选手尊严的深层次问题。让我们从多方视角，还原这场争议的真相。一、OpenAI的急不可耐，激怒了IMO官方7月19日，IMO闭幕式刚刚结束
推荐项目： Few-Shot-Adversarial-Learning-for-face-swap 邱晋力
推荐项目：Few-Shot-Adversarial-Learning-for-face-swap去发现同类优质开源项目:https://gitcode.com/1、项目介绍Few-Shot-Adversarial-Learning-for-face-swap是一个基于PyTorch的开源实现，重演了三星AI实验室的一项前沿研究——“Few-ShotAdversarialLearningofReal
6、LangChain —— 使用 Huggingface 中的开源模型 Miyazaki_Hayao LangChain 实战 langchain
文章目录一、概述二、大语言模型发展史三、预训练+微调的模式四、用HuggingFace跑开源模型五、申请使用Meta的Llama2模型六、通过HuggingFace调用Llama七、LangChain和HuggingFace的接口1、通过HuggingFaceHub2、通过HuggingFacePipeline八、用LangChain调用自定义语言模型一、概述大语言模型，不止ChatGPT一种。
黑猫带你学UFS协议第1篇：全网最全UFS协议中文详讲，这份学习框架图，你值得拥有！！！（持续更新中...）黑猫学长呀黑猫带你学：UFS协议详解网络 ufs 存储芯片嵌入式手机
文/黑猫学长1作者想说笔者本人从事于存储芯片行业多年，对eMMC/UFS/SD等芯片有深入研究，协议尤甚。而今看来，UFS协议在整个存储产品中（包括U盘、SPI、SD卡，NM卡、emmc、SSD、flash颗粒等），属于最难梯队。对于嵌入式存储芯片来说，从最初大家熟悉的SD/TF卡，发展到emmc，再到如今的UFS，速率越来越快，性能越来越稳定。即使是最新的UFS产品，从问世到笔者写这篇文章（20
Hugging Face x LangChain: 全新 LangChain 合作伙伴包
langchain-huggingface与LangChain无缝集成，为在LangChain生态系统中使用HuggingFace模型提供了一种可用且高效的方法。这种伙伴关系不仅仅涉及到技术贡献，还展示了双方对维护和不断改进这一集成的共同承诺。起步langchain-huggingface的起步非常简单。以下是安装该软件包的方法:pipinstalllangchain-huggingface现在，
迈向大型推理模型：基于大型语言模型的强化推理综述（附教程） LLM大模型人工智能自然语言处理知识库本地化部署吴恩达大模型 RAG
语言长期以来被认为是人类推理的基本工具。大型语言模型（LLM）的突破激发了大量研究兴趣，推动了利用这些模型解决复杂推理任务的探索。研究人员通过引入“思维”这一概念——即一系列代表推理过程中的中间步骤的标记——超越了简单的自回归标记生成。这一创新范式使LLMs能够模仿复杂的人类推理过程，如树搜索和反思性思维。近年来，学习推理的趋势逐渐兴起，强化学习（RL）被应用于训练LLMs掌握推理过程。这种方法通
使用Python调用Hugging Face Question Answering (问答)模型墨如夜色 python easyui 开发语言 Python
使用Python调用HuggingFaceQuestionAnswering(问答)模型在自然语言处理领域，问答系统是一种能够回答用户提出的问题的智能系统。HuggingFace是一个知名的开源软件库，提供了许多强大的自然语言处理工具和模型。其中，HuggingFace的QuestionAnswering模型可以帮助我们构建问答系统，使得我们能够从给定的文本中提取答案。本文将介绍如何使用Pytho
濮阳做亲子鉴定的机构一览（附2024年鉴定地址汇总）民鉴基因科普
濮阳可以做亲子鉴定的机构在哪里？濮阳亲子鉴定机构地址在濮阳市华龙区胜利中路。在濮阳做司法亲子鉴定需要携带本人证件办理（身份证、出生证、结婚/离婚证），个人隐私亲子鉴定和无创胎儿亲子鉴定可匿名办理，无需出示证件，支持邮寄样本，正规亲子鉴定机构可保障亲子鉴定结果的准确性以及可行性。濮阳做亲子鉴定的机构一览（附2024年鉴定地址汇总）濮阳正规亲子鉴定机构1、濮阳民鉴基因亲子鉴定中心濮阳亲子鉴定机构地址：
Python爬虫【四十五章】爬虫攻防战：异步并发+AI反爬识别的技术解密程序员_CLUB Python入门到进阶 python 爬虫人工智能
目录引言：当爬虫工程师遇上AI反爬官一、异步并发基础设施层1.1混合调度框架设计1.2智能连接池管理二、机器学习反爬识别层2.1特征工程体系2.2轻量级在线推理三、智能决策系统3.1动态策略引擎3.2实时对抗案例四、性能优化实战4.1全链路压测数据4.2典型故障处理案例五、总结：构建智能化的爬虫生态系统Python爬虫相关文章（推荐）引言：当爬虫工程师遇上AI反爬官在大数据采集领域，我们正经历着技
有机酸：结构解析、生物功能优宁维生物经验分享
有机酸是指分子结构中含有可解离羧基（-COOH）或磺酸基（-SO₃H）等酸性官能团的一类有机化合物。其中羧酸类（R-COOH）作为最典型的有机酸家族，其酸性特征直接源于羧基中羟基氧的质子解离能力。除羧酸外，磺酸（R-SO₃H）、亚磺酸（R-SOOH）、硫醇酸（R-SH）等含硫含氧酸类也属于重要的有机酸衍生物。在有机合成领域，羧酸可通过酯化反应与醇类生成特征性酯类产物。从结构特征分析，羧酸可视为烃基
客流分析核心算法 trajectory_event_analyzer数据结构风吹落叶花飘荡 python 后端算法数据结构网络
客流分析核心算法trajectory_event_analyzerV4.py数据结构文章目录客流分析核心算法trajectory_event_analyzerV4.py数据结构一、算法描述1、描述2、客流分析模块trajectory_event_analyzerV4.py解析1.分层统计：2.状态一致性检查：3.区域状态统计：4、客流状态统计5.ReID集成：6.数据清理机制：二、核心模块解释1、
美剧《模范爱侣》全集完整版无删减免费在线观看-完美夫妻百度云/夸克迅雷网盘小小编007
《模范爱侣》是一部由Netflix出品的犯罪悬疑迷你剧，共六集，以其紧凑的剧情、精湛的演技和深刻的主题吸引了众多观众的目光。该剧改编自艾琳·希尔德布兰德的同名畅销书，由苏珊娜·比尔执导，妮可·基德曼、列维·施瑞博尔、达科塔·范宁等一众实力派演员共同演绎。提示：文章排版原因，观剧资源链接地址放在文章结尾，往下翻就行故事发生在风景如画的楠塔基特岛，围绕着即将嫁入岛上最富有家族之一的阿梅莉亚·萨克斯（由
镁与情绪：为什么它如此关键？净逮着一个嘬经验分享笔记
镁与情绪：为什么它如此关键？1.镁在大脑中的「多面手」角色生理环节镁的作用对情绪的潜在影响神经递质合成作为300+种酶的辅因子，参与色氨酸→5-HT（血清素）的转化血清素充足有助于舒缓焦虑、提升愉悦感NMDA受体调控以“塞栓”形式嵌入NMDA受体通道，防止过度兴奋性谷氨酸刺激减少神经毒性和情绪波动GABA功能支持镁可提高GABA受体亲和力加强“刹车”神经递质，促进放松、改善睡眠HPA轴（压力轴）制
2019-1-19周六奥特曼成长史172 校长333
亲爱的家人们我是来自东营洪恩英语奥特曼奥老师（｡ӧӧ｡）今天是我分享第172天【1】比学习：《可复制的执行力》点燃型，自燃型，阻燃型，我们要做一个自燃型的人，自带气氛，自然兴奋，喜欢竞争，迎接挑战，开创未来，再创佳绩！加油，同样，虽然我愿意普度众生，愿意拯救世界，但是，你不求佛佛怎么拯救你？你如果是阻燃型，你回来了，你在哪里？提升境界提升格局不断学习，才能跟上潮流甚至创造潮流改变时代【2】比改变：
基于 vue＋Cesium 实现军事标绘之钳击箭头绘制实战
效果图在地理信息系统（GIS）开发中，军事标绘是一个重要的应用场景，其中箭头类标绘（如攻击箭头、钳击箭头）是常用的战术符号。本文将基于Cesium引擎，详细讲解如何实现可交互的钳击箭头绘制功能，支持动态跟随鼠标调整、固定部分标绘区域及自动清理临时标记等特性。一、技术背景与实现目标Cesium简介Cesium是一款开源的3D地理信息引擎，支持高精度全球地形、影像加载及矢量数据可视化，广泛应用于数字地
第5章：数据访问层 liangxh2010 微服务后端架构
5.1SpringDataJPA使用文字讲解SpringDataJPA是SpringData项目的一部分，旨在极大地简化JPA（JavaPersistenceAPI）的使用。它通过提供基于Repository接口的编程模型，让我们无需编写任何实现代码就能完成大多数数据访问操作。核心概念：Entity：一个使用@Entity注解的普通Java对象（POJO），它映射到数据库中的一张表。Reposit
Spring Boot 源码解析之 Logging fire-flyer spring boot spring logging java log4j
目录设计总览（SpringBootLogging模块抽象）LoggingSystem加载机制源码分析LoggingApplicationListener启动流程Log4J2LoggingSystem主要源码解析logging.config、log4j2-spring.xml加载逻辑动态日志级别设置（Actuator调用）✅1️⃣设计总览logging初始化流程总览：[SpringBoot启动]|v
小程序领域的营销推广策略小程序开发2020 小程序 ai
小程序领域的营销推广策略：从流量获取到生态运营的全链路解析关键词：小程序营销、用户增长策略、社交裂变、私域流量运营、数据分析驱动、场景化营销、全域流量整合摘要：本文系统解析小程序营销推广的核心策略体系，从微信生态底层逻辑出发，结合用户生命周期管理理论，构建包含「用户拉新-留存转化-裂变增长-数据迭代」的全链路运营框架。通过深度拆解社交裂变模型、场景化运营策略、私域流量沉淀方法及数据驱动决策体系，结
大学专业科普 | 计算智能、信息学与大数据鸭鸭鸭进京赶烤大数据
一、专业背景随着信息技术的飞速发展，数据的产生速度呈爆炸式增长，传统数据处理技术已经无法满足如此庞大的数据量和复杂的数据类型，大数据专业应运而生，旨在培养能够应对大数据挑战的专业人才。二、主要课程内容数学基础课程高等数学、概率论与数理统计、线性代数是大数据分析的核心数学基础，为数据处理、算法优化和模型构建提供必要的理论支持。计算机基础课程数据结构与算法、计算机网络、操作系统是大数据技术的重要支撑，
大学专业科普 | 人工智能、物联网和云计算技术鸭鸭鸭进京赶烤人工智能物联网云计算 5G 信号处理信息与通信网络
一、专业概述人工智能专业是一门融合计算机科学、数学、信息学等多学科知识的交叉学科。它旨在培养学生掌握人工智能领域的基本理论、方法和技能，以应对人工智能在各个领域的应用需求和发展挑战。二、主要课程基础课程：包括高等数学、线性代数、概率论与数理统计、离散数学等数学基础课程，为人工智能算法提供理论支撑；以及数据结构、算法设计与分析、计算机组成原理、操作系统、计算机网络等计算机科学基础课程，帮助学生理解人
《房地产与中国经济》（一） Roy罗恩
房地产一直很火，在我国房地产业属于第三产业，是土地和建筑物流通环节的产业，与属于第二产业的建筑业有紧密联系，但也存在严格界限。对居民而言，住宅是生活中不可或缺的部分，在居民的消费和投资中占较大比重。因此，这本书就有很好的理解和参考价值。《房地产与中国经济》首先，作者认为房地产对国家经济有一定的作用，体现在：房地产业的资金投入大于其形成的资产，而制造业的资金投入低于其实际形成的资产。这在一定程度上可
2024年靠谱的副业有哪些？5个晚上有空闲时间可做的靠谱兼职高省爱氧惠
当下兼职副业已成为了一个热门词汇，越来越多的朋友都试图通过一份可靠的兼职工作来提高自己的生活质量，同时还能够增加自己的工作经验、促进个人的事业发展，确实是一件一举两得的事情。需求多了，供应自然也就大了，目前市面上的兼职副业数不胜数，其中优劣并存。本期文章就来和大家推荐五个比较不错的兼职副业，适合广大普通人进行值得尝试。1：app拉新App拉新是一个低门槛、高回报的兼职工作，随着市面上app软件的大
解读一个大学专业——信号与图像处理
专业定义与核心内容维度内容定义研究如何采集、处理、分析和理解一维信号（语音、雷达、脑电）和二维/三维图像（医学、遥感、工业视觉）。关键词数字信号处理（DSP）、图像处理、计算机视觉、模式识别、压缩感知、深度学习、GPU加速、嵌入式系统。技术栈MATLAB/Python+OpenCV/PyTorch+DSP/FPGA+GPU（CUDA）第五届先进算法与信号、图像处理国际学术会议（AASIP2025）
六盘水的亲子鉴定中心机构地址一览（2024年汇总共12家正规机构）国医基因黄主任
六盘水亲子鉴定中心地址在哪里？六盘水亲子鉴定办理中心地址在六盘水市钟山区钟山西路56号（六盘水国医基因）。六盘水亲子鉴定中心位于六盘水市钟山区钟山西路56号。在六盘水做司法亲子鉴定需要携带本人证件办理（身份证、出生证、结婚/离婚证），个人隐私亲子鉴定和无创胎儿亲子鉴定可匿名办理，无需出示证件，支持邮寄样本，正规亲子鉴定机构可保障亲子鉴定结果的准确性以及可行性。六盘水的亲子鉴定中心机构地址一览（20
vue3实现可视化大屏布局程序猿的杂货店前端VUE3开发笔记可视化大屏 vue3 vue3页面布局
实现功能:1实现4x3宫格布局，2自定义设置跨行，跨列自动隐藏对应列，比如setAreaSpanAndUpdateVisibility(2,3,2);表示设置区域2，跨3行，跨2列，然后区域3，6，7，10，11自动隐藏3内容自动剧中1效果图代码数据可视化大屏-顶部区域{{item.id}}-{{item.title}}测试区域1跨2行2列-->importGridCellfrom"./compo
直接内存溢出 p＆f° JVM jvm
一、什么是直接内存直接捏成是一块由操作系统直接管理的内存，也叫堆外内存可以使用Unsafe或ByteBuffer分配直接内存可用-XX:MaxDirectMemorySize控制，默认是0，表示不限制二、为什么使用直接内存直接内存vs堆内存io效率高推荐参考：Java直接内存与非直接内存性能测试-阿里云开发者社区三、什么场景使用直接内存1有很大的数据需要存储，它的生命周期又很长2适合频繁的IO操作
Pad Token技术原理与实现指南 Takoony AI
目录概述理论基础：第一性原理分析技术实现机制工程最佳实践性能优化策略常见问题与解决方案技术发展趋势附录1.概述1.1文档目的本文档旨在深入阐述深度学习中PadToken的技术原理、实现机制及工程应用，为算法工程师提供全面的理论指导和实践参考。1.2适用范围自然语言处理模型开发序列数据批处理优化深度学习系统架构设计高性能计算资源管理1.3核心问题研究问题:为什么深度学习模型需要将变长序列统一到固定长
深度学习分布式训练：并行策略与通信机制的系统性分析 Takoony 深度学习分布式人工智能
1.引言随着深度学习模型规模的指数级增长，单一计算设备已无法满足训练需求。以GPT-3为例，其1750亿参数在FP16精度下需要约350GB存储空间（每个参数2字节），远超当前主流GPU的显存容量（如NVIDIAA100的80GB）。根据OpenAI的技术报告[1]，即使使用最先进的硬件，单卡训练GPT-3需要355年。这一计算瓶颈催生了分布式训练技术的快速发展。本文将从理论基础出发，系统性地分析
Maven Array_06 eclipse jdk maven
Maven Maven是基于项目对象模型(POM)，信息来管理项目的构建，报告和文档的软件项目管理工具。 Maven 除了以程序构建能力为特色之外，还提供高级项目管理工具。由于 Maven 的缺省构建规则有较高的可重用性，所以常常用两三行 Maven 构建脚本就可以构建简单的项目。由于 Maven 的面向项目的方法，许多 Apache Jakarta 项目发文时使用 Maven，而且公司
ibatis的queyrForList和queryForMap区别 bijian1013 java ibatis
一.说明 iBatis的返回值参数类型也有种：resultMap与resultClass，这两种类型的选择可以用两句话说明之： 1.当结果集列名和类的属性名完全相对应的时候，则可直接用resultClass直接指定查询结果类
LeetCode[位运算] - #191 计算汉明权重 Cwind java 位运算 LeetCode Algorithm 题解
原题链接：#191 Number of 1 Bits 要求：写一个函数，以一个无符号整数为参数，返回其汉明权重。例如，‘11’的二进制表示为'00000000000000000000000000001011', 故函数应当返回3。汉明权重：指一个字符串中非零字符的个数；对于二进制串，即其中‘1’的个数。难度：简单分析：将十进制参数转换为二进制，然后计算其中1的个数即可。 “
浅谈java类与对象 15700786134 java
java是一门面向对象的编程语言，类与对象是其最基本的概念。所谓对象，就是一个个具体的物体，一个人，一台电脑，都是对象。而类，就是对象的一种抽象，是多个对象具有的共性的一种集合，其中包含了属性与方法，就是属于该类的对象所具有的共性。当一个类创建了对象，这个对象就拥有了该类全部的属性，方法。相比于结构化的编程思路，面向对象更适用于人的思维
linux下双网卡同一个IP 被触发 linux
转自： http://q2482696735.blog.163.com/blog/static/250606077201569029441/ 由于需要一台机器有两个网卡，开始时设置在同一个网段的IP，发现数据总是从一个网卡发出，而另一个网卡上没有数据流动。网上找了下，发现相同的问题不少：一、关于双网卡设置同一网段IP然后连接交换机的时候出现的奇怪现象。当时没有怎么思考、以为是生成树
安卓按主页键隐藏程序之后无法再次打开肆无忌惮_ 安卓
遇到一个奇怪的问题，当SplashActivity跳转到MainActivity之后，按主页键，再去打开程序，程序没法再打开（闪一下），结束任务再开也是这样，只能卸载了再重装。而且每次在Log里都打印了这句话"进入主程序"。后来发现是必须跳转之后再finish掉SplashActivity 本来代码： // 销毁这个Activity fin
通过cookie保存并读取用户登录信息实例知了ing JavaScript html
通过cookie的getCookies()方法可获取所有cookie对象的集合；通过getName()方法可以获取指定的名称的cookie；通过getValue()方法获取到cookie对象的值。另外，将一个cookie对象发送到客户端，使用response对象的addCookie()方法。下面通过cookie保存并读取用户登录信息的例子加深一下理解。（1）创建index.jsp文件。在改
JAVA 对象池矮蛋蛋 java ObjectPool
原文地址： http://www.blogjava.net/baoyaer/articles/218460.html Jakarta对象池 ☆为什么使用对象池恰当地使用对象池化技术，可以有效地减少对象生成和初始化时的消耗，提高系统的运行效率。Jakarta Commons Pool组件提供了一整套用于实现对象池化
ArrayList根据条件+for循环批量删除的方法 alleni123 java
场景如下： ArrayList<Obj> list Obj-> createTime, sid. 现在要根据obj的createTime来进行定期清理。（释放内存） ------------------------- 首先想到的方法就是 for(Obj o:list){ if(o.createTime-currentT>xxx){
阿里巴巴“耕地宝”大战各种宝百合不是茶平台战略
“耕地保”平台是阿里巴巴和安徽农民共同推出的一个 “首个互联网定制私人农场”，“耕地宝”由阿里巴巴投入一亿，主要是用来进行农业方面，将农民手中的散地集中起来不仅加大农民集体在土地上面的话语权，还增加了土地的流通与利用率，提高了土地的产量，有利于大规模的产业化的高科技农业的发展，阿里在农业上的探索将会引起新一轮的产业调整，但是集体化之后农民的个体的话语权将更少，国家应出台相应的法律法规保护
Spring注入有继承关系的类（1） bijian1013 java spring
一个类一个类的注入 1.AClass类 package com.bijian.spring.test2; public class AClass { String a; String b; public String getA() { return a; } public void setA(Strin
30岁转型期你能否成为成功人士 bijian1013 成功
很多人由于年轻时走了弯路，到了30岁一事无成，这样的例子大有人在。但同样也有一些人，整个职业生涯都发展得很优秀，到了30岁已经成为职场的精英阶层。由于做猎头的原因，我们接触很多30岁左右的经理人，发现他们在职业发展道路上往往有很多致命的问题。在30岁之前，他们的职业生涯表现很优秀，但从30岁到40岁这一段，很多人
[Velocity三]基于Servlet+Velocity的web应用 bit1129 velocity
什么是VelocityViewServlet 使用org.apache.velocity.tools.view.VelocityViewServlet可以将Velocity集成到基于Servlet的web应用中，以Servlet+Velocity的方式实现web应用 Servlet + Velocity的一般步骤 1.自定义Servlet，实现VelocityViewServl
【Kafka十二】关于Kafka是一个Commit Log Service bit1129 service
Kafka is a distributed, partitioned, replicated commit log service.这里的commit log如何理解？ A message is considered "committed" when all in sync replicas for that partition have applied i
NGINX + LUA实现复杂的控制 ronin47 lua nginx 控制
安装lua_nginx_module 模块 lua_nginx_module 可以一步步的安装，也可以直接用淘宝的OpenResty Centos和debian的安装就简单了。。这里说下freebsd的安装： fetch http://www.lua.org/ftp/lua-5.1.4.tar.gz tar zxvf lua-5.1.4.tar.gz cd lua-5.1.4 ma
java-14.输入一个已经按升序排序过的数组和一个数字，在数组中查找两个数，使得它们的和正好是输入的那个数字 bylijinnan java
public class TwoElementEqualSum { /** * 第 14 题：题目：输入一个已经按升序排序过的数组和一个数字，在数组中查找两个数，使得它们的和正好是输入的那个数字。要求时间复杂度是 O(n) 。如果有多对数字的和等于输入的数字，输出任意一对即可。例如输入数组 1 、 2 、 4 、 7 、 11 、 15 和数字 15 。由于
Netty源码学习-HttpChunkAggregator-HttpRequestEncoder-HttpResponseDecoder bylijinnan java netty
今天看Netty如何实现一个Http Server org.jboss.netty.example.http.file.HttpStaticFileServerPipelineFactory： pipeline.addLast("decoder", new HttpRequestDecoder()); pipeline.addLast(&quo
java敏感词过虑-基于多叉树原理 cngolon 违禁词过虑替换违禁词敏感词过虑多叉树
基于多叉树的敏感词、关键词过滤的工具包，用于java中的敏感词过滤 1、工具包自带敏感词词库，第一次调用时读入词库，故第一次调用时间可能较长，在类加载后普通pc机上html过滤5000字在80毫秒左右，纯文本35毫秒左右。 2、如需自定义词库，将jar包考入WEB-INF工程的lib目录，在WEB-INF/classes目录下建一个 utf-8的words.dict文本文件，
多线程知识 cuishikuan 多线程
T1，T2，T3三个线程工作顺序，按照T1，T2，T3依次进行 public class T1 implements Runnable{ @Override
spring整合activemq dalan_123 java spring jms
整合spring和activemq需要搞清楚如下的东东1、ConnectionFactory分： a、spring管理连接到activemq服务器的管理ConnectionFactory也即是所谓产生到jms服务器的链接 b、真正产生到JMS服务器链接的ConnectionFactory还得
MySQL时间字段究竟使用INT还是DateTime？ dcj3sjt126com mysql
环境：Windows XPPHP Version 5.2.9MySQL Server 5.1 第一步、创建一个表date_test（非定长、int时间） CREATE TABLE `test`.`date_test` (`id` INT NOT NULL AUTO_INCREMENT ,`start_time` INT NOT NULL ,`some_content`
Parcel: unable to marshal value dcj3sjt126com marshal
在两个activity直接传递List<xxInfo>时，出现Parcel: unable to marshal value异常。在MainActivity页面（MainActivity页面向NextActivity页面传递一个List<xxInfo>）： Intent intent = new Intent(this, Next
linux进程的查看上（ps） eksliang linux ps linux ps -l linux ps aux
ps:将某个时间点的进程运行情况选取下来转载请出自出处：http://eksliang.iteye.com/admin/blogs/2119469 http://eksliang.iteye.com ps 这个命令的man page 不是很好查阅，因为很多不同的Unix都使用这儿ps来查阅进程的状态，为了要符合不同版本的需求，所以这个
为什么第三方应用能早于System的app启动 gqdy365 System
Android应用的启动顺序网上有一大堆资料可以查阅了，这里就不细述了，这里不阐述ROM启动还有bootloader，软件启动的大致流程应该是启动kernel -> 运行servicemanager 把一些native的服务用命令启动起来（包括wifi, power, rild, surfaceflinger, mediaserver等等）-> 启动Dalivk中的第一个进程Zygot
App Framework发送JSONP请求(3) hw1287789687 jsonp 跨域请求发送jsonp ajax请求越狱请求
App Framework 中如何发送JSONP请求呢? 使用jsonp,详情请参考:http://json-p.org/ 如何发送Ajax请求呢? (1)登录 /*** * 会员登录 * @param username * @param password */ var user_login=function(username,password){ // aler
发福利，整理了一份关于“资源汇总”的汇总 justjavac 资源
觉得有用的话，可以去github关注：https://github.com/justjavac/awesome-awesomeness-zh_CN 通用 free-programming-books-zh_CN 免费的计算机编程类中文书籍精彩博客集合 hacke2/hacke2.github.io#2 ResumeSample 程序员简历
用 Java 技术创建 RESTful Web 服务 macroli java 编程 Web REST
转载：http://www.ibm.com/developerworks/cn/web/wa-jaxrs/ JAX-RS (JSR-311) 【 Java API for RESTful Web Services 】是一种 Java™ API，可使 Java Restful 服务的开发变得迅速而轻松。这个 API 提供了一种基于注释的模型来描述分布式资源。注释被用来提供资源的位
CentOS6.5-x86_64位下oracle11g的安装详细步骤及注意事项超声波 oracle linux
前言：这两天项目要上线了，由我负责往服务器部署整个项目，因此首先要往服务器安装oracle，服务器本身是CentOS6.5的64位系统，安装的数据库版本是11g，在整个的安装过程中碰到很多的坑，不过最后还是通过各种途径解决并成功装上了。转别写篇博客来记录完整的安装过程以及在整个过程中的注意事项。希望对以后那些刚刚接触的菜鸟们能起到一定的帮助作用。安装过程中可能遇到的问题（注
HttpClient 4.3 设置keeplive 和 timeout 的方法 supben httpclient
ConnectionKeepAliveStrategy kaStrategy = new DefaultConnectionKeepAliveStrategy() { @Override public long getKeepAliveDuration(HttpResponse response, HttpContext context) { long keepAlive
Spring 4.2新特性-@Import注解的升级 wiselyman spring 4
3.1 @Import @Import注解在4.2之前只支持导入配置类在4.2,@Import注解支持导入普通的java类,并将其声明成一个bean 3.2 示例演示java类 package com.wisely.spring4_2.imp; public class DemoService { public void doSomethin