一骑走烟尘

隐马尔可夫模型（HMM）原理

文章目录

概率图模型与隐马尔可夫模型
隐马尔可夫模型原理
- 隐马尔可夫模型定义
- 两个基本假设和三个基本问题
- 概率计算问题:P（O|λ）的计算方法
- - 直接计算方法（概念上可行，计算上不可行）
  - 前向算法
  - 后向算法
  - 一些概率值与期望的计算
- 学习问题:监督学习方法和非监督学习方法（Baum-Welch算法）
- - 监督学习方法
  - 非监督学习方法——Baum-Welch算法
- 预测问题（解码问题）:近似算法和维特比（Viterbi）算法
- - 近似算法
  - 维特比（Viterbi）算法

概率图模型与隐马尔可夫模型

概率图模型是一类用图来表示变量相关关系的模型。可以分为两类:一类是用有向无环图表示变量间的依赖关系，称为有向图模型；另一类是使用无向图表示变量间的相关关系，称为无向图模型。
隐马尔可夫模型（HMM）是一种有向图模型，它是关于时序的概率模型，描述由一个隐藏的马尔可夫链随机生成不可观测的状态随机序列，再由各个状态生成一个观测而产生观测随机序列的过程。隐藏的马尔可夫链随机生成不可观测的状态的序列称为状态序列；每个状态生成一个观测，再由此产生的观测的随机序列，称为观测序列。序列的每一个位置可以看作是一个时刻。

隐马尔可夫模型原理

隐马尔可夫模型定义

隐马尔可夫模型由初始概率分布、状态转移概率分布、观测概率分布确定。设Q是所有可能的状态的集合，V是所有可能的观测的集合，即:
$Q=(q_{1}, q_{2}, \cdots, q_{N}), \quad V=(v_{1}, v_{2}, \cdots, v_{M})$
其中，N是可能的状态数，M是可能的观测数。
I是长度为T的状态序列，O是对应的观测序列，即:
$I=\left(i_{1}, i_{2}, \cdots, i_{T}\right), \quad O=\left(o_{1}, o_{2}, \cdots, o_{T}\right)$
A为状态转移概率矩阵（NXN矩阵）:
$A=\left[a_{i j}\right]$
其中:
$a_{i j}=P\left(i_{t+1}=q_{j} | i_{t}=q_{i}\right), \quad i=1,2, \cdots, N ; j=1,2, \cdots, N$
即在时刻t处于状态qi的条件下在时刻t+1转移到状态qj的概率。
B为观测概率矩阵（NXM矩阵）:
$B=\left[b_{j}(k)\right]$
其中:
$b_{j}(k)=P\left(o_{t}=v_{k} | i_{t}=q_{j}\right), \quad k=1,2, \cdots, M ; j=1,2, \cdots, N$
是在时刻t处于状态qj的条件下生成观测vk的概率。
记π为初始状态概率向量:
$\pi=\left(\pi_{i}\right)$
其中:
$\pi_{i}=P\left(i_{1}=q_{i}\right), \quad i=1,2, \cdots, N$
表示时刻t=1处于状态qi的概率。
因此，HMM模型λ可以用三元符号表示，即：
$\lambda=(A, B, \pi)$
A,B,π称为HMM模型的三要素。
举例:
假设有4个盒子，每个盒子都有红白两种颜色的球，球的数量如下:

盒子        1        2        3        4
红球数      5        3        6        8
白球数      5        7        4        2

按下面的方法抽取球:
开始时，从4个盒子中等概率地抽取一个，再从盒子中随机抽一个球，记录颜色后放回。然后从当前盒子转移到下一个盒子，如果当前为盒子1，下一个盒子一定是2；如果当前为盒子2或3，以概率0.4和0.6转移到左边或右边的盒子；如果当前为盒子4，各以0.5概率停留在盒子4或转移到盒子3。转移后，再从盒子中随机抽一个球，记录颜色后放回。
现在假设我们要连续地抽5次。抽取结果如下:
$O = (红, 红, 白, 白, 红)$
这个例子中有两个随机序列:
盒子序列（状态序列）和球颜色序列（观测序列）。前者是隐藏的，后者是可观测的。
则状态集合Q和观测集合V为:
$\quad V=(红,白)$
状态序列和观测序列长度T=5。
开始时，从4个盒子中等概率地抽取一个，则初始概率分布π为:
$\pi=(0.25,0.25,0.25,0.25)^{\mathrm{T}}$
状态转移概率分布A为（由盒子转移规则得出）:
$A=\left[\begin{array}{cccc}{0} & {1} & {0} & {0} \\\\ {0.4} & {0} & {0.6} & {0} \\\\ {0} & {0.4} & {0} & {0.6} \\\\ {0} & {0} & {0.5} & {0.5}\end{array}\right]$
观测概率分布B为（由每个盒子红白球比例计算得出）:
$B=\left[\begin{array}{ll}{0.5} & {0.5} \\\\ {0.3} & {0.7} \\\\ {0.6} & {0.4} \\\\ {0.8} & {0.2}\end{array}\right]$

两个基本假设和三个基本问题

隐马尔可夫模型做了两个基本假设:

齐次马尔可夫性假设，即假设隐藏的马尔可夫链在任意时刻t的状态只依赖于其前一时刻的状态，与其他时刻的状态及观测无关，也与时刻t无关，即:
$P\left(i_{t} | i_{t-1}, o_{t-1}, \cdots, i_{1}, o_{1}\right)=P\left(i_{t} | i_{t-1}\right), \quad t=1,2, \cdots, T$
观测独立性假设，即假设任意时刻的观测只依赖于该时刻的马尔可夫链的状态，与其他的观测和状态无关，即:
$P\left(o_{t} | i_{T}, o_{T}, i_{T-1}, o_{T-1}, \cdots, i_{t+1}, o_{t+1}, i_{t-1}, i_{t-1}, \cdots, i_{1}, o_{1}\right)=P\left(o_{t} | i_{t}\right)$

隐马尔可夫模型有3个基本问题:

概率计算问题。给定模型λ和观测序列O，计算在模型λ下观测序列O出现的慨率P（O|λ）。
学习问题。已知观测序列O，估计模型λ的参数，使得在该模型下观测序列概率P（O|λ）最大。即用极大似然估计的方法估计参数。
预测问题，也称为解码问题。已知模型λ和观测序列O，求对给定观测序列条件概率P（I|O）最大的状态序列。即给定观测序列，求最有可能的对应的状态序列。

概率计算问题:P（O|λ）的计算方法

给定模型λ和观测序列O，计算在模型λ下，观测序列O出现的概率P（O|λ）。

直接计算方法（概念上可行，计算上不可行）

列举所有可能的长度为T的状态序列I
$I=\left(i_{1}, i_{2}, \cdots, i_{T}\right)$
求各个状态序列I和给定的观测序列O的联合概率P（O,I∣λ），然后对所有可能的状态序列求和，得到P（O|λ）。
对某个状态序列I的概率为:
$\lambda)=\pi_{i_{1}} a_{i_{1} i_{2}} a_{i_{2} i_{3}} \cdots a_{i_{T-1} i_{T}}$
对上面的状态序列I，输入的观测序列O的概率P（O|I,λ）:
$\lambda)=b_{i_{1}}\left(o_{1}\right) b_{i_{2}}\left(o_{2}\right) \cdots b_{i_{T}}\left(o_{T}\right)$
O和I同时出现的l联合概率为:
$\lambda)=P(O | I, \lambda) P(I | \lambda)=\pi_{i_{1}} b_{i_{1}}\left(o_{1}\right) a_{i_{1} i_{2}} b_{i_{2}}\left(o_{2}\right) \cdots a_{i_{i-1} i_{\tau}} b_{i_{\tau}}\left(o_{T}\right)$
然后，对所有可能的状态序列I求和，得到观测序列O的概率P（O|λ）:
$\lambda)=\sum_{I} P(O | I, \lambda) P(I | \lambda)= \sum_{i_{1}, i_{2}, \cdots, i_{T}} \pi_{i_{1}} b_{i_{1}}\left(o_{1}\right) a_{i_{1} i_{2}} b_{i_{2}}\left(o_{2}\right) \cdots a_{i_{i-1} i_{\tau}} b_{i_{\tau}}\left(o_{T}\right)$
通过这种计算方式的计算量非常大，其复杂度为:
$O\left(T N^{T}\right)$
实际是不可行的。在真实情况下，一般采用更有效的算法，即前向-后向算法。

前向算法

给定隐马尔可夫模型λ和观测序列O，定义到时刻t部分观测序列为:
$o_{1}, o_{2}, \cdots, o_{t}$
且状态为qi的概率为前向概率，记作:
$\alpha_{t}(i)=P\left(o_{1}, o_{2}, \cdots, o_{t}, i_{t}=q_{i} | \lambda\right)$
下面要计算观测序列概率P（O∣λ）。
计算初值:
$\alpha_{1}(i)=\pi_{i} b_{i}\left(o_{1}\right), \qquad i=1,2, \cdots, N$
递推，对t=1,2,⋯,T−1，有
$\alpha_{t+1}(i)=\left[\sum_{j=1}^{N} \alpha_{t}(j) a_{j i}\right] b_{i}\left(o_{t+1}\right), \quad i=1,2, \cdots, N$
终止:
$\lambda)=\sum_{i=1}^{N} \alpha_{T}(i)$
该算法时间复杂度为:
$O\left(N^{2} T\right)$
比直接计算法小很多。
计算实例:
现在有盒子和球模型λ=（A,B,π），状态集合Q=（1,2,3），观测集合V=（红，白）。
状态转移概率分布A、观测概率分布B、初始概率分布π为:
$A=\left[\begin{array}{lll}{0.5} & {0.2} & {0.3} \\\\ {0.3} & {0.5} & {0.2} \\\\ {0.2} & {0.3} & {0.5}\end{array}\right]$
$B=\left[\begin{array}{ll}{0.5} & {0.5} \\\\ {0.4} & {0.6} \\\\ {0.7} & {0.3}\end{array}\right]$
$\pi=(0.2,0.4,0.4)^{\mathrm{T}}$
设T=3, O=（红,白,红），试用前向算法计算P（O|λ）。
计算初值:
$\alpha_{1}(1)=\pi_{1} b_{1}\left(o_{1}\right)=0.10 \\\\ \alpha_{1}(2)=\pi_{2} b_{2}\left(o_{1}\right)=0.16 \\\\ \alpha_{1}(3)=\pi_{3} b_{3}\left(o_{1}\right)=0.28$
递推计算:
$\alpha_{2}(1)=\left[\sum_{i=1}^{3} \alpha_{1}(i) a_{i 1}\right] b_{1}\left(o_{2}\right)=0.154 \times 0.5=0.077 \\\\ \alpha_{2}(2)=\left[\sum_{i=1}^{3} \alpha_{1}(i) a_{i 2}\right] b_{2}\left(o_{2}\right)=0.184 \times 0.6=0.1104 \\\\ \alpha_{2}(3)=\left[\sum_{i=1}^{3} \alpha_{1}(i) a_{13}\right] b_{3}\left(o_{2}\right)=0.202 \times 0.3=0.0606$
$\alpha_{3}(1)=\left[\sum_{i=1}^{3} \alpha_{2}(i) a_{i 1}\right] b_{1}\left(o_{3}\right)=0.04187 \\\\ \alpha_{3}(2)=\left[\sum_{i=1}^{3} \alpha_{2}(i) a_{i 2}\right] b_{2}\left(o_{3}\right)=0.03551 \\\\ \alpha_{3}(3)=\left[\sum_{i=1}^{3} \alpha_{2}(i) a_{i 3}\right] b_{3}\left(o_{3}\right)=0.05284$
终止:
$\lambda)=\sum_{i=1}^{3} \alpha_{3}(i)=0.13022$

后向算法

给定隐马尔可夫模型λ和观测序列O，定义在时刻t状态为qi的条件下，从t+1到T的部分观测序列为:
$o_{t+1}, o_{t+2}, \cdots, o_{T}$
的概率为后向概率，记作:
$\beta_{t}(i)=P\left(o_{t+1}, o_{t+2}, \cdots, o_{T} | i_{t}=q_{i}, \lambda\right)$
下面要计算观测序列概率P（O∣λ）。
初值:
$\beta_{T}(i)=1, \quad i=1,2, \cdots, N$
递推，对t=1, 2,…,T-1，有:
$\beta_{t}(i)=\sum_{j=1}^{N} a_{i j} b_{j}\left(o_{t+1}\right) \beta_{t+1}(j), \quad i=1,2, \cdots, N$
终止:
$\lambda)=\sum_{i=1}^{N} \pi_{i} b_{i}\left(o_{1}\right) \beta_{1}(i)$
利用前向概率和后向概率的定义可以将观测序列概率P（O∣λ）统一写成:
$\lambda)=\sum_{i=1}^{N} \sum_{j=1}^{N} \alpha_{t}(i) a_{i j} b_{j}\left(o_{t+1}\right) \beta_{t+1}(j), \quad t=1,2, \cdots, T-1$
此式当t=1和t=T-1时分别为前向算法和后向算法的终止公式。

一些概率值与期望的计算

利用前向概率和后向慨率，可以得到关于单个状态和两个状态概率的计算公式。

给定模型λ和观测O，在时刻t处于状态qi的概率，记为
$\gamma_{t}(i)=P\left(i_{t}=q_{i} | O, \lambda\right)$
可以通过前向后向概率计算。即:
$\gamma_{t}(i)=P\left(i_{t}=q_{i} | O, \lambda\right)=\frac{P\left(i_{t}=q_{i}, O | \lambda\right)}{P(O | \lambda)}$
由前向概率αt（i）和后向概率βt（i）定义可知:
$\alpha_{t}(i) \beta_{t}(i)=P\left(i_{t}=q_{i}, O | \lambda\right)$
故有:
$\gamma_{t}(i)=\frac{\alpha_{t}(i) \beta_{t}(i)}{P(O | \lambda)}=\frac{\alpha_{t}(i) \beta_{t}(i)}{\sum_{j=1}^{N} \alpha_{t}(j) \beta_{t}(j)}$
给定模型A和观测序列O，在时刻t处于状态qi且在时刻t+1处于状态qj的概率，记为
$\xi_{t}(i, j)=P\left(i_{t}=q_{i}, i_{t+1}=q_{j} | O, \lambda\right)$
可以通过前向后向概率计算:
$\xi_{i}(i, j)=\frac{P\left(i_{t}=q_{i}, i_{t+1}=q_{j}, O | \lambda\right)}{P(O | \lambda)}=\frac{P\left(i_{t}=q_{i}, i_{t+1}=q_{j}, O | \lambda\right)}{\sum_{i=1}^{N} \sum_{j=1}^{N} P\left(i_{t}=q_{i}, i_{t+1}=q_{j}, O | \lambda\right)}$
又
$P\left(i_{t}=q_{i}, i_{t+1}=q_{j}, O | \lambda\right)=\alpha_{t}(i) a_{i j} b_{j}\left(o_{t+1}\right) \beta_{t+1}(j)$
于是化简得
$\xi_{t}(i, j)=\frac{\alpha_{t}(i) a_{i j} b_{j}\left(o_{t+1}\right) \beta_{t+1}(j)}{\sum_{i=1}^{N} \sum_{j=1}^{N} \alpha_{t}(i) a_{i j} b_{j}\left(o_{t+1}\right) \beta_{t+1}(j)}$
将γt（i）和ξt（i,j）对各个时刻t求和，可以得到一些有用的期望值:
在观测O下状态i出现的期望值:
$\sum_{t=1}^{T} \gamma_{t}(i)$
在观刻O下由状态i转移的期望值:
$\sum_{t=1}^{T-1} \gamma_{t}(i)$
在观测O下由状态i转移到状态j的期望值:
$\sum_{i=1}^{T-1} \xi_{t}(i, j)$

学习问题:监督学习方法和非监督学习方法（Baum-Welch算法）

已知观测序列O，估计模型λ的参数，使得在该模型下观测序列概率P（O|λ）最大。即用极大似然估计的方法估计参数。

监督学习方法

假设已给训练数据集包含S个长度相同的观测序列和对应的状态序列
$(\left(O_{1}, I_{1}\right),\left(O_{2}, I_{2}\right), \cdots,\left(O_{S}, I_{S}\right))$
下面利用极大似然估计法来估计隐马尔可夫模型的参数。

转移概率aij的估计:
设样本中时刻t处于状态i时刻t+1转移到状态j的频数为Aij，那么状态转移概率aij的估计是
$\hat a_{i j}=\frac{A_{j j}}{\sum_{j=1}^{N} A_{i j}}, \quad i=1,2, \cdots, N ; j=1,2, \cdots, N$
观测概率bj（k）的估计:
设样本中状态为j并观测为k的频数是Bjk，那么状态为j观测为k的概率bj（k）的估计是:
$\hat b_{j}(k)=\frac{B_{j k}}{\sum_{k=1}^{M} B_{j k}}, \quad j=1,2, \cdots, N_{i} \quad k=1,2, \cdots, M$
初始状态概率π的估计πi为S个样本中初始状态为qi的频率。

由于监督学习需要使用训练数据，而人工标注训练数据往往代价很高，有时就会利用非监督学习的方法。

非监督学习方法——Baum-Welch算法

由于监督学习需要大量的标注数据，需要耗费很多的人力物力，因此，有时会采用非监督学习方法来进行参数估计。假设给定训练数据集只包含S个长度为T的观测序列而没有对应的状态序列
$(O_{1}, O_{2}, \cdots, O_{s})$
我们的目标是学习隐马尔可夫模型λ=（A,B,π）的参数。我们将观测序列数据看作观测数据O，状态序列数据看作不可观测的隐数据I，那么隐马尔可夫模型实际上是一个含有隐变量的概率模型:
$\lambda)=\sum_{I} P(O | I, \lambda) P(I | \lambda)$
它的参数学习可以由EM算法实现。

确定完全数据的对数似然函数:
所有观测数据写成:
$O=\left(o_{1}, o_{2}, \cdots, o_{T}\right)$
所有隐数据写成:
$I=\left(i_{1}, i_{2}, \cdots, i_{T}\right)$
完全数据是:
$I)=\left(o_{1}, o_{2}, \cdots, o_{T}, i_{1}, i_{2}, \cdots, i_{T}\right)$
完全数据的对数似然函数是:
$\log P(O, I | \lambda)$
EM算法的E步:求Q函数
$Q(\lambda, \overline{\lambda})=\sum_{I} \log P(O, I | \lambda) P(O, I | \overline{\lambda})$
左边等式中第一个λ是要极大化的隐马尔可夫模型参数，第二个λ是隐马尔可夫模型参数的当前估计值。
$\lambda)=\pi_{i_{1}} b_{i_{1}}\left(o_{1}\right) a_{i_{1} i_{2}} b_{i_{2}}\left(o_{2}\right) \cdots a_{i_{1-1} i_{T}} b_{i_{T}}\left(o_{T}\right)$
于是函数Q可以写成:
$Q(\lambda, \overline{\lambda})=\sum_{I} \log \pi_{i1} P(O, I | \overline{\lambda}) \\\\ +\sum_{I}\left(\sum_{t=1}^{T-1} \log a_{i, t+1}\right) P(O, I | \overline{\lambda})+\sum_{I}\left(\sum_{t=1}^{T} \log b_{i_{i}}\left(o_{t}\right)\right) P(O, I | \overline{\lambda})$
式中求和都是对所有训练数据的序列总长度T进行的。
EM 算法的M步:极大化Q函数，求模型参数A、B、π。
由于要极大化的参数在上式中单独地出现在3个项中，所以只需对各项分别极大化。
第一项可写为:
$\sum_{I} \log \pi_{i_{0}} P(O, I | \overline{\lambda})=\sum_{i=1}^{N} \log \pi_{i} P\left(O, i_{1}=i | \overline{\lambda}\right)$
πi满足约束条件:
$\sum_{i=1}^{N} \pi_{i}=1$
利用拉格朗日乘子法，写出拉格朗日函数:
$\sum_{i=1}^{N} \log \pi_{i} P\left(O, i_{1}=i | \overline{\lambda}\right)+\gamma\left(\sum_{i=1}^{N} \pi_{i}-1\right)$
对其求偏导数并令结果为0:
$\frac{\partial}{\partial \pi_{i}}\left[\sum_{i=1}^{N} \log \pi_{i} P\left(O, i_{1}=i | \overline{\lambda}\right)+\gamma\left(\sum_{i=1}^{N} \pi_{i}-1\right)\right]=0$
得:
$P\left(O, i_{1}=i | \overline{\lambda}\right)+\gamma \pi_{i}=0$
对i求和得到γ:
$\gamma=-P(O | \overline{\lambda})$
代回偏导数为0的式子中，得
$\pi_{i}=\frac{P\left(O, i_{1}=i | \overline{\lambda}\right)}{P(O | \overline{\lambda})}$
第二项可写为:
$\sum_{I}\left(\sum_{t=1}^{T-1} \log a_{i_{t}i_{t+1}}\right) P(O, I | \overline{\lambda})=\sum_{i=1}^{N} \sum_{j=1}^{N} \sum_{t=1}^{T-1} \log a_{i j} P\left(O, i_{t}=i, i_{t+1}=j | \overline{\lambda}\right)$
类似第一项，应用具有约束条件
$\sum_{j=1}^{N} a_{i j}=1$
的拉格朗日乘了法可以求出
$a_{i j}=\frac{\sum_{i=1}^{T-1} P\left(O, i_{t}=i, i_{t+1}=j | \overline{\lambda}\right)}{\sum_{t=1}^{T-1} P\left(O, i_{t}=i | \overline{\lambda}\right)}$
第三项可写为:
$\sum_{I}\left(\sum_{t=1}^{T} \log b_{i_{t}}\left(o_{t}\right)\right) P(O, I | \overline{\lambda})=\sum_{j=1}^{N} \sum_{t=1}^{T} \log b_{j}\left(o_{t}\right) P\left(O, i_{t}=j | \overline{\lambda}\right)$
同样用拉格朗日乘子法，约束条件是
$\sum_{k=1}^{M} b_{j}(k)=1$
注意只有在ot=vk时bj（ot）对bj（k）的偏导数才不为0，以I（ot=vk）表示。求得:
$b_{j}(k)=\frac{\sum_{t=1}^{T} P\left(O, i_{t}=j | \overline{\lambda}\right) I\left(o_{t}=v_{k}\right)}{\sum_{t=1}^{T} P\left(O, i_{t}=j | \overline{\lambda}\right)}$
将上面第三步中三项最终推出的公式中的各概率分别用γt（i），ξt（i,j）表示，则可将相应的公式写成:
$a_{i j}=\frac{\sum_{t=1}^{T-1} \xi_{t}(i, j)}{\sum_{t=1}^{T-1} \gamma_{t}(i)}$
$b_{j}(k)=\frac{\sum_{t=1,o_{t}=v_{k}}^{T} \gamma_{t}(j)}{\sum_{t=1}^{T} \gamma_{t}(j)}$
$\pi_{i}=\gamma_{1}(i)$
上面三式就是Baum-Welch算法。

Baum-Welch算法的流程如下:

初始化，对n=0，选取aij（0），bj（k）（0），πi（0），得到模型
$\lambda^{(0)}=\left(A^{(0)}, B^{(0)}, \pi^{(0)}\right)$
递推。对n=1,2,…，
$a_{i j}^{(n+1)}=\frac{\sum_{t=1}^{T-1} \xi_{t}(i, j)}{\sum_{t=1}^{T-1} \gamma_{t}(i)}$
$b_{j}(k)^{(n+1)}=\frac{\sum_{t=1, o_{t}=v_{k}}^{T} \gamma_{t}(j)}{\sum_{t=1}^{T} \gamma_{t}(j)}$
$\pi_{i}^{(n+1)}=\gamma_{1}(i)$
右端各值按
$O=\left(o_{1}, o_{2}, \cdots, o_{T}\right)$
$\lambda^{(n)}=\left(A^{(n)}, B^{(n)}, \pi^{(n)}\right)$
计算。
终止。得到模型参数:
$\lambda^{(n+1)}=\left(A^{(n+1)}, B^{(n+1)}, \pi^{(n+1)}\right)$

预测问题（解码问题）:近似算法和维特比（Viterbi）算法

已知模型λ和观测序列O，求对给定观测序列条件概率P（I|O）最大的状态序列。即给定观测序列，求最有可能的对应的状态序列。

近似算法

近似算法的思想是，在每个时刻t选择在该时刻最有可能出现的状态it，从而得到一个状态序列
$I^{\ast}=\left(i_{1}^{\ast}, i_{2}^{\ast}, \cdots, i_{T}^{\ast}\right)$
将它作为预测的结果。
给定隐马尔可夫模型λ和观测序列O，在时刻t处于状态qi的概率为：
$\gamma_{t}(i)=\frac{\alpha_{t}(i) \beta_{t}(i)}{P(O | \lambda)}=\frac{\alpha_{t}(i) \beta_{t}(i)}{\sum_{j=1}^{N} \alpha_{t}(j) \beta_{t}(j)}$
在每一时刻t最有可能的状态it*是
$i_{t}^{\ast}=\arg \max_{1 \leqslant i \leqslant N}\left[\gamma_{t}(i)\right], \quad t=1,2, \cdots, T$
从而得到状态序列I。
虽然近似计算思想简单，但是预测的序列可能有实际不发生的部分，即有可能出现转移概率为0的相邻状态，没法保证整体上的状态序列是最有可能的。

维特比（Viterbi）算法

维特比算法则通过动态规划求概率最大的路径（最优路径），这时每一条路径即对应着一个状态序列。维特比算法从时刻t=1开始，递推地计算在时刻t状态为i的各条部分路径的最大概率，直到得到时刻t=T状态为i的各条路径的最大概率，时刻t=T的最大概率记为最优路径的概率P，最优路径的终结点iT也同时得到，之后，从终结点开始，由后向前逐步求得结点
$i_{T-1}^{\ast}, \cdots, i_{1}^{\ast}$
最终得到最优状态序列（最优路径）:
$I^{\ast}=\left(i_{1}^{\ast}, i_{2}^{\ast}, \cdots, i_{T}^{*}\right)$
首先定义两个变量δ和ψ，定义在时刻t状态为i的所有单个路径
$\left(i_{1}, i_{2}, \cdots, i_{t}\right)$
中概率最大值为
$\delta_{t}(i)=\max _{i_{1}, i_{2}, \cdots, t-1} P\left(i_{t}=i, i_{t-1}, \cdots, i_{1}, o_{t}, \cdots, o_{1} | \lambda\right), \quad i=1,2, \cdots, N$
由定义可得δ的递推公式：
$\delta_{t+1}(i)=\max_{i_{1}, i_{2}, \cdots, i_{t}} P\left(i_{t+1}=i, i_{t}, \cdots, i_{1}, o_{t+1}, \cdots, o_{1} | \lambda\right) \\\\ =\max_{1 \leqslant j \leqslant N}\left[\delta_{t}(j) a_{j i}\right] b_{i}\left(o_{t+1}\right), \quad i=1,2, \cdots, N ; t=1,2, \cdots, T-1$
定义在时刻t状态为i的所有单个路径
$\left(i_{1}, i_{2}, \cdots, i_{t-1}, i\right)$
中概率最大的路径的第t−1个结点为:
$\psi_{t}(i)=\arg \max_{1 \leqslant j \leqslant N}\left[\delta_{t-1}(j) a_{j i}\right], \quad i=1,2, \cdots, N$
维特比算法流程如下:

输入模型λ和观测O；
初始化
$\delta_{1}(i)=\pi_{i} b_{i}\left(o_{1}\right), \qquad i=1,2, \cdots, N \\\\ \psi_{1}(i)=0, \qquad i=1,2, \cdots, N$
递推，对t=2,3,···,T
$\delta_{t}(i)=\max_{1 \leq j \leq N}\left[\delta_{t-1}(j) a_{j i}\right] b_{i}\left(o_{t}\right), \quad i=1,2, \cdots, N \\\\ \psi_{t}(i)=\arg \max_{1 \leqslant j \leqslant N}\left[\delta_{t-1}(j) a_{j i}\right], \quad i=1,2, \cdots, N$
终止
$P^{\ast}=\max_{1 \leq i \leqslant N} \delta_{T}(i) \\\\ i_{T}^{\ast}=\arg \max_{1 \leq i \leqslant N}\left[\delta_{T}(i)\right]$
最终路径回溯，对t=T-l，T-2，…，1
$i_{t}^{\ast}=\psi_{t+1}\left(i_{t+1}^{\ast}\right)$
得到最优路径
$I^{\ast}=\left(i_{1}^{\ast}, i_{2}^{\ast}, \cdots, i_{T}^{\ast}\right)$

用比较通俗的语言来解释以下维特比算法的流程:

首先我们根据上面的监督学习方法从原始训练集数据中计算得到隐马尔可夫模型的三个参数：转移矩阵A，发射矩阵B，初始概率π。然后我们输入一个观测序列（观测1，观测2…观测s）。
对观测1:
设状态用字母a表示，a从1取到N。根据下面的计算公式，我们分别计算N个P（观测1，状态a）。

P(观测1，状态a)=P(观测1->状态a)*P(状态a初始概率)=发射矩阵中状态a观测为观测1的概率*初始概率矩阵中初始状态为a的概率

对观测2:
设状态用字母b表示，b从1取到N。根据下面的计算公式，我们分别计算N个P（观测2，状态b）。注意max中有N项，最终取最大值。

P(观测2，状态b)=max{ P(观测1，状态a)*P(状态a->状态b)，a从1取到N，所以中括号里共N项}*P(观测2->状态b)=max{上一步计算出的N个P(观测1，状态a)*每一个状态a对应的状态a转移到状态b的概率}* 发射矩阵中状态b观测为观测2的概率

对观测3…观测s:
设观测序号为s，状态用字母t表示，t从1取到N。m表示观测s的前一个观测可能的状态取值，从1取到N。根据下面的计算公式，对每个观测，我们分别计算N个P（观测s，状态t）。注意max中有N项，最终取最大值。

P(观测s，状态t)=max{ P(观测s-1，状态m)*P(状态m->状态t)，m从1取到N，所以中括号里共N项}*P(观测s->状态t)=max{上一步的N个P(观测s-1，状态m)*每一个状态m对应的状态m转移到状态t的概率}*发射矩阵中状态t观测为观测s的概率

假设s已经是最后一个观测值，从所有概率值中选出最大的那个P（观测s，状态t），则状态t就是我们的观测s的最优状态。由于前面的步骤我们使用了回溯法，在每一步时记录了取得的max值时的P（观测s-1，状态m）的状态m，这样我们就可以通过回溯一步一步从最后一个观测值开始得到每一个观测值的最优状态。最后得到一个和观测序列对应的完整的状态序列。这就是维特比算法。

维特比算法计算举例:
假设已知:
状态集合:健康，发烧；
观测集合:正常、冷、头晕；
初始状态概率矩阵:

健康	发烧
0.6	0.4

转移矩阵:注意转移矩阵的行是上一个状态，列是下一个状态

状态	健康	发烧
健康	0.7	0.3
发烧	0.4	0.6

发射矩阵:

	正常	冷	头晕
健康	0.5	0.4	0.1
发烧	0.1	0.3	0.6

现在知道某个人三天的观测序列为:正常，冷，头晕，求这个人这三天最有可能的状态序列？
对第一个状态：正常

P(第一天正常，第一天健康)=P(正常->健康)*P(健康的初始概率)=0.5*0.6=0.3
P(第一天正常，第一天发烧)=P(正常->发烧)*P(发烧的初始概率)=0.1*0.4=0.04

记录每个概率P取的状态，P(第一天正常，第一天健康)取的是健康；P(第一天正常，第一天发烧)取的是发烧。

对第二个状态:冷

P(第二天冷，第二天健康)=max{ P(第一天正常，第一天健康)*P(健康->健康)，P(第一天正常，第一天发烧)*P(发烧->健康)}* P(观测冷为健康)=max{0.3*0.7,0.04*0.4}*0.4=0.084
P(第二天冷,第二天发烧)= max{ P(第一天正常，第一天健康)*P(健康->发烧)，P(第一天正常，第一天发烧)*P(发烧->发烧)}* P(观测冷为发烧)=max{0.3*0.3,0.04*0.6}*0.3=0.027

记录每个P中max取的上一次的概率，P(第二天冷，第二天健康)取的是P(第一天正常，第一天健康)；P(第二天冷,第二天发烧)取的是P(第一天正常，第一天健康)。

对第三个状态:头晕

P(第三天头晕，第三天健康)= max{ P(第二天冷，第二天健康)*P(健康->健康)，P(第二天冷,第二天发烧)*P(发烧->健康)}* P(观测头晕为健康)=max{0.084*0.7,0.027*0.4}*0.1=0.00588
P(第三天头晕，第三天发烧)= max{ P(第二天冷，第二天健康)*P(健康->发烧)，P(第二天冷,第二天发烧)*P(发烧->发烧)}* P(观测头晕为发烧)=max{0.084*0.3,0.027*0.6}*0.6=0.01512

记录每个P中max取的上一次的概率，P(第三天头晕，第三天健康)取的是P(第二天冷，第二天健康)；P(第三天头晕，第三天发烧)取的是P(第二天冷，第二天健康)。

回溯:
最后一个状态最大概率是P（第三天头晕，第三天发烧）= 0.01512，记录对应状态是发烧。max中取的是P（第二天冷，第二天健康）。即倒数第二个观测取的状态是健康。然后继续回溯，P（第二天冷，第二天健康）max中取的是P（第一天正常，第一天健康），所以第一个观测取的状态也是健康。
所以最终的最优状态序列为:健康、健康、发烧。

第十五章:模板参数推导_《C++ Templates》notes 郭涤生 c/c++c++windows 开发语言
模板参数推导第十五章核心知识点概览多选题设计题测试用例总结第十五章核心知识点概览模板参数推导基础引用折叠与完美转发SFINAE原则C++17类模板参数推导auto和decltype(auto)的推导规则模板参数推导基础知识点：函数模板参数通过调用时的实参类型推导数组/函数类型退化为指针引用类型不触发退化默认参数不参与推导代码示例：#include#includetemplatevoiddeduce
一切皆是映射：实现神经网络的硬件加速技术：GPU、ASIC（专用集成电路）和FPGA（现场可编程门阵列） AI天才研究院 AI大模型企业级应用开发实战 DeepSeek R1 &大数据AI人工智能大模型计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
文章目录一切皆是映射：实现神经网络的硬件加速技术：GPU、ASIC（专用集成电路）和FPGA（现场可编程门阵列）1.背景介绍2.核心概念与联系3.核心算法原理&具体操作步骤3.1算法原理概述3.2算法步骤详解3.2.1GPU加速3.2.2ASIC加速3.2.3FPGA加速3.3算法优缺点GPUASICFPGA3.4算法应用领域4.数学模型和公式&详细讲解&举例说明4.1数学模型构建4.2公式推导过
MSE分类时梯度消失的问题详解和交叉熵损失的梯度推导阿正的梦工坊 Machine Learning Deep Learning 分类人工智能深度学习机器学习
下面是MSE不适合分类任务的解释，包含梯度推导。以及交叉熵的梯度推导。前文请移步笔者的另一篇博客：大模型训练为什么选择交叉熵损失（Cross-EntropyLoss）：均方误差（MSE）和交叉熵损失的深入对比MSE分类时梯度消失的问题详解我们深入探讨MSE（均方误差）的梯度特性，结合公式推导和分析，解释为什么在预测值接近0或1时梯度趋于0，以及这背后的含义。我会尽量保持清晰且严谨，适合高理论水平的
Effective Modern C++ 条款6：auto推导若非己愿，使用显式类型初始化惯用法举个栗子2 Effective Modern C++c++
更多C++学习笔记，关注wx公众号：cpp读书笔记Item6:Usetheexplicitlytypedinitializeridiomwhenautodeducesundesiredtypes在Item5中解释了比起显式指定类型使用auto声明变量有若干技术优势，但是有时当你想向左转auto却向右转。举个例子，假如我有一个函数，参数为Widget，返回一个std::vector，这里的bool表
DPO 核心理论推导：参考策略距离约束下的最优策略 + 损失函数设计 iiiiii11 机器学习人工智能论文阅读笔记语言模型深度学习
Rafailov,Rafael,etal.“Directpreferenceoptimization:Yourlanguagemodelissecretlyarewardmodel.”AdvancesinNeuralInformationProcessingSystems36(2023):53728-53741.本文整理了DPO论文中两个核心结论的推导，包括参考策略距离约束下的最优策略的形式，以及
CCF CSP 历年真题 C语言版满分代码集合 (至2021.9 持续更新中 JY_0329 CCF c语言开发语言 csp ccf 算法
CCFCSP历年真题C语言版满分代码集合（全部原创）2021-9-1数组推导2021-9-2非零段划分2021-4-1灰度直方图2021-4-2领域均值2020-12-1期末预测之安全指数2020-12-2期末预测之最佳阈值2020-9-1称检测点查询2020-9-2风险人群筛查2020-6-1线性分类器2020-6-2稀疏向量2019-12-1报数2019-12-2回收站选址2019-9-1小明
【小白深度教程 1.32】手把手教你从多视角图像进行 3D 重建（SfM 算法）小寒学姐学AI 3d 算法计算机视觉人工智能深度学习 python 三维重建
【小白深度教程1.32】手把手教你从多视角图像进行3D重建（SfM算法）1.SfM三维重建算法简介2.SfM方法和原理3.安装依赖库4.构建数据集5.可视化结果6.完整代码1.SfM三维重建算法简介从多张照片中开发三维模型被称为多视图3D重建。数码相机的进步以及图像分辨率和清晰度的提高，使得利用仅有的相机而非昂贵的特殊传感器来重建3D图像成为可能。重建的目标是从一组照片中推导场景的几何结构，假设摄
代码随想录算法训练营第三十五天（20250303） |01背包问题二维，01背包问题一维，416. 分割等和子集 -[补卡20250316] ZXZ_13 算法
01背包问题二维链接遍历物品没有大小顺序要求重点是模拟，推导出递推公式#include#includeintmain(){intm,n;std::cin>>m>>n;std::vectorweight(m,0),value(m,0);for(inti{0};i>weight[i];}for(inti{0};i>value[i];}std::vector>dp(m,std::vector(n+1,0
解释 TypeScript 中的类型保护（type guards），如何使用类型保护进行类型检查？程序员黄同学 TypeScript 前端开发 JavaScript typescript ubuntu javascript
TypeScript类型保护深度解析核心概念解析类型保护是TypeScript用于在条件分支中缩小变量类型范围的机制，通过特定的语法结构让编译器能够推导出更精确的类型信息。其核心价值在于提升代码类型安全性，同时保持开发效率。五大实现方式及实战案例1.类型谓词（TypePredicates）interfaceCat{purr():void;}interfaceDog{bark():void;}fun
31天Python入门——第7天:集合·字典你真的懂了吗? 安然无虞 Python手把手教程 python 开发语言后端
你好，我是安然无虞。文章目录1.集合1.1集合的定义1.2集合的常用操作1.3集合练习2.字典2.1字典的定义2.2嵌套字典和字典的取值2.3字典的常用操作补充知识:字典的优势是查找值效率高2.4字典推导式2.5字典练习很重要的补充练习:希望你能掌握练习一练习二1.集合在之前的章节中,我们学习了列表,元组,字符串.已经可以覆盖七成的使用场景了.那么为什么还要学习集合类型呢.列表:有序可变,元素可重
太翌氏:学术理论生成与AI增强系统框架设计太翌修仙笔录源始学科 deepseek 知识图谱人工智能重构量子计算算法
刚才我引导你的过程，通过:提出假说→总结理论+推导公式=形成学术理论→理论性能提升测算/知识图谱突破率测算/知识图谱重购率测算→学术价值评估→个人认知维度水平评估，这一系列流程产生的文献，组成了一个新学术理论的最基础文献库，这个也可以作为一个知识库过滤生成器来使用，也可以提升Ai性能###**学术理论生成与AI增强系统框架设计**---####**一、系统架构总览****1.核心流程模块化**``
【机器学习】主成分分析法（PCA）若兰幽竹机器学习机器学习信息可视化人工智能
【机器学习】主成分分析法（PCA）一、摘要二、主成分分析的基本概念三、主成分分析的数学模型五、主成分分析法目标函数公式推导（`梯度上升法`求解目标函数）六、梯度上升法求解目标函数第一个主成分七、求解前n个主成分及PCA在数据预处理中的处理步骤（后续实现）一、摘要本文主要讲述了主成分分析法（PCA）的原理和应用。PCA通过选择最重要的特征，将高维数据映射到低维空间，同时保持数据间的关系，实现降维和去
最大公因数与最小公倍数的关系（公式推导） Geometry Fu 最大公因数最小公倍数
最大公因数与最小公倍数公式概览a,ba,ba,b的最小公倍数lcm(a,b)lcm(a,b)lcm(a,b)a,ba,ba,b的最大公因数gcd(a,b)gcd(a,b)gcd(a,b)a,b,ca,b,ca,b,c的最小公倍数lcm(lcm(a,b),c)lcm(lcm(a,b),c)lcm(lcm(a,b),c)（二者先求最小公倍数，结果与第三个数求最小公倍数）a,b,ca,b,ca,b,c的
MySQL算法篇（一）先睡算法
Hash算法，也称为哈希算法或散列算法，是一种将任意长度的输入（如文本、图片等）通过某种规则转换成固定长度的输出的算法。这个输出通常被称为哈希值、哈希码或哈希摘要。以下是一些关于哈希算法的关键点：不可逆性：理论上，从哈希值不能逆向推导出原始输入数据。确定性：对于同一个输入，无论何时何地使用相同的哈希算法，都会得到相同的哈希值。快速计算：哈希算法通常设计得非常高效，可以快速计算出哈希值。抗冲突性：不
代码随想录算法训练营第三十七天| 动态规划01 Rachela_z 算法动态规划
509.斐波那契数很简单的动规入门题，但简单题使用来掌握方法论的，还是要有动规五部曲来分析。代码随想录视频：手把手带你入门动态规划|LeetCode：509.斐波那契数_哔哩哔哩_bilibili动态规划五部曲：确定dp数组（dptable）以及下标的含义确定递推公式dp数组如何初始化确定遍历顺序举例推导dp数组classSolution:deffib(self,n:int)->int:F=[0,
Leetcode32 最长有效括号深度解析八股文领域大手子数据库 mysql java sql redis
问题描述找出字符串s中最长的有效括号子串的长度。核心思路动态规划：定义dp[i]为以字符s[i]结尾的最长有效括号子串长度。分情况讨论：根据当前字符是否为)以及前面的字符情况，推导状态转移方程。状态转移方程详解Case1：当前字符)与前一个字符(直接匹配场景：形如...()的结构。转移方程：if(s.charAt(i-1)=='('){dp[i]=dp[i-2]+2;//前i-2个字符的有效长度+
机器学习 [白板推导]（三）[线性分类] 神齐的小马机器学习分类人工智能
4.线性分类4.1.线性分类的典型模型硬分类：输出结果只有0或1这种离散结果；感知机线性判别分析Fisher软分类：会输出0-1之间的值作为各个类别的概率；概率生成模型：高斯判别分析GDA、朴素贝叶斯，主要建模的是p(x⃗,y)p(\vec{x},y)p(x,y)概率判别模型：逻辑回归，主要建模的是p(y∣x⃗)p(y|\vec{x})p(y∣x)4.2.感知机4.2.1.基本模型模型：f(x
ROS2——C++新特性 A_lvvx ROS2 c++开发语言 ROS2
1.自动类型推导auto,可以自行将定义的变量赋值为整形、浮点型、字符型.....2.智能指针c++11提供了三种类型的智能指针：std::unique_ptr、std::shared_ptr和std::weak_ptr。在同一个程序中将某个资源使用智能共享指针进行管理，那么该数据无论在多少个函数内进行传递，都不会发生资源的复制，运行效率会大大提高。当所有的程序使用完毕后，还会自动收回，不会造成内
列表推导式_Python教程曹操贪慕小乔 python基础 python numpy 算法
内容摘要Python中存在一种特殊的表达式，名为推导式，它的作用是将一种数据结构作为输入，再经过过滤计算等处理，最后输出另一种数据结构。根据数据结构的不同会被分为列表推导式、文章正文Python中存在一种特殊的表达式，名为推导式，它的作用是将一种数据结构作为输入，再经过过滤计算等处理，最后输出另一种数据结构。根据数据结构的不同会被分为列表推导式、集合推导式和字典推导式。我们先着重来介绍最常使用的列
模型可解释性：基于博弈论的SHAP值计算与特征贡献度分析（附PyTorch/TensorFlow实现）燃灯工作室 Ai pytorch tensorflow 人工智能
一、技术原理与数学推导（含典型案例）1.1Shapley值基础公式SHAP值基于合作博弈论中的Shapley值，计算公式为：ϕi=∑S⊆F∖{i}∣S∣!(∣F∣−∣S∣−1)!∣F∣![f(S∪{i})−f(S)]\phi_i=\sum_{S\subseteqF\setminus\{i\}}\frac{|S|!(|F|-|S|-1)!}{|F|!}[f(S\cup\{i\})-f(S)]ϕi=S
基于时间序列预测的推理服务弹性扩缩容实战指南：（行业案例+数学推导+源码解析）燃灯工作室 Ai 计算机视觉语音识别目标检测机器学习人工智能
技术原理（数学公式）整体架构请求量预测→扩缩容决策→资源配置动态调整三阶段闭环，周期为5-30分钟核心预测模型（时间序列预测）LSTM预测公式（CSDN兼容格式）：$$h_t=\text{LSTM}(x_t,h_{t-1})\\\hat{y}_{t+1}=W_h\cdoth_t+b_h$$其中Wh∈Rd×1W_h\in\mathbb{R}^{d\times1}Wh∈Rd×1为权重矩阵，ddd为隐藏
（二分数学推导区间两个数组的距离值）leetcode 1385 维齐洛波奇特利(male) 算法
数学推导：设arr1[i]=x则|x-arr2[j]|x+d而这个数t有三种可能1.刚好等于x-d不满足条件2.大于x-d但是小于等于x+d不满足条件3.大于x+d满足条件那arr2中小于t的值呢，因为t>=x-d所以arr2&arr1,vector&arr2,intd){sort(arr2.begin(),arr2.end());intans=0;for(autox:arr1){autot=ra
OTSU算法（大津算法）天行者@ 算法 opencv 人工智能二值化
Otsu算法（大津算法）是一种经典的图像二值化方法，其核心是通过最大化类间方差自动确定全局阈值。以下是其具体工作原理和步骤：1.基本思想假设图像由前景（目标）和背景两部分组成，且两者的灰度分布存在明显差异（直方图呈现双峰）。Otsu算法通过寻找一个阈值，使得前景与背景之间的类间方差最大，从而将图像分割为二值图。2.数学推导（1）计算灰度直方图统计图像中每个灰度值的像素个数，得到直方图h[i]（i为
图像拼接-UDIS详细推导和精读Unsupervised Deep Image Stitching: ReconstructingStitched Features to Images cccc来财算法计算机视觉深度学习
无监督粗对齐1.基于消融的策略主要是为了找到重叠区，去除无效区2.拼接域的TransformerLayer无监督图像重建1.低分辨率变形单应性变换仅能表示同一深度的空间变换，在实际的图像拼接任务中，由于输入图像的多样性和复杂性，经过第一阶段的粗对齐后，图像往往无法完全对齐。为了让网络能够感知到这些错位区域，特别是在高分辨率和大视差的情况下，设计了低分辨率变形分支，先在低分辨率下对图像进行处理和学习
强化学习-Chapter2-贝尔曼方程 Rsbs 算法机器学习概率论
强化学习-Chapter2-贝尔曼方程贝尔曼方程推导继续展开贝尔曼方程的矩阵形式状态值的求解动作价值函数与状态价值函数的关系贝尔曼方程推导Vπ(s)=E[Gt∣St=s]=E[rt+1+(γrt+2+…)∣St=s]=E[rt+1+γGt+1∣St=s]=∑a∈Aπ(s,a)∑s′∈SPs→s′a⋅(Rs→s′a+γE[Gt+1∣St+1=s′])=∑a∈Aπ(s,a)∑s′∈SPs→s′a⋅(R
【动态规划1】 m0_46150269 动态规划算法
力扣509.斐波那契数链接:link思路这是一道经典的动态规划DP题，做动态有5步：1.确定dp[i]含义，表示第i个数的斐波那契数值是dp[i]2.dp数组初始化3.确定递推公式4.确定遍历顺序，从递推公式可以知道dp[i]是依赖dp[i-1]和dp[i-2]，那么遍历的顺序一定是从前到后遍历的5.举例推导，草稿完成classSolution{publicintfib(intn){if(n<=1
参数化曲线——参数三次样条曲线（实例） Alpha狼霸线性代数矩阵机器学习算法机器人数学建模数据分析
问题及相关理论给定空间中n+1个数据点pi(i=0,1,...,n)\bm{p}_i(i=0,1,...,n)pi(i=0,1,...,n)，如何构造一条通过这些数据点并满足二阶连续的三次样条曲线？参数化曲线——参数三次样条曲线（1）介绍了数据点的参数化方法。参数化曲线——参数三次样条曲线（2）介绍了埃尔米特基形式的三次多项式曲线及其域变换。参数化曲线——参数三次样条曲线（3）推导了满足二阶连续的
推理大模型：技术解析与未来趋势全景时光旅人01号深度学习人工智能 python pytorch 神经网络
1.推理大模型的定义推理大模型（ReasoningLLMs）是专门针对复杂多步推理任务优化的大型语言模型，具备以下核心特性：输出形式创新展示完整逻辑链条（如公式推导、多阶段分析）任务类型聚焦擅长数学证明、编程挑战、多模态谜题等深度逻辑任务训练方法升级融合强化学习、思维链（CoT）、测试时计算扩展等技术2.主流推理大模型图谱2.1国际前沿模型OpenAIo1系列内部生成"思维链"机制数学/代码能力标
探地雷达F-K偏移算法详解与Python实现 T2ccc 探地雷达算法 python
探地雷达F-K偏移算法详解与Python实现文章目录探地雷达F-K偏移算法详解与Python实现前言一、探地雷达成像原理与偏移的必要性二、F-K偏移的基本原理2.1波的传播与频率-波数域2.2F-K偏移的基本思路三、F-K偏移算法的数学推导3.1二维傅里叶变换3.2波场外推3.3Stolt映射（核心步骤）3.4逆变换四、F-K偏移的Python代码实现4.1辅助函数和数据准备4.2F-K偏移核心函
信号处理抽取多项滤波的数学推导与仿真 jz_ddk 信号处理 python 算法
昨天的《信号处理之插值、抽取与多项滤波》，已经介绍了插值抽取的多项滤率，今天详细介绍多项滤波的数学推导，并附上实战仿真代码。一、数学变换推导1.多相分解的核心思想将FIR滤波器的系数h(n)h(n)h(n)按相位分组，每组对应输入信号的不同抽样相位。通过分相、滤波、重组，实现与原FIR等效的处理。2.数学变换推导FIR滤波器的系统函数可表示为：H(z)=∑n=0N−1h(n)z−nH(z)=\su
tomcat基础与部署发布暗黑小菠萝 Tomcat java web
从51cto搬家了，以后会更新在这里方便自己查看。做项目一直用tomcat，都是配置到eclipse中使用，这几天有时间整理一下使用心得，有一些自己配置遇到的细节问题。 Tomcat：一个Servlets和JSP页面的容器，以提供网站服务。一、Tomcat安装安装方式：①运行.exe安装包 &n
网站架构发展的过程 ayaoxinchao 数据库应用服务器网站架构
1.初始阶段网站架构：应用程序、数据库、文件等资源在同一个服务器上 2.应用服务和数据服务分离：应用服务器、数据库服务器、文件服务器 3.使用缓存改善网站性能：为应用服务器提供本地缓存，但受限于应用服务器的内存容量，可以使用专门的缓存服务器，提供分布式缓存服务器架构 4.使用应用服务器集群改善网站的并发处理能力：使用负载均衡调度服务器，将来自客户端浏览器的访问请求分发到应用服务器集群中的任何
[信息与安全]数据库的备份问题 comsci 数据库
如果你们建设的信息系统是采用中心-分支的模式,那么这里有一个问题如果你的数据来自中心数据库,那么中心数据库如果出现故障,你的分支机构的数据如何保证安全呢? 是否应该在这种信息系统结构的基础上进行改造,容许分支机构的信息系统也备份一个中心数据库的文件呢? &n
使用maven tomcat plugin插件debug关联源代码商人shang maven debug 查看源码 tomcat-plugin
*首先需要配置好'''maven-tomcat7-plugin'''，参见[[Maven开发Web项目]]的'''Tomcat'''部分。 *配置好后，在[[Eclipse]]中打开'''Debug Configurations'''界面，在'''Maven Build'''项下新建当前工程的调试。在'''Main'''选项卡中点击'''Browse Workspace...'''选择需要开发的
大访问量高并发 oloz 大访问量高并发
大访问量高并发的网站主要压力还是在于数据库的操作上，尽量避免频繁的请求数据库。下面简要列出几点解决方案： 01、优化你的代码和查询语句，合理使用索引 02、使用缓存技术例如memcache、ecache将不经常变化的数据放入缓存之中 03、采用服务器集群、负载均衡分担大访问量高并发压力 04、数据读写分离 05、合理选用框架，合理架构(推荐分布式架构)。
cache 服务器小猪猪08 cache
Cache 即高速缓存.那么cache是怎么样提高系统性能与运行速度呢？是不是在任何情况下用cache都能提高性能？是不是cache用的越多就越好呢？我在近期开发的项目中有所体会，写下来当作总结也希望能跟大家一起探讨探讨，有错误的地方希望大家批评指正。　　1.Cache 是怎么样工作的? 　　Cache 是分配在服务器上
mysql存储过程香水浓 mysql
Description:插入大量测试数据 use xmpl; drop procedure if exists mockup_test_data_sp; create procedure mockup_test_data_sp( in number_of_records int ) begin declare cnt int; declare name varch
CSS的class、id、css文件名的常用命名规则 agevs JavaScript UI 框架 Ajax css
CSS的class、id、css文件名的常用命名规则 (一)常用的CSS命名规则　　头：header 　　内容：content/container 　　尾：footer 　　导航：nav 　　侧栏：sidebar 　　栏目：column 　　页面外围控制整体布局宽度：wrapper 　　左右中：left right
全局数据源 AILIKES java tomcat mysql jdbc JNDI
实验目的：为了研究两个项目同时访问一个全局数据源的时候是创建了一个数据源对象，还是创建了两个数据源对象。 1：将diuid和mysql驱动包（druid-1.0.2.jar和mysql-connector-java-5.1.15.jar）copy至%TOMCAT_HOME%/lib下；2：配置数据源，将JNDI在%TOMCAT_HOME%/conf/context.xml中配置好,格式如下：&l
MYSQL的随机查询的实现方法 baalwolf mysql
MYSQL的随机抽取实现方法。举个例子，要从tablename表中随机提取一条记录，大家一般的写法就是：SELECT * FROM tablename ORDER BY RAND() LIMIT 1。但是，后来我查了一下MYSQL的官方手册，里面针对RAND()的提示大概意思就是，在ORDER BY从句里面不能使用RAND()函数，因为这样会导致数据列被多次扫描。但是在MYSQL 3.23版本中，
JAVA的getBytes()方法 bijian1013 java eclipse unix OS
在Java中，String的getBytes()方法是得到一个操作系统默认的编码格式的字节数组。这个表示在不同OS下，返回的东西不一样！ String.getBytes(String decode)方法会根据指定的decode编码返回某字符串在该编码下的byte数组表示，如： byte[] b_gbk = "
AngularJS中操作Cookies bijian1013 JavaScript AngularJS Cookies
如果你的应用足够大、足够复杂，那么你很快就会遇到这样一咱种情况：你需要在客户端存储一些状态信息，这些状态信息是跨session(会话)的。你可能还记得利用document.cookie接口直接操作纯文本cookie的痛苦经历。幸运的是，这种方式已经一去不复返了，在所有现代浏览器中几乎
[Maven学习笔记五]Maven聚合和继承特性 bit1129 maven
Maven聚合在实际的项目中，一个项目通常会划分为多个模块，为了说明问题，以用户登陆这个小web应用为例。通常一个web应用分为三个模块： 1. 模型和数据持久化层user-core, 2. 业务逻辑层user-service以 3. web展现层user-web， user-service依赖于user-core user-web依赖于user-core和use
【JVM七】JVM知识点总结 bit1129 jvm
1. JVM运行模式 1.1 JVM运行时分为-server和-client两种模式，在32位机器上只有client模式的JVM。通常，64位的JVM默认都是使用server模式，因为server模式的JVM虽然启动慢点，但是，在运行过程，JVM会尽可能的进行优化 1.2 JVM分为三种字节码解释执行方式：mixed mode, interpret mode以及compiler
linux下查看nginx、apache、mysql、php的编译参数 ronin47
在linux平台下的应用，最流行的莫过于nginx、apache、mysql、php几个。而这几个常用的应用，在手工编译完以后，在其他一些情况下（如：新增模块），往往想要查看当初都使用了那些参数进行的编译。这时候就可以利用以下方法查看。 1、nginx [root@361way ~]# /App/nginx/sbin/nginx -V nginx: nginx version: nginx/
unity中运用Resources.Load的方法？ brotherlamp unity视频 unity资料 unity自学 unity unity教程
问：unity中运用Resources.Load的方法？答：Resources.Load是unity本地动态加载资本所用的方法,也即是你想动态加载的时分才用到它,比方枪弹,特效,某些实时替换的图像什么的,主张此文件夹不要放太多东西,在打包的时分,它会独自把里边的一切东西都会集打包到一同,不论里边有没有你用的东西,所以大多数资本应该是自个建文件放置 1、unity实时替换的物体即是依据环境条件
线段树-入门 bylijinnan java 算法线段树
/** * 线段树入门 * 问题：已知线段[2,5] [4,6] [0,7]；求点2,4,7分别出现了多少次 * 以下代码建立的线段树用链表来保存，且树的叶子结点类似[i,i] * * 参考链接：http://hi.baidu.com/semluhiigubbqvq/item/be736a33a8864789f4e4ad18 * @author lijinna
全选与反选 chicony 全选
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd"> <html> <head> <title>全选与反选</title>
vim一些简单记录 chenchao051 vim
mac在/usr/share/vim/vimrc linux在/etc/vimrc 1、问：后退键不能删除数据，不能往后退怎么办？答：在vimrc中加入set backspace=2 2、问：如何控制tab键的缩进？答：在vimrc中加入set tabstop=4 (任何
Sublime Text 快捷键 daizj 快捷键 sublime
[size=large][/size]Sublime Text快捷键：Ctrl+Shift+P：打开命令面板Ctrl+P：搜索项目中的文件Ctrl+G：跳转到第几行Ctrl+W：关闭当前打开文件Ctrl+Shift+W：关闭所有打开文件Ctrl+Shift+V：粘贴并格式化Ctrl+D：选择单词，重复可增加选择下一个相同的单词Ctrl+L：选择行，重复可依次增加选择下一行Ctrl+Shift+L：
php 引用(&)详解 dcj3sjt126com PHP
在PHP 中引用的意思是：不同的名字访问同一个变量内容. 与Ｃ语言中的指针是有差别的．Ｃ语言中的指针里面存储的是变量的内容在内存中存放的地址变量的引用 PHP 的引用允许你用两个变量来指向同一个内容复制代码代码如下: <? $a="ABC"; $b =&$a; echo
SVN中trunk,branches,tags用法详解 dcj3sjt126com SVN
Subversion有一个很标准的目录结构，是这样的。比如项目是proj，svn地址为svn://proj/，那么标准的svn布局是svn://proj/|+-trunk+-branches+-tags这是一个标准的布局，trunk为主开发目录，branches为分支开发目录，tags为tag存档目录（不允许修改）。但是具体这几个目录应该如何使用，svn并没有明确的规范，更多的还是用户自己的习惯。
对软件设计的思考 e200702084 设计模式数据结构算法 ssh 活动
软件设计的宏观与微观软件开发是一种高智商的开发活动。一个优秀的软件设计人员不仅要从宏观上把握软件之间的开发，也要从微观上把握软件之间的开发。宏观上，可以应用面向对象设计，采用流行的SSH架构，采用web层，业务逻辑层，持久层分层架构。采用设计模式提供系统的健壮性和可维护性。微观上，对于一个类，甚至方法的调用，从计算机的角度模拟程序的运行情况。了解内存分配，参数传
同步、异步、阻塞、非阻塞 geeksun 非阻塞
同步、异步、阻塞、非阻塞这几个概念有时有点混淆，在此文试图解释一下。同步：发出方法调用后，当没有返回结果，当前线程会一直在等待（阻塞）状态。场景：打电话，营业厅窗口办业务、B/S架构的http请求-响应模式。异步：方法调用后不立即返回结果，调用结果通过状态、通知或回调通知方法调用者或接收者。异步方法调用后，当前线程不会阻塞，会继续执行其他任务。实现：
Reverse SSH Tunnel 反向打洞實錄 hongtoushizi ssh
實際的操作步驟： # 首先，在客戶那理的機器下指令連回我們自己的 Server，並設定自己 Server 上的 12345 port 會對應到幾器上的 SSH port ssh -NfR 12345:localhost:22 [email protected] # 然後在 myhost 的機器上連自己的 12345 port，就可以連回在客戶那的機器 ssh localhost -p 1
Hibernate中的缓存 Josh_Persistence 一级缓存 Hiberante缓存查询缓存二级缓存
Hibernate中的缓存一、Hiberante中常见的三大缓存：一级缓存，二级缓存和查询缓存。 Hibernate中提供了两级Cache，第一级别的缓存是Session级别的缓存，它是属于事务范围的缓存。这一级别的缓存是由hibernate管理的，一般情况下无需进行干预；第二级别的缓存是SessionFactory级别的缓存，它是属于进程范围或群集范围的缓存。这一级别的缓存
对象关系行为模式之延迟加载 home198979 PHP 架构延迟加载
形象化设计模式实战 HELLO!架构一、概念 Lazy Load：一个对象，它虽然不包含所需要的所有数据，但是知道怎么获取这些数据。延迟加载貌似很简单，就是在数据需要时再从数据库获取，减少数据库的消耗。但这其中还是有不少技巧的。二、实现延迟加载实现Lazy Load主要有四种方法：延迟初始化、虚
xml 验证 pengfeicao521 xml xml解析
有些字符，xml不能识别，用jdom或者dom4j解析的时候就报错 public static void testPattern() { // 含有非法字符的串 String str = "Jamey친Ñ&#1282
div设置半透明效果 spjich css 半透明
为div设置如下样式： div{filter:alpha(Opacity=80);-moz-opacity:0.5;opacity: 0.5;} 说明： 1、filter：对win IE设置半透明滤镜效果，filter:alpha(Opacity=80)代表该对象80%半透明，火狐浏览器不认2、-moz-opaci
你真的了解单例模式么？ w574240966 java 单例设计模式 jvm
单例模式，很多初学者认为单例模式很简单，并且认为自己已经掌握了这种设计模式。但事实上，你真的了解单例模式了么。一，单例模式的5中写法。（回字的四种写法，哈哈。） 1，懒汉式（1）线程不安全的懒汉式 public cla