weixin_41911765

HMM隐马尔可夫模型详解

关于什么是隐马尔可夫模型我想你看到的解释应该是酱紫的：

或者是这样子的：

一、什么是隐马尔可夫模型

二、隐马尔可夫模型要解决的问题

三、问题解决

1.概率计算问题：

2.学习问题：

3.预测问题：

关于什么是隐马尔可夫模型我想你看到的解释应该是酱紫的：

隐马尔可夫模型（Hidden Markov Model，HMM）是统计模型，它用来描述一个含有隐含未知参数的马尔可夫过程。其难点是从可观察的参数中确定该过程的隐含参数。然后利用这些参数来作进一步的分析，隐马尔科夫模型在语音识别、自然语言处理、生物信息、模式识别等领域有着广泛的应用。

或者是这样子的：

隐马尔可夫模型是关于时序的概率模型，描述由一个隐藏的马尔可夫链随机生成不可观测的状态随机序列，再由各个状态生成一个观测而产生观察随机序列的过程......

看不懂没关系，我也看不懂，这可能是出于专业出版的对于定义的严谨性，所以很多时候看不懂一些文献、书籍没关系，我很喜欢博客上各位大神的博文，他们常常能够解决我最根本的问题，看懂了他们博文，再去看书籍和文献，什么都通了。

一、什么是隐马尔可夫模型

我们先用一个例子来说明一下什么是隐马尔可夫模型

该例子来自Yang Eninala博士的知乎https://www.zhihu.com/question/20962240/answer/33438846

一个经典的例子，掷骰子。假设我手里有三个不同的骰子。第一个骰子是我们平常见的骰子（称这个骰子为D6），6个面，每个面（1，2，3，4，5，6）出现的概率是1/6。第二个骰子是个四面体（称这个骰子为D4），每个面（1，2，3，4）出现的概率是1/4。第三个骰子有八个面（称这个骰子为D8），每个面（1，2，3，4，5，6，7，8）出现的概率是1/8。

假设我们开始掷骰子，我们先从三个骰子里挑一个，挑到每一个骰子的概率都是1/3。然后我们掷骰子，得到一个数字，1，2，3，4，5，6，7，8中的一个。不停的重复上述过程，我们会得到一串数字，每个数字都是1，2，3，4，5，6，7，8中的一个。例如我们可能得到这么一串数字（掷骰子10次）：1 6 3 5 2 7 3 5 2 4

这串数字叫做可见状态链。但是在隐马尔可夫模型中，我们不仅仅有这么一串可见状态链，还有一串隐含状态链。在这个例子里，这串隐含状态链就是你用的骰子的序列。比如，隐含状态链有可能是：D6 D8 D8 D6 D4 D8 D6 D6 D4 D8，这条链就是HMM中说到的马尔可夫链。基于这种类型引发的问题就是隐马尔可夫模型。

马尔可夫链不是为了隐马尔科夫模型取的，他的应用也不只是隐马尔可夫。

我们再来看看马尔可夫链的定义过程：

马尔可夫过程的定义：

⑴设是一个随机过程，如果在在时刻所处的状态为已知时，以后的状态与它在时刻之前所处的状态无关，则称具有马尔可夫性。(就是说某个状态的概率只受前一个状态的影响）

⑵设的状态空间为，如果对于任意的，任意的，在条件下，的条件概率分布函数恰好等于其在条件下的条件概率分布函数，即

则称为马尔可夫过程。

((2)在于用公式来表达定义(1)，==》P(t时刻的状态|前1—t-1时刻发生的条件下)=P(t时刻的状态|t-1时刻发生的条件)

其实对于HMM来说，如果提前知道所有隐含状态之间的转换概率和所有隐含状态到所有可见状态之间的输出概率，做模拟是相当容易的。但是应用HMM模型时候呢，往往是缺失了一部分信息的，有时候你知道骰子有几种，每种骰子是什么，但是不知道掷出来的骰子序列；有时候你只是看到了很多次掷骰子的结果，剩下的什么都不知道。如果应用算法去估计这些缺失的信息，就成了一个很重要的问题。这些东西就是HMM要解决的问题。

二、隐马尔可夫模型要解决的问题

*在提问题之前我们先来定义几个变量(重新看一下这个图的图例)

*几个矩阵的定义

所有可能的状态集合={ $q_{1},q_{2},q_{3},...,q_{N-1},q_{N}$ }	所有可能的观测集合={ $v_{1},v_{2},v_{3},...,v_{M-1},v_{M}$ }
T时刻的状态序列=( $i_{1},i_{2},i_{3},...,i_{t-1},i_{t}$ \| i∈Q)	T时刻的观测序列=( $o_{1},o_{2},o_{3},...,o_{t-1},o_{t}$ \| o∈V)
状态转移概率矩阵 $A=[a_{i,j}]_{N*N}$ $a_{i,j}$ 表示t时刻处于状态 $i_{t}=q_{i}$ 转移至 $i_{t+1}=q_{j}$ 的转化概率	观测概率矩阵 $B=[b_{j}(k)]_{N*M}$ $b_{j(k)}$ 表示处于状态 $q_{j}$ 下生成观测 $o_{t}=v_{k}$ 的生成概率
模型参数 λ(A,B,Π)，Π为初始状态概率向量，A为状态转移概率矩阵，B为观测概率矩阵，Π和A决定状态序列，B决定观测序列

*马尔可夫链的两个假设

(1)齐次马尔可夫假设：	即t时刻的状态只受t-1时刻状态的影响
(2)观测独立性假设：	即任意时刻的观测只受该时刻所处状态的影响

*马尔可夫模型的三个基本问题

(1)概率计算问题：	给定模型参数 λ(A,B,Π)和观测序列=( $o_{1},o_{2},o_{3},...,o_{t-1},o_{t}$ )，计算在模型λ下观测序列O出现的概率 $P(O\|\lambda)$
(2)学习问题：	给定观测序列=( $o_{1},o_{2},o_{3},...,o_{t-1},o_{t}$ )，求参数λ(A,B,Π)，这就是类似EM算法的问题了.
(3)预测问题：	给定参数 λ(A,B,Π)和观测序列=( $o_{1},o_{2},o_{3},...,o_{t-1},o_{t}$ )，求隐含的状态序列=( $i_{1},i_{2},i_{3},...,i_{t-1},i_{t}$ ).

问题(1)是求条件概率问题。(2)在解决这个问题的时候用的是Baum-welch算法，它是由EM算法引发出来的，而EM算法里面又涉及到极大似然估计的知识，本文会简单的交代一下EM算法，至于极大似然估计的问题如果不懂的话先补完知识再看。往后有时间我会写这个节点的博文。(3)是隐马尔可夫模型的核心，很多领域对隐马尔可夫模型的应用大部分会是问题(3)，比如在机器翻译做中文对英文的翻译时，单词的翻译总是有很多个意思，而词性往往起到很重要的作用，乍一看词性这一序列怎么跟我们说到的隐含的状态序列=( $i_{1},i_{2},i_{3},...,i_{t-1},i_{t}$ )很像呢！类似这样的还有很多.......

如果只是想了解一下HMM是什么的话你了解到这里也就差不多了，如果想要知道他长什么样，那就往下。

三、问题解决

1.概率计算问题：

直接计算算法：对所有可能存在的状态序列 =( $i_{1},i_{2},i_{3},...,i_{t-1},i_{t}$ )，表示出来，形成一个状态序列空间{ $I_{1},I_{2},I_{3},...,I_{z}$ },并求 $P(O,I|\lambda)$ ，即基于模型 $\lambda$ 求空间D中全部状态序列下出现O的概率。

联合概率 $P(O,I|\lambda)=P(O,|I,\lambda)\cdot P(I|\lambda )$

变成 $\lambda$ 发生的条件下发生的概率 $P(I|\lambda )$ 乘以 $\lambda$ ,发生的条件下O发生的概率

其中 1) $P(I|\lambda )=\pi _{i}\cdot a_{i_{1},i_{2}}\cdot a_{i_{2},i_{3}}\cdot...\cdot a_{i_{t-1},i_{t}}$ ，

= $(i_{1},i_{2},i_{3},...,i_{t-1},i_{t})$ , $I\epsilon D$

表示所有可能状态序列

2) $P(O,I|\lambda)=b_{i_{1}}(o_{1})\cdot b_{i_{2}}(o_{2})\cdot ...\cdot b_{i_{t}}(o_{t})$

故

$P(O,I|\lambda)=\pi _{i}\cdot b_{i_{1}}(o_{1})\cdot a_{i_{1},i_{2}}\cdot b_{i_{2}}(o_{2})\cdot a_{i_{2},i_{3}}\cdot b_{i_{3}}(o_{3})\cdot...\cdot a_{i_{t-1},i_{t}}\cdot b_{i_{t}}(o_{t})$

对所有满足的求和得到

$P(O|\lambda )=\sum _{I\epsilon D}P(O,I|\lambda )$ $=\sum _{I\epsilon D}\pi _{i}\cdot b_{i_{1}}(o_{1})\cdot a_{i_{1},i_{2}}\cdot b_{i_{2}}(o_{2})\cdot a_{i_{2},i_{3}}\cdot b_{i_{3}}(o_{3})\cdot...\cdot a_{i_{t-1},i_{t}}\cdot b_{i_{t}}(o_{t})$

至此算法结束

前向算法：直接计算算法很简单便捷，但是计算量很大，假设状态集合有N个可选的状态，而状态序列有t个节点则可选的状态序列空间就有 $N^{t}$ 个可选序列，这意味这求和项要求和 $N^{t}$ 次，可想而知，计算量不是一般的少。因此引入前向算法：每个节点处先对N个状态分别乘以转化率之后再求和，不理解没关系，先来一幅图。

大概看一下：

定义:

$a_{t}(i)=P(o_{1},o_{2},...,o_{t},i= q_{i} |\lambda )$ ，表示时刻t，其部分观测序列为 $o_{1},o_{2},...,o_{t}$ ，且状态等于中的 $q_{i}$

故：

(1)初值： $a_{1}(i)=\pi_{i}b_{i}(o_{1}),i\epsilon Q$ 即遍历状态集合

(2)递推 for t =1 to T-1 $a_{t+1}(i)=[ \sum_{j\epsilon Q} a_{t}(j)}\cdot a_{j,i}] b_{i}(o_{t+1}),i\epsilon Q$

即对上一个节点的所以状态乘转化率后求和再乘本节点的生成概率

(3)终止 $P(O|\lambda )=\sum _{I\epsilon Q}a_{T}(i)$ 对最后一节点的所有 $a_{T}(i)$ 求和

后向算法：和前向算法一样，只是顺序倒置了而已,形状参考前向算法，只是对应的位置换成 $\beta_t(i)$ 。

定义：

$\beta_t (i)=P(o_{t+1},o_{t+2},...,o_{T}|i_t=q_i,\lambda)$ ，表示时刻状态为的条件下，往后部分观测序列为 $o_{t+1},o_{t+2},...,o_{T}$ 的概率

(1)初值： $\beta_T(i)=1,i\epsilon Q$

(2)递推 for t=T-1 to 1 $\beta _t(i)=\sum_{j\epsilon D}a_{i,j}\cdot b_j(o_{t+1}) \cdot \beta _{t+1}(j),i\epsilon D$

(3) 终止 $P(O|\lambda )=\sum_{i\epsilon Q}\sum_{j\epsilon Q}\pi_{i}\cdot a_{i,j} \cdot b_j(o_{t+1})\cdot \beta _{t+1}(j)$

至此三个对概率计算的算法算结束了，为了对一下问题(2)和(3)的推导，引入一些概率与期望的计算

一些概率与期望值的计算

1)给定模型 $\lambda$ 和观测序列，在t时刻处于状态的概率为：

$\gamma _t(i)=P(i_t=q_i|O,\lambda )=\frac{P(i_t=q_i,O|\lambda )}{P(O|\lambda )}$

由上述前向概率和后向概率 $\beta _t(i)$ 的定义可知:

$a_t(i)\cdot \beta _t(i)=P(i_t=q_i,O|\lambda )$

于是得到： $\gamma _t(i)=\frac{a_t(i)\cdot \beta _t(i)}{P(O|\lambda )}=\frac{a_t(i)\cdot \beta _t(i)}{\sum_{j\epsilon Q}a_t(j)\cdot \beta _t(j)}$

2)给定模型 $\lambda$ 和观测序列，在t时刻状态，且在t+1时刻处于状态的概率为：

$\xi _t(i,j)=P(i_t=q_i,i_{t+1}=q_j|O,\lambda )=\frac{P(i_t=q_i,i_{t+1}=q_j,O|\lambda )}{P(O|\lambda )}$

$\xi _t(i,j)=\frac{a_t(i) a_{ij} b_i(o_{t+1})\beta _{t+1}(j)}{\sum _{i\epsilon D}\sum _{j\epsilon D}a_t(i)a_{ij}b_j(o_{t+1})\beta _{t+1}(j)}$

3)将 $\gamma _t(i)$ 和 $\xi _t(i,j)$ 对各个时刻t求和，可以得到一些有用的期望：

①在观测序列的条件下状态出现的期望值： $\sum_{t=1}^{T}\gamma _t(i)$

②在观测序列的条件下由状态转移的期望值： $\sum_{t=1}^{T-1}\gamma _t(i)$

③在观测序列的条件下由状态转移到状态的期望值： $\sum_{t=1}^{T}\xi _t(i,j)$

注：上面几个应该有错，似乎忽略了各个时刻相交的部分，使得期望变大。

以1为例假如状态集Q有10个状态，时刻T=10，并且各个时刻状态下i出现的概率都是相等的，

则 ${\color{Blue} \gamma _t(i)}$ =0.1， ${\color{Blue}\sum_{t=1}^{T}\gamma _t(i)}$ =1，这是不可能存在的，

应该是 ${\color{Blue} 0.1+(1-0.1)*0.1+(1-0.1)^2*0.1......+(1-0.1)^9*0.1}$ 。

通项就是 ${\color{Blue} 0.1*\sum _{i=1}^{T}(1-0.1)^{T-1}}$

但是的分布总是乱七八糟的，没办法写出通项来。

2.学习问题：

学习问题就是给定观测序列 $O=(o_{1},o_{2},o_{3},...,o_{t-1},o_{t})$ ，求参数 $\lambda (A,B,\Pi)$ 映射到我们起初提到的骰子的例子大概就是知道了观测序列为要求参数

1)A: t时刻选用骰子D4到t+1时刻选用骰子D6或D8的转换概率。

2)B: 任意时刻选用固定骰子后出现某个点数的概率。

3)Π: 其实选择骰子D4、D6、D8的概率。

如果知道了隐藏的状态序列，即是每个时刻都选用了哪个骰子的话，求参数 $\lambda (A,B,\Pi)$ 我们直接选用极大似然估计就好了，可是关键在于我们并不知道是什么。因此我们采用Baum-welch算法来求解，而该算法来自与EM算法的变形。

Baum-Welch算法：

是为了解决HMM的参数估计问题而提出的，而且是没有标注也就是HMM的状态序列未知的参数估计问题。具体来说，就是已知观测序列O=(o1,o2,...,oT)O=(o1,o2,...,oT)，估计模型参数λ=(A,B,π)λ=(A,B,π)，使得在该模型下观测序列概率P(O|λ)P(O|λ)最大。由于状态序列未知，因此这可以看做是一个含有隐变量的参数估计问题，解决这一问题的经典算法就是EM算法。Baum-Welch算法就是EM算法在隐马尔科夫模型学习中的具体体现。下面简单叙述一下该算法。

首先按照EM算法，我们需要先写出Q函数。Q函数是完全数据的对数似然函数关于给定模型参数和观测变量的前提下对隐变量的条件概率分布的期望。如下:

我们写出Q函数之后后面就要对它进行极大化，也就是说EM算法的M步骤。既然是最大化，那么只要保证不影响最终的结果，对Q函数进行对于最大化来说没有影响的常数因子乘除是可以的。我们注意到Q函数的后部分

而P(O|λ)P(O|λ)便是概率计算问题中我们解决的问题，对于固定的模型参数来说它是一个常量，因此我们为了后边计算方便可以在上面原先的Q函数的基础上乘以它，使得Q函数成为：

为什么要这么做呢？这是为了后面将概率计算问题中有意义的一些概率计算公式直接套进去。

又因为完全数据可以写成这样：

于是Q函数可以写成：

此时我们看到待估计的参数刚好分别出现在三个项中，所以只需对各个项分别极大化。然后直接极大化我们无法对公式进行细致描述，因此需要将以上Q函数形式修改一下，变成下面这样：

可以看到，我们将三项中分别的对的求和进行了划分。由于隐变量=( $i_{1},i_{2},i_{3},...,i_{t-1},i_{t}$ )。原来的求和需要遍历所有的取值，然后进行求和，然而这基本是不可能完成的任务。改写后，我们将遍历的空间进行了划分，同时很好地将 $P(O,I|\bar{\lambda})$ 部分改写后也融入到求和其中。比如第一项，对的遍历等价于先固定状态，使其分别取值所有可能的状态（共有N个可取的离散状态），而仍然像原来一样随便取值。这样，就把II空间划分成了N个更小的空间。然后再把这N个空间的结果相加，等价于原来对空间进行遍历。

而且，改写之后 $P(O,I|\bar{\lambda})$ 部分变的可以表示了。如果对函数的三项分别求极大，在计算后会发现，上面导出的有意义的概率可以用来表示。这也就是之前对函数进行修改的原因。

接下来极大化 $Q(\lambda ,\bar{\lambda })$ ，并求解满足目标最大化的参数A、B、 $\pi$ 的值

用上面推导的公式有 $\pi_i=\gamma _1(i)$ ，

表示给定模型 $\lambda$ 和观测序列，在t=1时刻处于状态的概率

$\gamma _1(i)=\frac{a_1(i)\cdot \beta _1(i)}{P(O|\lambda )}=\frac{a_1(i)\cdot \beta _1(i)}{\sum_{j\epsilon Q}a_t(j)\cdot \beta _t(j)}$

$a_{ij}=\frac{\sum _{t=1}^{T}\xi _t(i,j)}{\sum _{t=1}^{T}\gamma _t(i)}$

表示对 (任意时刻由状态转移到状态的所有求和项) 比上 (任意时刻处于状态的所有求和项)

表示对（任意时刻状态为观测值为的所有求和项) 比上 (任意时刻状态为的所有求和项)

3.预测问题：

给定参数 λ(A,B,Π)和观测序列=( $o_{1},o_{2},o_{3},...,o_{t-1},o_{t}$ )，求隐含的状态序列=( $i_{1},i_{2},i_{3},...,i_{t-1},i_{t}$ ).

套回骰子的例子就是已知参数，已知观测到的数字，求数字背后隐藏的是哪种骰子。

近似算法：

用公式表示就是 $\gamma _t(i)=P(i_t=q_i|O,\lambda )=\frac{P(i_t=q_i,O|\lambda )}{P(O|\lambda )}$

$a_t(i)\cdot \beta _t(i)=P(i_t=q_i,O|\lambda )$

$\gamma _t(i)=\frac{a_t(i)\cdot \beta _t(i)}{P(O|\lambda )}=\frac{a_t(i)\cdot \beta _t(i)}{\sum_{j\epsilon Q}a_t(j)\cdot \beta _t(j)}$

在每个时刻最可能隐藏的状态 $i_t^*=arg\ max [\gamma _t(i)],\ \ _{(1\leq i\leq N),t=1,2,...,T}$

从而状态序列：

由于存在转移概率为0的相邻状态，改算法很不稳定

维比特算法：

维比特算法分两步

第一步

计算每一步的 $\delta _t(i)$ 值，即t时刻对每个状态求最大的 $P(i_t= i ,i_{t-1},i_{t-2},...,t_1,o_{t-1},o_{t-2},...,o_{1}| \lambda )$ ，并返回连接到当前状态的前一个最优状态。

始化 $\delta _1(i)=\pi_ib_i(o_1),i=1,2,......,N$

$\varphi _1(i)=0$

递推 $\delta _t(i)=max_j[\delta _{t-1}(j)a_{ji}]b_i(o_t),i=1,2,......,N$

$\varphi _t(i)=arg max_j[\delta_{t-1}(j) a_{ji}]$

终止 $i_T^*=arg max_j[\delta_{T}(i) ]$

第二步：把T时刻的最优状态，作为参数回溯寻求每一步的最优

$i_t^*=\varphi _{t+1}(i_{t+1}^*)$

[1] 李航.统计学习方法[M].北京：清华大学出版社，2012：155-184

[2] 如何用简单易懂的例子解释隐马尔可夫模型?[Online]，https://www.zhihu.com/question/20962240/answer/33438846

[3] ”相亲记“之从EM算法到Baum-Welch算法[Online]，https://blog.csdn.net/firparks/article/details/54934112

充气泵方案｜便携式充气泵方案【天吉智芯】天吉智芯充气泵一体机打气泵单片机嵌入式硬件人工智能安全
便携车载充气泵方案的使用范围其实不仅仅是汽车轮胎，它在设计时工程师选取高性能和存储芯片，可实现汽车轮胎、篮球、自行车、摩托车、零模式等多种场景应用。其原理便是通过马达运转工作，当抽气时连通器的阀门被大气的气压冲开，气体进入气筒中；当向轮胎打气时，阀门又被气筒的气压关闭，所以气体由此进入轮胎中。这其实就是利用大气压的原理来充气。以下是便携车载充气泵方案的功能设计介绍。深圳天吉芯技术king-chip
搜广推校招面经五十四 Y1nhl 搜广推面经搜索算法 python 推荐算法机器学习人工智能
美团推荐算法一、手撕Transformer的位置编码1.1.位置编码的作用Transformer模型没有显式的序列信息（如RNN的循环结构），因此需要通过位置编码（PositionalEncoding）为输入序列中的每个位置添加位置信息。位置编码的作用是：提供序列位置信息：帮助模型理解输入序列中元素的顺序。保持唯一性和连续性：确保每个位置的位置编码是唯一的，且相邻位置的位置编码是连续的。1.2.位
AI工具如何改变编程学习？Trae IDE与Claude 3.5的实践案例黑金IT AI智能 AI编程 fasttify 人工智能学习 ide
在现在这个到处都是电脑和手机的时代，AI工具正在变成编程学习和开发的好帮手。今天，咱们就来好好聊聊AI工具，特别是TraeIDE和Claude3.5这两个工具，在学习FastAPI和构建知识图谱的时候有多厉害，还有它们对编程行业会有什么影响。一、AI工具：编程学习与开发的好帮手AI工具在编程学习和开发里，作用可太大了。就像TraeIDE和Claude3.5，它们能像好朋友一样，在写代码的时候帮忙检
搜广推校招面经五十三 Y1nhl 搜广推面经 python 机器学习人工智能推荐算法搜索算法算法
小红书推荐算法一、ESMM(EntireSpaceMulti-TaskModel)ESMM（EntireSpaceMulti-TaskModel）是一种用于解决推荐系统中多任务学习问题的模型。它由阿里巴巴团队提出，主要用于处理点击率（CTR）和转化率（CVR）的联合预测问题。1.1.背景在推荐系统中，CTR和CVR是两个重要的指标：CTR（Click-ThroughRate）：用户点击广告的概率。
EnerVerse：智元机器人提出首个机器人4D世界模型，在动作规划任务中达到SOTA水平强化学习曾小健机器人
EnerVerse：智元机器人提出首个机器人4D世界模型，在动作规划任务中达到SOTA水平PNP机器人PNP机器人2025年02月10日21:04上海本文来自：公众号智元机器人https://sites.google.com/view/enerverse，出于学术/技术分享进行转载，如有侵权，联系删文。EnerVerse的科研核心团队由智元机器人研究院的具身算法精英组成。黄思渊，作为上海交通大学与
Pytorch使用手册-DCGAN 指南（专题十四） AI专题精讲 Pytorch入门到精通 pytorch 人工智能 python
1.Introduction本教程将通过一个示例介绍DCGANs（深度卷积生成对抗网络）。我们将训练一个生成对抗网络（GAN），在给它展示大量真实名人照片后，它能够生成新的“名人”图片。这里的大部分代码来源于PyTorch官方示例中的DCGAN实现，而本文档将对该实现进行详细解释，并阐明这种模型的运行机制及其背后的原因。无需担心，你不需要事先了解GAN的知识，但初次接触的读者可能需要花一些时间来理
使用 Milvus 进行向量数据库管理与实践 qahaj milvus 数据库 python
技术背景介绍在当今的AI与机器学习应用中，处理和管理大量的嵌入向量是一个常见的需求。Milvus是一个开源向量数据库，专门用于存储、索引和管理深度神经网络以及其他机器学习模型生成的大规模嵌入向量。它的高性能和易用性使其成为处理向量数据的理想选择。核心原理解析Milvus的核心功能体现在其强大的向量索引和搜索能力。它支持多种索引算法，包括IVF、HNSW等，使其能够高效地进行大规模向量的相似性搜索操
MyBatis学习：基本使用 Landy_Jay mybatis 学习 java
学习之前：MyBatis是一款优秀的持久层框架，它支持自定义SQL、存储过程以及高级映射。MyBatis免除了几乎所有的JDBC代码以及设置参数和获取结果集的工作。2.1向SQL语句传参2.1.1mybatis日志输出配置MyBatis配置文件详解：官方文档：mybatis–MyBatis3|简介标签：用于选择MyBatis配置环境的标签，如开发、测试和生产环境需要不同的配置。更换环境，只需更开标
[2]2025年新手集成开发环境（IDE）选择指南 Aqua_chang ide python vscode conda
本文涵盖‌主流IDE推荐（分场景）‌、‌安装配置详解及‌高频问题解决方案‌，如数据科学领域必备工具‌Anaconda‌和‌Spyder‌，帮助新手快速上手编程开发。一、‌IDE核心作用与分类‌集成开发环境‌（IDE）是什么？‌集成代码编辑、编译、调试、版本管理等功能的开发工具，提升效率。优势：代码补全、调试便捷、插件扩展。‌新手选择原则‌‌轻量级工具‌（如VSCode）适合入门；‌专业型IDE‌（
【IT大学生必会的】 10 种图表线性回归 .Boss. 深度学习开发语言人工智能机器学习算法
这段时间，不少同学提到了一些图表的问题。每次在使用matplotlib画图，运用这些图表说明问题的时候，很多时候是模糊的，比如说什么时候画什么图合适？其实这个根据你自己的需求，自己的想法来就行。今天的话，我这里举例在线性回归中，最常用的一些图表，应该可以cover绝大多数情况了。其他算法模型适用的图表，咱们在后面再给大家进行总结~至于数据集，表现方式，大家可以根据我给出的代码继续调整即可！那么，在
【自学笔记】Web3基础知识点总览-持续更新 Long_poem 笔记 web3
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录Web3基础知识点总览（Markdown格式）1.引言2.区块链基础3.智能合约4.去中心化应用（DApps）5.数字货币与钱包6.跨链技术7.Web3生态与工具代码块示例（Solidity智能合约）总结Web3基础知识点总览（Markdown格式）1.引言Web3，也称为第三代互联网或去中心化互联网，旨在通过区块链技术实现更
搜广推校招面经五十五 Y1nhl 搜广推面经深度学习机器学习 python 推荐算法搜索算法广告算法人工智能
腾讯搜推面经一、双塔模型有什么缺点双塔模型（Two-TowerModel）是一种常见的推荐系统或检索系统架构，尤其在处理大规模用户-物品交互数据时表现出色。1.1.特征交互受限问题：双塔模型将用户特征和物品特征分别编码为两个独立的向量（用户塔和物品塔），然后在顶层通过简单的点积或余弦相似度计算得分。这种设计限制了用户特征和物品特征之间的细粒度交互。影响：无法捕捉复杂的特征交叉信息，可能导致模型性能
SQLMesh SCD Type 2 深度解析：时间戳与列级跟踪的实战指南梦想画家数据分析工程 #python 数据工程分析工程 sqlmesh
在数据仓库架构中，缓慢变化维度（SlowlyChangingDimensions,SCD）是处理历史数据追踪的核心技术。SQLMesh作为新一代数据编织平台，其支持的SCDType2模型通过valid_from和valid_to双时间戳机制，为开发者提供了灵活的历史状态管理能力。本文将深入解析SQLMeshSCDType2的两种实现模式（基于时间戳与列级变更检测）、关键配置项及删除操作处理逻辑，让
元数据驱动的设想吾爱乐享 python
title:元数据驱动的设想tags:pythoncategories:python文章目录1.背景针对相似结构的表单，为了提高ui自动化编写效率，减少以减少重复工作，设想是否可以设计一个针对neoUI2.0通过元数据驱动的方式适应不同业务对象的测试框架2.设计元数据模型-字段名-字段类型-是否必填-是否只读-默认值-业务逻辑（可选，后期扩展）3.构建自动化测试框架利用现有的RF框架已实现的功能，
法律行业——合同审查与AI律师 zhouyaowei1983 人工智能人工智能
一、引言：AI技术重构法律行业新格局‌随着AI技术从实验室走向规模化应用，法律行业正经历从“经验驱动”向“数据驱动”的范式转变。这一变革的核心驱动力源于法律服务的两大根本矛盾：‌传统人工服务效率瓶颈‌与‌市场对高精度、低成本法律产品的迫切需求‌‌。‌1.法律行业数字化转型的底层逻辑‌‌技术革命推手‌：以DeepSeekR1大模型为代表的开源AI技术，让法律文本解析、案例推理等复杂任务实现平民化应用
使用 Resilience4j 实现重试树懒_Zz Spring spring cloud spring boot spring
在本文中，我们将首先简要介绍Resilience4j，然后深入研究其重试模块。我们将了解何时以及如何使用它，以及它提供哪些功能.什么是Resilience4j？应用程序通过网络通信时，许多事情都可能出错。由于连接中断、网络故障、上游服务不可用等原因，操作可能会超时或失败。应用程序可能会相互过载、无响应，甚至崩溃。Resilience4j是一个Java库，可帮助我们构建具有弹性和容错能力的应用程序。
Spring Boot 外部化配置 (Externalized Configuration) 超详解：灵活管理应用配置，打造可移植、可扩展的应用无眠_ spring boot 数据库 oracle
引言在SpringBoot应用开发中，配置管理是至关重要的环节。不同的环境(开发、测试、生产)通常需要不同的配置参数，例如数据库连接、端口号、日志级别、第三方API密钥等等。SpringBoot外部化配置(ExternalizedConfiguration)提供了一套强大的机制，允许我们将应用的配置从代码中解耦出来，并通过多种外部来源进行灵活管理，从而打造出可移植、可扩展、易于维护的SpringB
《Java线程池深度解析：从核心参数到饱和策略实战》云之兕 java基础入门到精通 java 开发语言
"线程池核心数设置多少合适？为什么任务队列满了会导致OOM？如何设计可降级的异步任务系统？"本文通过电商秒杀场景贯穿线程池参数调优全过程，结合ThreadPoolExecutor源码解析核心机制，并给出动态线程池与监控报警的最佳实践。一、线程池核心参数关系图解graphLRA[提交任务]-->B{核心线程是否已满?}B-->|否|C[创建核心线程执行]B-->|是|D{队列是否已满?}D-->|否
蓝桥杯动态规划实战：从数字三角形到砝码称重藍海琴泉蓝桥杯动态规划职场和发展
适合人群：蓝桥杯备考生|算法竞赛入门者|DP学习实践者目录一、我的动态规划入门之路1.数字三角形：经典DP首战告捷2.砝码称重：背包问题的变形二、蓝桥杯高频算法考点三、蓝桥杯DP专项训练题四、备考建议一、我的动态规划入门之路1.数字三角形：经典DP首战告捷题目描述：从三角形的顶部到底部有很多条不同的路径。对于每条路径，把路径上面的数加起来可以得到一个和，你的任务就是找到最大的和（路径上的每一步只可
Python函数完全解读：从零基础到高阶实战藍海琴泉 python 开发语言
目标读者：编程新手|转行者|需系统掌握函数用法的开发者目录一、函数是什么？为什么需要函数？二、函数基础语法详解1.定义与调用2.返回值：函数的输出结果3.参数传递机制4.案例：计算BMI指数三、变量作用域：理解局部与全局1.局部变量2.全局变量四、函数进阶：lambda与高阶函数1.lambda匿名函数2.高阶函数五、函数高级特性1.装饰器：增强函数功能2.递归函数六、实战案例：文件处理工具一、函
微软Data Formulator：用AI重塑数据可视化的未来几道之旅人工智能智能体及数字员工人工智能信息可视化
在数据驱动的时代，如何快速将复杂数据转化为直观的图表是每个分析师面临的挑战。微软研究院推出的开源工具DataFormulator，通过结合AI与交互式界面，重新定义了数据可视化的工作流。本文将深入解析这一工具的核心功能、安装方法及使用技巧，助你轻松驾驭数据之美。一、DataFormulator是什么？DataFormulator是一款基于大语言模型（LLM）的AI工具，旨在帮助用户通过自然语言和界
本地部署deepseek-r1:14b 批量调用 Python调用本地deepseek-r1:14b实现对本地数据库的AI管理朴拙Python交易猿 python 数据库开发语言
这篇文章主要为大家详细介绍了Python如何基于DeepSeek模型，调用本地deepseek-r1:14b实现对本地数据库的AI管理场景描述基于DeepSeek模型，实现对本地数据库的AI管理。实现思路1、本地python+flask搭建个WEB，配置数据源。2、通过DeepSeek模型根据用户输入的文字需求，自动生成SQL语句。3、通过SQL执行按钮，实现对数据库的增删改查。模型服务方法1启动
RFM案例(简要版) 郜太素数据处理和统计分析 Numpy pandas RFM案例 mysql 学习方法 sql
一、会员价值度模型1、RFM模型介绍会员价值度用来评估用户的价值情况，是区分会员价值的重要模型和参考依据，也是衡量不同营销效果的关键指标之一。价值度模型一般基于交易行为产生，衡量的是有实体转化价值的行为。常用的价值度模型是RFMRFM模型是根据会员最近一次购买时间R（Recency）购买频率F（Frequency）购买金额M（Monetary）计算得出RFM得分通过这3个维度来评估客户的订单活跃价
策略模式详解：实现灵活多样的支付方式 Dong雨策略模式 java
多支付方式的实现：策略模式详解策略模式（StrategyPattern）是一种行为设计模式，它定义了一系列算法，并将每个算法封装起来，使它们可以互换使用。策略模式使得算法可以独立于使用它的客户端变化。本文将通过一个具体的业务场景来介绍策略模式，并给出相应的代码实现。业务场景我们以一个电商平台为例，该平台支持多种支付方式，包括信用卡支付、PayPal支付和比特币支付。我们希望在不修改客户端代码的情况
原创LabVIEW与台达EtherCAT运动控制卡完整测试程序代码 LabVIEW热爱者 labview
利用LabVIEW调用台达提供的库函数，控制台达EtherCAT运动控制卡，实现初始化、IO、运动控制、模拟量读取等功能。LabVIEW2013以上版本可以打开。可实现单轴、多轴运动控制。
C++多线程苜柠 C++c++
线程：async和thread锁：C++11中的std::atomic和std::mutex推荐文章：C++11多线程（std::thread）详解_c++11线程使用-CSDN博客c++标准库多线程-云山漫卷-博客园std::lock_guard是一个RAII风格的简单的锁管理器，它在构造时自动加锁，在析构时自动解锁。#include#include#include#includestd::mu
如何使用百度云Qianfan进行AI应用开发 dgay_hua 百度云人工智能云计算 python
技术背景介绍百度云Qianfan是由百度公司提供的云服务，包含了云存储、文件管理、资源共享、以及第三方集成等功能。作为开发者，Qianfan支持多种AI应用开发组件，包括大语言模型（LLMs）、对话模型、嵌入模型和向量存储等。本文将重点介绍如何利用这些组件进行实际的AI应用开发。核心原理解析百度云Qianfan通过其丰富的API接口和云计算能力，为开发者提供了易于集成的AI开发环境。核心组件如Qi
免费GIS工具箱：支持多种格式的模型预览及编辑，还能进行协同编辑 GISBox GISBox GIS 切片分发倾斜摄影 OBJ FBX OSGB
市面上不少GIS软件价格高昂，功能却不尽人意。但GISBox却不太一样，它的切片、分发功能完全免费，能预览、编辑多种格式模型，还支持协同编辑，性价比远超同类软件，如果你想进一步了解它，不妨看看这篇文章。01打破价格与功能的双重困境在地理信息系统（GIS）领域，大多数软件的高价一直是小型企业、科研团队以及个人开发者的一大阻碍。这些软件不仅采购成本高，后续的维护和升级费用也不低。与此同时，很多软件功能
OSGB编辑复杂又困难？试试这款免费GIS工具箱，高效实现场景编辑 GISBox GISBox vue.js webgl node.js edge 数据分析科技经验分享
在当今的地理信息科学（GIS）领域，数据的精确处理与直观展示无疑扮演着核心角色。无论是城市规划的精细布局、环境保护的科学决策，还是灾害预警的迅速响应，都离不开准确、实时的地理信息基石。然而，面对庞大的GIS数据，许多软件在处理、编辑和转换上都显得力不从心，尤其是对于倾斜摄影模型、地形和影像的编辑，更是成为了许多用户的棘手难题。1.GISBox简介GISBox作为一款免费的GIS工具箱，支持OSGB
Ollama 本地部署 FuWen_Hao ai
文章目录前言一、Ollama是什么？二、使用步骤1.安装OllamaWindows检验是否安装成功2.运行ollama模型库运行模型提问修改配置（可选）如果有个性化需求，需要修改默认配置：参考前言Ollama是一个易于使用的本地大模型运行框架，支持Mac、Windows和WSL2环境。文章介绍了如何在Widows上安装Ollama。一、Ollama是什么？Ollama是一个简明易用的本地大模型运行
jQuery 跨域访问的三种方式 No 'Access-Control-Allow-Origin' header is present on the reque qiaolevip 每天进步一点点学习永无止境跨域众观千象
XMLHttpRequest cannot load http://v.xxx.com. No 'Access-Control-Allow-Origin' header is present on the requested resource. Origin 'http://localhost:63342' is therefore not allowed access. test.html:1
mysql 分区查询优化 annan211 java 分区优化 mysql
分区查询优化引入分区可以给查询带来一定的优势，但同时也会引入一些bug. 分区最大的优点就是优化器可以根据分区函数来过滤掉一些分区，通过分区过滤可以让查询扫描更少的数据。所以，对于访问分区表来说，很重要的一点是要在where 条件中带入分区，让优化器过滤掉无需访问的分区。可以通过查看explain执行计划，是否携带 partitions
MYSQL存储过程中使用游标 chicony Mysql存储过程
DELIMITER $$ DROP PROCEDURE IF EXISTS getUserInfo $$ CREATE PROCEDURE getUserInfo(in date_day datetime)-- -- 实例-- 存储过程名为：getUserInfo-- 参数为：date_day日期格式:2008-03-08-- BEGINdecla
mysql 和 sqlite 区别 Array_06 sqlite
转载： http://www.cnblogs.com/ygm900/p/3460663.html mysql 和 sqlite 区别 SQLITE是单机数据库。功能简约，小型化，追求最大磁盘效率 MYSQL是完善的服务器数据库。功能全面，综合化，追求最大并发效率 MYSQL、Sybase、Oracle等这些都是试用于服务器数据量大功能多需要安装，例如网站访问量比较大的。而sq
pinyin4j使用 oloz pinyin4j
首先需要pinyin4j的jar包支持；jar包已上传至附件内方法一:把汉字转换为拼音；例如：编程转换后则为biancheng /** * 将汉字转换为全拼 * @param src 你的需要转换的汉字 * @param isUPPERCASE 是否转换为大写的拼音； true:转换为大写；fal
微博发送私信随意而生微博
在前面文章中说了如和获取登陆时候所需要的cookie，现在只要拿到最后登陆所需要的cookie，然后抓包分析一下微博私信发送界面 http://weibo.com/message/history?uid=****&name=**** 可以发现其发送提交的Post请求和其中的数据，让后用程序模拟发送POST请求中的数据，带着cookie发送到私信的接入口，就可以实现发私信的功能了。
jsp 香水浓 jsp
JSP初始化容器载入JSP文件后，它会在为请求提供任何服务前调用jspInit()方法。如果您需要执行自定义的JSP初始化任务，复写jspInit()方法就行了 JSP执行这一阶段描述了JSP生命周期中一切与请求相关的交互行为，直到被销毁。当JSP网页完成初始化后
在 Windows 上安装 SVN Subversion 服务端 AdyZhang SVN
在 Windows 上安装 SVN Subversion 服务端2009-09-16高宏伟哈尔滨市道里区通达街291号最佳阅读效果请访问原地址：http://blog.donews.com/dukejoe/archive/2009/09/16/1560917.aspx 现在的Subversion已经足够稳定，而且已经进入了它的黄金时段。我们看到大量的项目都在使
android开发中如何使用 alertDialog从listView中删除数据？ aijuans android
我现在使用listView展示了很多的配置信息，我现在想在点击其中一条的时候填出 alertDialog,点击确认后就删除该条数据，（ ArrayAdapter ，ArrayList，listView 全部删除），我知道在下面的onItemLongClick 方法中参数 arg2 是选中的序号，但是我不知道如何继续处理下去 1 2 3
jdk-6u26-linux-x64.bin 安装 baalwolf linux
1.上传安装文件(jdk-6u26-linux-x64.bin) 2.修改权限 [root@localhost ~]# ls -l /usr/local/jdk-6u26-linux-x64.bin 3.执行安装文件 [root@localhost ~]# cd /usr/local [root@localhost local]# ./jdk-6u26-linux-x64.bin&nbs
MongoDB经典面试题集锦 BigBird2012 mongodb
1.什么是NoSQL数据库？NoSQL和RDBMS有什么区别？在哪些情况下使用和不使用NoSQL数据库？ NoSQL是非关系型数据库，NoSQL = Not Only SQL。关系型数据库采用的结构化的数据，NoSQL采用的是键值对的方式存储数据。在处理非结构化/半结构化的大数据时；在水平方向上进行扩展时；随时应对动态增加的数据项时可以优先考虑使用NoSQL数据库。在考虑数据库的成熟
JavaScript异步编程Promise模式的6个特性 bijian1013 JavaScript Promise
Promise是一个非常有价值的构造器，能够帮助你避免使用镶套匿名方法，而使用更具有可读性的方式组装异步代码。这里我们将介绍6个最简单的特性。在我们开始正式介绍之前，我们想看看Javascript Promise的样子： var p = new Promise(function(r
[Zookeeper学习笔记之八]Zookeeper源代码分析之Zookeeper.ZKWatchManager bit1129 zookeeper
ClientWatchManager接口 //接口的唯一方法materialize用于确定那些Watcher需要被通知 //确定Watcher需要三方面的因素1.事件状态 2.事件类型 3.znode的path public interface ClientWatchManager { /** * Return a set of watchers that should
【Scala十五】Scala核心九：隐式转换之二 bit1129 scala
隐式转换存在的必要性，在Java Swing中，按钮点击事件的处理，转换为Scala的的写法如下： val button = new JButton button.addActionListener( new ActionListener { def actionPerformed(event: ActionEvent) {
Android JSON数据的解析与封装小Demo ronin47
转自：http://www.open-open.com/lib/view/open1420529336406.html package com.example.jsondemo; import org.json.JSONArray; import org.json.JSONException; import org.json.JSONObject; impor
[设计]字体创意设计方法谈 brotherlamp UI ui自学 ui视频 ui教程 ui资料
从古至今，文字在我们的生活中是必不可少的事物，我们不能想象没有文字的世界将会是怎样。在平面设计中，UI设计师在文字上所花的心思和功夫最多，因为文字能直观地表达UI设计师所的意念。在文字上的创造设计，直接反映出平面作品的主题。如设计一幅戴尔笔记本电脑的广告海报，假设海报上没有出现“戴尔”两个文字，即使放上所有戴尔笔记本电脑的图片都不能让人们得知这些电脑是什么品牌。只要写上“戴尔笔
单调队列-用一个长度为k的窗在整数数列上移动，求窗里面所包含的数的最大值 bylijinnan java 算法面试题
import java.util.LinkedList; /* 单调队列滑动窗口单调队列是这样的一个队列：队列里面的元素是有序的，是递增或者递减题目：给定一个长度为N的整数数列a(i),i=0,1,...,N-1和窗长度k. 要求：f(i) = max{a(i-k+1),a(i-k+2),..., a(i)},i = 0,1,...,N-1 问题的另一种描述就
struts2处理一个form多个submit chiangfai struts2
web应用中，为完成不同工作，一个jsp的form标签可能有多个submit。如下代码： <s:form action="submit" method="post" namespace="/my"> <s:textfield name="msg" label="叙述：">
shell查找上个月，陷阱及野路子 chenchao051 shell
date -d "-1 month" +%F 以上这段代码，假如在2012/10/31执行，结果并不会出现你预计的9月份，而是会出现八月份，原因是10月份有31天，9月份30天，所以-1 month在10月份看来要减去31天，所以直接到了8月31日这天，这不靠谱。野路子解决：假设当天日期大于15号
mysql导出数据中文乱码问题 daizj mysql 中文乱码导数据
解决mysql导入导出数据乱码问题方法：１、进入mysql，通过如下命令查看数据库编码方式： mysql> show variables like 'character_set_%'; +--------------------------+----------------------------------------+ | Variable_name&nbs
SAE部署Smarty出现：Uncaught exception 'SmartyException' with message 'unable to write dcj3sjt126com PHP smarty sae
对于SAE出现的问题：Uncaught exception 'SmartyException' with message 'unable to write file...。官方给出了详细的FAQ：http://sae.sina.com.cn/?m=faqs&catId=11#show_213 解决方案为： 01 $path
《教父》系列台词 dcj3sjt126com
Your love is also your weak point. 你的所爱同时也是你的弱点。 If anything in this life is certain, if history has taught us anything, it is that you can kill anyone. 不顾家的人永远不可能成为一个真正的男人。 &
mongodb安装与使用 dyy_gusi mongo
一.MongoDB安装和启动,widndows和linux基本相同 1.下载数据库, linux:mongodb-linux-x86_64-ubuntu1404-3.0.3.tgz 2.解压文件,并且放置到合适的位置 tar -vxf mongodb-linux-x86_64-ubun
Git排除目录 geeksun git
在Git的版本控制中，可能有些文件是不需要加入控制的，那我们在提交代码时就需要忽略这些文件，下面讲讲应该怎么给Git配置一些忽略规则。有三种方法可以忽略掉这些文件，这三种方法都能达到目的，只不过适用情景不一样。 1. 针对单一工程排除文件这种方式会让这个工程的所有修改者在克隆代码的同时，也能克隆到过滤规则，而不用自己再写一份，这就能保证所有修改者应用的都是同一
Ubuntu 创建开机自启动脚本的方法 hongtoushizi ubuntu
转载自： http://rongjih.blog.163.com/blog/static/33574461201111504843245/ Ubuntu 创建开机自启动脚本的步骤如下： 1) 将你的启动脚本复制到 /etc/init.d目录下以下假设你的脚本文件名为 test。 2) 设置脚本文件的权限 $ sudo chmod 755
第八章流量复制/AB测试/协程 jinnianshilongnian nginx lua coroutine
流量复制在实际开发中经常涉及到项目的升级，而该升级不能简单的上线就完事了，需要验证该升级是否兼容老的上线，因此可能需要并行运行两个项目一段时间进行数据比对和校验，待没问题后再进行上线。这其实就需要进行流量复制，把流量复制到其他服务器上，一种方式是使用如tcpcopy引流；另外我们还可以使用nginx的HttpLuaModule模块中的ngx.location.capture_multi进行并发
电商系统商品表设计 lkl
DROP TABLE IF EXISTS `category`; -- 类目表 /*!40101 SET @saved_cs_client = @@character_set_client */; /*!40101 SET character_set_client = utf8 */; CREATE TABLE `category` ( `id` int(11) NOT NUL
修改phpMyAdmin导入SQL文件的大小限制 pda158 sql mysql
　用phpMyAdmin导入mysql数据库时，我的10M的数据库不能导入，提示mysql数据库最大只能导入2M。　　 phpMyAdmin数据库导入出错：　　You probably tried to upload too large file. Please refer to documentation for ways to workaround this limit.
Tomcat性能调优方案 Sobfist apache jvm tomcat 应用服务器
一、操作系统调优对于操作系统优化来说，是尽可能的增大可使用的内存容量、提高CPU的频率，保证文件系统的读写速率等。经过压力测试验证，在并发连接很多的情况下，CPU的处理能力越强，系统运行速度越快。。【适用场景】任何项目。二、Java虚拟机调优应该选择SUN的JVM，在满足项目需要的前提下，尽量选用版本较高的JVM，一般来说高版本产品在速度和效率上比低版本会有改进。 J
SQLServer学习笔记 vipbooks 数据结构 xml
1、create database school 创建数据库school 2、drop database school 删除数据库school 3、use school 连接到school数据库，使其成为当前数据库 4、create table class(classID int primary key identity not null) 创建一个名为class的表，其有一

HMM隐马尔可夫模型详解

关于什么是隐马尔可夫模型我想你看到的解释应该是酱紫的：

或者是这样子的：

一、什么是隐马尔可夫模型

二、隐马尔可夫模型要解决的问题

三、问题解决

1.概率计算问题：

2.学习问题：

3.预测问题：

你可能感兴趣的:(HMM隐马尔可夫模型详解)