小一的学习笔记

《两日算法系列》之第四篇：隐马尔可夫模型HMM

另外，通过长期的观察总结，韩梅梅发现李雷雷会根据当天的天气情况，决定进行什么样的活动。比如：今天是阴天的话，李雷雷很有可能会选择一个人去打球；而如果今天是雨天的话，李雷雷很有可能选择在家看书；而如果是晴天的话，那就看情况而定了。

基于上面的种种条件，韩梅梅构建了一个隐马尔科夫模型，在只通过李雷雷每天朋友圈的活动猜测他所在城市的天气情况。

ok，上面的就是一个隐马尔可夫模型HMM，HMM的英文全称是Hidden Markov Model。上面的例子用HMM专业术语描述如下：

HMM的基本定义：HMM是用于描述隐藏的状态序列和显性的观测序列组合而成的双重随机过程。 在前面的例子中，李雷雷所在城市的天气是隐藏的状态序列，这个序列我们是观测不到的；而李雷雷每天的活动是观测序列，这个序列我们可以观测到。这两个序列都是随机序列。

HMM的假设一：马尔科夫性假设。当前时刻的状态值，仅依赖于前一时刻的状态值，和其他时刻的状态值无关。 每天的天气情况，会和前一天的天气有关系

HMM的假设二：齐次性假设。状态转移矩阵与时间无关。即所有时刻共享一个状态转移矩阵。 李雷雷所在城市的天气一年四季都是三种之一。

HMM的假设三：观测独立性假设。当前时刻的观察值，仅依赖于当前时刻的状态值。 李雷雷会根据当天的天气情况，决定今天进行什么样的活动。

HMM的应用目的：通过可观测到的数据，预测不可观测到的数据。 韩梅梅想通过李雷雷每天的活动，猜测他所在城市的天气情况。

2. 相关概念的表示

隐马尔可夫模型由初始概率分布、状态转移概率分布以及观测概率分布确定，其中，隐马尔可夫模型的形式定义如下：

（1）Q是所有可能的状态的集合
$\lbrace q_1,q_2,...,q_N\rbrace$
其中，N表示有N种状态值。例如天气的状态值集合为{晴天，阴天，雨天}

（2） V是所有的观测值集合
$\lbrace v_1,v_2,...,v_M \rbrace$
其中，M表示可能的观测数。例如李雷雷的观测值集合为{看书，打球}。

（3）I是长度为T的状态值序列
$\lbrace i_1,i_2,...,i_T \rbrace$
状态值序列表示每天的城市天气状态值构成的序列。例如{晴，晴，阴}

（4）O是I对应的观测序列
$\lbrace o_1,o_2,...,o_T \rbrace$
观测序列表示每天的城市天气状态值对应的李雷雷活动状态构成的序列。例如{看书，看书，打球}

（5）A是状态转移概率矩阵
$A =[a_{ij}]_{N * N}$
其中：
$a_{tj} = P(i_{t+1} = q_j | i_t=q_i), \ \ \ \ i=1,2,...,N;\ \ \ j=1,2,...,N$
指的是在时刻t处于状态 $q_i$ 的条件下在时刻t+1转移到状态 $q_j$ 的概率。例如今天是晴天，那么明天可能会是{晴天，阴天，雨天}中的一种，其中明天会有a1的概率是晴天，a2的概率是阴天，a3的概率是雨天，对应此时的a就是一个状态转移矩阵。

（6）B是观测概率矩阵
$B =[b_j(k)]_{N * M}$
其中：
$b_j(k) = P(o_t=v_k | i_t=q_j), \ \ \ \ k=1,2,...,M;\ \ \ j=1,2,...,N$
指的是在时刻t处于状态 $q_j$ 的条件下生成观测 $v_k$ 的概率。例如今天是阴天，那么李雷雷的活动就会是{看书，打球}中的一种，其中会有b1的概率去看书，b2的概率去打球，对应此时的b就是观测概率矩阵。

（7）初始状态概率向量
$\pi = (\pi_i)$
其中
$\pi_i = P(i_1=q_i), \ \ \ \ i=1,2,...,N$
是时刻t=1处于状态 $q_i$ 的概率。

ok，上述的后三个定义你可能看的似懂非懂，相信看了下面这个例子你应该秒懂：

状态转移概率矩阵A：

表示在时刻t处于状态 $q_i$ 的条件下在时刻t+1转移到状态 $q_j$ 的概率

	晴天	阴天	雨天
晴天	0.5	0.2	0.3
阴天	0.3	0.5	0.2
雨天	0.2	0.3	0.5

观测概率矩阵B：

表示在时刻t处于状态 $q_j$ 的条件下生成观测 $v_k$ 的概率

	看书	打球
晴天	0.5	0.5
阴天	0.4	0.6
雨天	0.7	0.3

初始概率状态向量π：

表示在初始时刻状态 $q_i$ 的概率

天气	初始概率
晴天	0.2
阴天	0.4
雨天	0.4

3. 三个基本问题

在学习HMM的过程中，需要研究三个问题，分别是：

概率计算问题： 给定模型参数和观测序列，计算该观测序列的概率。

学习训练问题： 给定观测序列，估计模型参数

解码预测问题： 给定模型参数和观测序列，求概率最大的状态序列

3.1. 概率计算问题

给定模型参数 $\lambda=(A,B,\pi)$ 和观测序列 $O=(o_1,o_2,\dots,o_T)$ ，计算观测序列O出现的概率 $P(O,I|\lambda)$ 。

3.1.1. 暴力求解

思路：

列举所有可能的长度为T的状态序列 $I$
求各个状态序列 $I$ 与观测序列的联合概率 $P(O,I|\lambda)$
所有可能的状态序列求和 $\sum_iP(O,I|\lambda)$

步骤：

目标是求 $O$ 与 $I$ 同时出现概率 $P(O,I|\lambda)=P(O|I,\lambda)\cdot P(I|\lambda)$
求解 $P(I|\lambda)$

其中 $P(i_1|\lambda)$ 是初始概率 $\pi_{i_1}$ ， $P(i_2|i_1,\lambda)$ 是从状态 $i 1$ 转换到 $i 2$ 的概率

求解 $P(O|I,\lambda)$

这个的意思是在固定的状态序列 $I$ ，求观测序列 $O$ 的概率

$P(O|I,\lambda) = b_{i_1}(o_1)b_{i_2}(o_2)\cdots b_{i_T}(o_T)$
将②和③代入①中求出 $\lambda)$
进行概率求和

带入计算之后，发现计算量是特别大的，大概是 $O(TN^T)$ 阶，可行是而可行，但是因为巨大的计算量，并不值得推广。

相应的，可以通过以下两种方式较少计算量，从而求出观测序列出现的概率

3.1.2. 前向算法

暴力求解是直接计算隐状态，相当于一传十十传百的效果

前向算法在一传十之后会重新计算，也就是计算前一项的概率分布当作当前节点的观测概率，然后继续下一步，所以前向算法的计算量为 $O(TN^2)$ ，远少于直接计算法。

先来看一下前向算法的计算：

同样的，给定模型参数 $\lambda=(A,B,\pi)$ 和观测序列 $O=(o_1,o_2,\dots,o_T)$ ，计算观测序列O出现的概率 $P(O,I|\lambda)$ 。

这里需要引入一个定义：

给定隐马尔可夫模型 $\lambda$ ，定义到时刻t部分观测序列为 $o_1,o_2,...,o_t$ 且状态为 $q_i$ 的概率为前向概率，记作：
$\alpha_t(i) = P(o_1,o_2,...,o_t, i_t=q_i|\lambda)$
基于观测节点的计算公式，我们知道①通过当前观测节点的概率与状态转移矩的乘积算出下一个状态节点的概率，②通过下一个状态节点的概率与观测概率矩阵的乘积算出下一个观测节点的概率。

在前向算法中，不同的是通过计算当前时刻前向概率与下一时刻观测序列的联合概率，再通过联合概率与观测概率的乘积计算下一个前向概率

写成公式是这样的：

①初值
$\alpha_1(i) = \pi_ib_i(o_1), \ \ i=1,2,...,N$
②递推，对t=1,2,…,T-1,
$\alpha_{t+1}(i) = \begin{bmatrix}\sum_{j=1}^N \alpha_t(j)a_{ji}\end{bmatrix} b_i(o_{t+1}), \ \ i=1,2,...,N$
③终止
$P(O|\lambda) = \sum_{j=1}^N \alpha_T(i)$
前向算法主要考虑前一个状态节点的概率（可想象成初始节点的概率），到达当前状态节点的转移概率（转移矩阵），当前状态节点和观测节点之间的关系（观测概率矩阵），将观测的各种可能路径综合起来（求和）当做当前观测节点的概率，依次类推，一步步走到终点。

3.1.3. 后向算法

同前向算法，在后向算法中定义了后向概率：

给定隐马尔可夫模型 $\lambda$ ，定义到时刻t状态为 $q_i$ 的条件下，从+1到T的部分观测序列为 $o_{t+1},o_{t+2},...,o_T$ 且状态为 $q_i$ 的概率为后向概率，记作：
$\beta_t(i) = P(o_{t+1},o_{t+2},...,o_T, i_t=q_i|\lambda)$
用递推的方法求得后向概率 $\beta_t(i)$ 及观测序列概率P(O|λ)

前向算法是从前往后，后向算法是从后往前，一句话总计一下：

前向算法：现在这样，要得到result，往后能怎么走？（求果）

后向算法：现在这样的result，是当初怎么走造成的？（追因）

例如，在给定模型下，观测为O = ( 红，白，红 ) 的概率（其他参数在此省略）

前向算法是先计算第一个红球的概率（从1，2，3号盒子中取出），然后在此基础上计算第二个白球的概率（同样是1，2，3号盒子中取出），最后是第三个红球的概率

后向算法是先计算第三个红球的概率（从1，2，3号盒子中取出），然后在此基础上计算第二个白球的概率（同样是1，2，3号盒子中取出），最后是第一个红球的概率。

3.2. 学习问题

给定观测序列 $O=(o_1,o_2,\dots,o_T)$ ，估计模型参数 $\lambda=(A,B,\pi)$

这个问题，有点类似前面说到的EM算法求解，同样是知道最终结果，求模型最有可能的参数。

那么根据EM算法的求解步骤，我们可以这样去解决学习问题：

①确定完全数据的对数似然函数
②EM算法的E步：求Q函数
③EM算法的M步：极大化Q函数，求模型参数A,B,π

具体步骤可以参考EM算法：《两日算法系列》之第三篇：EM聚类

3.3. 预测问题

给定模型参数 $\lambda=(A,B,\pi)$ 和观测序列 $O=(o_1,o_2,\dots,o_T)$ ，求概率最大的状态序列 $\lbrace i_1,i_2,...,i_T \rbrace$

**3.3.1. 近似算法 **

近似算法的思想是，在每个时刻t选择在该时刻最有可能出现的状态 $i_t$ ，从而选择得到一个状态序列 $I$ ，将它作为预测的结果。

给定隐马尔可夫模型λ和观测序列O，在时刻t处于状态 $q_i$ 的概率 $\gamma_t(i)$ 是：
$\gamma_t(i) = \frac{\alpha_t(i)\beta_t(i)}{P(O|\lambda)} = \frac{\alpha_t(i)\beta_t(i)}{\sum_{j=1}^N\alpha_t(j)\beta_t(j)}$
近似算法的原理有点类似于贪心算法，在每一步中选择最有可能出现的状态序列，所以会导致最终预测的状态序列并不一定是最优。

3.3.2. 维特比算法

相比起贪心算法的局部最优，动态规划可以实现全局最优解，而维特比算法正是基于动态规划思想的。我们先从最开始的例子来了解维特比算法

现在已知的模型参数有初始概率状态向量π，状态转移矩阵A，观测概率矩阵B，已知李雷雷在3天的活动序列为：{看书、打球、看书}，求最有可能的天气序列情况，模型参数分别如下：

初始概率状态向量π：

表示在初始时刻状态 $q_i$ 的概率

天气	初始概率
晴天	0.2
阴天	0.4
雨天	0.4

状态转移概率矩阵A：

表示在时刻t处于状态 $q_i$ 的条件下在时刻t+1转移到状态 $q_j$ 的概率

	晴天	阴天	雨天
晴天	0.5	0.2	0.3
阴天	0.3	0.5	0.2
雨天	0.2	0.3	0.5

观测概率矩阵B：

表示在时刻t处于状态 $q_j$ 的条件下生成观测 $v_k$ 的概率

	看书	打球
晴天	0.5	0.5
阴天	0.4	0.6
雨天	0.7	0.3

维特比算法预测过程如下：

步骤①：根据模型参数，计算第一天天气的概率分布

$P (D 1, 晴天, 看书) = P (D 1, 晴天) * P (看书 ∣ D 1, 晴天) = 0.2 * 0.5 = 0.1$

$P (D 1, 阴天, 看书) = P (D 1, 阴天) * P (看书 ∣ D 1, 阴天) = 0.4 * 0.4 = 0.16$

$P (D 1, 雨天, 看书) = P (D 1, 雨天) * P (看书 ∣ D 1, 雨天) = 0.4 * 0.7 = 0.28$

此时我们需要保存三个序列：

最后时刻为晴天的最大概率序列：[晴天：0.1]
最后时刻为阴天的最大概率序列：[阴天：0.16]
最后时刻为雨天的最大概率序列：[雨天：0.28]

步骤②：根据步骤①的三个序列，模型参数A和B，计算第二天天气的概率分布
$\begin{cases} P(D1, 晴天) * P(D2, 晴天 | D1, 晴天) * P(打球 | D2,晴天) \\ P(D1, 阴天) * P(D2, 晴天 | D1, 阴天) * P(打球 | D2,晴天) \\ P(D1, 雨天) * P(D2, 晴天 | D1, 雨天) * P(打球 | D2,晴天) \end{cases}$
代入数据可得：

$P (D 2, 晴天, 打球) = m a x (0.1 * 0.5 * 0.5, 0.16 * 0.3 * 0.5, 0.28 * 0.2 * 0.5) = m a x (0.025, 0.024, 0.028) = 0.028$

同理，第二天是阴天和雨天的最大概率分别是：

$P (D 2, 阴天, 打球) = m a x (0.1 * 0.2 * 0.6 ， 0.16 * 0.5 * 0.6 ， 0.28 * 0.3 * 0.6) = m a x (0.012 ， 0.048 ， 0.0504) = 0.0504$

$P (D 2, 雨天, 打球) = m a x (0.1 * 0.3 * 0.3 ， 0.16 * 0.3 * 0.3 ， 0.28 * 0.5 * 0.3) = m a x (0.009 ， 0.0096 ， 0.042) = 0.042$

此时我们需要保存的三个序列更新为：

最后时刻为晴天的最大概率序列： [雨天，晴天：0.028]
最后时刻为阴天的最大概率序列： [雨天，阴天：0.0504]
最后时刻为雨天的最大概率序列： [雨天，雨天：0.042]

步骤③：根据步骤②的三个序列，模型参数A和B，计算第三天天气的概率分布
$\begin{cases} P(D2, 晴天) * P(D3, 晴天 | D2, 晴天) * P(看书 | D3,晴天) \\ P(D2, 阴天) * P(D3, 晴天 | D2, 阴天) * P(看书 | D3,晴天) \\ P(D2, 雨天) * P(D3, 晴天 | D2, 雨天) * P(看书 | D3,晴天) \end{cases}$
代入数据可得：

$P (D 3, 晴天, 看书) = m a x (0.028 * 0.5 * 0.5 ， 0.0504 * 0.3 * 0.5 ， 0.042 * 0.2 * 0.5) = m a x (0.007 ， 0.00756 ， 0.0042) = 0.00756$

同理，第三天是阴天和雨天的最大概率分别是：

$P (D 3, 阴天, 看书) = m a x (0.0028 * 0.2 * 0.4 ， 0.0504 * 0.5 * 0.4 ， 0.042 * 0.3 * 0.4) = m a x (0.00224 ， 0.01008 ， 0.00504) = 0.01008$

$P (D 3, 雨天, 看书) = m a x (0.028 * 0.3 * 0.7 ， 0.0504 * 0.2 * 0.7 ， 0.042 * 0.5 * 0.7) = m a x (0.00588 ， 0.007056 ， 0.0147) = 0.0147$

步骤④：对比步骤③的三个序列，选出概率最大的状态序列

很明显的能看到，在[0.00756, 0.01008, 0.0147]中概率最大的是0.0147，对应的状态序列为[雨天，雨天，雨天]

所以，李雷雷在3天的活动序列为：{看书、打球、看书}，最有可能的天气序列为{雨天，雨天，雨天}

ok，总结一下维特比算法的思路：

①若状态值集合有N个取值，则需维护N个状态序列，以及N个状态序列对应的概率。且每个状态序列存储的是：序列最后一个时刻取值为特定状态（共N个状态）时，概率最大的状态序列

在上面的例子中，我们维护的是晴天、阴天、雨天三个状态序列，以及它们对应的概率

②从第一个时刻开始，根据状态子序列和模型参数，计算和更新N个状态序列及其概率值

在上面的例子中，对于当前时刻的晴天、阴天、雨天3个状态值，分别拼接上一时刻的状态序列和当前状态序列。例如D2晴天分别拼接D1状态序列得到：[晴天]+[晴天]，[阴天]+[晴天]，[雨天]+[晴天]三个新的状态序列

通过计算新状态序列的最大概率，确定最大概率对应的新状态序列为当前最有可能的状态序列，丢弃其他的新状态序列。

依次往后。

③一直迭代到最后一个时刻，对比所有状态序列的概率值，概率值最大的状态序列即为最大状态概率序列

总结

HMM的内容还是蛮多的，而且还不太好理解，所以在看算法的时候还是要和例子多结合，这样会容易些。

列了一下HMM的思维导图，希望对大家有用。

Python scikit-learn 【机器学习库】全面讲解
让AI成为我们的得力助手：《用Cursor玩转AI辅助编程——不写代码也能做软件开发》scikit-learn（简称sklearn）是Python最流行的机器学习库之一，提供简单高效的数据挖掘和数据分析工具。它基于NumPy、SciPy和Matplotlib构建，广泛应用于工业界和学术界。核心优势统一API设计：所有模型使用一致的接口（fit()、predict()、score()）丰富的算法：覆
Nystromformer：一种基于 Nyström 方法的自注意力近似算法 AI专题精讲 Paper阅读人工智能自然语言处理 AI
1.摘要Transformer已经成为广泛自然语言处理任务中的强大工具。推动Transformer展现出卓越性能的一个关键组件是self-attention机制，它对每个token编码了其他token的影响或依赖关系。虽然self-attention机制具有诸多优势，但其在输入序列长度上的二次复杂度限制了其在较长序列上的应用——这是当前社区积极研究的一个主题。为了解决这一限制，我们提出了Nystr
PHP接单涨薪系列（八）之AI内容工厂：用PHP批量生成SEO文章系统（2025接单秘籍）攻城狮凌霄 PHP PHP接单涨薪 AI 人工智能 php android
某SEO团队采用本方案后，内容产出效率提升10倍，网站流量3个月增长300%，单月通过内容外包获利超¥50,000。本文将揭秘如何用PHP+AI打造全自动SEO内容工厂，让你成为搜索引擎优化领域的抢手人才！一、SEO市场新机遇：AI内容生成的红利期1.12025年SEO行业巨变搜索引擎算法升级2025核心变革SGE体验优化EEAT权重提升多模态内容整合2025年SEO关键数据：指标20232025
Oracle数据库中JOIN连接查询的高效应用与性能优化教程 caifox菜狐狸 Oracle相关知识笔记 Oracle PL/SQL 编程入门数据库 oracle JOIN LEFT JOIN FULL JOIN INNER JOIN 连接查询
在Oracle数据库的日常使用中，JOIN连接查询是实现多表数据关联查询的核心手段。无论是企业级的数据分析，还是日常的业务报表生成，JOIN操作都扮演着不可或缺的角色。然而，JOIN查询的性能优化一直是数据库开发和运维人员面临的挑战。一个低效的JOIN查询可能会导致查询响应时间过长，甚至拖垮整个数据库系统的性能。因此，掌握JOIN连接查询的高效应用技巧和性能优化方法，对于提升数据库的整体性能和用户
协同过滤算法：挖掘用户偏好，精准推荐商品 AI大模型应用实战 java python javascript kotlin golang 架构人工智能
1.背景介绍协同过滤（CollaborativeFiltering，CF）作为推荐系统中的重要技术，其核心思想是利用用户和物品间的行为数据，挖掘用户隐性偏好，从而实现精准推荐。自20世纪90年代提出以来，协同过滤算法已经在电子商务、社交媒体、音乐视频等多个领域中广泛应用，取得了显著的推荐效果。协同过滤算法主要分为基于用户的协同过滤和基于物品的协同过滤两种。基于用户的协同过滤通过比较用户间的相似性，
历史数据分析——中证医药人大博士的交易之路大数据数据挖掘数学建模程序员创富缠中说禅道琼斯结构
中证医药简介代码：000933成分来源：在沪深300指数成分股中筛选的医药卫生行业股票，聚焦医药核心资产行业分布：覆盖化学制药、生物科技、医疗器械、医疗服务Top10权重股（2025Q2）：恒瑞医药(12%)迈瑞医疗(11%)药明康德(10%)爱尔眼科(7%)百济神州(6%)片仔癀(5%)长春高新(4%)智飞生物(4%)凯莱英(4%)云南白药(3%)中证医药值得关注的原因：1.在中国人口老龄化即将
SQL注入与防御-第四章-6：窃取哈希口令在安全厂商修设备 SQL注入与防御 sql 网络安全 web安全
SQL注入利用——窃取哈希口令一、核心逻辑：哈希口令的价值与窃取路径数据库中，用户口令通常以哈希形式存储（防明文泄露）。攻击者通过SQL注入窃取哈希后，可：暴力破解：用工具（如JohntheRipper）枚举原始口令。横向渗透：利用“用户reused口令”（同一口令用于多系统）入侵其他设备。不同数据库的哈希存储位置、算法差异极大，需针对性分析。二、SQLServer：哈希存储与窃取（分版本）（一）
真题训练1-算法思维训练不懂的浪漫数据结构与算法算法题
真题训练1-算法思维训练文章目录真题训练1-算法思维训练前言项目环境例题1：斐波那契数列例题2：判断一个数组中是否存在某个数参考前言第十四章《通用解题的方法论》我们讨论了解题的方法论，宏观上可以分为以下4个步骤：复杂度分析，估算问题中的复杂度的上限和下限。定位问题，根据问题类型，确定采用何种算法思维。数据操作分析，根据增、删、查和数据顺序关系选择合适的数据结构，利用空间换时间的思想。编码实现。本章
供应链管理：MES制造执行系统与APS高级排程系统解析快雪时晴-初晴融雪供应链管理供应链管理
一、MES制造执行系统与APS高级排程系统解析维度MES制造执行系统APS高级排程系统定义制造执行系统，用于管理和监控制造过程，实现生产过程的实时监控、数据采集、质量管理、工艺执行等功能。高级计划与排程系统，通过优化算法和模型，在有限资源条件下制定最优生产计划，提高生产效率和灵活性。核心功能-生产计划与调度：细化ERP计划为可执行工单，动态调整生产进度。-生产过程管理：记录工序执行情况，实时监控异
供应链风险管理：AI预测潜在风险 AI智能应用 AI大模型应用入门实战与进阶 java python javascript kotlin golang 架构人工智能
供应链风险管理,AI预测,机器学习,深度学习,自然语言处理,风险评估,供应链可视化1.背景介绍在当今全球化经济体系中，供应链的复杂性和脆弱性日益凸显。供应链风险是指任何可能对供应链正常运行造成负面影响的事件或因素。这些风险可能来自自然灾害、政治动荡、经济波动、技术故障、供应商违约等方面。一旦供应链风险爆发，可能会导致生产中断、产品短缺、成本飙升、品牌形象受损等严重后果。传统供应链风险管理方法主要依
供应链风险管理：AI如何预测供应链风险 AI大模型应用之禅 java python javascript kotlin golang 架构人工智能
供应链风险管理,AI预测,机器学习,深度学习,自然语言处理,时间序列分析,风险评估1.背景介绍在当今全球化经济体系中，供应链风险已成为企业面临的重大挑战。供应链的复杂性和不可预测性使得企业更容易受到各种风险的影响，例如自然灾害、政治动荡、经济波动、疫情爆发等。这些风险可能导致供应中断、成本增加、交付延迟，甚至损害企业声誉。传统供应链风险管理方法主要依赖于经验和专家判断，缺乏数据驱动和预测能力。随着
【极光优化算法+分解对比】VMD-PLO-Transformer-LSTM多变量时间序列光伏功率预测Matlab代码 matlab科研助手算法 transformer lstm
✅作者简介：热爱数据处理、建模、算法设计的Matlab仿真开发者。更多Matlab代码及仿真咨询内容点击：Matlab科研工作室个人信条：格物致知。内容介绍光伏发电作为一种清洁能源，其功率预测对于电网稳定运行和电力系统调度至关重要。然而，光伏功率具有高度的非线性和波动性，传统的预测方法难以准确捕捉其动态特性。近年来，深度学习技术在时间序列预测领域取得了显著进展，为提高光伏功率预测精度提供了新的途径
【MySQL基础】MVCC多版本并发控制 scj1022 MySQL mysql
文章目录MVCC-多版本并发控制一、MVCC概述1、三种并发场景2、当前读&快照读3、MVCC的作用4、结合MVCC处理并发问题二、MVCC实现原理1、隐式字段2、回滚日志UndoLog3、一致性视图ReadView1）什么时候生成？2）可见性判断3）可见性算法（属性）4）可见性算法（实现）5）可见性算法（小结）4、举例说明（版本链）三、MVCC与可重复读RR1、事务的启动时机2、事务A读取流程3
【算法训练营Day07】字符串part1
文章目录反转字符串反转字符串II替换数字反转字符串题目链接：344.反转字符串双指针法，两个指针的元素直接调转即可classSolution{publicvoidreverseString(char[]s){inthead=0;intend=s.length-1;while(head=k){reverseString(charArray,head,head+k-1);}else{reverseSt
对称加密及AES加密算法一只牛_007 安全加密解密非对称
目录一、对称加密 1、什么是对称加密？ 2、对称加密的工作过程 3、对称加密的优点 4、对称加密的两大不足二、AES加密算法 1、什么是AES加密算法及AES加密算法的形成过程 2、AES的加密流程（要理解AES的加密流程，会涉及到AES的五个关键词：分组密码体制、Padding、初始向量IV、密钥、四种加密模式） 3、AES的加密原理（要理解AES的加密原理，会涉及到AES的四个关键词：密钥扩展
[代码随想录算法训练营 Day09 字符串 Part2] yancyss 算法 python 开发语言
Day09文章目录Day09字符串6.实现strStr（力扣28）7.重复的子字符串（力扣459）字符串今天两道KMP：KMP功能，在一个字符串中找到是否出现另一个字符串本篇会再更新~6.实现strStr（力扣28）题目描述：找出字符串中第一个匹配项的下标heystack干草堆，needle针，大海捞针~思路：KMP算法B站一个讲的很好的视频整体思路：假设有主串n和模式串m，在暴力算法当中，每当主
DAY08 算法训练营| 字符串part01 天空的孩子算法
344.反转字符串-力扣（LeetCode）字符串和数组算法题目思路类似反转字符串是经典双指针法（回忆反转链表，有序数组的平方，三数之和，四数之和）classSolution{public:voidreverseString(vector&s){len=s.length();for(inti=0,j=s.size()-1;iusingnamespacestd;intmain(){strings;/
寻路算法作品集勤奋的大熊猫 Python学习之路 Python 寻路算法
寻路算法作品集正文初始点与结尾点均具有方向性的自动寻路算法（不包含限制点）正文初始点与结尾点均具有方向性的自动寻路算法（不包含限制点）如果大家觉得有用，就点个赞让更多的人看到吧~
2024大模型秋招LLM相关面试题整理 AGI大模型资料分享官人工智能深度学习机器学习自然语言处理语言模型 easyui
0一些基础术语大模型：一般指1亿以上参数的模型，但是这个标准一直在升级，目前万亿参数以上的模型也有了。大语言模型（LargeLanguageModel，LLM）是针对语言的大模型。175B、60B、540B等：这些一般指参数的个数，B是Billion/十亿的意思，175B是1750亿参数，这是ChatGPT大约的参数规模。强化学习：（ReinforcementLearning）一种机器学习的方法，
Python pip：包的云计算部署
Pythonpip：包的云计算部署关键词：Pythonpip、云计算部署、包管理、虚拟环境、云平台摘要：本文围绕Pythonpip进行包的云计算部署展开深入探讨。首先介绍了Pythonpip在包管理中的重要性以及云计算部署的背景和意义。接着详细阐述了pip的核心概念和工作原理，包括其与Python生态系统的紧密联系。通过具体的Python代码示例，讲解了pip包管理的核心算法原理和操作步骤。同时，
余数定理问题和余数类问题的解法 wangychf python 抽象代数
一、引言Python里面有一个重要的求模运算符号“％”，作为一个小白，实验了好多次求模的运算，发现这个算法不同于一般的四则运算，其运算效率简直可以用神奇来形容。例如以当今知道的最大质数——梅森素数为例，进行求模计算，速度快得惊人。当前知道的最大的梅森素数是第51个梅森素数，也是迄今为止知道的最大的素数。它的表示为：2^82589933–1,如果用十进制打开，这个数有24862048位，是2018年
【python实用小脚本-127】基于 Python 的 Google 图片爬取工具：实现高效图片数据收集 Kyln.Wu Python python 开发语言
引言在数据科学、机器学习和多媒体应用中，图片数据的收集是一个常见且重要的任务。Google图片是一个丰富的图片资源库，能够为各种项目提供大量的图片数据。本文将介绍一个基于Python的Google图片爬取工具，它能够自动化地从Google图片搜索结果中下载图片。该工具主要利用了Python的selenium、BeautifulSoup、urllib和argparse库，结合了网页自动化和数据解析技
用Python解锁图像处理之力：从基础到智能应用的深度探索熊猫钓鱼>_> python 图像处理开发语言
在像素构成的数字世界里，Python已成为解码图像奥秘的核心引擎。一、为何选择Python处理图像？超越工具的本质思考当人们谈论图像处理时，往往会陷入工具对比的漩涡（PythonvsMATLABvsC++）。但Python的真正价值在于其构建的完整生态闭环：科学计算基石：NumPy的ndarray结构完美对应图像的多维矩阵本质算法实现自由：从传统算子到深度学习模型的无缝衔接可视化即战力：Matpl
微算法科技（NASDAQ MLGO）开发基于量子搜索算法的多方量子密钥协议
随着量子信息技术的快速发展，传统加密技术面临量子计算带来的破解威胁。密码技术是网络安全的基石，而量子信息安全则使用基于量子物理和数据算法的密码技术，嵌套在网络的不同环节，提供额外的安全层。量子密钥分发（QKD）作为量子信息安全的核心技术之一，正在逐步走向实际应用。微算法科技（NASDAQMLGO）开发基于量子搜索算法的多方量子密钥协议，旨在提升信息安全水平。基于量子搜索算法的多方量子密钥协议是一种
【Python爬虫进阶】从网页抓取到数据清洗与存储——完整实战教程 Python爬虫项目 python 爬虫开发语言 javascript 自然语言处理 selenium
1.为什么网页抓取后需要数据清洗？在实际项目中，抓取的原始数据往往是杂乱的、不完整的、格式各异的。如果不清洗，直接用来建模、分析，会导致：脏数据干扰（如乱码、重复数据）异常值影响结果（如薪资异常高）格式不统一（比如地点有中文名和英文名混杂）所以，抓取数据后，必须进行系统清洗与标准化，才能用于后续的：数据分析可视化展示机器学习建模2.项目概览：从抓取到存储的完整流程本项目流程如下：确定抓取目标（某招
构建“城市生活指数”爬虫系统：抓取物价、租金、工资等数据并可视化实战程序员威哥生活爬虫 python 开发语言 selenium beautifulsoup
一、项目背景“城市生活指数”是一种综合反映城市居民生活成本和经济水平的指标。通过抓取不同网站上的物价、租金、工资等数据，结合数据分析和可视化，可以帮助用户直观比较各城市生活压力和经济实力，为工作、生活决策提供数据支持。二、数据来源与选取1.物价数据典型网站：物价类统计网站、超市/电商价格（如淘宝、京东）、地方统计局官网示例网站：国家统计局物价数据、各城市生活成本调查网站2.房租数据典型网站：链家、
验证码破解的可能与不可能：用Python处理图片验证码的原理与限制程序员威哥 python 开发语言
前言验证码（CAPTCHA）是当前互联网防护机制中的重要组成部分，用于区分真人与自动程序。近年来，随着自动化技术发展，验证码破解成为自动化测试、爬虫及安全研究领域的热点。然而，从技术层面来看，验证码破解既有可行之处，也存在根本限制。本文将结合Python图像处理与机器学习技术，深度剖析图片验证码破解的原理、实践与瓶颈。一、验证码的分类及破解难点1.验证码类型字符型验证码纯数字、字母或混合，最常见。
Python 爬虫实战：高效存储与数据清洗技巧，助你轻松处理抓取数据程序员威哥 python 爬虫开发语言
在进行大规模数据抓取时，数据的存储与清洗是爬虫项目中不可或缺的环节。抓取到的数据往往是杂乱无章的，包含了许多无关的内容，需要经过处理才能用于分析和应用。如何高效地存储数据，并对其进行清洗、去重、格式化等操作，是每个爬虫开发者必须掌握的重要技能。本文将介绍如何使用Python实现数据存储与清洗的常见技巧，帮助你提升数据处理效率，为后续的数据分析和应用打下坚实的基础。一、为什么数据存储与清洗如此重要？
Python 爬虫实战：如何在东方财富网抓取股票行情数据，提升投资决策精准度
前言随着金融市场的快速发展，投资者越来越依赖于实时的股票行情数据来做出决策。在这个过程中，股票数据爬取成为了许多投资者、数据分析师和金融工程师的重要技能。通过编写一个高效的股票数据爬虫，我们可以快速抓取大量股票信息，并进行实时监控与分析，从而帮助做出更加精准的投资决策。本文将展示如何通过Python爬虫从东方财富网（东财网）抓取股票行情数据，并提供一些简单的数据分析手段，帮助用户更好地理解如何利用
分布式领域后端服务的限流算法实现大厂资深架构师 Spring Boot 开发实战分布式算法 wpf ai
分布式领域后端服务的限流算法实现关键词：分布式系统、限流算法、令牌桶、漏桶、滑动窗口、Redis、高并发摘要：本文深入探讨分布式系统中后端服务的限流算法实现。我们将从基础概念出发，详细分析各种限流算法的原理和适用场景，包括计数器算法、滑动窗口算法、令牌桶算法和漏桶算法。文章将提供Python实现代码和数学建模，并通过实际案例展示如何在分布式环境中使用Redis实现高效的限流机制。最后，我们将讨论限
windows下源码安装golang 616050468 golang安装 golang环境 windows
系统： 64位win7，开发环境：sublime text 2， go版本： 1.4.1 1. 安装前准备(gcc, gdb, git) golang在64位系
redis批量删除带空格的key bylijinnan redis
redis批量删除的通常做法： redis-cli keys "blacklist*" | xargs redis-cli del 上面的命令在key的前后没有空格时是可以的，但有空格就不行了： $redis-cli keys "blacklist*" 1) "blacklist:12: [email protected]
oracle正则表达式的用法 0624chenhong oracle 正则表达式
方括号表达示方括号表达式描述 [[:alnum:]] 字母和数字混合的字符 [[:alpha:]] 字母字符 [[:cntrl:]] 控制字符 [[:digit:]] 数字字符 [[:graph:]] 图像字符 [[:lower:]] 小写字母字符 [[:print:]] 打印字符 [[:punct：]] 标点符号字符 [[:space:]]
2048源码(核心算法有，缺少几个anctionbar，以后补上) 不懂事的小屁孩 2048
2048游戏基本上有四部分组成， 1：主activity，包含游戏块的16个方格，上面统计分数的模块 2：底下的gridview，监听上下左右的滑动，进行事件处理， 3：每一个卡片，里面的内容很简单，只有一个text，记录显示的数字 4：Actionbar，是游戏用重新开始，设置等功能(这个在底下可以下载的代码里面还没有实现) 写代码的流程 1：设计游戏的布局，基本是两块，上面是分
jquery内部链式调用机理换个号韩国红果果 JavaScript jquery
只需要在调用该对象合适(比如下列的setStyles)的方法后让该方法返回该对象（通过this 因为一旦一个函数称为一个对象方法的话那么在这个方法内部this（结合下面的setStyles）指向这个对象） function create(type){ var element=document.createElement(type); //this=element;
你订酒店时的每一次点击背后都是NoSQL和云计算蓝儿唯美 NoSQL
全球最大的在线旅游公司Expedia旗下的酒店预订公司，它运营着89个网站，跨越68个国家，三年前开始实验公有云，以求让客户在预订网站上查询假期酒店时得到更快的信息获取体验。云端本身是用于驱动网站的部分小功能的，如搜索框的自动推荐功能，还能保证处理Hotels.com服务的季节性需求高峰整体储能。 Hotels.com的首席技术官Thierry Bedos上个月在伦敦参加“2015 Clou
java笔记1 a-john java
1，面向对象程序设计（Object-oriented Propramming，OOP）：java就是一种面向对象程序设计。 2，对象：我们将问题空间中的元素及其在解空间中的表示称为“对象”。简单来说，对象是某个类型的实例。比如狗是一个类型，哈士奇可以是狗的一个实例，也就是对象。 3，面向对象程序设计方式的特性： 3.1 万物皆为对象。
C语言 sizeof和strlen之间的那些事 C/C++软件开发求职面试题必备考点（一） aijuans C/C++求职面试必备考点
找工作在即，以后决定每天至少写一个知识点，主要是记录，逼迫自己动手、总结加深印象。当然如果能有一言半语让他人收益，后学幸运之至也。如有错误，还希望大家帮忙指出来。感激不尽。后学保证每个写出来的结果都是自己在电脑上亲自跑过的，咱人笨，以前学的也半吊子。很多时候只能靠运行出来的结果再反过来
程序员写代码时就不要管需求了吗？ asia007 程序员不能一味跟需求走
编程也有2年了，刚开始不懂的什么都跟需求走，需求是怎样就用代码实现就行，也不管这个需求是否合理，是否为较好的用户体验。当然刚开始编程都会这样，但是如果有了2年以上的工作经验的程序员只知道一味写代码，而不在写的过程中思考一下这个需求是否合理，那么，我想这个程序员就只能一辈写敲敲代码了。我的技术不是很好，但是就不代
Activity的四种启动模式百合不是茶 android 栈模式启动 Activity的标准模式启动栈顶模式启动单例模式启动
android界面的操作就是很多个activity之间的切换,启动模式决定启动的activity的生命周期 ; 启动模式xml中配置 <activity android:name=".MainActivity" android:launchMode="standard&quo
Spring中@Autowired标签与@Resource标签的区别 bijian1013 java spring @Resource @Autowired @Qualifier
Spring不但支持自己定义的@Autowired注解，还支持由JSR-250规范定义的几个注解，如：@Resource、 @PostConstruct及@PreDestroy。 1. @Autowired @Autowired是Spring 提供的，需导入 Package:org.springframewo
Changes Between SOAP 1.1 and SOAP 1.2 sunjing Changes Enable SOAP 1.1 SOAP 1.2
JAX-WS SOAP Version 1.2 Part 0: Primer (Second Edition) SOAP Version 1.2 Part 1: Messaging Framework (Second Edition) SOAP Version 1.2 Part 2: Adjuncts (Second Edition) Which style of WSDL
【Hadoop二】Hadoop常用命令 bit1129 hadoop
以Hadoop运行Hadoop自带的wordcount为例， hadoop脚本位于/home/hadoop/hadoop-2.5.2/bin/hadoop，需要说明的是，这些命令的使用必须在Hadoop已经运行的情况下才能执行 Hadoop HDFS相关命令 hadoop fs -ls 列出HDFS文件系统的第一级文件和第一级
java异常处理（初级）白糖_ java DAO spring 虚拟机 Ajax
从学习到现在从事java开发一年多了，个人觉得对java只了解皮毛，很多东西都是用到再去慢慢学习，编程真的是一项艺术，要完成一段好的代码，需要懂得很多。最近项目经理让我负责一个组件开发，框架都由自己搭建，最让我头疼的是异常处理，我看了一些网上的源码，发现他们对异常的处理不是很重视，研究了很久都没有找到很好的解决方案。后来有幸看到一个200W美元的项目部分源码，通过他们对异常处理的解决方案，我终
记录整理-工作问题 braveCS 工作
1）那位同学还是CSV文件默认Excel打开看不到全部结果。以为是没写进去。同学甲说文件应该不分大小。后来log一下原来是有写进去。只是Excel有行数限制。那位同学进步好快啊。 2）今天同学说写文件的时候提示jvm的内存溢出。我马上反应说那就改一下jvm的内存大小。同学说改用分批处理了。果然想问题还是有局限性。改jvm内存大小只能暂时地解决问题，以后要是写更大的文件还是得改内存。想问题要长远啊
org.apache.tools.zip实现文件的压缩和解压，支持中文 bylijinnan apache
刚开始用java.util.Zip，发现不支持中文（网上有修改的方法，但比较麻烦）后改用org.apache.tools.zip org.apache.tools.zip的使用网上有更简单的例子下面的程序根据实际需求，实现了压缩指定目录下指定文件的方法 import java.io.BufferedReader; import java.io.BufferedWrit
读书笔记-4 chengxuyuancsdn 读书笔记
1、JSTL 核心标签库标签 2、避免SQL注入 3、字符串逆转方法 4、字符串比较compareTo 5、字符串替换replace 6、分拆字符串 1、JSTL 核心标签库标签共有13个，学习资料：http://www.cnblogs.com/lihuiyy/archive/2012/02/24/2366806.html 功能上分为4类： (1)表达式控制标签：out
[物理与电子]半导体教材的一个小问题 comsci 问题
各种模拟电子和数字电子教材中都有这个词汇-空穴书中对这个词汇的解释是; 当电子脱离共价键的束缚成为自由电子之后,共价键中就留下一个空位,这个空位叫做空穴我现在回过头翻大学时候的教材,觉得这个
Flashback Database --闪回数据库 daizj oracle 闪回数据库
Flashback 技术是以Undo segment中的内容为基础的，因此受限于UNDO_RETENTON参数。要使用flashback 的特性，必须启用自动撤销管理表空间。在Oracle 10g中， Flash back家族分为以下成员： Flashback Database， Flashback Drop，Flashback Query(分Flashback Query,Flashbac
简单排序:插入排序 dieslrae 插入排序
public void insertSort(int[] array){ int temp; for(int i=1;i<array.length;i++){ temp = array[i]; for(int k=i-1;k>=0;k--)
C语言学习六指针小示例、一维数组名含义，定义一个函数输出数组的内容 dcj3sjt126com c
# include <stdio.h> int main(void) { int * p; //等价于 int *p 也等价于 int* p; int i = 5; char ch = 'A'; //p = 5; //error //p = &ch; //error //p = ch; //error p = &i; //
centos下php redis扩展的安装配置3种方法 dcj3sjt126com redis
方法一 1.下载php redis扩展包代码如下复制代码 #wget http://redis.googlecode.com/files/redis-2.4.4.tar.gz 2 tar -zxvf 解压压缩包，cd /扩展包（进入扩展包然后运行phpize 一下是我环境中phpize的目录，/usr/local/php/bin/phpize (一定要
线程池(Executors) shuizhaosi888 线程池
在java类库中，任务执行的主要抽象不是Thread，而是Executor，将任务的提交过程和执行过程解耦 public interface Executor { void execute(Runnable command); } public class RunMain implements Executor{ @Override pub
openstack 快速安装笔记 haoningabc openstack
前提是要配置好yum源版本icehouse，操作系统redhat6.5 最简化安装，不要cinder和swift 三个节点 172 control节点keystone glance horizon 173 compute节点nova 173 network节点neutron control /etc/sysctl.conf net.ipv4.ip_forward =
从c面向对象的实现理解c++的对象（二） jimmee C++面向对象虚函数
1. 类就可以看作一个struct，类的方法，可以理解为通过函数指针的方式实现的，类对象分配内存时，只分配成员变量的，函数指针并不需要分配额外的内存保存地址。 2. c++中类的构造函数，就是进行内存分配(malloc)，调用构造函数 3. c++中类的析构函数，就时回收内存(free) 4. c++是基于栈和全局数据分配内存的，如果是一个方法内创建的对象，就直接在栈上分配内存了。专门在
如何让那个一个div可以拖动 lingfeng520240 html
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml
第10章高级事件（中） onestopweb 事件
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
计算两个经纬度之间的距离 roadrunners 计算纬度 LBS 经度距离
要解决这个问题的时候，到网上查了很多方案，最后计算出来的都与百度计算出来的有出入。下面这个公式计算出来的距离和百度计算出来的距离是一致的。 /** * * @param longitudeA * 经度A点 * @param latitudeA * 纬度A点 * @param longitudeB *
最具争议的10个Java话题 tomcat_oracle java
1、Java8已经到来。什么！？ Java8 支持lambda。哇哦，RIP Scala！　　随着Java8 的发布，出现很多关于新发布的Java8是否有潜力干掉Scala的争论，最终的结论是远远没有那么简单。Java8可能已经在Scala的lambda的包围中突围，但Java并非是函数式编程王位的真正觊觎者。　　2、Java 9 即将到来　　 Oracle早在8月份就发布
zoj 3826 Hierarchical Notation(模拟) 阿尔萨斯 rar
题目链接：zoj 3826 Hierarchical Notation 题目大意：给定一些结构体，结构体有value值和key值，Q次询问，输出每个key值对应的value值。解题思路：思路很简单，写个类词法的递归函数，每次将key值映射成一个hash值，用map映射每个key的value起始终止位置，预处理完了查询就很简单了。这题是最后10分钟出的，因为没有考虑value为{}的情