DuHz

隐马尔可夫模型详解

引言
马尔可夫模型基础
1. 马尔可夫性质
2. 马尔可夫链的联合分布
隐马尔可夫模型（HMM）简介
1. 模型参数的表示
2. HMM的联合分布
HMM的三大元素与基本公式
HMM的三大基本问题
1. 评估问题：前向-后向算法（Forward-Backward）
  1. 前向算法（Forward）
  2. 后向算法（Backward）
  3. 前向-后向的更多推导
2. 解码问题：维特比算法（Viterbi）
3. 学习问题：Baum-Welch算法（EM算法）
隐马尔可夫模型的具体种类
1. 离散观测隐马尔可夫模型（Discrete HMM）
2. 连续观测隐马尔可夫模型（Continuous HMM）
3. 半隐马尔可夫模型（Semi-HMM）
4. 其他扩展
代码示例
代码简要解读

引言

隐马尔可夫模型（Hidden Markov Model, HMM）是一种能够对隐藏状态序列和观测序列进行联合建模的统计模型。它在语音识别、自然语言处理、生物信息（基因序列分析）及很多时序预测领域都有广泛的应用。本教程将以通俗易懂的方式详细介绍从马尔可夫链到隐马尔可夫模型，并给出核心算法和典型的数学公式推导，力求让读者更好地理解其原理。

马尔可夫模型基础

马尔可夫性质

一个随机过程 ${X_t\}$ （这里 $t$ 可以是离散时刻）满足马尔可夫性质，表示当前状态对未来状态的影响只与当前状态本身有关，而与过去的历史状态无关。用数学语言描述：

$P\bigl(X_{t+1} = x \,\big\vert\, X_1 = x_1, X_2 = x_2, \dots, X_t = x_t\bigr) = P\bigl(X_{t+1} = x \,\big\vert\, X_t = x_t\bigr).$

对于“一阶马尔可夫链”，此性质足够描述。若需要考虑记忆性更长的过程，可扩展为高阶马尔可夫链。

马尔可夫链的联合分布

马尔可夫链状态空间设为 $\{s_1, s_2, \dots, s_N\}$ 。定义状态转移概率：

$a_{ij} = P(X_{t+1} = s_j \mid X_t = s_i), \quad \sum_{j=1}^N a_{ij} = 1.$

如果我们有初始分布 $\pi = (\pi_1, \pi_2, \dots, \pi_N)$ ，其中

$\pi_i = P(X_1 = s_i), \quad \sum_{i=1}^N \pi_i = 1,$

那么，对于时刻 $1$ 到 $T$ 的状态序列 $(X_1, X_2, \dots, X_T)$ ，它的联合概率可写为：

$P(X_1 = s_{i_1}, X_2 = s_{i_2}, \dots, X_T = s_{i_T}) = \pi_{i_1}\,a_{i_1 i_2}\,a_{i_2 i_3}\,\cdots\,a_{i_{T-1} i_T}.$

隐马尔可夫模型（HMM）简介

在普通马尔可夫链中，状态 $X_t$ 是可直接观察的。而隐马尔可夫模型提出：每个时刻 $t$ 的状态 $X_t$ 是不可见（隐藏的），但我们可以观测到一个与之相关的随机变量（或向量） $O_t$ 。因此，实际观测到的是序列 $(O_1,O_2,\dots,O_T)$ ，而状态序列 $(X_1,X_2,\dots,X_T)$ 就是 “隐”的马尔可夫链。

模型参数的表示

一个HMM由如下参数刻画：

状态集合： $\{s_1, s_2, \ldots, s_N\}$ ，隐藏状态数为 $N$ 。
观测集合： $\{v_1, v_2, \ldots, v_M\}$ （若为离散情况），或者是一个连续空间（若为连续情况）。
初始状态分布： $\pi = (\pi_1, \pi_2, \dots, \pi_N)$ 。
状态转移概率矩阵： $A = [a_{ij}]$ ，其中
$a_{ij} = P(X_{t+1} = s_j \mid X_t = s_i), \quad 1 \le i,j \le N.$
观测概率分布： $B$ 。
- 若为离散情况： $B = [b_j(k)]$ ，其中
  $b_j(k) = P(O_t = v_k \mid X_t = s_j).$
- 若为连续情况：可以用高斯分布或其混合分布来表示
  $b_j(o) = p(O_t = o \mid X_t = s_j).$

常将这些参数记为 $\lambda = (A, B, \pi)$ 。

HMM的联合分布

在HMM中，如果我们同时考虑状态序列 $X$ 和观测序列 $O$ ，它们的联合概率可写为：

$\mid \lambda) = P(X_1)\,\prod_{t=2}^T P(X_t \mid X_{t-1}) \,\prod_{t=1}^T P(O_t \mid X_t).$

展开后，我们有：

$\mid \lambda) = \pi_{x_1}\,\prod_{t=1}^{T-1} a_{x_t, x_{t+1}} \,\prod_{t=1}^{T} b_{x_t}(o_t).$

这里 $x_t$ 表示时刻 $t$ 的隐藏状态在 $\{1,\dots,N\}$ 中的具体取值； $o_t$ 表示时刻 $t$ 的观测值在观测集合中的索引（或具体向量）。

HMM的三大元素与基本公式

隐藏状态（state）： $X_t\in \{s_1,\dots,s_N\}$ 。
观测变量（observation）： $O_t\in \{v_1,\dots,v_M\}$ 或连续空间。
初始分布 $\pi$ 、转移概率 $A$ 、观测概率 $B$ 。

在时刻 $t$ ，“真实”状态为 $X_t$ ，但我们只能观测到 $O_t$ 。贯穿整个序列有长度为 $T$ 的 $\{O_1,O_2,\dots,O_T\}$ 和 $\{X_1,X_2,\dots,X_T\}$ 。

HMM的三大基本问题

在实际应用中，我们常常会遇到以下三个核心问题：

评估（Evaluation）：给定 $\lambda$ 和观测序列 $O$ ，计算 $\mid \lambda)$ 。
解码（Decoding）：给定 $\lambda$ 和观测序列 $O$ ，找到最优的隐藏状态序列 $\hat{X}$ 。
学习（Learning）：给定观测序列 $O$ ，估计最佳的 $\lambda$ （或使 $\mid \lambda)$ 最大）。

评估问题：前向-后向算法（Forward-Backward）

我们先考察：如何快速计算给定HMM（ $\lambda$ ）生成观测序列 $O$ 的概率 $\mid \lambda)$ ？这就是评估问题，可用前向-后向算法在多项式时间内完成。

前向算法（Forward）

定义“前向变量” $\alpha_t(i)$ ：
$\alpha_t(i) = P(o_1, o_2, \dots, o_t, X_t = s_i \mid \lambda).$
即“从时刻1到时刻 $t$ 的所有观测值为 $o_1,\dots,o_t$ ，并且时刻 $t$ 的隐藏状态为 $s_i$ ”的联合概率。

初始化：
$\alpha_1(i) = \pi_i \, b_i(o_1), \quad 1 \le i \le N.$
因为在时刻1，我们处于状态 $s_i$ 的概率是 $\pi_i$ ，同时观测到 $o_1$ 的概率是 $b_i(o_1)$ 。
递推：
$\alpha_{t+1}(j) = \Bigl[\sum_{i=1}^N \alpha_t(i)\, a_{ij}\Bigr] \, b_j(o_{t+1}), \quad 1 \le j \le N,\ 1\le t \le T-1.$
这里 $\sum_{i=1}^N \alpha_t(i)\, a_{ij}$ 表示从时刻 $t$ 的所有可能状态转移到时刻 $t + 1$ 状态 $s_j$ 的联合概率之和，然后再乘以在状态 $s_j$ 下产生观测 $o_{t+1}$ 的概率。
终止：
$\mid \lambda) = \sum_{i=1}^N \alpha_T(i).$
即时刻 $T$ 可能处于任何状态下的联合概率之和。

从而可得观测序列的概率。该算法时间复杂度为 $O(N^2 T)$ 。

后向算法（Backward）

“后向算法”同样能得到 $\mid \lambda)$ ，定义“后向变量” $\beta_t(i)$ ：
$\beta_t(i) = P(o_{t+1}, o_{t+2}, \dots, o_T \mid X_t = s_i, \lambda).$
即“在时刻 $t$ 处于状态 $s_i$ 时，后面时刻 $t + 1$ 到 $T$ 的观测序列为 $o_{t+1},\dots,o_T$ 的概率”。

初始化：
$\beta_T(i) = 1, \quad 1 \le i \le N.$
递推：
$\beta_t(i) = \sum_{j=1}^N a_{ij} \, b_j(o_{t+1}) \, \beta_{t+1}(j), \quad 1 \le i \le N, \ t = T-1,\dots,1.$
终止：
$\mid \lambda) = \sum_{i=1}^N \pi_i \, b_i(o_1) \, \beta_1(i).$

和前向算法一样，后向算法也只需要 $O(N^2 T)$ 的时间。

前向-后向的更多推导

在后面谈学习问题时，我们还会用到前向-后向算法来求各时刻处于某状态的后验概率等量。常见定义有：

$\gamma_t(i)$ ：时刻 $t$ 处于状态 $s_i$ 的概率；
$\xi_t(i,j)$ ：时刻 $t$ 处于状态 $s_i$ 且时刻 $t + 1$ 处于状态 $s_j$ 的概率。

这两个量可用 $\alpha_t(i)$ 与 $\beta_t(i)$ 以及观测概率进行计算。例如，

$\gamma_t(i) = P(X_t = s_i \mid O, \lambda) = \frac{\alpha_t(i)\,\beta_t(i)}{P(O \mid \lambda)}.$

$\xi_t(i,j) = P(X_t = s_i, X_{t+1} = s_j \mid O, \lambda) = \frac{\alpha_t(i)\, a_{ij}\, b_j(o_{t+1})\, \beta_{t+1}(j)}{P(O \mid \lambda)}.$

解码问题：维特比算法（Viterbi）

解码问题想要得到的是：给定观测序列 $O$ 和模型 $\lambda$ ，哪一条隐藏状态序列 $X=(X_1,\dots,X_T)$ 最有可能出现？即

$\hat{X} = \arg\max_X P(X \mid O,\lambda).$

因为在HMM下等价于最大化 $\mid \lambda)$ ，所以可用维特比算法进行动态规划求解。

定义“维特比变量” $\delta_t(i)$ ：

$\delta_t(i) = \max_{X_1,\dots,X_{t-1}} P(X_1,\dots,X_{t-1}, X_t=s_i,\; o_1,\dots,o_t \mid \lambda).$

初始化：
$\delta_1(i) = \pi_i \, b_i(o_1).$
递推：
$\delta_{t+1}(j) = \Bigl[\max_{1\le i \le N} \delta_t(i)\,a_{ij}\Bigr] \, b_j(o_{t+1}).$
并令
$\psi_{t+1}(j) = \arg\max_{1 \le i \le N} \delta_t(i)\,a_{ij}.$
这里 $\psi_{t+1}(j)$ 是记录“最优路径”从上一时刻哪个状态转移而来。
终止：
$P^* = \max_{1\le i \le N} \delta_T(i), \quad X_T^* = \arg\max_{1 \le i \le N} \delta_T(i).$
回溯：根据 $\psi_t(\cdot)$ 从后向前逐步找出最优状态序列。

学习问题：Baum-Welch算法（EM算法）

当HMM的参数 $\lambda$ （即 $\pi$ ）未知时，我们可以通过观测序列 $O$ 来“训练”或“学习”这些参数，使得该模型在一定意义下“最好地”解释观测数据。最常用的方法是Baum-Welch算法，可视为对HMM应用EM思想。

令 $\lambda^{(m)}$ 表示第 $m$ 次迭代得到的模型参数。
在一次迭代中，“E步”计算基于 $\lambda^{(m)}$ 时的后验概率 $\gamma_t(i)$ 和 $\xi_t(i,j)$ ；“M步”则更新下式：

初始状态分布：
$\pi_i^{(m+1)} = \gamma_1(i).$
状态转移概率：
$a_{ij}^{(m+1)} = \frac{\sum_{t=1}^{T-1} \xi_t(i,j)}{\sum_{t=1}^{T-1} \gamma_t(i)}.$
观测概率（离散情况）：
$b_j^{(m+1)}(k) = \frac{\sum_{t=1}^T \mathbf{1}(o_t = v_k)\,\gamma_t(j)}{\sum_{t=1}^T \gamma_t(j)},$
其中 $\mathbf{1}(\cdot)$ 为指示函数，若 $o_t = v_k$ 则为1，否则为0。
对于连续情况，会对 $\gamma_t(j)$ 做加权似然估计，具体地估计高斯均值、方差等混合参数。

通过多次迭代（E步 + M步），参数会收敛到某个局部极值，从而得到可以解释训练序列的HMM参数。

隐马尔可夫模型的具体种类

离散观测隐马尔可夫模型（Discrete HMM）

观测值：离散有限集合 $\{v_1,\dots,v_M\}$ 。
观测概率： $b_j(k) = P(O_t = v_k \mid X_t=s_j)$ 。
应用：词性标注、离散符号序列分析等。

连续观测隐马尔可夫模型（Continuous HMM）

观测值：连续向量（如语音的声学特征）。
常用建模：用混合高斯分布（GMM）刻画状态的观测概率：
$b_j(o) = \sum_{m=1}^{M_j} c_{jm}\,\mathcal{N}(o;\,\mu_{jm},\,\Sigma_{jm}),$
其中 $c_{jm}$ 是混合系数， $\mu_{jm}$ 和 $\Sigma_{jm}$ 分别为均值向量和协方差矩阵。

半隐马尔可夫模型（Semi-HMM）

区别：在普通HMM中，状态持续时间服从几何分布；而实际中有时需更灵活的时长分布。
特性：Semi-HMM可显式建模状态持续时间，从而更准确描述某些过程（如语音识别中的音素持续）。

其他扩展

层级HMM（Hierarchical HMM）
耦合HMM（Coupled HMM）
部分可观测马尔可夫决策过程（POMDP）
结合深度学习的HMM变体

代码示例

以下为一个简化的离散观测HMM示例（Python），演示核心：前向、后向和维特比算法。实际应用中通常还需数值稳定处理（例如取对数规避下溢），以及Baum-Welch学习等部分。

import numpy as np

class DiscreteHMM:
    def __init__(self, A, B, pi):
        """
        A: 状态转移矩阵 (N x N)
        B: 观测概率矩阵 (N x M)，B[j,k] 表示在状态 j 时观测到 k 的概率
        pi: 初始状态概率向量 (N,)
        """
        self.A = np.array(A)  # (N, N)
        self.B = np.array(B)  # (N, M)
        self.pi = np.array(pi)  # (N,)
        self.N = self.A.shape[0]  # 状态数 N
        self.M = self.B.shape[1]  # 观测种类数 M
    
    def forward(self, O):
        """
        前向算法计算 P(O | 模型)
        O: 观测序列 (长度 T 的离散索引列表)，如 [0, 2, 1, ...]
        返回: P(O | 模型)
        """
        T = len(O)
        alpha = np.zeros((T, self.N))
        
        # 初始化
        alpha[0, :] = self.pi * self.B[:, O[0]]
        
        # 递推
        for t in range(1, T):
            for j in range(self.N):
                # alpha[t, j] = sum_{i=1 to N}(alpha[t-1,i] * A[i,j]) * B[j,O[t]]
                alpha[t, j] = np.dot(alpha[t-1, :], self.A[:, j]) * self.B[j, O[t]]
        
        # 终止：把时刻 T 所有状态下的概率加总
        return np.sum(alpha[T-1, :])
    
    def backward(self, O):
        """
        后向算法计算 P(O | 模型)
        O: 观测序列
        返回: P(O | 模型)
        """
        T = len(O)
        beta = np.zeros((T, self.N))
        
        # 初始化
        beta[T-1, :] = 1.0
        
        # 递推
        for t in range(T-2, -1, -1):
            for i in range(self.N):
                # beta[t,i] = sum_{j=1 to N}(A[i,j] * B[j,O[t+1]] * beta[t+1,j])
                beta[t, i] = np.sum(self.A[i, :] * self.B[:, O[t+1]] * beta[t+1, :])
        
        # 终止：使用初始状态概率 pi 和 B[:,O[0]] 以及 beta[0,:]
        return np.sum(self.pi * self.B[:, O[0]] * beta[0, :])
    
    def viterbi(self, O):
        """
        维特比算法求最优状态序列
        O: 观测序列
        返回: (最佳路径概率, 最优状态序列)
        """
        T = len(O)
        delta = np.zeros((T, self.N))
        psi = np.zeros((T, self.N), dtype=int)
        
        # 初始化
        delta[0, :] = self.pi * self.B[:, O[0]]
        
        # 递推
        for t in range(1, T):
            for j in range(self.N):
                # 对各 i, 取 argmax (delta[t-1,i] * A[i,j])
                temp_vals = delta[t-1, :] * self.A[:, j]
                psi[t, j] = np.argmax(temp_vals)
                delta[t, j] = np.max(temp_vals) * self.B[j, O[t]]
        
        # 终止：找到时刻 T 最可能的最后状态
        p_star = np.max(delta[T-1, :])
        best_last_state = np.argmax(delta[T-1, :])
        
        # 回溯：依靠 psi[] 把最优路径检索出来
        best_path = [best_last_state]
        for t in range(T-1, 0, -1):
            best_path.insert(0, psi[t, best_last_state])
            best_last_state = psi[t, best_last_state]
        
        return p_star, best_path

if __name__ == "__main__":
    # 示例模型参数
    A = [
        [0.7, 0.3],
        [0.4, 0.6]
    ]
    B = [
        [0.5, 0.5],  # 状态0时，观测0和1的概率
        [0.1, 0.9]   # 状态1时，观测0和1的概率
    ]
    pi = [0.6, 0.4]
    
    hmm = DiscreteHMM(A, B, pi)
    
    # 示例观测序列 O (长度 T=4)，假设观测字典是 {0,1}
    O = [0, 1, 1, 0]
    
    # 1) 前向算法
    prob_forward = hmm.forward(O)
    print(f"Forward算法计算得到的序列概率: {prob_forward}")
    
    # 2) 后向算法
    prob_backward = hmm.backward(O)
    print(f"Backward算法计算得到的序列概率: {prob_backward}")
    
    # 3) 维特比算法
    p_star, best_path = hmm.viterbi(O)
    print(f"Viterbi算法的最优路径概率: {p_star}")
    print(f"Viterbi算法的最优状态序列: {best_path}")

【数字后端】- 什么是NDR规则？ LogicYarn 数字后端硬件架构
NDR是指与工艺库的默认规则（DR）不同的特殊物理规则：常见的有：间距规则（spacing）：增加信号线与邻近线之间的距离，降低Crosstalk串扰。线宽规则（width）：加宽信号线，降低电阻和电感，提高信号驱动能力金属层指定：指定使用低电阻或低串扰的金属层(如高层金属)端点规则：如加强端点接触等为什么要有NDR？这就要提到金属的EM(电迁移electro-migration)问题。由于电子的
go语言学习第5章：函数余厌厌厌 golang go 开发语言学习
第5章：函数函数是编程中不可或缺的一部分，它封装了一段可重复使用的代码，用于执行特定的任务。在Go语言中，函数同样扮演着重要的角色。本章将详细介绍Go语言中函数的定义、调用、参数传递、返回值处理以及一些高级特性，如闭包和匿名函数。一、函数的定义与调用（一）函数的定义在Go语言中，函数的定义使用func关键字。基本语法如下：func函数名(参数列表)返回值列表{//函数体}函数名：函数的名称，用于调
路由器对不同数据帧的处理 lulinhao 数通基础学习网络数据帧
一、单播A：目的MAC地址是自己的MAC地址路由器在接收接口上收到帧，检查目的MAC地址，发现该地址与接收接口的MAC地址完全匹配，得知这个帧是发给自己的，就会接收该帧，并且剥离数据链路层的帧头和帧尾，开始处理数据包。A1：数据包的目的IP地址是单播1.目的IP地址是自己的IP地址，路由器将数据包交给上层协议栈处理2.目的IP地址不是自己的IP地址，查询路由表，如果没有找到匹配的路由条目，静默丢弃
设计模式之建造者模式缘来是庄设计模式建造者模式 java
目录定义结构适用场景使用示例定义建造者模式是一种创建型设计模式，其核心思想是将复杂对象的构建过程与其表示分离，使相同构建逻辑能生成不同结构的对象。该模式通过分步骤构建复杂对象，允许用户只指定对象类型和内容而无需了解内部构建细节。结构适用场景1）对象具有复杂内部结构或需要多个配置参数时；2）需要将对象的创建与使用分离；3）相同构建过程需产生不同表现形式；4）避免使用过长的构造器参数列表；5）构建步骤
模拟工作队列 - 华为OD机试真题(JavaScript卷) 什码情况算法面试 javascript 数据结构华为od
华为OD机试题库《C++》限时优惠9.9华为OD机试题库《Python》限时优惠9.9华为OD机试题库《JavaScript》限时优惠9.9针对刷题难，效率慢，我们提供一对一算法辅导，针对个人情况定制化的提高计划（全称1V1效率更高）。看不懂有疑问需要答疑辅导欢迎私VX：code5bug题目描述让我们来模拟一个工作队列的运作，有一个任务提交者和若干任务执行者，执行者从1开始编号。提交者会在给定的时
数据分类 - 华为OD机试真题(JavaScript 题解) 什码情况华为od javascript 开发语言数据结构算法机试
华为OD机试题库《C++》限时优惠9.9华为OD机试题库《Python》限时优惠9.9华为OD机试题库《JavaScript》限时优惠9.9针对刷题难，效率慢，我们提供一对一算法辅导，针对个人情况定制化的提高计划（全称1V1效率更高）。看不懂有疑问需要答疑辅导欢迎私VX：code5bug题目描述对一个数据a进行分类，分类方法为：此数据a（四个字节大小）的四个字节相加对一个给定的值b取模，如果得到的
变压器励磁电感、励磁电流、漏感、漏感折算的具体意思你懂了吗
变压器的励磁电流与励磁电感原边KVL：线阻的电压+绕组电压+mos管的导通压降等于输入源的电压线阻的电压、mos管的导通压降都很小，为了满足KVL，这里绕组电压就需要维持了一个平衡输出有没有电流，原边绕组都需要有一个反向的电动势输出为空载的时候，副边没有电流，但是副边还是有电压，这个电压的建立是因为励磁电感与励磁电流的存在。不维持绕组电压，输入源短路了，电感没有感抗了。那么为了维持这样个绕组电压而
第5篇：Gin的数据验证与绑定——确保请求数据合法性 GO兔 gin golang 后端
引言在Web开发中，你是否遇到过这些令人头疼的问题？用户提交的表单数据格式混乱导致系统崩溃，恶意请求携带非法参数攻击API接口，或者因为数据校验不完善而引发的各种业务异常？这些问题的根源往往在于——我们没有在数据进入业务逻辑之前就建立起坚固的防线。今天，我将带你深入探索Gin框架的数据验证与绑定机制，教你如何用最少的代码构建最坚固的数据防护墙。一、数据绑定：自动化数据处理Gin框架最强大的特性之一
nacos配置文件快速部署另一种方法谢平康 nacos
提交nacos配置的另一种一种方法,批命令/shell:以下脚本直接把当前目录下的所有yaml文件一键提交到nacos上前提是要先安装curl以及jq然后把下面的shell保存为import-all.sh然后chmod+ximport-all.sh&&./import-all.sh就好了.记得修改一下的NAMESPACE_NAME与GROUP.#!/bin/bashclearset-e#Nacos
Spring框架中的过滤器、拦截器与Spring Security：深入比较与应用实践暮乘白帝过重山数据仓库 java 后端 spring 拦截器过滤器 Spring Security
一、引言在现代Java企业级应用开发中，Spring框架已经成为事实上的标准。随着应用安全性和复杂性的不断提高，开发者需要掌握多种请求处理和安全控制机制。本文将深入探讨Spring框架中的过滤器(Filter)、拦截器(Interceptor)和SpringSecurity这三种关键技术，分析它们的异同点、适用场景以及当前企业开发中的流行趋势。二、Spring框架概述Spring框架是一个轻量级的
odrive软件的版本 m0_55305757 stm32 电机嵌入式硬件 odrive
odrive软件的版本0.4.0通信方面引入一个fibre变复杂了（节点还是手工生成的），cpp程序开始变多了。（sensorless我看到变成独立文件了）pythontool开始使用pip安装形式。0.5.0开始支持spi的encoder，as5047之类0.5.1据说之后的版本controlloop开始变化0.5.2开始应该是大修改了//RequiredtouseOC4forADCtrigge
141G显存H20单机DeepSeek-R1满血FP8版性能测试
#环境参数#H20141G单机8卡，CUDA12.4，vLLMv0.8.3，flashinferv0.2.2#服务化命令#基于知乎大神的推荐出装与前期H800双机生产环境测试，在H20上开启EP、MLA等核心优化参数，实现推理吞吐性能最优吞吐量破10000tokens/s，VLLM0.8.1版本驱动下的Deepseek-r1671Bhttps://zhuanlan.zhihu.com/p/1887
Deepseek：多轮对话与上下文拼接 chilavert318 熬之滴水穿石 ai
今天的内容，应该很好理解。我们先从场景切入来理解。首先，你回想一下，有没有遇到过这样的情况：和朋友聊天时，聊了一会儿，突然朋友说起之前的某个话题，你却有点反应不过来，得努力回忆之前说了啥。人工智能之所以“智能”，因为它就不可能这么健忘。在和Deepseek聊天，在多轮对话中，Deepseek就像一个记忆力超强的小伙伴，能清楚记得你们聊过的每一个重要细节，让对话一直顺顺畅畅。这背后呀，藏着Deeps
ROS学习笔记5：常用API和模块导入
前言本人ROS小白，利用寒假时间学习ROS，在此以笔记的方式记录自己每天的学习过程。争取写满15篇(5/15)。环境：Ubuntu20.04、ROS1：noetic环境配置：严格按照下方学习链接的教程配置，基本一次成功。学习链接：【Autolabor初级教程】ROS机器人入门对应链接文档：ROS机器人入门课程《ROS理论与实践》笔记绝大部分代码使用Python语言编写。本期关键词：初始化，话题服务
对话式数据分析与Text2SQL Agent产品可行性分析思考
Text2SQLAgent产品可行性分析报告版本BG：基于一些手撸Text2SQL的产品MVP，进一步进行商业化思考。目标输出包含市场、技术、开发、商业模式及护城河策略的完整可行性分析报告，支撑产品决策。✅市场调研与竞品分析研究内容：市场现状与趋势全球Text2SQL技术应用场景（金融、零售、医疗等）2023-2028年复合增长率（CAGR）及驱动因素（如低代码、AI民主化）竞品分析矩阵竞品类型代
一个简单测试Deepseek吞吐量的脚本,国内环境可跑谢平康深度学习 pytorch 人工智能
一个简单测试Deepseek吞吐量的脚本,这里用DeepSeek-R1-Distill-Qwen-32B,支持单卡409024G可跑,具体看你的硬件情况做调整,理论支持所有的模型,看你需要,可以修改模型名称,重点是pip使用国内的源,模型下载用阿里的ModelScope,无障碍下载,使用.最后可以生成一个txt与html报表.前提是你安装了python与python-venv,你可以不用venv来
企业架构设计中的CBAM方法深度解析：成本效益驱动的架构决策艺术架构进化论系统架构设计师架构微服务云原生后端
目录CBAM方法概述与核心价值CBAM核心流程与实施步骤前期准备与场景确定成本效益建模与分析风险调整与决策制定实施技巧与挑战克服CBAM实战案例与应用场景案例一：电商平台促销系统架构选型案例二：制造业ERP系统云迁移决策案例三：金融机构实时风控系统重构跨案例经验总结CBAM与其他架构评估方法的集成应用CBAM与ATAM的协同机制分层评估框架构建行业定制化集成模式敏捷环境中的轻量级CBAM组织能力建
OpenCV实战：图像颜色识别与提取、掩膜制作
前言在计算机视觉和图像处理领域，颜色识别是一项基础而重要的技术。无论是交通标志识别、工业分拣还是美颜滤镜开发，都离不开对特定颜色的处理。本文将带你全面掌握使用OpenCV进行颜色识别的关键技术，包含完整的代码实现和原理讲解。一、颜色空间基础1.1RGB颜色空间在图像处理中，最常见的就是RGB颜色空间。RGB颜色空间是我们接触最多的颜色空间，是一种用于表示和显示彩色图像的一种颜色模型。RGB代表红色
PIC16F877A与Proteus仿真-GPIO寄存器与配置视觉与物联智能物联网全栈开发实战 PIC16F877A proteus 嵌入式物联网仿真
GPIO寄存器与配置在本文中，我们将讨论PIC控制器的端口配置。我们将使用PIC16F877A作为参考，同样适用于其他PIC系列控制器。在本文结束时，你将熟悉PICGPIO以及用于配置和访问GPIO的相关寄存器。1、GPIO寄存器任何控制器的基本和重要特性是可用于连接外围设备的gpio数量。PIC16F877A的33-gpio分为五个端口，即PORTA-PORTE，如下表所示：端口方向寄存器引脚数
Midday：自由职业者的智能业务管理工具人工智能我来了人工智能 AI 人工智能
Midday：为自由职业者打造的智能业务管理工具随着自由职业市场的不断扩展，自由职业者、承包商、咨询师以及个人创业者在管理业务运营方面面临着诸多挑战。为了帮助这些个人更高效地管理他们的业务，Midday应运而生。作为一款全能工具，Midday将通常分散在多个平台上的功能整合到一个统一的系统中，使业务管理变得更加简单和智能。Midday功能概览实时时间追踪：提升项目生产力与协作在自由职业中，时间管理
MCP 与 AI 任务分解：如何让 AI 高效执行复杂任务？ Echo_Wish Python 进阶人工智能
MCP与AI任务分解：如何让AI高效执行复杂任务？在人工智能应用中，任务分解（TaskDecomposition）是一个绕不开的话题。无论是自动驾驶、智能客服，还是代码生成，AI都需要将复杂问题拆解成可执行的小任务，逐步完成目标。而在AI领域，MCP（Multi-StepCognitiveProcessing，多步认知处理）是一种前沿技术，旨在提升AI的任务分解能力，使其能够更精准、高效地执行复杂
Python编程实战：爬虫与数据可视化的全过程草莓味儿柠檬
本文还有配套的精品资源，点击获取简介：本项目通过Python编程实现网络数据爬取和数据可视化，适合初学者深入了解Python。我们将涵盖基础语法、网络爬虫技术、数据处理、可视化技术、文件操作和错误处理等关键知识点，最终完成从爬取各省降水量数据到可视化展示的全过程。1.Python基础语法使用Python作为一门流行的编程语言，因其简洁和易读性被广泛应用于网络爬虫、数据处理和可视化等领域。本章将帮助
Java Web二手物品交易平台课程设计项目草莓味儿柠檬
本文还有配套的精品资源，点击获取简介：盐鱼二手物品交易网站是一个基于Servlet和JSP的JavaWeb开发课程设计项目，适合Java初学者进行实战演练。项目内容包括Servlet与JSP的基础知识、MVC架构、数据库交互、会话管理、安全与性能优化、部署与运行，以及测试与调试等各个方面。学生通过此项目可以全面理解JavaWeb开发技术，并提升实战能力。1.Servlet生命周期与HTTP请求处理
C51单片机控制OLED显示屏反白显示SPI通信例程草莓味儿柠檬
本文还有配套的精品资源，点击获取简介：本文档详细介绍0.96英寸OLED显示屏、C51系列单片机、SPI接口及反白显示技术的原理与应用，并提供一套完整的例程源码，指导开发者如何使用C51单片机通过SPI接口控制OLED显示屏实现反白显示效果。文档内容包括硬件连接、初始化SPI、配置OLED显示参数、绘制像素和实现反白显示等关键步骤，旨在帮助初学者学习嵌入式系统开发，并理解相关硬件和软件工作流程。1
SBC编解码器库：蓝牙音频传输的核心草莓味儿柠檬
本文还有配套的精品资源，点击获取简介：SBC编解码器库是一个软件工具集，提供在蓝牙技术中核心使用的音频编解码功能。该库以C语言实现，包含编码、解码以及相关设置控制功能，使得开发者可以在应用中集成SBC编解码能力，如蓝牙音频播放器或耳机。SBC编解码工作原理基于子带编码理论，通过量化和编码音频信号的各个子带，实现高效的数据传输。SBC支持多种比特率、采样率和声道配置，并包含错误检测与恢复机制，控制接
安装黑苹果时提示未能与服务器,安装黑苹果遇到的问题与解决记录草莓味儿柠檬安装黑苹果时提示未能与服务器
前言–这篇文章讲了啥？这篇文件是我在安装黑苹果时遇到的问题与解决办法的总结所以更注重的是发现问题解决问题，关于黑苹果教程自己上网上找吧，资源非常多所以安装方面可能就几句话带过了1.硬件配置电脑型号戴尔Inspiron5680台式电脑操作系统Windows1064位家庭版处理器英特尔Corei5-8400主板戴尔0PXWHK(z370芯片组)，找efi驱动首先按照这个主板来就行(z370)内存三星D
MongoDB 与关系型数据库的核心区别（面试向详解）真IT布道者数据库 mongodb 面试
一、数据模型差异1.1结构化vs半结构化关系型数据库：严格遵循二维表结构，需要预定义Schema（字段名、数据类型、约束等）CREATETABLEusers(idINTPRIMARYKEY,nameVARCHAR(50)NOTNULL,ageINTCHECK(age>0)MongoDB：采用BSON文档模型（类似JSON），支持动态Schema//同一个集合中可以存在不同结构的文档db.users
基于 abp vNext 和 .NET Core 开发博客项目 - 数据访问和代码优先阿星Plus
系列文章基于abpvNext和.NETCore开发博客项目-使用abpcli搭建项目基于abpvNext和.NETCore开发博客项目-给项目瘦身，让它跑起来基于abpvNext和.NETCore开发博客项目-完善与美化，Swagger登场基于abpvNext和.NETCore开发博客项目-数据访问和代码优先基于abpvNext和.NETCore开发博客项目-自定义仓储之增删改查基于abpvNex
构建全栈式数据库与消息队列服务治理体系：监控、告警与组件搭配实践喝醉酒的小白 DBA K8s 数据库
目录标题分类✅一、分类总览表✅二、详细分类说明1.关系型数据库（RDBMS）2.NoSQL数据库3.分布式系统协调组件4.消息队列系统✅三、按用途分类（实战参考）✅四、开源vs商业（闭源）分类全面的监控指标分类与告警模板清单✅一、通用结构✅二、数据库系统级别详细监控项与告警模板1.MySQL/TiDB/OceanBase2.PostgreSQL/openGauss/GaussDB/KingBase
GESP认证C++编程真题解析 | GESP202409 三级单选题和判断题热爱编程的通信人历年GESP CSP-J CSP-S真题解析 c++开发语言
欢迎大家订阅我的专栏：算法题解：C++与Python实现！本专栏旨在帮助大家从基础到进阶，逐步提升编程能力，助力信息学竞赛备战！专栏特色1.经典算法练习：根据信息学竞赛大纲，精心挑选经典算法题目，提供清晰的代码实现与详细指导，帮助您夯实算法基础。2.系统化学习路径：按照算法类别和难度分级，从基础到进阶，循序渐进，帮助您全面提升编程能力与算法思维。适合人群：准备参加蓝桥杯、GESP、CSP-J、CS
xml解析小猪猪08 xml
1、DOM解析的步奏准备工作： 1.创建DocumentBuilderFactory的对象 2.创建DocumentBuilder对象 3.通过DocumentBuilder对象的parse(String fileName)方法解析xml文件 4.通过Document的getElem
每个开发人员都需要了解的一个SQL技巧 brotherlamp linux linux视频 linux教程 linux自学 linux资料
对于数据过滤而言CHECK约束已经算是相当不错了。然而它仍存在一些缺陷，比如说它们是应用到表上面的，但有的时候你可能希望指定一条约束，而它只在特定条件下才生效。使用SQL标准的WITH CHECK OPTION子句就能完成这点，至少Oracle和SQL Server都实现了这个功能。下面是实现方式： CREATE TABLE books ( id &
Quartz——CronTrigger触发器 eksliang quartz CronTrigger
转载请出自出处：http://eksliang.iteye.com/blog/2208295 一.概述 CronTrigger 能够提供比 SimpleTrigger 更有具体实际意义的调度方案，调度规则基于 Cron 表达式，CronTrigger 支持日历相关的重复时间间隔（比如每月第一个周一执行），而不是简单的周期时间间隔。二.Cron表达式介绍 1）Cron表达式规则表 Quartz
Informatica基础 18289753290 Informatica Monitor manager workflow Designer
1. 1）PowerCenter Designer：设计开发环境，定义源及目标数据结构；设计转换规则，生成ETL映射。 2）Workflow Manager：合理地实现复杂的ETL工作流，基于时间，事件的作业调度 3）Workflow Monitor：监控Workflow和Session运行情况，生成日志和报告 4）Repository Manager：
linux下为程序创建启动和关闭的的sh文件，scrapyd为例酷的飞上天空 scrapy
对于一些未提供service管理的程序每次启动和关闭都要加上全部路径，想到可以做一个简单的启动和关闭控制的文件下面以scrapy启动server为例，文件名为run.sh： #端口号，根据此端口号确定PID PORT=6800 #启动命令所在目录 HOME='/home/jmscra/scrapy/' #查询出监听了PORT端口
人--自私与无私永夜-极光
今天上毛概课,老师提出一个问题--人是自私的还是无私的,根源是什么? 从客观的角度来看,人有自私的行为,也有无私的
Ubuntu安装NS-3 环境脚本随便小屋 ubuntu
将附件下载下来之后解压，将解压后的文件ns3environment.sh复制到下载目录下（其实放在哪里都可以，就是为了和我下面的命令相统一）。输入命令： sudo ./ns3environment.sh >>result 这样系统就自动安装ns3的环境，运行的结果在result文件中，如果提示 com
创业的简单感受 aijuans 创业的简单感受
2009年11月9日我进入a公司实习，2012年4月26日，我离开a公司，开始自己的创业之旅。今天是2012年5月30日，我忽然很想谈谈自己创业一个月的感受。当初离开边锋时，我就对自己说：“自己选择的路，就是跪着也要把他走完”，我也做好了心理准备，准备迎接一次次的困难。我这次走出来，不管成败
如何经营自己的独立人脉 aoyouzi 如何经营自己的独立人脉
独立人脉不是父母、亲戚的人脉，而是自己主动投入构造的人脉圈。“放长线，钓大鱼”，先行投入才能产生后续产出。现在几乎做所有的事情都需要人脉。以银行柜员为例，需要拉储户，而其本质就是社会人脉，就是社交！很多人都说，人脉我不行，因为我爸不行、我妈不行、我姨不行、我舅不行……我谁谁谁都不行，怎么能建立人脉？我这里说的人脉，是你的独立人脉。以一个普通的银行柜员
JSP基础百合不是茶 jsp 注释隐式对象
1,JSP语句的声明 <%! 声明 %> 　　声明：这个就是提供java代码声明变量、方法等的场所。表达式 <%= 表达式 %> 　　这个相当于赋值，可以在页面上显示表达式的结果，程序代码段/小型指令　<% 程序代码片段 %> 2,JSP的注释
web.xml之session-config、mime-mapping bijian1013 java web.xml servlet session-config mime-mapping
session-config 1.定义： <session-config> <session-timeout>20</session-timeout> </session-config> 2.作用：用于定义整个WEB站点session的有效期限，单位是分钟。 mime-mapping 1.定义： <mime-m
互联网开放平台（1） Bill_chen 互联网 qq 新浪微博百度腾讯
现在各互联网公司都推出了自己的开放平台供用户创造自己的应用，互联网的开放技术欣欣向荣，自己总结如下： 1.淘宝开放平台(TOP) 网址：http://open.taobao.com/ 依赖淘宝强大的电子商务数据，将淘宝内部业务数据作为API开放出去，同时将外部ISV的应用引入进来。目前TOP的三条主线： TOP访问网站：open.taobao.com ISV后台：my.open.ta
【MongoDB学习笔记九】MongoDB索引 bit1129 mongodb
索引可以在任意列上建立索引索引的构造和使用与传统关系型数据库几乎一样,适用于Oracle的索引优化技巧也适用于Mongodb 使用索引可以加快查询,但同时会降低修改,插入等的性能内嵌文档照样可以建立使用索引测试数据 var p1 = { "name":"Jack", "age&q
JDBC常用API之外的总结白糖_ jdbc
做JAVA的人玩JDBC肯定已经很熟练了，像DriverManager、Connection、ResultSet、Statement这些基本类大家肯定很常用啦，我不赘述那些诸如注册JDBC驱动、创建连接、获取数据集的API了，在这我介绍一些写框架时常用的API，大家共同学习吧。 ResultSetMetaData获取ResultSet对象的元数据信息
apache VelocityEngine使用记录 bozch VelocityEngine
VelocityEngine是一个模板引擎，能够基于模板生成指定的文件代码。使用方法如下： VelocityEngine engine = new VelocityEngine();// 定义模板引擎 Properties properties = new Properties();// 模板引擎属
编程之美-快速找出故障机器 bylijinnan 编程之美
package beautyOfCoding; import java.util.Arrays; public class TheLostID { /*编程之美假设一个机器仅存储一个标号为ID的记录，假设机器总量在10亿以下且ID是小于10亿的整数，假设每份数据保存两个备份，这样就有两个机器存储了同样的数据。 1.假设在某个时间得到一个数据文件ID的列表，是
关于Java中redirect与forward的区别 chenbowen00 java servlet
在Servlet中两种实现： forward方式：request.getRequestDispatcher(“/somePage.jsp”).forward(request, response); redirect方式：response.sendRedirect(“/somePage.jsp”); forward是服务器内部重定向，程序收到请求后重新定向到另一个程序，客户机并不知
[信号与系统]人体最关键的两个信号节点 comsci 系统
如果把人体看做是一个带生物磁场的导体,那么这个导体有两个很重要的节点,第一个在头部,中医的名称叫做百汇穴, 另外一个节点在腰部,中医的名称叫做命门如果要保护自己的脑部磁场不受到外界有害信号的攻击,最简单的
oracle 存储过程执行权限 daizj oracle 存储过程权限执行者调用者
在数据库系统中存储过程是必不可少的利器，存储过程是预先编译好的为实现一个复杂功能的一段Sql语句集合。它的优点我就不多说了，说一下我碰到的问题吧。我在项目开发的过程中需要用存储过程来实现一个功能，其中涉及到判断一张表是否已经建立，没有建立就由存储过程来建立这张表。 CREATE OR REPLACE PROCEDURE TestProc IS fla
为mysql数据库建立索引 dengkane mysql 性能索引
前些时候，一位颇高级的程序员居然问我什么叫做索引，令我感到十分的惊奇，我想这绝不会是沧海一粟，因为有成千上万的开发者（可能大部分是使用MySQL的）都没有受过有关数据库的正规培训，尽管他们都为客户做过一些开发，但却对如何为数据库建立适当的索引所知较少，因此我起了写一篇相关文章的念头。最普通的情况，是为出现在where子句的字段建一个索引。为方便讲述，我们先建立一个如下的表。
学习C语言常见误区如何看懂一个程序如何掌握一个程序以及几个小题目示例 dcj3sjt126com c 算法
如果看懂一个程序，分三步 1、流程 2、每个语句的功能 3、试数如何学习一些小算法的程序尝试自己去编程解决它，大部分人都自己无法解决如果解决不了就看答案关键是把答案看懂，这个是要花很大的精力，也是我们学习的重点看懂之后尝试自己去修改程序，并且知道修改之后程序的不同输出结果的含义照着答案去敲调试错误
centos6.3安装php5.4报错 dcj3sjt126com centos6
报错内容如下: Resolving Dependencies --> Running transaction check ---> Package php54w.x86_64 0:5.4.38-1.w6 will be installed --> Processing Dependency: php54w-common(x86-64) = 5.4.38-1.w6 for
JSONP请求 flyer0126 jsonp
使用jsonp不能发起POST请求。 It is not possible to make a JSONP POST request. JSONP works by creating a <script> tag that executes Javascript from a different domain; it is not pos
Spring Security（03）——核心类简介 234390216 Authentication
核心类简介目录 1.1 Authentication 1.2 SecurityContextHolder 1.3 AuthenticationManager和AuthenticationProvider 1.3.1 &nb
在CentOS上部署JAVA服务 java--hhf java jdk centos Java服务
本文将介绍如何在CentOS上运行Java Web服务，其中将包括如何搭建JAVA运行环境、如何开启端口号、如何使得服务在命令执行窗口关闭后依旧运行第一步：卸载旧Linux自带的JDK ①查看本机JDK版本 java -version 结果如下 java version "1.6.0"
oracle、sqlserver、mysql常用函数对比[to_char、to_number、to_date] ldzyz007 oracle mysql SQL Server
oracle &n
记Protocol Oriented Programming in Swift of WWDC 2015 ningandjin protocol WWDC 2015 Swift2.0
其实最先朋友让我就这个题目写篇文章的时候，我是拒绝的，因为觉得苹果就是在炒冷饭，把已经流行了数十年的OOP中的“面向接口编程”还拿来讲，看完整个Session之后呢，虽然还是觉得在炒冷饭，但是毕竟还是加了蛋的，有些东西还是值得说说的。通常谈到面向接口编程，其主要作用是把系统设计和具体实现分离开，让系统的每个部分都可以在不影响别的部分的情况下，改变自身的具体实现。接口的设计就反映了系统
搭建 CentOS 6 服务器(15) - Keepalived、HAProxy、LVS rensanning keepalived
（一）Keepalived （1）安装 # cd /usr/local/src # wget http://www.keepalived.org/software/keepalived-1.2.15.tar.gz # tar zxvf keepalived-1.2.15.tar.gz # cd keepalived-1.2.15 # ./configure # make &a
ORACLE数据库SCN和时间的互相转换 tomcat_oracle oracle sql
SCN（System Change Number 简称 SCN）是当Oracle数据库更新后，由DBMS自动维护去累积递增的一个数字，可以理解成ORACLE数据库的时间戳，从ORACLE 10G开始，提供了函数可以实现SCN和时间进行相互转换；　　用途：在进行数据库的还原和利用数据库的闪回功能时，进行SCN和时间的转换就变的非常必要了；　　操作方法：　　1、通过dbms_f
Spring MVC 方法注解拦截器 xp9802 spring mvc
应用场景，在方法级别对本次调用进行鉴权，如api接口中有个用户唯一标示accessToken,对于有accessToken的每次请求可以在方法加一个拦截器，获得本次请求的用户，存放到request或者session域。 python中，之前在python flask中可以使用装饰器来对方法进行预处理，进行权限处理先看一个实例,使用@access_required拦截： ?