另一个我竟然存在

机器学习：《统计学习方法》笔记（二）—— 条件随机场（CRF）

参考：《统计学习方法》——李航；

摘要

介绍条件随机场的基本概念、概率计算、学习方法、预测方法等内容。

正文

1.基本概念

1.1 什么是条件随机场

条件随机场的定义为：X和Y都是随机变量， $P\left(Y|X\right)$ 是给定X条件下Y的条件概率分布。若Y可以构成一个由无向图 $G=\left(V,E\right)$ 表示的马尔可夫随机场，即

$P(Y\sub_{v}|X,Y\sub_{w},w\neq v)=P(Y\sub_{v}|X,Y\sub_{w},w=v)$

对任意成立，则称为条件随机场。

其中 $w\neq v$ 指在无向图中除之外的所有点，指与相连的所有点。

1.2 什么是概率无向图模型

联合概率分布 $P\left(Y \right )$ 由无向图 $G=\left(V,E\right)$ 来表示，图中的结点表示随机变量，边表示依赖关系。如果 $P\left(Y \right )$ 满足成对、局部、全局马尔可夫性，则该联合概率分布为无向图模型。

无向图中的最大团是指图的某个子集中任何两个结点均有边连接，并且这个子集不能再加任何一个结点使之成为更大的团。图中 ${Y_1,Y_2,Y_3 }$ 是一个最大团， ${Y_1,Y_2,Y_3,Y_4 }$ 不是最大团。

无向图的特点在于可以被因子分解，即用最大团的随机变量的函数的乘积来表示概率无向图的联合概率分布。

$P(Y)=\frac{1}{Z} \prod_{C} \psi_{C}\left(Y_C \right )$

$Z=\sum_{Y} \prod_{C}\psi_C(Y_C)$

$\psi_C(Y_C)=\exp\{-E(Y_C)\}$

C是无向图中的最大团，是C的结点对应的随机变量， $\psi_C(Y_C)$ 是C上定义的严格正函数，乘积是在无向图所有的最大团上进行的。

1.3 什么是成对、局部、全局马尔可夫性

成对马尔可夫性：

和是无向图中任意两个没有边连接的结点，两个结点分别对应随机变量，，其他结点为，对应的随机变量组为。则成对马尔可夫性指，给定随机变量组的条件下，，是条件独立的。

局部马尔可夫性：

$v\in V$ 是无向图中任意一结点，是与有边连接的所有结点，是之外的所有结点，各自表示的随机变量（组）为。则局部马尔可夫性指，给定随机变量组的条件下，与是独立的，即

全局马尔可夫性：

结点集合被无向图中点集分隔开，其对应的随机变量组分别为，则全局马尔可夫性是指给定随机变量组条件下的随机变量组和是条件独立的，即

1.4 线性条件随机场

和是线性链表示的随机变量序列，在给定X的条件下，Y的条件概率分布构成条件随机场，即满足马尔可夫性

$P(Y_i|X,Y_1,...,Y_{i-1},Y_{i+1},...Y_n)=P(Y_i|X,Y_{i-1},Y_{i+1})$

（在和时只考虑单边）

则称为线性条件随机场。在标注问题中，X表示输入观测序列，Y表示对应的输出标记序列或状态序列。

1.4.1 条件随机场的参数化形式为

$P(y|x)=\frac{1}{Z(x)}\exp(\sum_{i,k}\lambda_k t_k(y_{i-1},y_i,x,i)+\sum_{i,l} \mu _l s_l (y_i,x,i))$

$Z(x)=\sum_{y} \exp(\sum_{i,k} \lambda_k t_k (y_{i-1},y_i,x,i)+ \sum_{i,l} \mu_l s_l(y_i,x,i))$

式中是定义在边上的特征函数，称为转移特征，依赖于当前和前一个位置，

是定义在结点上的特征函数，称为状态特征，依赖于当前位置。

通常两个函数的取值为1或0；满足特征时取1，否则取0。

1.4.2 条件随机场的简化形式

$f_k(y_{i-1},y_i,x,i)=\begin{cases}t_k(y_{i-1},y_i,x,i) & k=1,2,...K_1 \\ s_l(y_i,x,i) & x= K_1+l;l=1,2,...,K_2 \end{cases}$

$f_k(y,x)=\sum_{i=1}^{n}f_k(y_{i-1},y_i,x,i), k=1,2,...,K$

$w_k=\begin{cases}\lambda_k, & k=1,2,...,K_1 \\ \mu_k & k= K_1+l;l=1,2,...,K_2 \end{cases}$

故 $P(y|x)=\frac{1}{Z(x)}\exp\sum_{k=1}^{K}w_kf_k(y,x)$ 。

1.4.3 条件随机场的矩阵形式

引入起点和终点状态标记， $y_{n+1}=stop$ 。对观测序列x的每一个位置，定义一个m阶矩阵（m表示标记取值的个数）

$M_i(x)=[M_i(y_{i-1},y_i|x)]$

$M_i(y_{i-1},y_i|x)=\exp(W_i(y_{i-1},y_i|x))$

$W_i(y_{i-1},y_i|x)=\sum_{k=1}^{K}w_kf_k(y_{i-1},y_i,x,i)$

这样，给定观测序列x，标记序列y的非规范化概率可以通过n+1个矩阵的乘积 $\prod_{i=1}^{n+1}M_i(y_{i-1},y_i|x)$ 表示，于是可得，

$P_w(y|x)=\frac{1}{Z(x)}\prod_{i=1}^{n+1}M_i(y_{i-1},y_i|x)$

$Z_w(x)=(M_1(x)M_2(x)...M_{n+1}(x))_{start,stop}$

这里，笔者对m阶矩阵的理解如下,

假设，状态序列y，观测序列x，，，标记 $y_i\in {1,2}$ ，，各个位置随机矩阵为

$M_1(x)=\begin{bmatrix}a_{01} &a_{02} \\0 &0 \end{bmatrix}$ $M_2(x)=\begin{bmatrix} b_{11} &b_{12} \\b_{21} &b_{22} \end{bmatrix}$ $M_3(x)=\begin{bmatrix} c_{11} &c_{12} \\c_{21} & c_{22} \end{bmatrix}$ $M_4(x)=\begin{bmatrix}1 & 0 \\ 1 & 0 \end{bmatrix}$

中 $a_{01}$ 表示在位置一时，从0到1的概率，从1到0的概率为0；

中 $b_{11}$ 表示在位置二时，从1到1的概率， $b_{21}$ 表示从2到1的概率；

中由于在最后stop=1，故从1到1概率为1，从2到1概率为1，从1到2概率为0，从2到2概率也为0 ；

注：是非规范化概率。

2.概率计算

2.1前向后向算法

对每个指标，定义前向向量 $\alpha_i(x)$

$\alpha_0(y|x)=\begin{cases} 1,&y=start \\ 0, &y\neq start \end{cases}$

$\alpha_i^{T}(y_i|x)=\alpha_{i-1}^{T}(y_{i-1}|x)M_i(y_{i-1},y_i|x), i=1,2,...,n+1$

即 $\alpha_i^{T}(x)=\alpha_{i-1}^{T}(x)M_i(x)$

$\alpha_i(y_i|x)$ 表示在位置i的标记是并且到位置i的前部分标记序列的非规范化概率。

对每个指标，定义后向向量 $\beta_i(x)$

$\beta_{n+1}(y_{n+1}|x)=\begin{cases} 1, &y_{n+1}=stop \\ 0, &y_{n+1}\neq stop \end{cases}$

$\beta_i(y_i|x)=M_i(y_i,y_{i+1}|x)\beta_{i+1}(y_{i+1}|x)$

即 $\beta_i(x)=M_{i+1}\beta_{i+1}(x)$

$\beta_i(y_i|x)$ 表示在位置i的标记为并且从位置i+1到n的后部分标记序列的非规范化概率。

由前向-后向向量定义可得

$Z(x)=\alpha_n^T(x)\cdot 1=1^T\cdot \beta_1(x)$

2.2概率计算

给定观测序列X，标记序列在i位置的标记是的概率为

$P(Y_i=y_i|x)=\frac{\alpha_i^T(y_i|x)\beta_i(y_i|x)}{Z(x)}$

给定观测序列X，标记序列在i-1位置是 $y_{i-1}$ ，且在i位置的标记为的概率为

$P(Y_{i-1}=y_{i-1},Y_i=y_i|x)=\frac{\alpha_{i-1}^T(y_{i-1}|x)M_i(y_{i-1},y_i|x)\beta_i(y_i|x)}{Z(x)}$

$Z(x)=\alpha_n^T(x)\cdot 1$

2.3期望值的计算

特征函数关于条件分布的数学期望是

$\begin{align*}E_{P(Y|X)}\left[f_k \right ] &= \sum_{y} P(y|x) \sum_{i=1}^{n+1}f_k(y_{i-1},y_i,x,i)\\ &= \sum_{i=1}^{n+1}\sum_{y_{i-1},y_i}f_k(y_{i-1},y_i,x,i)\frac{\alpha_{i-1}^T(y_{i-1}|x)M_{i}(y_{i-1},y_i|x)\beta_i(y_i|x)}{Z(x)} \\ & k=1,2,...,K \end{align*}$

假设经验分布为 $\tilde{P}(X)$ ，特征函数关于联合分布的数学期望是 $\begin{align*}E_{P(X,Y)}[f_k] &=\sum_{x,y}P(x,y)\sum_{i=1}^{n+1}f_k(y_{i-1},y_i,x,i)\\ &=\sum_{x}\tilde{P}(x)\sum_{y}P(y|x)\sum_{i=1}^{n+1}f_k(y_{i-1},y_i,x,i)\\ &=\sum_{x}\tilde{P}(x)\sum_{i=1}^{n+1}\sum_{y_{i+1},y_i}f_k(y_{i-1},y_i,x,i) \frac{\alpha_{i-1}^T(y_{i-1}|x)M_i(y_{i-1},y_i|x)\beta_i(y_i|x)}{Z(x)} \end{align*}$

其中

$Z(x)=\alpha_n^T(x)\cdot 1$

3. 学习算法

3.1改进的迭代尺度法

条件随机场要学习的是特征函数的权重。给定训练数据集，可以得到经验分布 $\tilde{P}(X,Y)$ 。通过极大化训练数据的对数似然函数来求解模型参数。

似然函数是

$L(w)=L_{\tilde{P}}(P_w)=\log \prod _{x,y}P_w(y|x)^{\tilde{P}(x,y)}=\sum_{x,y} \tilde{P}(x,y)\log P_w(y|x)$

$\begin{align*} L(w)&=\sum_{x,y}\tilde{P}(x,y)\log P_x(y|x)\\ &=\sum_{x,y}\left[ \tilde{P}(x,y)\sum_{k=1}^{K}w_k f_k(y,x) - \tilde{P}(x,y)\log Z_w(x) \right ]\\ &=\sum_{j=1}^{N}\sum_{k=1}^{K}w_k f_k(y_j, x_j) - \sum_{j=1}^{N}\log Z_w(x_j) \end{align*}$

改进的迭代尺度法通过迭代的方法不断优化对数似然函数改变量的下界，以达到极大化对数似然函数的目的。

算法输入：特征函数 $t_1,t_2,...,t_{k_1}$ ， $s_1,s_2,...,s_{k_2}$ ；经验分布 $\tilde{P}(X,Y)$ 。

算法输出：参数估计值 $\hat{w}$ ；模型 $P_{\hat{w}}$ 。

（1）对所有的k，取初值为；

（2）当时，令 $\delta_k$ 是方程

$\sum_{x,y}\tilde{P}(x)P(y|x)\sum_{i=1}^{n+1}t_k(y_{i-1},y_i,x,i)\exp (\delta_k T(x,y))=E_{\tilde{P}}[t_k]$

的解；

更新参数值 $w_k=w_k+\delta_k$ 。

当时，令 $\delta_k$ 是方程

$\sum_{x,y}\tilde{P}(x)P(y|x)\sum_{i=1}^{n+1}s_l(y_i,x,i)\exp (\delta_{K_1+l} T(x,y))=E_{\tilde{P}}[s_l]$

的解；

更新参数值 $w_k=w_k+\delta_k$ 。

是在数据(x,y)中出现所有特征数的总和

$T(x,y)=\sum_{k}f_k(y,x)=\sum_{k=1}^{K}\sum_{i=1}^{n+1}f_k(y_{i-1},y_i,x,i)$

（3）如果不是所有的都收敛，则重复（2）。

由于是在数据(x,y)中出现所有特征数的总和，对不同的数据(x,y)取值可能不同。为处理这个问题，定义松弛特征

$s(x,y)=S-\sum_{i=1}^{n+1}\sum_{k=1}^{K}f_k(y_{i-1},y_i,x,i)$

S是一个常数，选择中够大的常数S舍不得训练数据集的所有数据(x,y)， $s(x,y) \geq 0$ 成立，这时特征总数可取S。

更新方程也需要改一下：

对于转移特征

$\sum_{x,y}\tilde{P}(x)P(y|x)\sum_{i=1}^{n+1}t_k(y_{i-1},y_i,x,i)\exp (\delta_k S)=E_{\tilde{P}}[t_k]$

$\delta_k=\frac{1}{S}\log \frac{E_{\tilde{P}}[t_k]}{E_P[t_k]}$

$E_p (t_k)=\sum_{x} \tilde{P}(x)\sum_{i=1}^{n+1}\sum_{y_{i-1},y_i}t_k(y_{i-1},y_i,x,i)\frac{\alpha_{i-1}^{T}(y_{i-1}|x)M_i(y_{i-1},y_i|x)\beta_i(y_i|x)}{Z(x)}$

对于状态特征

$\sum_{x,y}\tilde{P}(x)P(y|x)\sum_{i=1}^{n}s_l(y_i,x,i)\exp (\delta_k S)=E_{\tilde{P}}[s_l]$

$\delta_k=\frac{1}{S}\log \frac{E_{\tilde{P}}[s_l]}{E_P[s_l]}$

$E_p(s_l)=\sum_{x}\tilde{P}(x)\sum_{i=1}^{n}\sum_{y_i}s_l(y_i,x,i)\frac{\alpha_i^T(y_i|x)\beta_i(y_i|x)}{Z(x)}$

上述方法称为算法S。常数S要取足够大，每步迭代的增量向量 $\delta_k$ 会变大，算法收敛会变慢。

算法T试图解决这个问题，其对每个观测序列x计算其特征总数最大值，即 $T(x)=\max_{y}T(x,y)$ 。

利用前向后向递推公式计算。

$\begin{align*} E_{\tilde{P}}[t_k]&=\sum_{x,y} \tilde{P}(x)P(y|x)\sum_{i=1}^{n+1}t_k(y_{i-1},y_i,x,i)\exp (\delta_k T(x))\\ &=\sum_{x}\tilde{P}(x)\sum_{y}P(y|x)\sum_{i=1}^{n+1}t_k(y_{i-1},y_i,x,i)\exp (\delta_k T(x))\\ &=\sum_{x}\tilde{P}(x)a_{k,t}\exp(\delta_k\cdot t)\\ &=\sum_{t=0}^{T_{max}}a_{k,t}\beta_k^t \end{align*}$

$a_{k,t}$ 是特征的期望值， $\delta_k=\log\beta_k$ 。 $\beta_k$ 是上式唯一实根，可用牛顿法求得，从而求得相关的 $\delta_k$ 。

$\begin{align*} E_{\tilde{P}}[s_l] &=\sum_{x,y}\tilde{P}(x)P(y|x)\sum_{i=1}^{n}s_l(y_i,x,i)\exp(\delta_{K_1+l}T(x))\\ &=\sum_{x}\tilde{P}(x)\sum_{y}P(y|x)\sum_{i=1}^{n}s_l(y_i,x,i)\exp(\delta_{K_1+l}T(x))\\ &=\sum_{x}\tilde{P}(x)b_{l,t}\exp(\delta_{k} \cdot t)\\\ &=\sum_{t=0}^{T_{max}}b_{l,t}\gamma_l^t \end{align*}$

$b_{l,t}$ 是特征的期望值， $\delta_l=\log \gamma_l$ ， $\gamma_l$ 是上式唯一实根，用牛顿法求得。

条件随机场的学习算法也可以用拟牛顿法，具体如何用，本文不再详述，以后接触到拟牛顿法时，再详细讲解。

4.预测算法

同HMM一样，CRF也可以用维特比算法来进行预测。

CRF的预测问题是给定模型P(y|x)和输入序列x，求条件概率最大的输出序列，即对观测序列进行标注。

$\begin{align*} y^* &=\arg \max_{y}P_w(y|x)\\ &=\arg \max_y \frac{\exp (w \cdot F(x,y))}{Z_w(x)}\\ &=\arg \max_y \exp (w \cdot F(x,y))\\ &= \arg \max_y (w \cdot F(x,y)) \end{align*}$

CRF的预测问题就是求非规范化概率最大的最优路径问题 $\max_y (w \cdot F(y,x))$

$f_k(y,x)=\sum_{i=1}^{n}f_k(y_{i-1},y_i,x,i), i=1,2,...,K$

可以写成

$\max_y \sum_{i=1}^{n}w \cdot F_i(y_{i-1},y_i,x)$

其中

$F_i(y_{i-1},y_i,x)=(f_1(y_{i-1},y_i,x),f_2(y_{i-1},y_i,x),...,f_K(y_{i-1},y_i,x))^T$

维特比方法过程如下

首先求出位置1的各个标记的非规范化概率

$\delta_1(j)=w \cdot F_1(y_0=start,y_1=j,x),j=1,2,...,m$

再求出到位置i的各个标记的非规范化概率的最大值，同时记录最大值的路径

$\delta_i(l)=\max_{1\leq j \leq m} \left \{\delta_{i-1}(j)+w \cdot F_i(y_{i-1}=j,y_i=l,x) \right \},l=1,2,...,m$

$\psi_i(l)=\arg \max_{1\leq j \leq m} \left \{\delta_{i-1}(j)+w \cdot F_i(y_{i-1}=j,y_i=l,x) \right \},l=1,2,...,m$

直到i=n时终止，这时求得非规范化概率的最大值及最优路径的终点，再由此终点返回 $y_i^*=\psi_{i+1}(y_{i+1}^*)$ 。

至此可求得最优路径。

Lineageos 22.1(Android 15) 开机向导制作 JabamiLight Lineageos android android 15 开机向导 Lineageos 22.1
一、前言开机向导原理其实就是将特定的category的Activity加入ComponentResolver，如下然后我们开机启动的时候，FallbackHome结束，然后启动Launcher的时候，就会找到对应的开机向导Activity页面。所以我们现定制我们自己的应用。这篇文章只适用于aosp原版的provision，Lineageos有自己的setup_wizard，虽然按照流程可以启动，但
关于AI OS那点事大囚长科普天地大模型人工智能
AIOS（人工智能操作系统）作为面向智能时代的操作系统，其功能定位和架构设计与传统操作系统（如Linux、Windows、iOS等）存在显著差异。一、AIOS需具备的核心功能智能体全生命周期管理智能体调度与并发：需支持多智能体任务的优先级排序、资源分配及并发执行，例如通过轮询调度或动态优先级算法优化LLM资源利用率。上下文感知与切换：通过上下文管理器实现智能体交互状态的快照保存与恢复，解决LLM生
python实际应用场景代码 yzx991013 python 前端服务器
1.自动化文件整理importosimportshutildeforganize_downloads_folder():download_path="/Users/YourName/Downloads"#修改为你的下载路径file_types={"Images":[".jpg",".png",".gif"],"Documents":[".pdf",".docx",".txt"],"Videos":
WPF从初学者到专家：实战项目经验分享与总结 xcLeigh WPF 从入门到精通 wpf C#
WPF从初学者到专家：实战项目经验分享与总结一、前言二、WPF基础概念与入门2.1什么是WPF2.2XAML基础2.3数据绑定基础三、第一个WPF项目：简单的待办事项列表3.1项目需求分析3.2项目搭建与界面设计3.3业务逻辑实现四、中级项目：音乐播放器应用4.1项目需求分析4.2界面设计与布局4.3多媒体功能实现五、高级项目：企业级办公自动化平台（回顾与进阶）5.1项目回顾与优化5.2引入MVV
C++有哪些高级特性值得学习？ c++
C++是一种功能丰富且复杂的编程语言，其中许多高级特性可以帮助开发者编写更高效、更安全、更灵活的代码。以下是一些值得深入学习的C++高级特性：模板编程（Templates）模板是C++中实现泛型编程的核心机制，允许开发者编写与数据类型无关的代码。模板函数cpp复制templateTmax(Ta,Tb){return(a>b)?a:b;}优点：模板函数可以处理多种数据类型，避免了代码重复。应用场景：
北斗导航 |低轨导航研究进展单北斗SLAMer 卫星导航人工智能北斗三号 GNSS 算法低轨导航
低轨导航作为空天信息网络的重要组成部分，近年来在技术研发、系统构建及实际应用方面均取得显著进展。以下是基于最新研究动态的总结：一、技术研发与系统构建低轨导航增强系统技术突破2025年1月，青岛召开的低轨卫星导航增强系统技术发展研讨会汇集了国内26家单位的60名专家，重点讨论了低轨星座与现有导航系统（如北斗、GPS）的融合增强技术。例如：巨型导航星座数字仿真试验系统：国防科技大学刘文祥团队提出通过数
基于 Redis 的分布式锁实现与优化 Blossom.118 分布式系统与高性能计算领域 redis 分布式数据库 python3.11 算法数据结构推荐算法
在分布式系统中，锁机制是保障数据一致性和并发控制的关键技术之一。Redis作为一种高性能的内存数据库，常被用于实现分布式锁。本文将详细介绍基于Redis的分布式锁的实现原理、代码示例以及优化策略，帮助读者更好地理解和应用这一技术。一、分布式锁的概念与需求在单机系统中，锁的实现相对简单，可以通过操作系统的同步机制或编程语言提供的锁机制来完成。然而，在分布式系统中，多个进程或线程可能运行在不同的机器上
【二、DeepSeek应用场景与案例】10.农业智能化：DeepSeek如何助力精准种植与养殖？代码世界的浪客人工智能 DeepSeek
一、引言1.1农业智能化的时代背景在全球人口持续增长的大趋势下，粮食需求正以前所未有的速度攀升。据联合国相关预测，到2050年，全球人口有望突破90亿，这无疑给本就压力重重的农业生产带来了更为艰巨的挑战，保障充足的粮食供应成为了迫在眉睫的任务。与此同时，资源短缺问题日益尖锐，耕地面积因城市化进程、土地退化等因素不断缩减，水资源分布不均且浪费严重，进一步加剧了农业生产的困境。根据世界银行的数据，过去
【人工智能】大模型的幻觉问题：DeepSeek 的解决策略与实践蒙娜丽宁 Python杂谈人工智能人工智能
《PythonOpenCV从菜鸟到高手》带你进入图像处理与计算机视觉的大门！解锁Python编程的无限可能：《奇妙的Python》带你漫游代码世界大语言模型（LLM）的“幻觉”问题，即模型生成与事实不符或脱离上下文的内容，是限制其广泛应用的关键挑战之一。本文深入探讨了幻觉问题的成因，包括训练数据的偏差、推理过程中的过度泛化以及缺乏外部验证机制。以DeepSeek系列模型为研究对象，我们分析了其在解
win-服务器部署程序自启动设置 johnrui operation and maintenance win 运维
为了简化应用服务器中项目启动的操作，现对在win操作系统下服务启动设置为开机启动的相关操作，在这里做一次记录和分享。参阅了很多文章，知道win设置开机启动项方式很多，这篇文章只是其中的一种，但是经过了实践测试非常有效。设置步骤如下：1）按住Win键，再按R键(Win+R)，启动"运行"窗口;2）WindowsXP/2003/2008/2008R2输入：controluserpasswords2Wi
在Spring Boot中集成分布式任务调度微赚淘客机器人开发者联盟@聚娃科技 spring boot 分布式后端
在SpringBoot中集成分布式任务调度大家好，我是微赚淘客系统3.0的小编，也是冬天不穿秋裤，天冷也要风度的程序猿！1.引言分布式任务调度是现代企业应用中常见的需求，特别是在微服务架构中，不同服务可能需要定时执行任务、定时触发某些业务逻辑或者周期性地处理数据。SpringBoot提供了多种方式来实现分布式任务调度，包括使用Quartz、Spring自带的任务调度以及集成第三方调度中心等。2.使
网络安全-黑客攻击刘林锋blog 网络规划设计师信息安全安全网络
基本知识黑客（Hacker）、骇客（Cracker）攻击，需要进行信息收集和根据需求选择攻击方式。信息收集攻击的效果和对目标的了解程度有着直接的相关性。因此信息收集在攻击过程中占据着头等重要的位置，包括财务数据、硬件配置、人员结构、网络架构和整体利益等诸多方面。主要方式如下：网络监测。一些监测网络中计算机漏洞的工具，包括嗅探应用软件，能在计算机内部或通过网络来捕捉传输过程中的密码等数据信息。社会工
汇编 - 基础知识雨过濯缨汇编语言汇编
文章目录前言1.组成2.指令和数据3.存储器读写4.地址总线5.数据总线6.控制总线7.计算机组成7.1存储器芯片8.内存地址空间总结前言汇编语言是直接在硬件之上工作的编程语言,首先了解硬件系统的结构,才能有效地应用汇编语言对其编程;值得注意的是,汇编指令是机器指令便于记忆的书写格式.此处的汇编语言版本为8086CPU的MASM宏汇编版本1.组成编译器:将汇编指令转换为机器指令的翻译程序编写编
高效利用AI处理大型编程任务大囚长大模型人工智能
在大型编程任务中，通过将任务细分为适合AI上下文处理能力的子任务并整合生成目标应用，已成为当前AI辅助开发的主流方法。一、任务分解的核心策略模块化功能拆分通过分层架构设计将系统拆分为独立模块（如用户认证、支付接口、数据存储），每个模块的代码量控制在AI模型的上下文窗口内（如ClaudeMax的200k窗口可处理约2万行代码）。例如开发电商系统时，可分解为「购物车逻辑」「库存管理」「订单流水」等子模
AWE大会来袭：家电圈上演“无限战争” 互联网江湖人工智能大数据 microsoft
文：互联网江湖作者：刘致呈3月19日，一年一度的中国家电及消费电子博览会AWE如期而至。每次大会，大小品牌方都会携自己的新品亮相，是家电圈的“春晚”。这次的看点除了AI外，还有一个有意思的点，就是部分品牌开始向大家电进军。比如追觅科技，在高端扫地机器人市场上取得一番成绩之后，表示要开始做冰箱、空调、洗衣机了。无独有偶，主攻厨电赛道的方太，也开始进军冰箱板块；还有石头科技，也有洗烘一体的洗衣机。这些
滴滴2024年四季度财报：订单同比增长14.8% GTV增至1032亿元互联网江湖人工智能大数据
3月18日，滴滴在其官网发布2024年第四季度业绩及全年业绩。延续前三季度的增长趋势，四季度，滴滴包括中国出行和国际业务在内的核心平台交易量达42.66亿单，同比增长14.8%，同期核心平台GTV（交易总额）达1032亿元，同比增长14.5%。2024年全年滴滴核心平台交易量为160.05亿单，较2023年增长18.8%；2024全年滴滴核心平台GTV为3927亿元，较2023年增长16.2%。2
解释CALL_FORM,NEW_FORM和OPEN_FORM之间有什么区别？思维导图代码示例（java 架构) 用心去追梦 java 架构开发语言
CALL_FORM,NEW_FORM和OPEN_FORM之间的区别在OracleForms中，CALL_FORM、NEW_FORM和OPEN_FORM是用于管理和启动表单的不同命令。每个命令的行为和用途都有所不同，理解它们的区别对于正确构建和管理Forms应用程序非常重要。1.CALL_FORM定义：调用并运行另一个表单，但不会关闭当前表单。被调用的表单以模式对话框的形式显示，即用户必须完成或取消
浏览器渲染流程前端岳大宝前端核心知识总结前端 javascript
以下是关于浏览器渲染流程的系统梳理，涵盖基础原理、关键阶段、性能优化及进阶知识，帮助我们深入理解现代浏览器如何将代码转换为用户可见的像素：一、核心渲染流程（CriticalRenderingPath）浏览器渲染流程分为六个核心阶段，决定页面首次加载和更新的性能：1.构建DOM（DocumentObjectModel）过程：解析HTML生成DOM树（逐步解析，遇到可能阻塞）。阻塞因素：未添加asyn
Android Compose 线性布局（Row、Column）源码深度剖析(十) &有梦想的咸鱼& Androiod Compose原理 Android开发大全 android
AndroidCompose线性布局（Row、Column）源码深度剖析一、引言在Android应用开发的领域中，UI布局是构建用户界面的核心工作之一。良好的布局设计不仅能提升用户体验，还能使应用在不同设备上保持一致的视觉效果。随着Android开发技术的不断演进，JetpackCompose作为新一代的声明式UI框架应运而生。它以简洁的代码、高效的性能和强大的可维护性，逐渐成为开发者的首选。线性
网页版 123 分身数字人源码搭建，OEM贴牌 18538162800=余音视频矩阵
在数字化时代的浪潮下，数字人技术蓬勃发展，网页版123分身数字人源码搭建为众多开发者和企业提供了实现个性化数字人应用的可能。本文将深入探讨其技术开发过程，从底层架构到关键技术实现，全方位解析如何构建一个功能强大的网页版数字人系统。技术架构设计前端展示层HTML5与CSS3：构建数字人的可视化界面，实现流畅的动画效果和交互元素。利用CSS3的过渡、动画属性，为数字人的动作、表情变化提供细腻的视觉呈现
IPv6网络的可操作安全考虑——RFC9099解析（四）黑带架构湿 IPv6安全网络安全安全
2.6记录和监控为了在发生安全事件或检测到异常行为的情况下进行取证（forensic）研究，网络运营商应记录多个信息片段。在某些情况下，这需要通过网络管理站对设备进行频繁的轮询。日志包括但不限于：在可用时，使用网络的所有应用程序（包括用户空间和内核空间）的日志(例如，网络运营商管理的web服务器；IPFIX数据【RFC7011】；SNMPMIBs或来自RESTCONF/NETCONF的YANG数据
PyTorch基础知识讲解（一）完整训练流程示例苏雨流丰机器学习 pytorch 人工智能 python 机器学习深度学习
文章目录Tutorial1.数据处理2.网络模型定义3.损失函数、模型优化、模型训练、模型评价4.模型保存、模型加载、模型推理Tutorial大多数机器学习工作流程涉及处理数据、创建模型、优化模型参数和保存训练好的模型。本教程向你介绍一个用PyTorch实现的完整的ML工作流程，并提供链接来了解这些概念中的每一个。我们将使用FashionMNIST数据集来训练一个神经网络，预测输入图像是否属于以下
机器学习中的贝叶斯网络：如何构建高效的风险预测模型 AI天才研究院 DeepSeek R1 &大数据AI人工智能大模型自然语言处理人工智能语言模型编程实践开发语言架构设计
作者：禅与计算机程序设计艺术文章目录机器学习中的贝叶斯网络：如何构建高效的风险预测模型1.背景介绍2.基本概念术语说明2.1马尔科夫随机场（MarkovRandomField）2.2条件随机场（ConditionalRandomField，CRF）2.3变量elimination算法2.4贝叶斯网络3.核心算法原理和具体操作步骤以及数学公式讲解3.1原理介绍1.贝叶斯网络基础2.贝叶斯网络构建风险
入门 Canvas：Web 绘图的强大工具 Hopebearer_ 前端 es6 javascript canva可画
文章目录入门Canvas：Web绘图的强大工具一、Canvas简介二、Canvas的基本用法（一）绘制基本图形（二）绘制文本三、Canvas的应用场景（一）数据可视化（二）游戏开发（三）图像编辑四、Canvas的动画效果五、Canvas的优势与局限性（一）优势（二）局限性六、总结入门Canvas：Web绘图的强大工具在Web开发的广阔天地中，为了满足用户对丰富、交互性强的体验的不断追求，前端技术持
【机会约束、鲁棒优化】机会约束和鲁棒优化研究优化【ccDCOPF】研究（Matlab代码实现）科研_G.E.M. matlab 概率论开发语言
‍个人主页欢迎来到本博客❤️❤️博主优势：博客内容尽量做到思维缜密，逻辑清晰，为了方便读者。⛳️座右铭：行百里者，半于九十。本文目录如下：目录1概述机会约束、鲁棒优化与ccDCOPF研究综述1.机会约束规划（ChanceConstrainedProgramming,CCP）在电力系统中的应用2.鲁棒优化（RobustOptimization,RO）在电力系统中的应用3.机会约束与鲁棒优化的协同方法
yolov8实战第七天——pyqt5-yolov8实现车牌识别系统（参考论文（约7000字）+环境配置+完整部署代码+代码使用说明+训练好的模型）学术菜鸟小晨 yolov8实战100天 python YOLO pyqt5 车牌识别毕业设计论文
基于pyqt5-yolov8实现车牌识别系统，包括图片车牌识别，视频车牌识别，视频流车牌识别。效果展示（图片检测，检测到的内容添加到历史记录）：效果展示（视频检测，视频车辆只会添加一条记录，下文更多实际应用中的优化策略）：新增功能：批量图片检测（2024/5/7更新代码）
GTC 2025 中文在线解读扫地的小何尚人工智能 NVIDIA GPU 深度学习机器学习
GTC2025中文在线解读｜CUDA最新特性与未来[WP72383]NVIDIAGTC大会火热进行中，一波波重磅科技演讲让人应接不暇，3月24日，NVIDIA企业开发者社区邀请KenHe、YipengLi两位技术专家，面向开发者，以中文深度拆解GTC2025四场重磅开发技术相关会议，直击AI行业应用痛点，破解前沿技术难题!作为GPU计算领域的基石，CUDA通过其编程语言、编译器、运行时环境及核心库
Python 3 介绍（二十二）--mysql-connector-python 小蘑菇二号零基础学 Python--快速入门 Python 快速入门 adb
目录安装mysql-connector-python基本使用示例1.连接到数据库2.插入数据3.更新数据4.删除数据进阶功能1.使用事务2.批量插入数据3.使用字典游标错误处理总结mysql-connector-python是一个用于Python的MySQL数据库驱动程序，它允许Python应用程序与MySQL数据库进行交互。这个驱动程序提供了高级别的API，支持多种Python版本，并且兼容多种
Vue 3 事件总线详解：构建组件间高效通信的桥梁 A-Kamen vue.js 前端 javascript
Vue3事件总线详解：构建组件间高效通信的桥梁为什么需要事件总线？使用mitt实现事件总线1.安装mitt2.创建事件总线3.在组件中使用事件总线发送端组件（例如ComponentA.vue）接收端组件（例如ComponentB.vue）自定义实现事件总线总结在复杂的前端应用中，组件之间的通信往往需要一种灵活且解耦的方式。传统的Vue2中，我们常使用全局事件总线来实现这种通信，但在Vue3中，由于
优化 Java 数据结构选择与使用，提升程序性能与可维护性 A-Kamen java 数据结构开发语言
引言在软件开发中，数据结构的选择是影响程序性能、内存使用以及代码可维护性的关键因素之一。Java作为一门广泛使用的编程语言，提供了丰富的内置数据结构，如数组、链表、栈、队列、树、图以及集合框架中的各种接口实现（如List,Set,Map等）。然而，面对不同的应用场景，如何合理地选择和优化数据结构，成为了一个值得深入探讨的话题。本文将介绍几种常见的Java数据结构，并探讨如何根据实际需求进行优化选择
数据采集高并发的架构应用 3golden .net
问题的出发点：最近公司为了发展需要，要扩大对用户的信息采集，每个用户的采集量估计约2W。如果用户量增加的话，将会大量照成采集量成3W倍的增长，但是又要满足日常业务需要，特别是指令要及时得到响应的频率次数远大于预期。 &n
不停止 MySQL 服务增加从库的两种方式 brotherlamp linux linux视频 linux资料 linux教程 linux自学
现在生产环境MySQL数据库是一主一从，由于业务量访问不断增大，故再增加一台从库。前提是不能影响线上业务使用，也就是说不能重启MySQL服务，为了避免出现其他情况，选择在网站访问量低峰期时间段操作。一般在线增加从库有两种方式，一种是通过mysqldump备份主库，恢复到从库，mysqldump是逻辑备份，数据量大时，备份速度会很慢，锁表的时间也会很长。另一种是通过xtrabacku
Quartz——SimpleTrigger触发器 eksliang SimpleTrigger TriggerUtils quartz
转载请出自出处：http://eksliang.iteye.com/blog/2208166 一.概述 SimpleTrigger触发器，当且仅需触发一次或者以固定时间间隔周期触发执行；二.SimpleTrigger的构造函数 SimpleTrigger(String name, String group)：通过该构造函数指定Trigger所属组和名称； Simpl
Informatica应用（1） 18289753290 sql workflow lookup 组件 Informatica
1.如果要在workflow中调用shell脚本有一个command组件，在里面设置shell的路径；调度wf可以右键出现schedule，现在用的是HP的tidal调度wf的执行。 2.designer里面的router类似于SSIS中的broadcast（多播组件）;Reset_Workflow_Var：参数重置（比如说我这个参数初始是1在workflow跑得过程中变成了3我要在结束时还要
python 获取图片验证码中文字酷的飞上天空 python
根据现成的开源项目 http://code.google.com/p/pytesser/改写在window上用easy_install安装不上看了下源码发现代码很少于是就想自己改写一下添加支持网络图片的直接解析 #coding:utf-8 #import sys #reload(sys) #sys.s
AJAX 永夜-极光 Ajax
1.AJAX功能:动态更新页面,减少流量消耗,减轻服务器负担 2.代码结构: <html> <head> <script type="text/javascript"> function loadXMLDoc() { .... AJAX script goes here ...
创业OR读研随便小屋创业
现在研一，有种想创业的想法，不知道该不该去实施。因为对于的我情况这两者是矛盾的，可能就是鱼与熊掌不能兼得。研一的生活刚刚过去两个月，我们学校主要的是
需求做得好与坏直接关系着程序员生活质量 aijuans IT 生活
这个故事还得从去年换工作的事情说起，由于自己不太喜欢第一家公司的环境我选择了换一份工作。去年九月份我入职现在的这家公司，专门从事金融业内软件的开发。十一月份我们整个项目组前往北京做现场开发，从此苦逼的日子开始了。系统背景：五月份就有同事前往甲方了解需求一直到6月份，后续几个月也完
如何定义和区分高级软件开发工程师 aoyouzi
在软件开发领域，高级开发工程师通常是指那些编写代码超过 3 年的人。这些人可能会被放到领导的位置，但经常会产生非常糟糕的结果。Matt Briggs 是一名高级开发工程师兼 Scrum 管理员。他认为，单纯使用年限来划分开发人员存在问题，两个同样具有 10 年开发经验的开发人员可能大不相同。近日，他发表了一篇博文，根据开发者所能发挥的作用划分软件开发工程师的成长阶段。　　初
Servlet的请求与响应百合不是茶 servlet get提交 java处理post提交
Servlet是tomcat中的一个重要组成,也是负责客户端和服务端的中介 1,Http的请求方式(get ,post); 客户端的请求一般都会都是Servlet来接受的,在接收之前怎么来确定是那种方式提交的,以及如何反馈,Servlet中有相应的方法, http的get方式 servlet就是都doGet(
web.xml配置详解之listener bijian1013 java web.xml listener
一.定义 <listener> <listen-class>com.myapp.MyListener</listen-class> </listener> 二.作用该元素用来注册一个监听器类。可以收到事件什么时候发生以及用什么作为响
Web页面性能优化（yahoo技术） Bill_chen JavaScript Ajax Web css Yahoo
1.尽可能的减少HTTP请求数 content 2.使用CDN server 3.添加Expires头(或者 Cache-control) server 4.Gzip 组件 server 5.把CSS样式放在页面的上方。 css 6.将脚本放在底部(包括内联的) javascript 7.避免在CSS中使用Expressions css 8.将javascript和css独立成外部文
【MongoDB学习笔记八】MongoDB游标、分页查询、查询结果排序 bit1129 mongodb
游标游标，简单的说就是一个查询结果的指针。游标作为数据库的一个对象，使用它是包括声明打开循环抓去一定数目的文档直到结果集中的所有文档已经抓取完关闭游标游标的基本用法，类似于JDBC的ResultSet(hasNext判断是否抓去完,next移动游标到下一条文档)，在获取一个文档集时，可以提供一个类似JDBC的FetchSize
ORA-12514 TNS 监听程序当前无法识别连接描述符中请求服务的解决方法白糖_ ORA-12514
今天通过Oracle SQL*Plus连接远端服务器的时候提示“监听程序当前无法识别连接描述符中请求服务”，遂在网上找到了解决方案： ①打开Oracle服务器安装目录\NETWORK\ADMIN\listener.ora文件，你会看到如下信息： # listener.ora Network Configuration File: D:\database\Oracle\net
Eclipse 问题 A resource exists with a different case bozch eclipse
在使用Eclipse进行开发的时候，出现了如下的问题： Description Resource Path Location TypeThe project was not built due to "A resource exists with a different case: '/SeenTaoImp_zhV2/bin/seentao'.&
编程之美-小飞的电梯调度算法 bylijinnan 编程之美
public class AptElevator { /** * 编程之美小飞电梯调度算法 * 在繁忙的时间，每次电梯从一层往上走时，我们只允许电梯停在其中的某一层。 * 所有乘客都从一楼上电梯，到达某层楼后，电梯听下来，所有乘客再从这里爬楼梯到自己的目的层。 * 在一楼时，每个乘客选择自己的目的层，电梯则自动计算出应停的楼层。 * 问：电梯停在哪
SQL注入相关概念 chenbowen00 sql Web 安全
SQL Injection：就是通过把SQL命令插入到Web表单递交或输入域名或页面请求的查询字符串，最终达到欺骗服务器执行恶意的SQL命令。具体来说，它是利用现有应用程序，将（恶意）的SQL命令注入到后台数据库引擎执行的能力，它可以通过在Web表单中输入（恶意）SQL语句得到一个存在安全漏洞的网站上的数据库，而不是按照设计者意图去执行SQL语句。首先让我们了解什么时候可能发生SQ
[光与电]光子信号战防御原理 comsci 原理
无论是在战场上,还是在后方,敌人都有可能用光子信号对人体进行控制和攻击,那么采取什么样的防御方法,最简单,最有效呢? 我们这里有几个山寨的办法,可能有些作用,大家如果有兴趣可以去实验一下根据光
oracle 11g新特性:Pending Statistics daizj oracle dbms_stats
oracle 11g新特性:Pending Statistics 转从11g开始，表与索引的统计信息收集完毕后，可以选择收集的统信息立即发布，也可以选择使新收集的统计信息处于pending状态，待确定处于pending状态的统计信息是安全的，再使处于pending状态的统计信息发布，这样就会避免一些因为收集统计信息立即发布而导致SQL执行计划走错的灾难。在 11g 之前的版本中，D
快速理解RequireJs dengkane jquery requirejs
RequireJs已经流行很久了，我们在项目中也打算使用它。它提供了以下功能：声明不同js文件之间的依赖可以按需、并行、延时载入js库可以让我们的代码以模块化的方式组织初看起来并不复杂。在html中引入requirejs 在HTML中，添加这样的 <script> 标签： <script src="/path/to
C语言学习四流程控制if条件选择、for循环和强制类型转换 dcj3sjt126com c
# include <stdio.h> int main(void) { int i, j; scanf("%d %d", &i, &j); if (i > j) printf("i大于j\n"); else printf("i小于j\n"); retu
dictionary的使用要注意 dcj3sjt126com IO
NSDictionary *dict = [NSDictionary dictionaryWithObjectsAndKeys: user.user_id , @"id", user.username , @"username",
Android 中的资源访问(Resource) finally_m xml android String drawable color
简单的说，Android中的资源是指非代码部分。例如，在我们的Android程序中要使用一些图片来设置界面，要使用一些音频文件来设置铃声，要使用一些动画来显示特效，要使用一些字符串来显示提示信息。那么，这些图片、音频、动画和字符串等叫做Android中的资源文件。在Eclipse创建的工程中，我们可以看到res和assets两个文件夹，是用来保存资源文件的，在assets中保存的一般是原生
Spring使用Cache、整合Ehcache 234390216 spring cache ehcache @Cacheable
Spring使用Cache 从3.1开始，Spring引入了对Cache的支持。其使用方法和原理都类似于Spring对事务管理的支持。Spring Cache是作用在方法上的，其核心思想是这样的：当我们在调用一个缓存方法时会把该方法参数和返回结果作为一个键值对存放在缓存中，等到下次利用同样的
当druid遇上oracle blob(clob) jackyrong oracle
http://blog.csdn.net/renfufei/article/details/44887371 众所周知，Oracle有很多坑, 所以才有了去IOE。在使用Druid做数据库连接池后，其实偶尔也会碰到小坑，这就是使用开源项目所必须去填平的。【如果使用不开源的产品，那就不是坑，而是陷阱了，你都不知道怎么去填坑】用Druid连接池，通过JDBC往Oracle数据库的
easyui datagrid pagination获得分页页码、总页数等信息 ldzyz007
var grid = $('#datagrid'); var options = grid.datagrid('getPager').data("pagination").options; var curr = options.pageNumber; var total = options.total; var max =
浅析awk里的数组 nigelzeng 二维数组 array 数组 awk
awk绝对是文本处理中的神器，它本身也是一门编程语言，还有许多功能本人没有使用到。这篇文章就单单针对awk里的数组来进行讨论，如何利用数组来帮助完成文本分析。有这么一组数据： abcd,91#31#2012-12-31 11:24:00 case_a,136#19#2012-12-31 11:24:00 case_a,136#23#2012-12-31 1
搭建 CentOS 6 服务器(6) - TigerVNC rensanning centos
安装GNOME桌面环境 # yum groupinstall "X Window System" "Desktop" 安装TigerVNC # yum -y install tigervnc-server tigervnc 启动VNC服务 # /etc/init.d/vncserver restart # vncser
Spring 数据库连接整理 tomcat_oracle spring bean jdbc
1、数据库连接jdbc.properties配置详解　　jdbc.url=jdbc:hsqldb:hsql://localhost/xdb 　　jdbc.username=sa 　　jdbc.password= 　　jdbc.driver=不同的数据库厂商驱动，此处不一一列举　　接下来，详细配置代码如下：　　 Spring连接池
Dom4J解析使用xpath java.lang.NoClassDefFoundError: org/jaxen/JaxenException异常 xp9802
用Dom4J解析xml,以前没注意,今天使用dom4j包解析xml时在xpath使用处报错异常栈：java.lang.NoClassDefFoundError: org/jaxen/JaxenException异常导入包 jaxen-1.1-beta-6.jar 解决; &nb

机器学习：《统计学习方法》笔记（二）—— 条件随机场（CRF）

摘要

正文

1.基本概念

2.概率计算

3. 学习算法

4.预测算法

你可能感兴趣的:(机器学习,机器学习理论及应用)