一入材料深似海

机器学习入门-西瓜书总结笔记第七章

西瓜书第七章-贝叶斯分类器

一、贝叶斯决策论
二、极大似然估计
三、朴素贝叶斯分类器
四、半朴素贝叶斯分类器
五、贝叶斯网（Bayesian network）
- 1.结构
- 2.学习
- 3.推断
六、EM算法
总结

一、贝叶斯决策论

贝叶斯决策论（Bayesian decision theory） 是在概率论框架下实施决策的基本方法。对分类任务来说，在所有相关概率都已知的理想情形下，贝叶斯决策论考虑如何基于这些概率和误判损失来选择最优的类别标记
假设有N种可能的类别标记，即 $y=\{c_1,c_2,\cdots,c_N\}$ ， $\lambda_{ij}$ 是将一个真实标记为 $c_j$ 的样本误分类为 $c_i$ 所产生的损失。基于后验概率 $P(c_i|\pmb x)$ 可获得将样本 $\pmb x$ 分类为 $c_i$ 所产生的 期望损失（expected loss），即在样本 $\pmb x$ 上的 “条件风险”（conditional risk）
$R(c_i|\pmb x) = \sum_{j=1}^N \lambda_{ij}P(c_j|\pmb x)$
我们的任务是寻找一个判定准则 $h:\chi\mapsto y$ 以最小化总体风险
$R(h)=E_x[R(h(\pmb x)|\pmb x]$
显然，对每个样本 $\pmb x$ ，若h能最小化条件风险 $R(h(\pmb x)|\pmb x$ ，则总体风险 $R (h)$ 也能被最小化，这就产生了 贝叶斯判定准则（Bayes decision rule）：为最小化总体风险，只需要在每个样本上选择那个使能使条件风险 $R(c|\pmb x)$ 最小化的类别标记
$h^*(\pmb x) = \underset{c\in y}{\operatorname {argmin}}R(c|\pmb x)$
$h^*$ 称为贝叶斯最优分类器（Bayes optimal classifier），与之对应的总体风险 $R(h^*)$ 称为贝叶斯风险（Bayes risk）。 $1-R(h^*)$ 反映了分类器所能达到的最好性能，即通过机器学习所能产生的模型的精度的理论上限
欲使用贝叶斯判定准则来最小化决策风险，首先要获得后验概率，然而，在现实任务中这通常难以直接获取。从这个角度来看，机器学习所要实现的是基于有限的训练样本集尽可能准确地估计出后验概率。大体来说，主要有两种策略：给定 $\pmb x$ ，可通过直接建模 $P(c|\pmb x)$ 来预测c，这样得到的是 “判别式模型”（discriminative models）；也可先对联合概率密度分布 $P(\pmb x,c)$ 建模，然后再由此获得 $P(c|\pmb x)$ ，这样得到的是 “生成式模型”（generative models）。
决策树、BP神经网络、支持向量机，都可以归入判别式模型
对生成式模型来说，必然考虑
$P(c|\pmb x)=\frac{P(\pmb x,c)}{P(\pmb x)}$
基于贝叶斯定理，可写为
$P(c|\pmb x)=\frac{P(c)P(\pmb x|c)}{P(\pmb x)}$
其中 $P (c)$ 是 类“先验”（prior）概率， $P(\pmb x|c)$ 是样本 $\pmb x$ 相对于类别标记c的 类条件概率（class-conditional probability），或者称为 “似然”（likelihood）； $P(\pmb x)$ 是用于归一化的 “证据”（evidence）因子。对给定样本 $\pmb x$ ，证据因子 $P(\pmb x)$ 与类别无关，因此估计 $P(\pmb x|c)$ 的问题转化为如何基于训练数据D来估计先验概率 $P (c)$ 和似然 $P(c|\pmb x)$
这里概念很多，引用大量整段原文

二、极大似然估计

估计类条件概率的一种常用策略是先假设其具有某种确定的概率分布形式，再基于训练样本对概率密度的参数进行估计。
事实上，概率模型的训练过程就是 参数估计（parameter estimation） 过程
统计学界两种不同的解决方案：
频率派（Frequentist） 认为参数虽然未知，但却是客观存在的固定值，可通过优化似然函数等准则来确定参数
贝叶斯派（Bayesian）则认为参数是未观察到的随机变量，其本身也可有分布，可假定参数服从一个先验分布，然后基于观测到的数据来计算参数的后验分布
源自频率主义学派的 极大似然估计（Maximum Likelihood Estimation，简称MLE）
令 $D_c$ 表示训练集 $D$ 中第c类样本组成的集合，假设这些样本是独立同分布的，则参数 $\pmb \theta_c$ 对于数据集 $D_c$ 的似然是
$P(D_c|\pmb \theta_c)=\prod_{x\in D_c}P(\pmb x|\pmb \theta_c)$
直观来看，极大似然估计是试图再 $\pmb \theta_c$ 所有可能的取值中，找到一个能使数据出现“可能性”最大的值
连乘易造成下溢，通常使用 对数似然（log-likelihood）
$\begin{aligned} LL(\pmb \theta_c) &= \operatorname{log} P(D_c|\pmb \theta_c)\\ & =\sum_{x\in D_c}\operatorname{log} P(\pmb x|\pmb \theta_c) \end{aligned}$
此时参数 $\pmb \theta_c$ 的极大似然估计 $\hat {\pmb \theta}_c$ 为
$\hat {\pmb \theta}_c = \underset{\theta_c}{\operatorname {argmax}}LL(\pmb \theta_c)$
例如，在连续属性情形下，假设概率密度函数 $p(\pmb x|c)\sim\mathcal{N}(\pmb \mu_c,\pmb \sigma_c^2)$ ，则参数 $\pmb \mu_c$ 和 $\pmb \sigma_c^2$ 的极大似然估计为
$\begin{aligned} &\hat {\pmb \mu}_c=\frac{1}{|D_c|}\sum_{x\in D_c}\pmb x\\ &\pmb \sigma_c^2 = \frac{1}{|D_c|}\sum_{x\in D_c}(\pmb x-\hat {\pmb \mu}_c)(\pmb x-\hat {\pmb \mu}_c)^T \end{aligned}$
取决于假设的概率密度分布形式是否符合潜在真实数据分布，需要结合关于任务本身的经验知识

三、朴素贝叶斯分类器

基于贝叶斯公式来估计后验概率 $P(c|\pmb x)$ 的主要困难在于：类条件概率 $P(\pmb x|c)$ 是所有属性上的联合概率，难以从有限的训练样本直接估计而得
为此，朴素贝叶斯分类器（naive Bayes classifier） 采用了 “属性条件独立性假设”（attribute conditional independence assumption）。假设每个属性独立地对分类结果发生影响
基于属性条件独立性假设，
$P(c|\pmb x)=\frac{P(c)P(\pmb x|c)}{P(\pmb x)}=\frac{P(c)}{P(\pmb x)}\prod_{i=1}^dP(x_i|c)$
其中d为属性数目， $x_i$ 为 $\pmb x$ 在第i个属性上的取值
$h_{nb}(\pmb x) = \underset{c\in y}{\operatorname{argmax}}P(c)\prod_{i=1}^dP(x_i|c)$
上式就是朴素贝叶斯分类器的表达式
容易估计出类先验概率：
$P(c)=\frac{|D_c|}{|D|}$
条件概率
$P(x_i|c)=\frac{|D_{c,x_i}|}{|D_c|}$
对于连续概率密度函数，假定 $p(x_i|c)\sim \mathcal{N}(\mu_{c,i},\sigma_{c,i}^2)$
则有
$p(x_i|c)=\frac{1}{\sqrt{2\pi}\sigma_{c,i}}\operatorname{exp}(-\frac{(x_i-\mu_{c,i})^2}{2\sigma_{c,i}^2})$
为了避免其他属性携带信息被训练集中未出现的属性值“抹去”，在估计概率值时通常进行 “平滑”（smoothing），常用 “拉普拉斯修正”（Laplacian correction）。具体来说，令N表示训练集D中可能的类别数， $N_i$ 表示第i个属性可能的取值数，则修正
$\begin{aligned} \hat P(c)&=\frac{|D_c|+1}{|D|+N},\\ \hat P(x_i|c)&=\frac{|D_{c,x_i}|+1}{|D|+N_i} \end{aligned}$

四、半朴素贝叶斯分类器

“半朴素贝叶斯分类器”（semi-naive Bayes classifiers） 学习方法，对属性条件独立性假设进行一定程度的放松。基本思想是适当考虑一部分属性间的相互依赖信息。
“独依赖估计”（One-Dependent Estimator，简称ODE），所谓“独依赖”就是假设每个属性在类别之外最多仅依赖于一个其他属性，即
$P(c|\pmb x)\propto P(c)\prod_{i=1}^dP(x_i|c,pa_i),$
其中 $pa_i$ 为属性 $x_i$ 所依赖的属性，称为 $x_i$ 的父属性
如何确定每个属性的父属性
最直接的做法是假设所有属性都依赖于同一属性，称为“超父”（super-parent），然后通过交叉验证等模型选择方法来确定超父属性，由此形成了SPODE（Super-Parent ODE）方法
TAN(Tree Augmented naive Bayes) 则是在 最大带权生成树（maximum weighted spanning tree） 算法的基础上，通过以下步骤将属性间依赖关系约简为©所示的属性结构：
（1）计算任意两个属性之间的条件互信息（conditional mutual information）
$I(x_i,x_j|y)=\sum_{x_i,x_;c\in y}P(x_i,x_j|c)\operatorname {log}\frac{P(x_i,x_j|c)}{P(x_i|c)P(x_j|c)}$
（2）以属性为结点构建完全图，任意两个结点之间边的权重设为 $I(x_i,x_j|y)$
（3）构建此完全图的最大带权生成树，挑选根变量，将边置为有向
（4）加入类别结点y，增加从y到每个属性的有向边
通过最大生成树算法，TAN实际上仅保留了强相关属性之间的依赖性
AODE（Averaged One-Dependent Estimator） 是一种基于集成学习机制、更为强大的独依赖分类器。AODE尝试将每个属性作为超父类来构建SPODE，然后将那些具有足够训练数据支撑的SPODE集成起来作为最终结果，即
$P(\pmb c|\pmb x)\propto \underset{|D_{x_i}|\geq m'}{\sum_{i=1}^d}P(c,x_i)\prod_{j=1}^dP(x_j|c,x_i)$
其中 $D_{x_i}$ 是在第i个属性上取值为 $x_i$ 的样本集合， $m^{'}$ 为阈值常数。显然，AODE需估计 $P(c,x_i)$ $P(x_j|c,x_i)$ ，有
$\begin{aligned} \hat P(c,x_i)&=\frac{|D_{c,x_i}|+1}{|D|+N_i},\\ \hat P(x_j|c,x_i)&=\frac{|D_{c,x_i,x_j}|+1}{|D_{c,x_i}|+N_j} \end{aligned}$

五、贝叶斯网（Bayesian network）

贝叶斯网（Bayesian network） 亦称 “信念网”（belief network），它借助 有向无环图（Directed Acyclic Graph，简称DAG） 来刻画属性之间的依赖关系，并使用条件概率表（Conditional Probability Table，简称CPT）来描述属性的联合概率分布
具体，一个贝叶斯网B由结构G和参数 $\Theta$ 两部分构成，即 $B=\langle B,\Theta\rangle$ 。
网络结构G是一个有向无环图，其每个结点对应于一个属性，若两个属性有依赖关系，则它们由一条边连接起来
参数 $\Theta$ 定量描述这种依赖关系

1.结构

联合概率分布
$P_B(x_1,x_2,\cdots,x_d)=\prod_{i=1}^dP_B=\prod_{i=1}^d\theta_{x_i|\pi_i}$
以上图为例，联合概率分布定义为
$P(x_1,x_2,x_3,x_4,x_5)=P(x_1)P(x_2)P(x_3|x_1)P(x_4|x_1,x_2)P(x_5|x_2)$

“同父”（common parent） 结构中，给定父节点 $x_1$ 的取值，则 $x_3$ 与 $x_4$ 相互条件独立
“顺序”结构 中，给定x的值，则y与z相互独立
V型结构（V-structure） 亦称“冲撞”结构，给定子节点 $x_4$ 的取值， $x_1$ 与 $x_2$ 必不独立；奇妙的是，若 $x_4$ 的取值完全未知，则V型结构下 $x_1$ 与 $x_2$ 却是相互独立的，这种独立性称为“边际独立性”（marginal independence）
为了分析有向图中变量间的条件独立性，可使用“有向分离”（D-separation）。我们先将有向图转变为一个无向图：
（1）找出有向图中的所有V型结构，在V型结构的两个父结点之间加上一条无向边；
（2）将所有有向边改为无向边
由此产生的无向图称为**“道德图”（moral graph）**，令父结点相连的过程称为 “道德化”（moralization）
有向分离，从图中能偶容易地找出所有条件独立关系： $x_3\perp x_4|x_1,x_4\perp x_5|x_2,x_3\perp x_2|x_1,x_3\perp x_5|x_1,x_3\perp x_5|x_2,$

2.学习

网络结构往往未知，贝叶斯网学习的首要任务就是根据训练数据集来找出结构最“恰当”的贝叶斯网
“评分搜索” 是求解这一问题的常用办法，我们先定义一个 评分函数（score function），以此评估贝叶斯网与训练数据的契合程度，然后基于这个评分函数来寻找结构最优的贝叶斯网。显然，评分函数引入了关于我们想要什么样的贝叶斯网的归纳偏好
对贝叶斯网学习而言，模型就是一个贝叶斯网，同时，每个贝叶斯网描述了一个训练数据上的概率分布，自有一套编码机制能使那些经常出现的样本有更短的编码，我们选择那个综合编码长度（包括描述网络和编码数据）最短的贝叶斯网，这就是 “最小描述长度”（Minimal Description Length，简称MDL）准则
给定训练集 $D=\{\pmb x_1, \pmb x_2,\cdots,\pmb x_m\}$ ，贝叶斯网 $B=\langle G,\Theta \rangle$ 在D上的评分函数可写为
$s(B|D)=f(\theta)|B|-LL(B|D)$
其中|B|是贝叶斯网的参数个数； $f(\theta)$ 表示描述每个参数 $\theta$ 所需字节数；而
$LL(B|D)=\sum_{i=1}^m\operatorname{log}P_B(\pmb x_i)$
是贝叶斯网B的对数似然
若 $f(\theta)=1$ ，即每个参数用1字节描述，则得到 AIC（Akaike Information Criterion）评分系统
$A I C (B ∣ D) = ∣ B ∣ - L L (B ∣ D)$
若 $f(\theta)=\frac{1}{2}\operatorname {log}m$ ，即每个参数用 $\frac{1}{2}\operatorname {log}m$ 字节描述，则得到BIC（Bayesian Information Criterion）评分函数
$BIC(B|D)=\frac{\operatorname{log}m}{2}|B|-LL(B|D)$
若G固定，则评分函数 $s (B ∣ D)$ 的第一项为常数，此时最小化 $s (B ∣ D)$ 等价于对参数 $\Theta$ 的极大似然估计，参数 $\theta_{x_i}|\pi_i$ 能直接在训练集D上通过经验估计获得，即
$\theta_{x_i|\pi_i} = \hat P_D(x_i|\pi_i)$
其中 $\hat P_D(\cdot)$ 是D上的经验分布，为了最小化评分函数，只需要对网络结构进行搜索，而候选结构的最优参数直接在训练集上计算得到
从所有可能的网络结构空间搜索最优贝叶斯网络是一个NP难问题，难以快速求解，有两种常用的策略求得近似解：
（1）贪心法，例如从某个网络结构出发，每个调整一条边（增加、删除或调整方向）直至评分不再降低为止
（2）通过给网络结构施加约束来削减搜索空间，例如将网络结构限定为树结构等

3.推断

贝叶斯网训练好之后就能用来回答“查询”（query），通过已知变量观测值来推测待查询变量的过程称为 “推断”（inference），已知变量观测值称为 “证据”（evidence）
最理想的是直接根据贝叶斯网定义的联合概率分布来精确计算后验概率，但当网络结点较多、连接稠密时，难以进行精确推断，此时需通过降低精度要求，在有限的时间内求得近似解。
贝叶斯网的近似推断常使用吉布斯采样（Gibbs sampling）来完成
令 $\pmb Q=\{Q_1,Q_2,\cdots,Q_n\}$ 表示查询变量， $\pmb E=\{E_1,E_2,\cdots,E_k\}$ 为证据变量，已知其取值 $\pmb e=\{e_1,e_2,\cdots,e_k\}$ .目标是计算后验概率 $P(\pmb Q = \pmb q|\pmb E = \pmb e)$
吉布斯采样法先随机产生一个与证据 $\pmb E=\pmb e$ 一致的样本 $\pmb q^0$ 作为起始点，然后每步从当前样本出发产生下一样本。具体来说，在第t次采样中，算法先假设 $\pmb q^t = \pmb q^{t-1}$ ，然后对非证据变量逐个进行采样改变其取值，采样概率通过贝叶斯网络B和其他变量的当前取值（即 $\pmb Z = \pmb z$ ）计算获得。假定经过T次采样得到与q一致的样本共有 $n_q$ 个，则可近似估算出后验概率
$P(\pmb Q=\pmb q|\pmb E=\pmb e)\simeq \frac{n_q}{T}$
实质上，吉布斯采样是在贝叶斯网所有变量的联合状态空间中与证据 $\pmb E=\pmb e$ 一致的子空间中进行 “随机漫步”（random walk），每一步仅依赖于前一步的状态，这是一个 “马尔科夫链”（Markov chain）
这里需要补充

六、EM算法

未观测变量的学名是 “隐变量”（latent variable）。
令 $\pmb X$ 表示已观测变量集， $\pmb Z$ 表示隐变量集， $\Theta$ 表示模型参数。若欲对 $\Theta$ 做极大似然估计，则应最大化对数似然
$LL(\Theta|\pmb X,\pmb Z) = \operatorname{ln}P(\pmb X,\pmb Z|\Theta)$
可通过对 $\pmb Z$ 计算期望，来最大化已观测数据的对数 “边际似然”（marginal likelihood）
$LL(\Theta|\pmb X)=\operatorname{ln}P(\pmb X|\Theta)=\operatorname{ln}\sum_{\pmb z}P(\pmb X,\pmb Z|\Theta)$
EM（Expectation-Maximization）算法 是常用的估计参数隐变量的利器，它是一种迭代的方法
其基本思想是：若参数 $\Theta$ 已知，则可根据训练数据推断出最优隐变量 $\pmb Z$ 的值（E步）；反之，若 $\pmb Z$ 的值已知，则可方便地对参数 $\Theta$ 做出极大似然估计（M步）
以初始值 $\Theta^0$ 为起点，可迭代执行以下步骤直至收敛：
（1）基于 $\Theta^t$ 推断隐变量 $\pmb Z$ 的期望，记为 $\pmb Z^t$ ;
（2）基于已观测变量 $\pmb X$ 和 $\pmb Z^t$ 对参数 $\Theta$ 做极大似然估计，记为 $\Theta^{t+1}$
如果是基于 $\Theta^{t}$ 计算隐变量的概率分布 $P(\pmb Z|\pmb X, \Theta^t)$ ，则EM算法的两个步骤是
（1）E步（Expectation）：以当前参数 $\Theta^{t}$ 推断隐变量 $P(\pmb Z|\pmb X, \Theta^t)$ ，并计算对数似然 $LL(\Theta|\pmb X,\pmb Z)$ 关于 $\pmb Z$ 的期望
$Q(\Theta|\Theta^t)=\mathbb{E}_{\pmb Z|\pmb X,\Theta^t}LL(\Theta|\pmb Z,\pmb X)$
（2）M步（Maximization）：寻找参数最大化期望似然
$\Theta^{t+1}=\underset{\Theta}{\operatorname{argmax}}Q(\Theta|\Theta^t)$

总结

这一章还需要加强理解

C++ 11 Lambda表达式和min_element()与max_element()的使用_c++ lamda函数 min_element((1) 2401_84976182 程序员 c语言 c++学习
既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课程，涵盖了95%以上CC++开发知识点，真正体系化！由于文件比较多，这里只是将部分目录截图出来，全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频，并且后续会持续更新如果你需要这些资料，可以戳这里获取#include#include#includeusingnamespacestd;boolcmp(int
算法学习笔记：17.蒙特卡洛算法 ——从原理到实战，涵盖 LeetCode 与考研 408 例题
在计算机科学和数学领域，蒙特卡洛算法（MonteCarloAlgorithm）以其独特的随机抽样思想，成为解决复杂问题的有力工具。从圆周率的计算到金融风险评估，从物理模拟到人工智能，蒙特卡洛算法都发挥着不可替代的作用。本文将深入剖析蒙特卡洛算法的思想、解题思路，结合实际应用场景与Java代码实现，并融入考研408的相关考点，穿插图片辅助理解，帮助你全面掌握这一重要算法。蒙特卡洛算法的基本概念蒙特卡
分布式学习笔记_04_复制模型 NzuCRAS 分布式学习笔记架构后端
常见复制模型使用复制的目的在分布式系统中，数据通常需要被分布在多台机器上，主要为了达到：拓展性：数据量因读写负载巨大，一台机器无法承载，数据分散在多台机器上仍然可以有效地进行负载均衡，达到灵活的横向拓展高容错&高可用：在分布式系统中单机故障是常态，在单机故障的情况下希望整体系统仍然能够正常工作，这时候就需要数据在多台机器上做冗余，在遇到单机故障时能够让其他机器接管统一的用户体验：如果系统客户端分布
算法学习笔记：15.二分查找 ——从原理到实战，涵盖 LeetCode 与考研 408 例题呆呆企鹅仔算法学习算法学习笔记考研二分查找
在计算机科学的查找算法中，二分查找以其高效性占据着重要地位。它利用数据的有序性，通过不断缩小查找范围，将原本需要线性时间的查找过程优化为对数时间，成为处理大规模有序数据查找问题的首选算法。二分查找的基本概念二分查找（BinarySearch），又称折半查找，是一种在有序数据集合中查找特定元素的高效算法。其核心原理是：通过不断将查找范围减半，快速定位目标元素。与线性查找逐个遍历元素不同，二分查找依赖
OKHttp3源码分析——学习笔记 Sincerity_ 源码相关 Okhttp 源码解析读书笔记 httpclient cache
文章目录1.HttpClient与HttpUrlConnection的区别2.OKHttp源码分析使用步骤:dispatcher任务调度器,（后面有详细说明）Request请求RealCallAsyncCall3.OKHttp架构分析1.异步请求线程池,Dispather2.连接池清理线程池-ConnectionPool3.缓存整理线程池DisLruCache4.Http2异步事务线程池,http
LangChain中的向量数据库接口－Weaviate 洪城叮当 langchain 数据库经验分享笔记交互人工智能知识图谱
文章目录前言一、原型定义二、代码解析1、add_texts方法1.1、应用样例2、from_texts方法2.1、应用样例3、similarity_search方法3.1、应用样例三、项目应用1、安装依赖2、引入依赖3、创建对象4、添加数据5、查询数据总结前言 Weaviate是一个开源的向量数据库，支持存储来自各类机器学习模型的数据对象和向量嵌入，并能无缝扩展至数十亿数据对象。它提供存储文档嵌
Python学习笔记5|条件语句和循环语句 iamecho9 Python从0到1学习笔记 python 学习笔记
一、条件语句条件语句用于根据不同的条件执行不同的代码块。1、if语句基本语法：if布尔型语句1:代码块#语句1为True时执行的代码示例：age=int(input("请输入你的年龄:"))ifage>=18:print("你已成年")2、if-else语句如果if条件不成立，则执行else代码块：if布尔型语句1:代码块#语句1为True时执行的代码else:代码块#语句1为False时执行的代
Python的科学计算库NumPy（一） linlin_1998 python numpy 开发语言
NumPy(NumericalPython)是Python中最基础、最重要的科学计算库之一，提供了高性能的多维数组（ndarray）对象和大量数学函数，是许多数据科学、机器学习库（如Pandas、SciPy、TensorFlow等）的基础依赖。1.创建一个numpy里面的一维数组importnumpyasnp###通过array方法创建一个ndarrayarray1=np.array([1,2,3
微算法科技的前沿探索：量子机器学习算法在视觉任务中的革新应用 MicroTech2025 量子计算算法
在信息技术飞速发展的今天，计算机视觉作为人工智能领域的重要分支，正逐步渗透到我们生活的方方面面。从自动驾驶到人脸识别，从医疗影像分析到安防监控，计算机视觉技术展现了巨大的应用潜力。然而，随着视觉任务复杂度的不断提升，传统机器学习算法在处理大规模、高维度数据时遇到了计算瓶颈。在此背景下，量子计算作为一种颠覆性的计算模式，以其独特的并行处理能力和指数级增长的计算空间，为解决这一难题提供了新的思路。微算
5G标准学习笔记14 - CSI--RS概述刘孬孬沉迷学习 5G 学习笔记信息与通信
5G标准学习笔记14-CSI–RS概述大家好~，这里是刘孬孬，今天带着大家一起学习一下5GNR中一个非常非常重要的参考信号------------------CSI-RS信号，CSI-RS不是持续发送，UE只能在网络明确配置了CSI-RS的情况下才能使用其进行信道测量。前言对于CSI-RS，肯定还离不开前面所说的CSI（channelstateinformation），前面也讲过CSI对于MIMO
5G标准学习笔记06-基于AI/ML波束管理刘孬孬沉迷学习 5G 学习笔记
5G标准学习笔记06-基于AI/ML波束管理前言前面对于孬孬学习了波束管理的概述，下面要进一步来看一下传统波束管理和现在3GPP中推动的AL/ML波束管理之前的区别联系。一、传统波束管理方法流程传统BM流程主要包括以下步骤：波束扫描（BeamSweeping）：gNB通过顺序发送多个窄波束（SSB或CSI-RS），覆盖整个服务区域，UE测量每个波束的信号质量（如L1-RSRP或L1-SINR）。波
5G标准学习笔记03- CSI 反馈增强概述刘孬孬沉迷学习 5G 笔记学习
5G标准学习笔记03-CSI反馈增强概述大家好，最近在研究AI/ML3gpp标准NR空口的有关内容，后面可能会给大家介绍一下对应的有关内容AI/ML在3GPP标准中的研究进展在AI/ML在NR空口的应用中，对应标准主要聚焦了3个case进行讨论研究分别是：CSI反馈增强；波束管理；定位精度增强；这三个内容可能比较涉及RAN1/2的具体内容，后面会基于这个进行一定的介绍。今天主要是主要介绍CSI反馈
学习笔记(33):matplotlib绘制简单图表-绘制混淆矩阵热图宁儿数据安全 #机器学习学习笔记 matplotlib
学习笔记(33):matplotlib绘制简单图表-绘制混淆矩阵热图一、绘制混淆矩阵热图代码解析1.1、导入必要的库importmatplotlib.pyplotaspltfromsklearn.metricsimportconfusion_matriximportseabornassnsmatplotlib.pyplot：Python中最常用的绘图库，用于创建各种图表confusion_matr
在mac m1基于llama.cpp运行deepseek
lama.cpp是一个高效的机器学习推理库，目标是在各种硬件上实现LLM推断，保持最小设置和最先进性能。llama.cpp支持1.5位、2位、3位、4位、5位、6位和8位整数量化，通过ARMNEON、Accelerate和Metal支持Apple芯片，使得在MACM1处理器上运行Deepseek大模型成为可能。1下载llama.cppgitclonehttps://github.com/ggerg
LLaMA 学习笔记 AI算法网奇深度学习基础人工智能深度学习
目录LLaMA模型结构：模型微调手册：推理示例：指定位置加载模型测试ok：模型下载：llama-stack下载modelscope下载LLaMA优化技术RMSNormSwiGLU激活函数旋转位置编码（RoPE）LLaMA模型结构：llama3结构详解-CSDN博客模型微调手册：大模型微调LLaMA详细指南（准备环境、数据、配置微调参数+微调过程）_llama微调-CSDN博客显存占用：FP16/B
BOOT_KEY按键（学习笔记）小高Baby@ 学习笔记
先来让我们了解一下GPIO是什么吧，它在单片机中也有很重要的作用，接下来我们来看看吧。esp32C3是QFN32封装（一种集成电路（IC）封装类型），GPIO引脚一共有22个，从GPIO-0到GPIO-21。从理论上来说，所有的IO引脚都可以复用为任何外设功能，但有些引脚用作连接芯片内部FLASH或者外部FLASH功能时，官方不建议用作其它用途。esp32c3的GPIO，可以用作输入、输出，可以配
【机器学习笔记Ⅰ】9 特征缩放巴伦是只猫机器学习机器学习笔记人工智能
特征缩放（FeatureScaling）详解特征缩放是机器学习数据预处理的关键步骤，旨在将不同特征的数值范围统一到相近的尺度，从而加速模型训练、提升性能并避免某些特征主导模型。1.为什么需要特征缩放？(1)问题背景量纲不一致：例如：特征1：年龄（范围0-100）特征2：收入（范围0-1,000,000）梯度下降的困境：量纲大的特征（如收入）会导致梯度更新方向偏离最优路径，收敛缓慢。量纲小的特征（如
Kotlin学习笔记 qq_26907861
1.Val和Varval:用于声明不可变量,不可变是指引用不可变;var:用于声明可变的变量;packagehello//可选的包头funmain(args:Array){//包级可见的函数，接受一个字符串数组作为参数vala="不可变的变量"//不可变的变量varn=2//可变println(a)println(n)}2.fun函数Kotlin中的函数可以这样声明:fun函数名(参数列表):返回
WPF学习笔记（2）——x名称空间详解上幽冥宇少 WPF C#WPF学习笔记初学者 C#VS2013
先说一些基本的，.NET的模块称为程序集（Assembly）。一般情况下，用VS创建的是解决方案（Solution），一个解决方案就是一个完整的程序。解决方案中包含若干个项目（Project），每个项目是可以独立编译的，他的编译结果是一个程序集。常见的程序集是以.exe为扩展名的可执行程序或者是以.dll为扩展名的动态链接库，大多数情况下，我们说“引用其他程序集”的时候，说的是动态链接库。因为.N
初学者的指针学习笔记（1）近津薪荼学习笔记
1.内存和地址1.1内存像学生宿舍一样，被分成许多个房间，每个房间都有自己的房号，每个房间能住8个学生内存被分成许多个单元（小为1Byte），每个单元都有自己的编号，每个单元里能住8个小比特（bite）c语言中，指针就是该单元内存的编号也就是地址，我们可以通过指针快速找到我们要访问的内存1.2编址计算机中的内存编址，是通过硬件设计来完成的，也就是说他被做出来的时候各个内存单元的地址就已经确定了。计
初学者关于自定义类型结构体的学习笔记近津薪荼学习笔记数据结构
1.结构的特殊声明//匿名结构体类型struct{inta;charb;floatc;}x;struct{inta;charb;floatc;}a[20],*p;p=&x;不可取，本质上是两个不同类型的结构体上述代码的声明方式，该结构体类型，如果不重命名的话，只能用一次（声明时顺便创建变量）2.结构体的自引用structNode{intdata;structNodenext;};上述代码，结构体中
深度学习实战-使用TensorFlow与Keras构建智能模型程序员Gloria Python超入门 TensorFlow python
深度学习实战-使用TensorFlow与Keras构建智能模型深度学习已经成为现代人工智能的重要组成部分，而Python则是实现深度学习的主要编程语言之一。本文将探讨如何使用TensorFlow和Keras构建深度学习模型，包括必要的代码实例和详细的解析。1.深度学习简介深度学习是机器学习的一个分支，使用多层神经网络来学习和表示数据中的复杂模式。其广泛应用于图像识别、自然语言处理、推荐系统等领域。
【大模型与机器学习解惑】什么是A/B测试，为何进行A/B测试？
以下内容将围绕机器学习中的A/B测试展开，从概念与背景到实施细节、示例代码、优化思路和未来建议，并在最后给出一个整体的“输出目录”供参考。目录什么是机器学习的A/B测试为何要进行A/B测试A/B测试的实施流程示例代码与详细解释优化方向与未来建议结语1.什么是机器学习的A/B测试A/B测试（也常被称作对照试验、SplitTest）最早多用于互联网产品的功能或界面迭代中，指的是将用户或样本随机分为两组
Xilinx系FPGA学习笔记（三）Vivado的仿真及ILA使用贾saisai FPGA学习 fpga开发学习笔记
系列文章目录文章目录系列文章目录前言仿真验证（类似modelsim）ILA在线调试工具添加ILAILA的例化ILA的使用前言接着学习vivado的使用方法仿真验证（类似modelsim）首先类似添加.v文件的方法，在File-AddSource中选择Addorcreatesimulationsources或者直接在Sources里面选就行然后就编写testbench，类似之前介绍的modelsim
学习笔记day1
Linux基础Linux到底是什么？Linux主要指的是内核（主机中的CPU）,它也是我们系统的大脑Ubuntu跟Linux的关系：Ubuntu是Linux系统的一个分支。为什么要选⽤Linux?开源的，用户可以根据自己的喜好和需求来定制系统。性免费，企业可以减少开发成本。安全性可移植性高Linux跟我们⽇常使⽤的windows的区别？操作习惯不⼀样：windows是以图形交互为主；Linux操作
详解LLMOps，将DevOps用于大语言模型开发
大家好，在机器学习领域，随着技术的不断发展，将大型语言模型（LLMs）集成到商业产品中已成为一种趋势，同时也带来了许多挑战。为了有效应对这些挑战，数据科学家们转向了一种新型的DevOps实践LLM-OPS，专为大型语言模型的开发和维护而设计。本文将介绍LLM-OPS的核心思想，并分析这一策略如何帮助数据科学家更高效地运用DevOps的优秀实践，从而在语言模型的开发和部署过程中，提升工作效率和成果的
搜广推校招面经九十一
美团机器学习/数据挖掘算法工程师_二面一、介绍一下ESMM模型，是否有进行过函数推导传统的转化率建模方式：只用发生点击（click=1）的样本来训练CVR模型。CVR定义如下：CVR=P(y=1∣x,z=1)CVR=P(y=1|x,z=1)CVR=P(y=1∣x,z=1)y=1表示用户发生了转化（如购买）z=1表示用户点击了广告这样做的问题：样本选择偏差（SampleSelectionBias,S
python 计算生态概览的概述
文章目录前言python计算生态库的介绍1.网络爬虫2.数据分析3.文本处理4.数据可视化5.机器学习6.图形用户界面7.游戏开发8.网络应用开发前言python计算生态概览的解释Python计算生态概览是对Python作为一门强大而广泛使用的编程语言所拥有的庞大软件集合的整体描述和概述。这个生态体系不仅包含了Python的标准库（stdlib），即随Python解释器安装的基本模块，还涵盖了极其
Google机器学习实践指南(模型预测偏差) AI_Auto 人工智能机器学习人工智能
Google机器学习（31）-模型预测偏差预测偏差：模型为何总是"猜不准"的真相揭秘你的模型预测准确率高达95%，却总是与实际情况差那么一点点？这可能是预测偏差在作祟！本文将带你深入探索这个被忽视的模型"隐形杀手"。一、什么是预测偏差？一个生活化案例想象一下，你网购了一个智能体重秤，连续一周称重显示都是60kg。但你去健身房用专业设备测量，实际是62kg。这种系统性的测量偏差，就是预测偏差在现实中
【机器学习|学习笔记】用 Python 结合 graphviz 生成 ID3、C4.5、CART 三种决策树的结构示意图。
【机器学习|学习笔记】用Python结合graphviz生成ID3、C4.5、CART三种决策树的结构示意图【机器学习|学习笔记】用Python结合graphviz生成ID3、C4.5、CART三种决策树的结构示意图文章目录【机器学习|学习笔记】用Python结合graphviz生成ID3、C4.5、CART三种决策树的结构示意图用Python结合graphviz生成ID3、C4.5、CART三种
ASM系列五利用TreeApi 解析生成Class lijingyao8206 ASM 字节码动态生成 ClassNode TreeAPI
前面CoreApi的介绍部分基本涵盖了ASMCore包下面的主要API及功能，其中还有一部分关于MetaData的解析和生成就不再赘述。这篇开始介绍ASM另一部分主要的Api。TreeApi。这一部分源码是关联的asm-tree-5.0.4的版本。在介绍前，先要知道一点， Tree工程的接口基本可以完
链表树——复合数据结构应用实例 bardo 数据结构树型结构表结构设计链表菜单排序
我们清楚：数据库设计中，表结构设计的好坏，直接影响程序的复杂度。所以，本文就无限级分类（目录）树与链表的复合在表设计中的应用进行探讨。当然，什么是树，什么是链表，这里不作介绍。有兴趣可以去看相关的教材。需求简介：经常遇到这样的需求，我们希望能将保存在数据库中的树结构能够按确定的顺序读出来。比如，多级菜单、组织结构、商品分类。更具体的，我们希望某个二级菜单在这一级别中就是第一个。虽然它是最后
为啥要用位运算代替取模呢 chenchao051 位运算哈希汇编
在hash中查找key的时候，经常会发现用&取代%，先看两段代码吧， JDK6中的HashMap中的indexFor方法： /** * Returns index for hash code h. */ static int indexFor(int h, int length) {
最近的情况麦田的设计者生活感悟计划软考想
今天是2015年4月27号整理一下最近的思绪以及要完成的任务 1、最近在驾校科目二练车，每周四天，练三周。其实做什么都要用心，追求合理的途径解决。为
PHP去掉字符串中最后一个字符的方法 IT独行者 PHP 字符串
今天在PHP项目开发中遇到一个需求，去掉字符串中的最后一个字符原字符串1,2,3,4,5,6, 去掉最后一个字符","，最终结果为1,2,3,4,5,6 代码如下： $str = "1,2,3,4,5,6,"; $newstr = substr($str,0,strlen($str)-1); echo $newstr;
hadoop在linux上单机安装过程 _wy_ linux hadoop
1、安装JDK jdk版本最好是1.6以上，可以使用执行命令java -version查看当前JAVA版本号，如果报命令不存在或版本比较低，则需要安装一个高版本的JDK，并在/etc/profile的文件末尾，根据本机JDK实际的安装位置加上以下几行： export JAVA_HOME=/usr/java/jdk1.7.0_25
JAVA进阶----分布式事务的一种简单处理方法无量多系统交互分布式事务
每个方法都是原子操作：提供第三方服务的系统，要同时提供执行方法和对应的回滚方法 A系统调用B,C,D系统完成分布式事务 =========执行开始======== A.aa(); try { B.bb(); } catch(Exception e) { A.rollbackAa(); } try { C.cc(); } catch(Excep
安墨移动广告：移动DSP厚积薄发引领未来广告业发展命脉矮蛋蛋 hadoop 互联网
　　“谁掌握了强大的DSP技术，谁将引领未来的广告行业发展命脉。”2014年，移动广告行业的热点非移动DSP莫属。各个圈子都在纷纷谈论，认为移动DSP是行业突破点，一时间许多移动广告联盟风起云涌，竞相推出专属移动DSP产品。　　到底什么是移动DSP呢? 　　DSP(Demand-SidePlatform)，就是需求方平台，为解决广告主投放的各种需求，真正实现人群定位的精准广
myelipse设置 alafqq IP
在一个项目的完整的生命周期中，其维护费用，往往是其开发费用的数倍。因此项目的可维护性、可复用性是衡量一个项目好坏的关键。而注释则是可维护性中必不可少的一环。注释模板导入步骤安装方法：打开eclipse/myeclipse 选择 window-->Preferences-->JAVA-->Code-->Code
java数组百合不是茶 java数组
java数组的声明创建初始化； java支持C语言数组中的每个数都有唯一的一个下标一维数组的定义声明： int[] a = new int[3];声明数组中有三个数int[3] int[] a 中有三个数，下标从0开始，可以同过for来遍历数组中的数
javascript读取表单数据 bijian1013 JavaScript
利用javascript读取表单数据，可以利用以下三种方法获取： 1、通过表单ID属性：var a = document.getElementByIdx_x_x("id"); 2、通过表单名称属性：var b = document.getElementsByName("name"); 3、直接通过表单名字获取：var c = form.content.
探索JUnit4扩展：使用Theory bijian1013 java JUnit Theory
理论机制（Theory）一.为什么要引用理论机制（Theory）当今软件开发中，测试驱动开发（TDD — Test-driven development）越发流行。为什么 TDD 会如此流行呢？因为它确实拥有很多优点，它允许开发人员通过简单的例子来指定和表明他们代码的行为意图。 TDD 的优点： &nb
[Spring Data Mongo一]Spring Mongo Template操作MongoDB bit1129 template
什么是Spring Data Mongo Spring Data MongoDB项目对访问MongoDB的Java客户端API进行了封装，这种封装类似于Spring封装Hibernate和JDBC而提供的HibernateTemplate和JDBCTemplate，主要能力包括 1. 封装客户端跟MongoDB的链接管理 2. 文档-对象映射，通过注解:@Document(collectio
【Kafka八】Zookeeper上关于Kafka的配置信息 bit1129 zookeeper
问题： 1. Kafka的哪些信息记录在Zookeeper中 2. Consumer Group消费的每个Partition的Offset信息存放在什么位置 3. Topic的每个Partition存放在哪个Broker上的信息存放在哪里 4. Producer跟Zookeeper究竟有没有关系？没有关系！！！ //consumers、config、brokers、cont
java OOM内存异常的四种类型及异常与解决方案 ronin47 java OOM 内存异常
　OOM异常的四种类型：　　　　　一：　StackOverflowError ：通常因为递归函数引起（死递归，递归太深）。-Xss 128k 一般够用。　二：　out Of memory: PermGen Space：通常是动态类大多，比如web 服务器自动更新部署时引起。-Xmx
java-实现链表反转-递归和非递归实现 bylijinnan java
20120422更新：对链表中部分节点进行反转操作，这些节点相隔k个： 0->1->2->3->4->5->6->7->8->9 k=2 8->1->6->3->4->5->2->7->0->9 注意1 3 5 7 9 位置是不变的。解法：将链表拆成两部分： a.0-&
Netty源码学习-DelimiterBasedFrameDecoder bylijinnan java netty
看DelimiterBasedFrameDecoder的API，有举例：接收到的ChannelBuffer如下： +--------------+ | ABC\nDEF\r\n | +--------------+ 经过DelimiterBasedFrameDecoder(Delimiters.lineDelimiter())之后，得到： +-----+----
linux的一些命令 -查看cc攻击-网口ip统计等 hotsunshine linux
Linux判断CC攻击命令详解 2011年12月23日 ⁄ 安全 ⁄ 暂无评论查看所有80端口的连接数 netstat -nat|grep -i '80'|wc -l 对连接的IP按连接数量进行排序 netstat -ntu | awk '{print $5}' | cut -d: -f1 | sort | uniq -c | sort -n 查看TCP连接状态 n
Spring获取SessionFactory ctrain sessionFactory
String sql = "select sysdate from dual"; WebApplicationContext wac = ContextLoader.getCurrentWebApplicationContext(); String[] names = wac.getBeanDefinitionNames(); for(int i=0; i&
Hive几种导出数据方式 daizj hive 数据导出
Hive几种导出数据方式 1.拷贝文件如果数据文件恰好是用户需要的格式，那么只需要拷贝文件或文件夹就可以。 hadoop fs –cp source_path target_path 2.导出到本地文件系统 --不能使用insert into local directory来导出数据，会报错 --只能使用
编程之美 dcj3sjt126com 编程 PHP 重构
我个人的 PHP 编程经验中，递归调用常常与静态变量使用。静态变量的含义可以参考 PHP 手册。希望下面的代码，会更有利于对递归以及静态变量的理解 header("Content-type: text/plain"); function static_function () { static $i = 0; if ($i++ < 1
Android保存用户名和密码 dcj3sjt126com android
转自：http://www.2cto.com/kf/201401/272336.html 我们不管在开发一个项目或者使用别人的项目，都有用户登录功能，为了让用户的体验效果更好，我们通常会做一个功能，叫做保存用户，这样做的目地就是为了让用户下一次再使用该程序不会重新输入用户名和密码，这里我使用3种方式来存储用户名和密码 1、通过普通的txt文本存储 2、通过properties属性文件进行存
Oracle 复习笔记之同义词 eksliang Oracle 同义词 Oracle synonym
转载请出自出处：http://eksliang.iteye.com/blog/2098861 1.什么是同义词同义词是现有模式对象的一个别名。概念性的东西，什么是模式呢？创建一个用户，就相应的创建了一个模式。模式是指数据库对象，是对用户所创建的数据对象的总称。模式对象包括表、视图、索引、同义词、序列、过
Ajax案例 gongmeitao Ajax jsp
数据库采用Sql Server2005 项目名称为:Ajax_Demo 1.com.demo.conn包 package com.demo.conn; import java.sql.Connection;import java.sql.DriverManager;import java.sql.SQLException; //获取数据库连接的类public class DBConnec
ASP.NET中Request.RawUrl、Request.Url的区别 hvt .net Web C#asp.net hovertree
如果访问的地址是：http://h.keleyi.com/guestbook/addmessage.aspx?key=hovertree%3C&n=myslider#zonemenu那么Request.Url.ToString() 的值是：http://h.keleyi.com/guestbook/addmessage.aspx?key=hovertree<&
SVG 教程（七）SVG 实例，SVG 参考手册天梯梦 svg
SVG 实例在线实例下面的例子是把SVG代码直接嵌入到HTML代码中。谷歌Chrome，火狐，Internet Explorer9，和Safari都支持。注意：下面的例子将不会在Opera运行，即使Opera支持SVG - 它也不支持SVG在HTML代码中直接使用。 SVG 实例 SVG基本形状一个圆矩形不透明矩形一个矩形不透明2 一个带圆角矩
事务管理 luyulong java spring 编程事务
事物管理 spring事物的好处为不同的事物API提供了一致的编程模型支持声明式事务管理提供比大多数事务API更简单更易于使用的编程式事务管理API 整合spring的各种数据访问抽象 TransactionDefinition 定义了事务策略 int getIsolationLevel()得到当前事务的隔离级别 READ_COMMITTED
基础数据结构和算法十一：Red-black binary search tree sunwinner Algorithm Red-black
The insertion algorithm for 2-3 trees just described is not difficult to understand; now, we will see that it is also not difficult to implement. We will consider a simple representation known
centos同步时间 stunizhengjia linux 集群同步时间
做了集群，时间的同步就显得非常必要了。以下是查到的如何做时间同步。在CentOS 5不再区分客户端和服务器，只要配置了NTP，它就会提供NTP服务。 1)确认已经ntp程序包： # yum install ntp 2)配置时间源（默认就行，不需要修改） # vi /etc/ntp.conf server pool.ntp.o
ITeye 9月技术图书有奖试读获奖名单公布 ITeye管理员 ITeye
ITeye携手博文视点举办的9月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 9月试读活动回顾：http://webmaster.iteye.com/blog/2118112本次技术图书试读活动的优秀奖获奖名单及相应作品如下（优秀文章有很多，但名额有限，没获奖并不代表不优秀）：《NFC：Arduino、Andro

机器学习入门-西瓜书总结笔记第七章

西瓜书第七章-贝叶斯分类器

一、贝叶斯决策论

二、极大似然估计

三、朴素贝叶斯分类器

四、半朴素贝叶斯分类器

五、贝叶斯网（Bayesian network）

1.结构

2.学习

3.推断

六、EM算法

总结

你可能感兴趣的:(学习笔记,机器学习)