GZGlenn

PRML读书笔记——线性回归模型

这一章从线性回归模型的基本形式出发，主要围绕线性基函数的回归模型展开，分析了最大似然估计和最小平方误差函数的关系、最小平方误差函数的几何意义、正则化的最小平方误差，然后用偏置-方差分解的角度理解正则化项；用贝叶斯的思想分析线性回归模型，介绍了模型证据的意义，最后分析线性回归模型的局限性

线性基函数模型

基础

回归问题的最简单模型是输⼊变量的线性组合：

y (x, w) = w 0 + w 1 x 1 + . . . + w D x D

这通常被称为线性回归，模型的关键是它既是 {wk} 的线性函数，也是输入变量 {xi} 的线性函数，虽然简单但是也带来了很大的局限性。

考虑将输⼊变量的固定的⾮线性函数进⾏线性组合，形式为：

y (x, w) = w 0 + \sum j = 1 M - 1 w j ϕ j (x)

其中， ϕj(x) 被称为基函数，这个模型参数总数为M

这里 w0 是偏置参数，可以融入系数中，得：

y (x, w) = \sum j = 0 M - 1 w j ϕ j (x) = w T x

现在， y(w,x) 是x的非线性函数，但它依然是 w 的线性函数，一般模型依然被称为线性模型

基函数选择有很多如

（1）径向基函数

ϕ j (x) = e x p {- ( x - μ j ) 2 2 s 2}

（2）sigmoid

σ a = 1 1 + e x p ( - a )

最大似然与最小平方

现在线性回归的模型已经搭建出来，考虑求解，假设⽬标变量 t 由确定的函数 y(x,w) 给出，这个函数被附加了⾼斯噪声，即

t = y (x, w) + ϵ

假设噪声是零均值的高斯随机变量，精度为 β ，则对应的概率分布满足：

p (t | x, w, β) = N (t | y (x, w), β - 1)

E [t | x] = \int t p (t | x) d t = y (x, w)

注意，这里有一个假设：给定x的条件下，t的条件分布是单峰的，这对于⼀些实际应⽤来说是不合适的。对于不同问题而言，这或许会是修改loss的起源之一。

那么，对于一个观测数据集 X={x1,...,xN} ，它对应的后验概率为：

p (t | x, w, β) = \sum n = 1 N N (t n | w T Φ (x n), β - 1)

然后构造似然函数

l n p (t | w, β) = = \sum n = 1 N l n N (t n | w T ϕ (x n), β - 1) N 2 l n β - N 2 l n (2 π) - β E D (w)

其中，平方和误差定义为：

E D (w) = 1 2 \sum n = 1 N {t n - w T ϕ (x n)} 2

所以，平方和误差本身就是出自高斯分布的前提假设的。

对似然函数求导并令导数为0，可得到：

w M L = (Φ T Φ) - 1 Φ T t

上式是最小平方问题的规范方程，其中 Φ 是 N×M 的设计矩阵，有：

Φ = ⎛ ⎝ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ⎜ ϕ 0 (x 1) ϕ 0 (x 2) . . . ϕ 0 (x N) ϕ 1 (x 1) ϕ 1 (x 2) . . . ϕ 1 (x N) . . . . . . . . . . . . ϕ M - 1 (x 1) ϕ M - 1 (x 2) . . . ϕ M - 1 (x N) ⎞ ⎠ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟ ⎟

对应的偏置为：

w 0 = t ⎯ - \sum j = 1 M - 1 w j ϕ j ⎯ ⎯ ⎯ ⎯

其中

t ⎯ = 1 N \sum n = 1 N t n

ϕ j ⎯ ⎯ ⎯ ⎯ = 1 N \sum n = 1 N ϕ j (x n)

这里，偏置 w0 补偿了⽬标值的平均值（在训练集上的）与基函数的值的平均值的加权求和之间的差。

同理

1 β M L = 1 N \sum n = 1 N {t n - w T M L ϕ (x n)} 2

这里，到噪声精度的倒数由⽬标值在回归函数周围的残留⽅差给出

最小平方的几何描述

最小平方误差的几何意义是，目标变量投影到模型形成的超平面上，模型拟合的结果尽可能接近这个投影。这在一定程度上说明，最小平方误差不可能完全拟合所有的训练数据

正则化最小平方

可以通过添加正则化项的思想来控制过拟合，则总的误差函数变为：

E = E D (w) + λ E W (w) = 1 2 \sum n = 1 N {t n - w T ϕ (x n)} 2 + 1 2 w T w

这是一个二次函数，直接求导并令导数为0即可得

w = (λ I + Φ T Φ) - 1 Φ T t

这里，L2番薯的正则化项又被称为脊回归或者权值衰减。上面的损失函数还可以写成更一般的形式：

1 2 \sum n = 1 N {t n - w T ϕ (x n)} 2 + λ 2 \sum j = 1 M ∣ ∣ w j ∣ ∣ q

不同的q值能得到不同的正则化函数轮廓线，

q=1时，被称为套索（lasso），这是很常用的一种正则化，如果 λ 充分⼤，那么某些系数 wj 会变为零，从⽽产⽣了⼀个稀疏模型，这个模型中对应的基函数不起作⽤。两种正则化项的对比如下图，图中的圆表示以目标变量t为中心，形成了平方差损失，显然越靠近中心表示越小（即越好），以原点为中心的是正则化项的形式，不同q产生不同的边界形状，当两个形状相交，表示w的一个解。而q=1时，往往在坐标轴上相交，所以就导致w有很多0

多输出

如果每个样本对应的标签数量 K>1 （目标变量记作目标向量t），则可以对于t的每个分量，引⼊⼀个不同的基函数集合，从⽽变成了多个独⽴的回归问题。而这里考虑的是使用一组相同的基函数来对目标向量的所有分量建模，如下

y (x, w) = W T ϕ (x)

其中，其中 y 是⼀个 K 维列向量， W 是⼀个 M×K 的参数矩阵， ϕ(x) 是⼀个 M 维列向量，每个元素为 ϕj(x) ，并且与之前⼀样， ϕ0(x)=1 。现在假设目标向量的条件概率分布是各项同性的高斯分布，即

p (t | x, W, β) = N (t | W T ϕ (x), β - 1 I)

则对于一组患侧 t1,...,tn ，对应的对数似然函数为：

l n p (T | X, W, β) = = \sum n = 1 N l n N (t n | W T ϕ (x n), β - 1 I) N K 2 l n (β 2 π) - β 2 \sum n = 1 N ∥ ∥ t n - W T ϕ (x n) ∥ ∥ 2

这样，可以得到最大似然的结果

W M L = (Φ T Φ) - 1 Φ T T

偏置-方差分解

用最大似然发或者最小平方和误差求解回归问题会存在过拟合，正则化能抑制过拟合现象但是超参数不好取值。现在，用分解的方式考察超参数对模型的影响。

假设用平方损失函数求解回归问题，则最优的预测结果如下：

h (x) = E [t | x] = \int t p (t | x) d t

假设我们用 y(x,w) 建模，则平方损失函数的期望为：

E [L] = \int {y (x) - h (x)} 2 p (x) d x + \int \int {h (x) - t} 2 p (x, t) d x d t

现在，第二项与 y(x) 无关，是由数据本⾝的噪声造成的，表⽰期望损失能够达到的最⼩值。第⼀项与我们对函数 y(x) 的选择有关，我们要找⼀个 y(x) 的解，使得这⼀项最⼩。实际上，由于数据有限，我们不能够精确地知道 h(x)

现在假设有许多数据集，每个数据集的⼤⼩为N，并且每个数据集都独⽴地从分布 p(t,x) 中抽取。对于任意给定的数据集 D ，可以学习算法到⼀个预测函数 y(x;D) 。不同的数据集会得到不同的函数，从⽽给出不同的平⽅损失的值。这样，特定的学习算法的表现就可以通过取各个数据集上的表现的平均值来进⾏评估。

考虑是第一项被积函数，对于特定的数据集D，有

E D [{y (x; D) - h (x)} 2] = = = E D [{y (x; D) - E D [y (x; D)] + E D [y (x; D)] - h (x)} 2] E D [{{y (x; D) - E D [y (x; D)]} 2 + {E D [y (x; D)] - h (x)} 2 + 2 {y (x; D) - E D [y (x; D)]} {E D [y (x; D)] - h (x)}}] {E D [y (x; D)] - h (x)} 2 + E D [{y (x; D) - E D [y (x; D)]} 2]

这里，第一项为平方偏置，表示所有数据集的平均预测与预期的回归函数之间的差异。第⼆项，被称为⽅差，度量了对于单独的数据集，模型所给出的解在平均值附近波动的情况，因此也就度量了函数 y(x;D) 对于特定的数据集的选择的敏感程度

也就是我们得到了期望平方损失的分解：

期 望 损 失 = 偏 置 2 + 方 差 + 噪 声

其中

偏 置 2 = \int {E D [y (x; D)] - h (x)} 2 p (x) d x

方 差 = \int E D [{y (x; D) - E D [y (x; D)]} 2] p (x) d x

噪 声 = \int \int {h (x) - t} 2 p (x, t) d x d t

公式可以看到，偏置和方差存在折中，对于灵活的模型，偏置较⼩，⽅差较⼤。对于固定的模型，偏置较⼤，⽅差较⼩。有着最优预测能⼒的模型时在偏置和⽅差之间取得最优的平衡的模型。

那么它和正则化超参数有什么关系呢，正则化的超参实际控制着这种平衡的关系，正则化系数大，则它要求不过过于拟合现有数据，因此不同数据得到的方差小，偏置大；反之，数据会相对拟合已有数据，不同数据集得到的模型预测方差大，但各个模型对自身的数据偏置小

贝叶斯线性回归

这里讲从贝叶斯的角度求解线性模型，它能避免最大似然的过拟合问题，也会引出使用训练数据本身确定模型复杂度的自动化方法

参数分布

所谓贝叶斯方法就是先假设参数的一个已知先验，然后求解后验概率的方法。这里假设模型参数 w 服从高斯分布

p (w) = N (w | w 0, S 0)

则对应的后验概率必然满足高斯分布

p (w | t) = N (w | m N, S N)

其中

m N = S N (S - 1 0 m 0 + β Φ T t)

S - 1 N = S - 1 0 + β Φ T Φ

这里为了简单起见，假设先验分布为各向同性的高斯分布：

p (w | α) = N (w | 0, α - 1 I)

则对应后验的参数为：

m N = β S N Φ T t

S - 1 N = α I + β Φ T Φ

我们知道，后验概率分布可以由对数似然函数和先验的乘积得到，而回归问题的对数似然函数是一个高斯形式，因而把后验看做 w 的函数，两边取对数即可得：

l n p (w | t) = - β 2 \sum n = 1 N {t n - w T ϕ (x n)} 2 - α 2 w T w + c o n s t

这也就是说，以贝叶斯的观点分析回归问题，因为它存在的先验假设，使得模型本身考虑了正则化参数的情况。

作者在这里还举了个顺序学习的例子。假设线性回归模型为 y(x,w)=w1x1+w2x2 ，则只有两个参数。现在我们初始化后，先得到参数空间的先验分布和后验分布。当新数据点被观测时，计算对应的似然函数，而上一轮的后验分布被当做先验分布，两者相乘得到当前轮的后验分布，以此类推，如下图

（2）预测分布

p (t | t, α, β) = \int p (t | w, β) p (w | t, α, β) d w

如果考虑 p(w|t)=N(w|wN,SN) ， p(t|x,w,β)=N(t|y(x,w),β−1) ，则有：

p (t | x, t, α, β) = N (t | m T N ϕ (x), σ 2 N (x))

其中

σ 2 N (x) = 1 β + Φ (x) T S N Φ (x)

等价核

对于高斯分布的先验而言，得到的后验恰好也是高斯分布，最大后验的权向量结果必然是 wMAP=mN ，所以，现在预测均值可以写成：

y (x, m N) = m T N ϕ (x) = β ϕ (x) T S N Φ T t = \sum n = 1 N β ϕ (x) T S N ϕ (x n) t n

所以可以写成核的形式

y (x, m N) = \sum n = 1 N k (x, x n) t n

其中

k (x, x') = β ϕ (x) T S N ϕ (x')

这个函数被称为平滑矩阵或者等价核

贝叶斯模型比较

过拟合是机器学习中常见的问题之一，指的是一个模型由于过度复杂造成在训练集中表现良好而在测试集中表现很差的现象，通常是由于参数过多导致数据相对变小造成的。这是因为在采用极大似然估计的方式进行参数的点估计的时候，复杂的模型总是拟合出更好的结果。但是由于模型过于复杂，它的泛化能力并不一定好。频率派通常采用加一个正规项和交叉验证的方式处理过拟合问题。与此相对的贝叶斯学派用贝叶斯的方法给出一种自然的方法进行模型选择, 找到一个复杂度适中的模型,同时避免了过拟合和欠拟合问题，不需要预先留出一部分数据进行验证。

模型⽐较的贝叶斯观点仅仅涉及到使⽤概率来表⽰模型选择的不确定性，以及恰当地使⽤概率的加和规则和乘积规则。

假设我们想⽐较L个模型 {Mi} ，其中 i=1,...,L 。这⾥，⼀个模型指的是观测数据 D 上的概率分布。我们假设数据是由这些玩模型中的一个生成的，但不知道究竟是哪一个，这种不确定性通过先验概率分布 p(Mi) 表示，现在我们想估计对应的后验分布：

p (M i | D) \propto p (M i) p (D | M i)

其中， p(D|Mi) 是模型证据，它表达了数据展现出的不同模型的优先级。两个模型的模型证据的比值 p(D|Mi)p(D|Mj) 被称为贝叶斯因子。

现在，假设模型由一个参数 w 控制，则模型证据为：

p (D | M i) = \int p (D | w, M i) p (w | M i) d w

下面考虑一种对积分的近似方法。假设后验分布在最⼤似然值 wMAP 附近是⼀个尖峰，宽度为 △w后验，那么可以⽤被积函数的值乘以尖峰的宽度来近似这个积分。如果进⼀步假设先验分布是平的，宽度为 △w先验，即 p(w)=1△w先验，那么有

p (D) = \int p (D | w) p (w) d w ≃ p (D | w M A P) △ w 后 验 △ w 先 验

取对数，有

l n p (D) ≃ l n p (D | w M A P) + l n △ w 后 验 △ w 先 验

这里，第⼀项表⽰拟合由最可能参数给出的数据。对于平的先验分布来说，这对应于对数似然。第⼆项⽤于根据模型的复杂度来惩罚模型

如果考虑一个有M个参数的模型，则有：

l n p (D) ≃ l n p (D | w M A P) + M l n △ w 后 验 △ w 先 验

复杂度惩罚项的⼤⼩随着模型中可调节参数M的数量线性增加。随着我们增加模型的复杂度，第⼀项通常会增⼤，因为⼀个更加复杂的模型能够更好地拟合数据，⽽第⼆项会减⼩，因为它依赖于M。由最⼤模型证据确定的最优的模型复杂度需要在这两个相互竞争的项之间进⾏折中。

优点：避免了过拟合的问题，并且使得模型能够基于训练数据⾃⾝进⾏对⽐。

缺点：需要对模型的形式作出假设，并且如果这些假设不合理，那么结果就会出错。

对于线性基函数模型，如果用贝叶斯方法求解，会难以求出参数 w 的解析解，书中提供了相应的近似方法，大致意思是引入超参数，对超参数做相关近似，然后得到目标变量关于超参数的似然函数，按照似然估计的方法求解。这里省略讨论

固定基函数的局限性

局限性的来源是我们假设了基函数在观测到任何数据之前就被固定了下来

局限性：

（1）基函数难以估计

（2）数据维数很大，基函数的数量会随着输入空间的维度D迅速增长，而且通常是指数方式的增长

真实数据的性质可能帮助缓解这种潜在的维度灾难：

（1）输入变量往往存在相关性

（2）目标变量可能只依赖于数据流形中的少量可能的方向

量子计算+AI：未来AI Agent的计算范式 AI天才研究院计算 ChatGPT DeepSeek RL 强化学习 agent agi 推理模型智能驾驶
量子计算+AI：未来AIAgent的计算范式关键词：量子计算，人工智能，AIAgent，量子算法，量子机器学习，量子优化，量子数据处理摘要：量子计算和人工智能（AI）的结合正在改变AIAgent的计算范式。通过量子计算的超强算力和独特性质，AIAgent在数据处理、算法优化和决策能力方面展现出巨大潜力。本文将详细探讨量子计算与AI结合的核心概念、算法原理、系统架构，并通过实际案例展示量子AIAge
AI人工智能深度学习算法：搭建可拓展的深度学习模型架构 AI大模型应用之禅 DeepSeek R1 &AI大模型与大数据 java python javascript kotlin golang 架构人工智能
深度学习、模型架构、可拓展性、神经网络、机器学习1.背景介绍深度学习作为人工智能领域最前沿的技术之一，在图像识别、自然语言处理、语音识别等领域取得了突破性的进展。深度学习模型的成功离不开其强大的学习能力和可拓展性。本文将深入探讨深度学习算法的原理、模型架构设计以及可拓展性的关键要素，并通过代码实例和实际应用场景，帮助读者理解如何搭建可拓展的深度学习模型架构。2.核心概念与联系深度学习的核心概念是人
机器学习之向量化珠峰日记 AI理论与实践机器学习人工智能
文章目录向量化是什么为什么要向量化提升计算效率简化代码与增强可读性适配模型需求怎么做向量化数据预处理特征提取特征选择向量构建机器学习与深度学习中向量化的区别数据特征提取方式机器学习深度学习模型结构与复杂度机器学习深度学习计算资源需求机器学习深度学习数据规模适应性机器学习深度学习向量化是什么向量化是把数据转化为向量形式进行表示与处理的过程。在机器学习与深度学习的范畴内，现实中的各类数据，像文本、图像
从零精通机器学习：线性回归入门吴师兄大模型 0基础实现机器学习入门到精通机器学习线性回归人工智能 python 算法回归开发语言
Langchain系列文章目录01-玩转LangChain：从模型调用到Prompt模板与输出解析的完整指南02-玩转LangChainMemory模块：四种记忆类型详解及应用场景全覆盖03-全面掌握LangChain：从核心链条构建到动态任务分配的实战指南04-玩转LangChain：从文档加载到高效问答系统构建的全程实战05-玩转LangChain：深度评估问答系统的三种高效方法（示例生成、手
聊聊Python都能做些什么 ·零落· Python入门到掌握 python 开发语言
文章目录一、Python简介二、Python都能做些什么1.Web开发2.数据分析和人工智能3.自动化运维和测试4.网络爬虫5.金融科技三、Python开源库都有哪些1.Web开发2.数据分析和科学计算3.机器学习和深度学习4.网络爬虫5.自动化和测试6.其他常用库四、相关链接一、Python简介Python是一种解释型、面向对象、动态数据类型的高级程序设计语言。它最初由GuidovanRossu
基于改进ISODATA算法的负荷场景曲线聚类（matlab代码）电力程序小学童聚类 matlab ISODATA算法风电光伏
目录1主要内容聚类中心选取步骤核方法2部分代码3程序结果4程序链接1主要内容程序复现文献《基于机器学习的短期电力负荷预测和负荷曲线聚类研究》第三章《基于改进ISODATA算法的负荷场景曲线聚类》模型，该方法不止适用于负荷聚类，同样适用于风光等可再生能源聚类，只需要改变聚类的数据即可，该方法的通用性和可创新性强。该代码实现一种基于改进ISODATA算法的负荷场景曲线聚类方法，代码中，主要做了四种聚类
《基于机器学习的负荷曲线聚类算法对比与改进：K-L-isodata的创新性研究》 TWHiwhjig 机器学习算法聚类
基于机器学习的负荷曲线聚类包括kmeansisodata和改进的L-isodata以及在其基础上再次进行改进的K-L-isodata(有创新性)，四者通过评价指标进行了对比精品代码可修改性极高有参考文献ID:93150688324967700自律的电气人基于机器学习的负荷曲线聚类是一种基于数据分析和模式识别的技术，它可以帮助我们对系统的负荷变化进行分类和理解。在负荷曲线聚类的研究中，K-means
机器学习Pandas_learn4 XW-ABAP 机器学习机器学习 pandas 人工智能
importpandasaspddefcalculate_goods_covariance():#定义商品销售数据字典goods_sales_data={"时期":["一期","二期","三期","四期"],"苹果":[15,16,3,2],"橘子":[12,14,16,18],"石榴":[11,8,7,1]}#将字典转换为DataFrame对象goods_dataframe=pd.DataFra
如何使用Python对Excel、CSV文件完成数据清洗与预处理？ Python 集中营 python数据分析应用 python excel 开发语言
在数据分析和机器学习项目中，数据清洗与预处理是不可或缺的重要环节。现实世界中的数据往往是不完整、不一致且含有噪声的，这些问题会严重影响数据分析的质量和机器学习模型的性能。Python作为一门强大的编程语言，提供了多种库和工具来帮助我们高效地完成数据清洗与预处理任务，其中最常用的库包括Pandas、NumPy、SciPy等。本文将详细介绍如何使用Python对Excel和CSV格式的数据文件进行清洗
理解深度学习1-简介 shangjg3 PyTorch深度学习实战深度学习人工智能
人工智能（AI）旨在打造模仿智能行为的系统。它覆盖了众多方法，涵盖了基于逻辑、搜索和概率推理的技术。机器学习是AI的一个分支，它通过对观测数据进行数学模型拟合来学习决策制定。这个领域近年来迅猛发展，现在几乎（虽不完全准确）与AI同义。深度神经网络是一类机器学习模型，将其应用到数据上的过程称为深度学习。目前，深度网络是最强大和最实用的机器学习模型之一，常见于日常生活中。我们常常用自然语言处理（Nat
【Java】已解决：`java.sql.SQLSyntaxErrorException: SQL` 屿小夏 java sql 开发语言
个人简介：某不知名博主，致力于全栈领域的优质博客分享|用最优质的内容带来最舒适的阅读体验！文末获取免费IT学习资料！文末获取更多信息精彩专栏推荐订阅收藏专栏系列直达链接相关介绍书籍分享点我跳转书籍作为获取知识的重要途径，对于IT从业者来说更是不可或缺的资源。不定期更新IT图书，并在评论区抽取随机粉丝，书籍免费包邮到家AI前沿点我跳转探讨人工智能技术领域的最新发展和创新，涵盖机器学习、深度学习、自然
AIGC带来数据革命：R语言如何成为数据科学家的秘密武器？程序边界 AIGC r语言开发语言
文章目录一、R语言的基础特性1.1R语言的起源与发展1.2R语言的核心优势二、R语言在AIGC中的应用场景2.1数据预处理与清洗2.2文本分析与生成2.3机器学习与模型构建2.4数据可视化与报告生成三、R语言在AIGC中的具体案例3.1金融数据分析与预测3.2医疗数据分析与建模3.3社交媒体数据分析与情感分析四、R语言在AIGC中的未来展望4.1与深度学习框架的集成4.2与云计算平台的集成4.3与
运维Tips | Ubuntu 24.04 安装配置 samba 文件共享全栈工程师修炼指南企业IT运维实践运维 ubuntu linux 服务器
[知识是人生的灯塔，只有不断学习，才能照亮前行的道路]Ubuntu24.04安装配置samba文件共享描述：我们将Ubuntu24.04作为机器学习的工作站，往往需要将Ubuntu24.04中的数据或者代码共享给我们其他使用Windows系统的小伙伴，此时我们可以使用SAMBA，开辟出一个文件共享目录供大家进行数据交换使用。SAMBA是什么?在Linux中，SAMBA是一个开源的软件套件，它提供了
人工智能与机器学习入门：基尼系数（Gini Index）和基于熵（Entropy）基尼系数基于熵机器学习入门
在决策树应用一文中，在构建决策分类树应用决策算法时，介绍了基尼系数（GiniIndex）和基于熵（Entropy）两种算法。本文通过实例来更加深入的介绍一下这两个算法。仍然以简单的数据为例：id喜欢颜色是否有喉结身高性别1绿否165女2蓝是170男3粉否172女4绿是175男基尼系数分别对喜欢颜色是否有喉结求基尼系数如下：喜欢的颜色id喜欢颜色性别1绿女2蓝男3粉女4绿男对于姓别女分类而言，数据如
构建未来智能：在Mojo模型中自定义模型架构的艺术 2401_85761003 mojo 架构
构建未来智能：在Mojo模型中自定义模型架构的艺术在深度学习的世界里，模型架构的设计往往决定了算法的性能和适用性。Mojo模型，作为一个假想中的高级机器学习框架，允许用户实现自定义的模型架构来解决特定的问题。本文将深入探讨如何在Mojo模型中实现自定义模型架构，并提供详细的步骤和代码示例，以帮助读者掌握这一强大的技术。自定义模型架构的重要性灵活性自定义模型架构提供了设计适合特定问题需求的模型的灵活
最新计算机专业毕设论文选题大全基于BeautifulSoup的毕业设计详细题目100套优质毕设项目分享(源码+论文)✅ 会写代码的羊毕设选题课程设计 beautifulsoup 毕业设计毕业设计题目毕设题目 python 网络爬虫
文章目录前言最新毕设选题（建议收藏起来）基于BeautifulSoup的毕业设计选题毕设作品推荐前言2025全新毕业设计项目博主介绍：✌全网粉丝10W+,CSDN全栈领域优质创作者，博客之星、掘金/华为云/阿里云等平台优质作者。技术范围：SpringBoot、Vue、SSM、HLMT、Jsp、PHP、Nodejs、Python、爬虫、数据可视化、小程序、大数据、机器学习等设计与开发。主要内容：免费
如果我想成为一名大数据和算法工程师，我需要学会哪些技能，获取大厂的offer 红豆和绿豆杂谈大数据算法
成为一名大数据和算法工程师并获取大厂Offer，需要掌握一系列核心技能，并具备丰富的项目经验与扎实的理论基础。以下是详细的技能要求和建议：---###**1.数学与理论基础**-**数学知识**：掌握线性代数、微积分、概率论和统计学，这些是设计和理解算法的基础。-**机器学习理论**：深入理解常见机器学习算法（如线性回归、逻辑回归、决策树、随机森林、SVM、K-means等），了解其原理、优缺点及
关于非线性优化小记文弱_书生乱七八糟算法
非线性优化（NonlinearOptimization）1.什么是非线性优化？非线性优化是指目标函数或约束条件中至少有一个是非线性的优化问题。它广泛应用于工程、经济、人工智能、机器学习等领域，用于求解最优解的问题。非线性优化通常可以表示为以下数学形式：min⁡xf(x)或max⁡xf(x)\min_{x}f(x)\quad\text{或}\quad\max_{x}f(x)xminf(x)或xmax
麦萌短剧技术解构《我跑江湖那些年》：从“仇恨驱动型算法”到“多方安全计算的自我救赎” 短剧萌算法安全
《我跑江湖那些年》以慕青青的复仇与蜕变为主线，展现了分布式系统中的信任崩塌与对抗性博弈的模型优化。本文将从机器学习视角拆解这场“江湖算法”的技术隐喻，探讨如何在数据污染的困境中实现参数净化。1.初始训练集：暴力采样与特征空间坍缩慕青青（Agent_M）的成长环境可视为一个高偏差训练集：数据污染事件：村主任（Node_V）通过恶意共识算法（如嫉妒驱动的PoW机制），煽动村民（Sub_Nodes）对果
学习pytorch 阿什么名字不会重复呢学习 pytorch 人工智能
学习PyTorch是一个很好的选择，尤其是如果你对深度学习和机器学习感兴趣。以下是一个详细的学习计划，可以帮助你系统地掌握PyTorch的基本概念和应用。学习计划概览学习周期：8周（每周约4-5小时）目标：掌握PyTorch基础，能够实现简单的深度学习模型。第1周：基础知识目标：了解深度学习的基础知识，掌握Python和NumPy基础。任务：学习Python基础（数据类型、控制流、函数、类）。资源
【机器学习-基础知识】统计和贝叶斯推断人类发明了工具 ML&DL学习分享机器学习概率论人工智能
1.概率论基本概念回顾1.概率分布定义：概率分布（ProbabilityDistribution）指的是随机变量所有可能取值及其对应概率的集合。它描述了一个随机变量可能取的所有值以及每个值被取到的概率。对于离散型随机变量，使用概率质量函数来描述。对于连续型随机变量，使用概率密度函数来描述。举例说明：投掷一颗六面骰子，每个面上的数字（1到6）都有相同的概率（1/6）出现，这就是一个简单的概率分布例子
AI驱动的代码重构与优化技术 AI天才研究院 DeepSeek R1 &大数据AI人工智能大模型 ChatGPT java python javascript kotlin golang 架构人工智能大厂程序员硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM 系统架构设计软件哲学 Agent 程序员实现财富自由
AI驱动的代码重构与优化技术概述什么是AI驱动的代码重构与优化？AI驱动的代码重构与优化技术，是指利用人工智能，特别是机器学习和深度学习的算法，对软件代码进行自动分析和改进的技术。这种技术能够通过学习大量的代码样本，识别出代码中的模式、问题和改进点，从而自动完成代码的重构和优化。重构的定义重构（Refactoring）是改进代码内部结构而不改变外部行为的过程。其目的通常是为了提高代码的可读性、可维
机器学习Pandas_learn3 XW-ABAP 机器学习 pandas
frompandasimportDataFrameimportnumpypaints={"车名":["奥迪Q5L","哈弗H6","奔驰GLC"],"最低报价":[numpy.nan,9.80,numpy.nan],"最高报价":[49.80,23.10,58.78]}goods_in=DataFrame(paints,index=[1,2,3])print(goods_in)goods_in_n
机器学习中输入输出Tokens的概念详解爱吃土豆的程序员机器学习基础机器学习人工智能 Tokens
随着深度学习技术的快速发展，大语言模型（LargeLanguageModels,LLMs）已经成为自然语言处理（NLP）领域的一个热点研究方向。这些模型不仅能够生成高质量的文本，还能在多种任务中展现出卓越的表现，比如机器翻译、问答系统、文本摘要等。在大语言模型的工作流程中，Tokens的概念扮演着至关重要的角色。本文将详细介绍大语言模型如何使用Tokens，以及如何计算Tokens的数量。什么是T
【sklearn 01】人工智能概述 @金色海岸人工智能 sklearn python
一、人工智能，机器学习，深度学习人工智能指由人类制造出的具有智能的机器。这是一个非常大的范围，长远目标是让机器实现人工智能，但目前我们仍处在非常初始的阶段，甚至不能称为智能机器学习是指通过数据训练出能完成一定功能的模型，是实现人工智能的手段之一，也是目前最主流的人工智能实现方法深度学习则是机器学习的分支，超过8层的神经网络模型就叫深度学习，深度即层数。深度学习目前在语音、图像等领域取得很好的效果
【AI】使用Python实现机器学习小项目教程丶2136 AI 人工智能 python 机器学习
引言在本教程中，我们将带领您使用Python编程语言实现一个经典的机器学习项目——鸢尾花（Iris）分类。通过这个项目，您将掌握机器学习的基本流程，包括数据加载、预处理、模型训练、评估和优化等步骤。论文AIGC检测，降AIGC检测，AI降重，三连私信免费获取：ReduceAIGC9折券！DetectAIGC立减2元券！AI降重9折券！目录引言一、项目背景与目标二、开发环境准备2.1所需工具2.2环
AI人工智能中的概率论与统计学原理与Python实战：Python实现概率模型 AI天才研究院 AI实战 AI大模型企业级应用开发实战大数据人工智能语言模型 AI LLM Java Python 架构设计 Agent RPA
1.背景介绍随着人工智能技术的不断发展，概率论与统计学在人工智能领域的应用越来越广泛。概率论与统计学是人工智能中的基础知识之一，它们在机器学习、深度学习、自然语言处理等领域都有着重要的作用。本文将介绍概率论与统计学的核心概念、算法原理、具体操作步骤以及Python实现方法，并通过具体代码实例进行详细解释。2.核心概念与联系2.1概率论与统计学的区别概率论是一门数学学科，它研究随机事件发生的可能性。
技术解析麦萌短剧《月光下的你》：从「时间序列的对抗扰动」到「加密身份的收敛证明」萌萌短剧重构
《月光下的你》以十六年的时间跨度展开一场关于「数据污染」与「身份验证」的深度博弈，本文将用机器学习视角拆解这场跨越时空的模型纠偏实验。1.数据污染事件：十六年前的对抗攻击许芳菲（Agent_Xu）的遭遇可视为时间序列上的对抗样本注入：标签篡改攻击：许清清（Adversary_XuQing）通过伪造标签（Label_Tampering）将Agent_Xu与傅临州（Node_Fu）强行关联，触发道德约
机器学习 [白板推导]（三）[线性分类] 神齐的小马机器学习分类人工智能
4.线性分类4.1.线性分类的典型模型硬分类：输出结果只有0或1这种离散结果；感知机线性判别分析Fisher软分类：会输出0-1之间的值作为各个类别的概率；概率生成模型：高斯判别分析GDA、朴素贝叶斯，主要建模的是p(x⃗,y)p(\vec{x},y)p(x,y)概率判别模型：逻辑回归，主要建模的是p(y∣x⃗)p(y|\vec{x})p(y∣x)4.2.感知机4.2.1.基本模型模型：f(x
Ollama 基本概念 Mr_One_Zhang 学习Ollama ai
Ollama是一个本地化的、支持多种自然语言处理（NLP）任务的机器学习框架，专注于模型加载、推理和生成任务。通过Ollama，用户能够方便地与本地部署的大型预训练模型进行交互。1.模型（Model）在Ollama中，模型是核心组成部分。它们是经过预训练的机器学习模型，能够执行不同的任务，例如文本生成、文本摘要、情感分析、对话生成等。Ollama支持多种流行的预训练模型，常见的模型有：deepse
web报表工具FineReport常见的数据集报错错误代码和解释老A不折腾 web报表 finereport 代码可视化工具
在使用finereport制作报表，若预览发生错误，很多朋友便手忙脚乱不知所措了，其实没什么，只要看懂报错代码和含义，可以很快的排除错误，这里我就分享一下finereport的数据集报错错误代码和解释，如果有说的不准确的地方，也请各位小伙伴纠正一下。 NS-war-remote=错误代码\:1117 压缩部署不支持远程设计 NS_LayerReport_MultiDs=错误代码
Java的WeakReference与WeakHashMap bylijinnan java 弱引用
首先看看 WeakReference wiki 上 Weak reference 的一个例子： public class ReferenceTest { public static void main(String[] args) throws InterruptedException { WeakReference r = new Wea
Linux——（hostname）主机名与ip的映射 eksliang linux hostname
一、什么是主机名无论在局域网还是INTERNET上，每台主机都有一个IP地址，是为了区分此台主机和彼台主机，也就是说IP地址就是主机的门牌号。但IP地址不方便记忆，所以又有了域名。域名只是在公网（INtERNET)中存在，每个域名都对应一个IP地址，但一个IP地址可有对应多个域名。域名类型 linuxsir.org 这样的；主机名是用于什么的呢？答：在一个局域网中，每台机器都有一个主
oracle 常用技巧 18289753290
oracle常用技巧 ①复制表结构和数据 create table temp_clientloginUser as select distinct userid from tbusrtloginlog ②仅复制数据如果表结构一样 insert into mytable select * &nb
使用c3p0数据库连接池时出现com.mchange.v2.resourcepool.TimeoutException 酷的飞上天空 exception
有一个线上环境使用的是c3p0数据库，为外部提供接口服务。最近访问压力增大后台tomcat的日志里面频繁出现 com.mchange.v2.resourcepool.TimeoutException: A client timed out while waiting to acquire a resource from com.mchange.v2.resourcepool.BasicResou
IT系统分析师如何学习大数据蓝儿唯美大数据
我是一名从事大数据项目的IT系统分析师。在深入这个项目前需要了解些什么呢？学习大数据的最佳方法就是先从了解信息系统是如何工作着手，尤其是数据库和基础设施。同样在开始前还需要了解大数据工具，如Cloudera、Hadoop、Spark、Hive、Pig、Flume、Sqoop与Mesos。系统分析师需要明白如何组织、管理和保护数据。在市面上有几十款数据管理产品可以用于管理数据。你的大数据数据库可能
spring学习——简介 a-john spring
Spring是一个开源框架，是为了解决企业应用开发的复杂性而创建的。Spring使用基本的JavaBean来完成以前只能由EJB完成的事情。然而Spring的用途不仅限于服务器端的开发，从简单性，可测试性和松耦合的角度而言，任何Java应用都可以从Spring中受益。其主要特征是依赖注入、AOP、持久化、事务、SpringMVC以及Acegi Security 为了降低Java开发的复杂性，
自定义颜色的xml文件 aijuans xml
<?xml version="1.0" encoding="utf-8"?> <resources> <color name="white">#FFFFFF</color> <color name="black">#000000</color> &
运营到底是做什么的？ aoyouzi 运营到底是做什么的？
文章来源：夏叔叔（微信号：woshixiashushu），欢迎大家关注！很久没有动笔写点东西，近些日子，由于爱狗团产品上线，不断面试，经常会被问道一个问题。问：爱狗团的运营主要做什么？答：带着用户一起嗨。为什么是带着用户玩起来呢？究竟什么是运营？运营到底是做什么的？那么，我们先来回答一个更简单的问题——互联网公司对运营考核什么？以爱狗团为例，绝大部分的移动互联网公司，对运营部门的考核分为三块——用
js面向对象类和对象百合不是茶 js 面向对象函数创建类和对象
接触js已经有几个月了,但是对js的面向对象的一些概念根本就是模糊的,js是一种面向对象的语言但又不像java一样有class,js不是严格的面向对象语言 ,js在java web开发的地位和java不相上下 ,其中web的数据的反馈现在主流的使用json,json的语法和js的类和属性的创建相似下面介绍一些js的类和对象的创建的技术一:类和对
web.xml之资源管理对象配置 resource-env-ref bijian1013 java web.xml servlet
resource-env-ref元素来指定对管理对象的servlet引用的声明，该对象与servlet环境中的资源相关联 <resource-env-ref> <resource-env-ref-name>资源名</resource-env-ref-name> <resource-env-ref-type>查找资源时返回的资源类
Create a composite component with a custom namespace sunjing
https://weblogs.java.net/blog/mriem/archive/2013/11/22/jsf-tip-45-create-composite-component-custom-namespace When you developed a composite component the namespace you would be seeing would
【MongoDB学习笔记十二】Mongo副本集服务器角色之Arbiter bit1129 mongodb
一、复本集为什么要加入Arbiter这个角色回答这个问题，要从复本集的存活条件和Aribter服务器的特性两方面来说。什么是Artiber？ An arbiter does not have a copy of data set and cannot become a primary. Replica sets may have arbiters to add a
Javascript开发笔记白糖_ JavaScript
获取iframe内的元素通常我们使用window.frames["frameId"].document.getElementById("divId").innerHTML这样的形式来获取iframe内的元素，这种写法在IE、safari、chrome下都是通过的，唯独在fireforx下不通过。其实jquery的contents方法提供了对if
Web浏览器Chrome打开一段时间后，运行alert无效 bozch Web chorme alert 无效
今天在开发的时候，突然间发现alert在chrome浏览器就没法弹出了，很是怪异。试了试其他浏览器，发现都是没有问题的。开始想以为是chorme浏览器有啥机制导致的，就开始尝试各种代码让alert出来。尝试结果是仍然没有显示出来。这样开发的结果，如果客户在使用的时候没有提示，那会带来致命的体验。哎，没啥办法了就关闭浏览器重启。结果就好了，这也太怪异了。难道是cho
编程之美-高效地安排会议图着色问题贪心算法 bylijinnan 编程之美
import java.util.ArrayList; import java.util.Collections; import java.util.List; import java.util.Random; public class GraphColoringProblem { /**编程之美高效地安排会议图着色问题贪心算法 * 假设要用很多个教室对一组
机器学习相关概念和开发工具 chenbowen00 算法 matlab 机器学习
基本概念：机器学习(Machine Learning, ML)是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。它是人工智能的核心，是使计算机具有智能的根本途径，其应用遍及人工智能的各个领域，它主要使用归纳、综合而不是演绎。开发工具 M
[宇宙经济学]关于在太空建立永久定居点的可能性 comsci 经济
大家都知道,地球上的房地产都比较昂贵,而且土地证经常会因为新的政府的意志而变幻文本格式........ 所以,在地球议会尚不具有在太空行使法律和权力的力量之前,我们外太阳系统的友好联盟可以考虑在地月系的某些引力平衡点上面,修建规模较大的定居点
oracle 11g database control 证书错误 daizj oracle 证书错误 oracle 11G 安装
oracle 11g database control 证书错误 win7 安装完oracle11后打开 Database control 后，会打开em管理页面，提示证书错误，点“继续浏览此网站”，还是会继续停留在证书错误页面解决办法：是 KB2661254 这个更新补丁引起的，它限制了 RSA 密钥位长度少于 1024 位的证书的使用。具体可以看微软官方公告：
Java I/O之用FilenameFilter实现根据文件扩展名删除文件游其是你 FilenameFilter
在Java中，你可以通过实现FilenameFilter类并重写accept(File dir, String name) 方法实现文件过滤功能。在这个例子中，我们向你展示在“c:\\folder”路径下列出所有“.txt”格式的文件并删除。 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
C语言数组的简单以及一维数组的简单排序算法示例，二维数组简单示例 dcj3sjt126com c array
# include <stdio.h> int main(void) { int a[5] = {1, 2, 3, 4, 5}; //a 是数组的名字 5是表示数组元素的个数，并且这五个元素分别用a[0], a[1]...a[4] int i; for (i=0; i<5; ++i) printf("%d\n",
PRIMARY, INDEX, UNIQUE 这3种是一类 PRIMARY 主键。就是唯一且不能为空。 INDEX 索引，普通的 UNIQUE 唯一索引 dcj3sjt126com primary
PRIMARY, INDEX, UNIQUE 这3种是一类PRIMARY 主键。就是唯一且不能为空。INDEX 索引，普通的UNIQUE 唯一索引。不允许有重复。FULLTEXT 是全文索引，用于在一篇文章中，检索文本信息的。举个例子来说，比如你在为某商场做一个会员卡的系统。这个系统有一个会员表有下列字段：会员编号 INT会员姓名
java集合辅助类 Collections、Arrays shuizhaosi888 Collections Arrays HashCode
Arrays、Collections 1 ）数组集合之间转换 public static <T> List<T> asList(T... a) { return new ArrayList<>(a); } a）Arrays.asL
Spring Security（10）——退出登录logout 234390216 logout Spring Security 退出登录 logout-url LogoutFilter
要实现退出登录的功能我们需要在http元素下定义logout元素，这样Spring Security将自动为我们添加用于处理退出登录的过滤器LogoutFilter到FilterChain。当我们指定了http元素的auto-config属性为true时logout定义是会自动配置的，此时我们默认退出登录的URL为“/j_spring_secu
透过源码学前端之 Backbone 三 Model 逐行分析JS源代码 backbone 源码分析 js学习
Backbone 分析第三部分 Model 概述： Model 提供了数据存储，将数据以JSON的形式保存在 Model的 attributes里，但重点功能在于其提供了一套功能强大，使用简单的存、取、删、改数据方法，并在不同的操作里加了相应的监听事件，如每次修改添加里都会触发 change，这在据模型变动来修改视图时很常用，并且与collection建立了关联。
SpringMVC源码总结（七）mvc:annotation-driven中的HttpMessageConverter 乒乓狂魔 springMVC
这一篇文章主要介绍下HttpMessageConverter整个注册过程包含自定义的HttpMessageConverter，然后对一些HttpMessageConverter进行具体介绍。 HttpMessageConverter接口介绍： public interface HttpMessageConverter<T> { /** * Indicate
分布式基础知识和算法理论 bluky999 算法 zookeeper 分布式一致性哈希 paxos
分布式基础知识和算法理论 BY [email protected] 本文永久链接：http://nodex.iteye.com/blog/2103218 在大数据的背景下，不管是做存储，做搜索，做数据分析，或者做产品或服务本身，面向互联网和移动互联网用户，已经不可避免地要面对分布式环境。笔者在此收录一些分布式相关的基础知识和算法理论介绍，在完善自我知识体系的同
Android Studio的.gitignore以及gitignore无效的解决 bell0901 android gitignore
　　github上.gitignore模板合集，里面有各种.gitignore ： https://github.com/github/gitignore 　　自己用的Android Studio下项目的.gitignore文件，对github上的android.gitignore添加了　　　　　　# OSX files　　　　　　//mac os下　　　　　　.DS_Store
成为高级程序员的10个步骤 tomcat_oracle 编程
What 软件工程师的职业生涯要历经以下几个阶段：初级、中级，最后才是高级。这篇文章主要是讲如何通过 10 个步骤助你成为一名高级软件工程师。 Why 得到更多的报酬！因为你的薪水会随着你水平的提高而增加提升你的职业生涯。成为了高级软件工程师之后，就可以朝着架构师、团队负责人、CTO 等职位前进历经更大的挑战。随着你的成长，各种影响力也会提高。
mongdb在linux下的安装 xtuhcy mongodb linux
一、查询linux版本号： lsb_release -a LSB Version: :base-4.0-amd64:base-4.0-noarch:core-4.0-amd64:core-4.0-noarch:graphics-4.0-amd64:graphics-4.0-noarch:printing-4.0-amd64:printing-4.0-noa