小羊和小何

机器学习基础：模型评估（下）

1. 引言

2. 进一步评估

3. 机器学习中的偏差和方差种类

3.1 过拟合

3.2 欠拟合

3.3 训练曲线观察泛化性

3.4 模型偏差和方差（bias and variance）

3.4.1 偏差 Bias

3.4.2 方差 Variance

3.4.3 方差偏差总结

4. 模型的泛化性（Generalization）

4.1 导致泛化性错误的原因

4.2 诊断高偏差/方差问题

4.2.1 高偏差诊断

4.2.2 高方差诊断

5. 针对偏差和方差的补救措施

6. 评估偏差和方差（Evaluation bias / Variance）

6.1 如何解决Evaluation偏差和方差

1. 引言

在博文《机器学习基础：模型评估（上）》里，我们谈论了模型评估的第一阶段：交叉验证，混淆矩阵，精确度和错误率。

本篇博文进一步的谈论模型评估：

如何衡量一个模型是否足够好？
什么时候应该停止模型的训练？
如何进行超参数的调整？
哪几种类型的原因导致模型的表现变差？
找出导致模型性能差的原因并进行修正？

2. 进一步评估

除了上面说的那些评估的方法和指标，我们必须还关注模型的：

泛化性：

用来衡量分类器从训练实例中归纳出预测目标函数的能力；如果一个模型的泛化性够好，就代表举一反三的能力强，对于没有见过的样本也能够给出较好的预测。甚至对于相似的数据集也能够给出较好的表现。

一致性：

模型是否可以完美地预测所有训练样本的类别。

3. 机器学习中的偏差和方差种类

偏差种类（偏差 bias 可以代指很多事情）：

模型偏差（model bias）模型能够系统地做出错误预测的倾向

评估偏差（evaluation bias）评估策略倾向于高估或低估模型有效性的趋势

抽样偏差（sampling bias）如果训练或评估数据集不能代表总体，就打破了归纳学习假设

方差种类：

模型方差（model variance）

评估方差（evaluation variance）

泛化性问题，泛化性不好主要体现在两个方面：

模型过拟合

模型欠拟合

3.1 过拟合

模型太复杂，甚至连数据中的噪声也捕捉了。

过拟合的原因：

决策边界很容易被噪声影响；

训练集中没有足够多的训练样本支持模型学到整个数据集的分布。

另外一种情况就是训练集合测试集在划分的时候没有按照相同的分布（也就是划分数据集的时候采样的随机性不足），在这种情况下，即使训练集样本很多也不能够学到整个数据集的分布，照样会造成过拟合的问题。

决策边界很容易被噪声影响：

如果对于一个简单的模型，遇到图中的 $noise \: \: point$ 可能没有那么强的能力去拟合，但是如果模型过于复杂，他就有强大的能力连噪声也拟合了，反而导致模型的泛化性不如简单模型。

训练集中没有足够多的训练样本支持模型学到整个数据集的分布：

如果训练集只有这么几个简单的样本，那么如果在测试集中如果出现了下面的情况：

测试样本中的分布与训练样本中的差距很大，也就是说：模型没有通过训练集学到整个样本集的分布情况；这样也会导致过拟合和模型精度不高的情况。

3.2 欠拟合

模型表达能力不够，无法捕获数据中的潜在的模式。

适当的拟合模型捕捉数据中的基本模式。

3.3 训练曲线观察泛化性

通过模型的训练曲线，可以观察模型是否发生了过拟合或者欠拟合的现象。
曲线的纵轴（）可以反映模型的精度、错误率或者其他的评估指标
曲线的横轴（）可以反映例如：训练集大小，模型复杂度，迭代次数

下图展示了一个贝叶斯模型随着训练样本的增加，其训练集精度和验证集精度的变化情况：

最开始的个样本之前，由于训练集很小，所以在训练集上得到的训练精度很高，而测试集的样本很多，所以验证集的精度比较低，但是随着训练样本的不断增多、测试样本的不断减少，模型训练的越来越充分，因此在测试集上的精度表现越来越好。最后达到模型的收敛状态，训练就可以停止了

训练集和测试集的比例按照多少划分才比较合适呢？

如果训练的数据太多，就会导致测试集的数据太少从而不能够反映出模型真实的泛化能力；而如果测试集太大导致训练集太小又会导致模型的训练不充分。

为了选择更好的比例对训练集和测试集进行切分，我们可以通过下面的例子来探讨：

Example 1

在下面的例子中，如果让你选择训练集和测试集的切分比例，到底是选还是呢：

在这个例子中，其实应该选择的样本训练，因为样本用来训练就足以表现的很好了，这种情况下保留更多的测试样本会更加充分地衡量模型的泛化能力。

Example 2

在线性回归中，我们会使用关于的多项式来增加线性回归的灵活性，使得模型的拟合能力更加强大，这是因为多项式的引入使得模型的复杂度更高，可以找出更加复杂的内部关系。

但是从这个图上来看，模型的错误率在多项式的最高次项之后不降反增，说明了模型的表现其实是在下降。所以模型并不是越复杂越好。

模型复杂度的问题几乎在所有的模型中都会有超参数进行调整，例如：

在深度学习中，神经网络的层数
决策树中，决策树的最大深度

3.4 模型偏差和方差（bias and variance）

公式定义：

3.4.1 偏差 Bias

其中 $E(\cdot)$ 是期望；
模型对于某个样本真实值和预测值 $\hat{f}(x_i)$ 之间的偏差是 $\hat{f}(x_i)-f(x_i)$

数据集中所有个样本的偏差总和的均值就是期望偏差 $Bias(\hat{f},f)$

$Bias(\hat{f},f)$ 也可以写成下面这种形式：

$Bias(\hat{f},f)=\frac{1}{n}\sum_{i=1}^n(\hat{f}(x_i)-f(x_i))$

回归任务的

在回归任务中，均方误差可以被用来衡量模型的偏差：

对于每个求值实例，都可以计算 $signed \: \: error$ 。
假设每个实例都是独立的，偏差就是这些有符号误差的平均值。

一个模型是有偏差的：如果预测比真实值系统地高，或者预测比真实值系统地低。

一个模型是无偏的：如果预测是系统正确的，或者有些预测太高，有些预测太低。

分类任务

在分类任务的场景中：

标签预测不能过高或过低。
偏向于多数类意味着我们的模型预测了太多标签为多数类的实例。

通常比较类的分布:

无偏差分类器产生的标签具有与实际分布相同的分布
有偏差分类器产生的标签分布与实际分布不同

3.4.2 方差 Variance

方差：模型方差是指不同训练集对同一类型的学习者产生不同模型或预测的倾向。

$Var(\cdot)$ 也是期望；只不过它是对方差的期望。

每个样本的预测值 $\hat{f}(x_i)$ ；所有样本在这个模型下的预测值的期望（均值）是：

$E[\hat{f}(x)]=\frac{1}{n}\sum_{i=1}^n\hat{f}(x_i)$

由此我们可以得到整个模型的期望方差 $Var(\hat{f},f)$ 是：

$Var(\hat{f},f)=E[(\hat{f}(x_i)-E[\hat{f}(x_i)])^2]=\frac{1}{m}\sum_{j=1}^m(\hat{f_j}(x_i)-\frac{1}{n}\sum_{i=1}^n\hat{f_j}(x_i))^2$

一共有个数据集（标签的类别数一样），在不同数据集上训练的模型表示为。

如果一个不同的随机抽样训练集导致评估集上非常不同的预测，那么这个模型就有很大的方差。
如果不同的随机抽样训练集导致相似的预测（与预测是否正确无关），则模型的方差较低。

不管预测的对不对，只要在具有相同分布的数据集上，训练出的模型的预测结果是一致的，例如对于类数据，哪怕全判错成类，哪怕都错了，但只要预测的方向一致，模型的方差就低。

3.4.3 方差偏差总结

偏置误差是来自学习算法中错误的假设的误差。高偏差会导致算法错过特征和目标输出之间的相关关系（欠拟合）。

方差是对训练集的小波动的敏感性所产生的误差。高方差可能来自于对训练数据中的随机噪声进行建模的算法（过拟合）。

偏差指的是模型的假设过于简单和真实情况之间的差距，比如一个非线性的数据集，我们使用一个线性的假设，那么这样的假设必然会导致偏差，所以高偏差的数据肯定是欠拟合的。

方差刻画了数据扰动对模型产生的影响，比如相同类型的两个数据集，他们都包含个类别的数据，模型分别在两个数据集上进行训练，然后用相同的测试集测试，发现模型对于样本的判断情况差距很大。例如同样对一个标签为的样本，在上训练的判断成而在上训练的判断成，但是在理想情况下，只要是数据样本类别相同的数据集，无论包含的图片数量多少，使用他们训练出来的模型在同一个测试集上表现应该是一样的。但现在在不同数据集上训练的结果竟然有较大的差距。

但是方差大的模型并不代表就一定过拟合了，因为如果方差和偏差同时高，那就代表这个模型更多地拟合了数据中的噪声。只有方差大偏差小的模型才是过拟合的。

4. 模型的泛化性（Generalization）

一个泛化性好的模型应该对于没见过的样本能够给出很好的预测结果

如何评估一个模型的泛化性能？

给定一个数据集 $D=\{x_i,y_i\}, i=1,...,n, y\in R$ ，假设这个数据集是通过一个函数 $f(\cdot)$ 混入一些随机噪声 $\epsilon \in \aleph(0,\sigma)$ ，这个随机噪声是一个不可测的误差，可能来自于标注错误等，我们用下列式子表示这个数据集的情况：

$Y=f(X)+\epsilon$

在这种情况下我们对数据集中的数据进行多次随机采样，得到多个随机采样的子数据集，然后在这些子数据集上训练不同的模型，将他们在验证集上进行验证得到预测结果 $\hat{f}(x)$ ，真实的情况用红线和表示，多个子训练集预测的情况及对应模型用黄线和 $\hat{f}(x)$ 来表示：

在一个点x处的预期预测误差平方为：

对于一个模型的误差问题，在之前的部分讲到了和，还有一个很重要的部分就是随机误差：

模型的泛化误差有，和误差三部分构成。

方差：如果你在不同的训练集上训练，你的模型会有多大变化。你的分类器对某一特定训练集的过度专业化程度如何？

偏差：即使有无限的训练数据，你从你的模型中得到的固有误差是多少？这是由于你的模型偏向于某种特定的解决方案。换句话说，偏见是你的模型所固有的。

噪声：这种误差衡量的是由于你的数据分布和特征表示而产生的模糊性。你永远无法战胜它；它是数据的一个方面。

衡量了在不同数据集上训练的模型对于同一个测试集的表现差异

反映了模型的假设在多大程度上和数据的真实情况是相符的，即有没有在构建模型的时候对数据进行较为准确的假设。

是一种不可避免的由数据分布和特征等很多方面的综合表示而造成的误差

4.1 导致泛化性错误的原因

高偏差和高方差都可以导致模型的泛化性很差：

模型的方差为，但是偏差很高。
一个很复杂的模型可能偏差很低但是方差很高。

拥有低偏差和低方差的模型被认为是泛化性能好的模型。

4.2 诊断高偏差/方差问题

从根本上说，处理偏差和方差其实就是处理过拟合和欠拟合。偏差减少，方差增加与模型的复杂性有关。

下面展示的是方差和偏差随着模型复杂度的变化:

下图展示的是训练样本数量与的变化关系：这三个图分别表示了欠拟合（高偏差），过拟合（高方差低偏差），以及一个泛化性较好的模型。

4.2.1 高偏差诊断

增加训练集的规模对于小的模型并不会有什么帮助，下图红色点是训练集的样本，蓝色线是拟合出的高模型。

高的学习曲线特点是训练误差和测试误差都大。

4.2.2 高方差诊断

使用更多的样本进行训练可以缓解高方差的问题，因为训练样本越大，分布就越接近理想分布，方差就能够有效减小。

高方差的学习曲线特征是 $train \: error$ 和 $test \: \: error$ 之间存在差距。

5. 针对偏差和方差的补救措施

高偏差补救措施

采用更复杂的模型（例如非线性模型）。

增加训练模型所使用的特征数量。

使用集成方法不断地对模型的残差进行迭代学习。

集成：

训练数据：不同的权重（要选择的概率）

使用多个弱模型 $\rightarrow$ 一个更强的模型；减少偏差（提高性能）

使用多个弱分类器。

按照顺序，前一个弱分类器学习产生的误差由后一个弱分类器来学习，即每个弱分类器都只学习前一个弱分类器的误差。

最后按照权重将这些顺序的弱分类器进行整合得到一个强分类器。

这样的方式相当于不断地增加模型的复杂度，提高对数据的拟合能力，从而减小偏差。

高偏差补救措施

增加更多的训练数据

减少构建模型时使用的特征数量

减小模型训练的复杂度

采用正则化方法（）

的方式进行模型集成

例如在 SVM 模型中，调整正则化参数 C 来控制对落在决策边界中的样本的严苛程度。

集成

从原始数据集中构建新数据集：随机有放回地选取训练数据，构造多个新数据集。
结合多个不同的模型常用投票法来集成，可以减少模型的方差。

6. 评估偏差和方差（Evaluation bias / Variance）

偏差和方差的定义：

评估的质量与模型无关，只与评估的方法有关

如果有无限大的测试集，那么在这个测试集上表现出的测试精度才能完全反映当前模型的训练情况。

评估结果可能存在的问题：

对于某些特定的 $evaluation \: \: set$ ，模型有很好的精度，但是对于其他不可见的 $evaluation \: \: set$ ，模型的精度很差。

评估函数（ $evaluation \: \: function$ ）也有可能对验证数据（ $valuation\: \: data$ ）过拟合。

我们想要知道一个分类器的“真实”错误率，但是我们只对错误率进行了估计，这取决于一些特定的评估样本集（因为没办法获得无穷大的测试样本集）。

评估偏差（evaluation bias）：我们对于模型的评估是偏颇的；我们对模型有效性的估计系统地过高/过低。

评估方差（evaluation variance）：当我们改变测试集中的样本时（采用不同的测试样本集），我们对模型有效性的估计会改变很多。

6.1 如何解决Evaluation偏差和方差

合理的划分训练测试集：训练集越大测试集越小——训练方差会更小，测试方差会更大。

重复随机采样（repeated random subsampling）和交叉验证（cross-evaluation）可以得到更小的模型方差和评估方差。

分层采样(stratification) / 垂直采样(vertical sampling)：有效降低模型和评估的偏差。

留一法交叉验证（leave-one-out Cross validation）：消除了采样偏差（sampling bias），通常也有最低的偏差/方差。

探索Python中的集成方法：Stacking Echo_Wish Python 笔记 Python 算法 python 开发语言
在机器学习领域，Stacking是一种高级的集成学习方法，它通过将多个基本模型的预测结果作为新的特征输入到一个元模型中，从而提高整体模型的性能和鲁棒性。本文将深入介绍Stacking的原理、实现方式以及如何在Python中应用。什么是Stacking？Stacking，又称为堆叠泛化（StackedGeneralization），是一种模型集成方法，与Bagging和Boosting不同，它并不直
【Python】 Stacking: 强大的集成学习方法音乐学家方大刚 Python python 集成学习开发语言
我们都找到天使了说好了心事不能偷藏着什么都一起做幸福得没话说把坏脾气变成了好沟通我们都找到天使了约好了负责对方的快乐阳光下的山坡你素描的以后怎么抄袭我脑袋想的薛凯琪《找到天使了》在机器学习中，单一模型的性能可能会受到其局限性和数据的影响。为了解决这个问题，我们可以使用集成学习（EnsembleLearning）方法。集成学习通过结合多个基模型的预测结果，来提高整体模型的准确性和稳健性。Stacki
Stacking算法：集成学习的终极武器 civilpy 算法集成学习机器学习
Stacking算法：集成学习的终极武器在机器学习的竞技场中，集成学习方法以其卓越的性能而闻名。其中，Stacking（堆叠泛化）作为一种高级集成技术，更是被誉为“集成学习的终极武器”。本文将带你深入了解Stacking算法的原理和实现，并提供一些实战技巧和最佳实践。1.Stacking算法原理探秘Stacking算法的核心思想是训练多个不同的基模型，并将它们的预测结果作为新模型的输入特征，以此来
集成学习（上）：Bagging集成方法万事可爱^ 机器学习修仙之旅 #监督学习集成学习机器学习人工智能 Bagging 随机森林
一、什么是集成学习？在机器学习的世界里，没有哪个模型是完美无缺的。就像古希腊神话中的"盲人摸象"，单个模型往往只能捕捉到数据特征的某个侧面。但当我们把多个模型的智慧集合起来，就能像拼图一样还原出完整的真相，接下来我们就来介绍一种“拼图”算法——集成学习。集成学习是一种机器学习技术，它通过组合多个模型（通常称为“弱学习器”或“基础模型”）的预测结果，构建出更强、更准确的学习算法。这种方法的主要思想是
【集成学习】：Stacking原理以及Python代码实现 Geeksongs 机器学习 python 机器学习深度学习人工智能算法
Stacking集成学习在各类机器学习竞赛当中得到了广泛的应用，尤其是在结构化的机器学习竞赛当中表现非常好。今天我们就来介绍下stacking这个在机器学习模型融合当中的大杀器的原理。并在博文的后面附有相关代码实现。总体来说，stacking集成算法主要是一种基于“标签”的学习，有以下的特点：用法：模型利用交叉验证，对训练集进行预测，从而实现二次学习优点：可以结合不同的模型缺点：增加了时间开销，容
windows使用ssh-copy-id命令的解决方案爱编程的喵喵 Windows实用技巧 windows ssh ssh-copy-id 解决方案
大家好，我是爱编程的喵喵。双985硕士毕业，现担任全栈工程师一职，热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客创作的方式对所学的知识进行总结与归纳，不仅形成深入且独到的理解，而且能够帮助新手快速入门。本文主要介绍了windows使用ssh-copy-
【人工智能】大模型的幻觉问题：DeepSeek 的解决策略与实践蒙娜丽宁 Python杂谈人工智能人工智能
《PythonOpenCV从菜鸟到高手》带你进入图像处理与计算机视觉的大门！解锁Python编程的无限可能：《奇妙的Python》带你漫游代码世界大语言模型（LLM）的“幻觉”问题，即模型生成与事实不符或脱离上下文的内容，是限制其广泛应用的关键挑战之一。本文深入探讨了幻觉问题的成因，包括训练数据的偏差、推理过程中的过度泛化以及缺乏外部验证机制。以DeepSeek系列模型为研究对象，我们分析了其在解
PyTorch基础知识讲解（一）完整训练流程示例苏雨流丰机器学习 pytorch 人工智能 python 机器学习深度学习
文章目录Tutorial1.数据处理2.网络模型定义3.损失函数、模型优化、模型训练、模型评价4.模型保存、模型加载、模型推理Tutorial大多数机器学习工作流程涉及处理数据、创建模型、优化模型参数和保存训练好的模型。本教程向你介绍一个用PyTorch实现的完整的ML工作流程，并提供链接来了解这些概念中的每一个。我们将使用FashionMNIST数据集来训练一个神经网络，预测输入图像是否属于以下
机器学习中的贝叶斯网络：如何构建高效的风险预测模型 AI天才研究院 DeepSeek R1 &大数据AI人工智能大模型自然语言处理人工智能语言模型编程实践开发语言架构设计
作者：禅与计算机程序设计艺术文章目录机器学习中的贝叶斯网络：如何构建高效的风险预测模型1.背景介绍2.基本概念术语说明2.1马尔科夫随机场（MarkovRandomField）2.2条件随机场（ConditionalRandomField，CRF）2.3变量elimination算法2.4贝叶斯网络3.核心算法原理和具体操作步骤以及数学公式讲解3.1原理介绍1.贝叶斯网络基础2.贝叶斯网络构建风险
使用 Milvus 进行向量数据库管理与实践 qahaj milvus 数据库 python
技术背景介绍在当今的AI与机器学习应用中，处理和管理大量的嵌入向量是一个常见的需求。Milvus是一个开源向量数据库，专门用于存储、索引和管理深度神经网络以及其他机器学习模型生成的大规模嵌入向量。它的高性能和易用性使其成为处理向量数据的理想选择。核心原理解析Milvus的核心功能体现在其强大的向量索引和搜索能力。它支持多种索引算法，包括IVF、HNSW等，使其能够高效地进行大规模向量的相似性搜索操
物理学不存在了？诺贝尔物理学奖颁给了人工智能资讯新鲜事人工智能
2024年10月8日，瑞典皇家科学院宣布，将2024年诺贝尔物理学奖授予美国普林斯顿大学教授约翰·J·霍普菲尔德（JohnJ.Hopfield）和加拿大多伦多大学教授杰弗里·E·辛顿（GeoffreyE.Hinton），以表彰他们“在人工神经网络机器学习方面的基础性发现和发明”。辛顿在接受电话采访时表示：“完全没想到”。实话实说，在结果出来前，大家也都没想到。因为在外界预测里，今年的诺贝尔物理学奖
PHP 爬虫实战：爬取淘宝商品详情数据 EcomDataMiner php 爬虫开发语言
随着互联网技术的发展，数据爬取越来越成为了数据分析、机器学习等领域的重要前置技能。而在这其中，爬虫技术更是不可或缺。php作为一门广泛使用的后端编程语言，其在爬虫领域同样也有着广泛应用和优势。本文将以爬取斗鱼直播数据为例，介绍php爬虫的实战应用。准备工作在开始爬虫之前，我们需要做一些准备工作。首先，需要搭建一个本地服务器环境，推荐使用WAMP、XAMPP等集成化工具，方便部署PHP环境。其次，我
强化学习中的深度卷积神经网络设计与应用实例数字扫地僧计算机视觉 cnn 人工智能神经网络
I.引言强化学习（ReinforcementLearning，RL）是机器学习的一个重要分支，通过与环境的交互来学习最优策略。深度学习，特别是深度卷积神经网络（DeepConvolutionalNeuralNetworks，DCNNs）的引入，为强化学习在处理高维度数据方面提供了强大工具。本文将探讨强化学习中深度卷积神经网络的设计原则及其在不同应用场景中的实例。II.深度卷积神经网络在强化学习中的
模拟退火算法：原理、应用与优化策略尹清雅算法
摘要模拟退火算法是一种基于物理退火过程的随机搜索算法，在解决复杂优化问题上表现出独特优势。本文详细阐述模拟退火算法的原理，深入分析其核心要素，通过案例展示在函数优化、旅行商问题中的应用，并探讨算法的优化策略与拓展方向，为解决复杂优化问题提供全面的理论与实践指导，助力该算法在多领域的高效应用与创新发展。一、引言在现代科学与工程领域，复杂优化问题无处不在，如资源分配、路径规划、机器学习模型参数调优等。
软件研发如何量化管理考核KPI指标软件工程
明确关键业务目标、量化数据指标、过程管控与反馈、重视协同与激励是软件研发中量化管理考核KPI的主要切入点。其中，过程管控与反馈尤为关键，因为它能帮助团队及时发现进度和质量问题，并快速响应调整策略，让每个阶段的目标与执行更趋于一致。通过持续监控研发过程中各项数据指标，并对出现的偏差进行即时纠偏，可以让团队在激烈的竞争环境中始终保持高效迭代和持续创新的能力，为业务拓展提供源源不断的动力。一、软件研发量
TensorFlow深度学习实战项目：从入门到精通点我头像干啥 Ai 深度学习 tensorflow 人工智能
引言深度学习作为人工智能领域的一个重要分支，近年来取得了显著的进展。TensorFlow作为Google开源的深度学习框架，因其强大的功能和灵活的架构，成为了众多开发者和研究者的首选工具。本文将带领大家通过一个实战项目，深入理解TensorFlow的使用方法，并掌握深度学习的基本流程。1.TensorFlow简介1.1TensorFlow是什么？TensorFlow是一个开源的机器学习框架，由Go
国外7个最佳大语言模型 (LLM) API推荐幂简集成 API新理念语言模型人工智能自然语言处理
大型语言模型(LLM)API将彻底改变我们处理语言的方式。在深度学习和机器学习算法的支持下，LLMAPI提供了前所未有的自然语言理解能力。通过利用这些新的API，开发人员现在可以创建能够以前所未有的方式理解和响应书面文本的应用程序。下面，我们将比较从Bard到ChatGPT、PaLM等市场上顶级LLMAPI。我们还将探讨整合这些LLM的潜在用例，并考虑其对语言处理的影响。什么是大语言模型(LLM)
软件工程：数据字典愚戏师软件工程软件工程数据库
一、数据字典的核心作用定位：数据字典是数据流图（DFD）的补充说明文档，与DFD共同构成系统的逻辑模型。核心价值：消除二义性：明确数据流、存储、元素的定义，避免理解偏差。设计依据：为数据库设计、代码开发提供数据规范。团队协作：作为开发团队的共享词汇表，确保术语一致性。二、数据字典的四大组成要素1.数据流（DataFlow）定义：数据在系统中的流动路径。描述内容：来源与去向：起点（外部实体/处理）、
机器学习是怎么一步一步由神经网络发展到今天的Transformer架构的？ yuanpan 机器学习神经网络 transformer
机器学习和神经网络的发展经历了一系列重要的架构和技术阶段。以下是更全面的总结，涵盖了从早期神经网络到卷积神经网络之前的架构演变：1.早期神经网络：感知机（Perceptron）时间：1950年代末至1960年代。背景：感知机由FrankRosenblatt提出，是第一个具有学习能力的神经网络模型。它由单层神经元组成，可以用于简单的二分类任务。特点：输入层和输出层之间直接连接，没有隐藏层。使用简单的
关于重投影误差小记文弱_书生乱七八糟数码相机算法
重投影误差（ReprojectionError）讲解1.什么是重投影误差？在三维重建或相机标定过程中，我们希望将一个世界坐标系中的三维点投影到相机的图像平面上。理想情况下，该点的投影位置应该与实际图像中的观测点（如特征点）完全匹配，但由于噪声、相机模型的不准确性或优化算法的误差，这两个点可能会有偏差。重投影误差就是这个偏差的度量，即：e=∥pobserved−preprojected∥e=\|p_
奇异值分解（SVD）文弱_书生乱七八糟神经网络人工智能
奇异值分解(SVD)介绍奇异值分解(SVD)，这是最强大的矩阵分解技术之一。SVD广泛应用于机器学习、数据科学和其他计算领域，用于降维、降噪和矩阵近似等应用。与仅适用于方阵的特征分解不同，SVD可以应用于任何矩阵，使其成为一种多功能工具。在这里煮啵将分解SVD背后的理论，通过手动计算示例进行分析，并展示如何在Python中实现SVD。在本节结束时，您将清楚地了解SVD的强大功能及其在机器学习中的应
yum install locate出现Error: Unable to find match: locate解决方案爱编程的喵喵 Linux解决方案 linux locate yum 解决方案
大家好，我是爱编程的喵喵。双985硕士毕业，现担任全栈工程师一职，热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客创作的方式对所学的知识进行总结与归纳，不仅形成深入且独到的理解，而且能够帮助新手快速入门。本文主要介绍了yuminstalllocate出现
【人工智能机器学习基础篇】——深入详解无监督学习之降维：PCA与t-SNE的关键概念与核心原理猿享天开人工智能数学基础专讲人工智能机器学习无监督学习降维
深入详解无监督学习之降维：PCA与t-SNE的关键概念与核心原理在当今数据驱动的世界中，数据维度的增多带来了计算复杂性和存储挑战，同时也可能导致模型性能下降，这一现象被称为“维度诅咒”（CurseofDimensionality）。降维作为一种重要的特征提取和数据预处理技术，旨在通过减少数据的维度，保留其主要信息，从而简化数据处理过程，并提升模型的性能。本文将深入探讨两种广泛应用于无监督学习中的降
Flink启动任务 swg321321 flink 大数据
Flink以本地运行作为解读例如：第一章Python机器学习入门之pandas的使用提示：写完文章后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录Flink前言StreamExecutionEnvironmentLocalExecutorMiniClusterStreamGraph二、使用步骤1.引入库2.读入数据总结前言提示：这里可以添加本文要记录的大概内容：例如：随着人工智能的不断发
计算机专业毕业设计题目推荐（新颖选题）本科计算机人工智能专业相关毕业设计选题大全✅ 会写代码的羊毕设选题课程设计人工智能毕业设计毕设题目毕业设计题目 ai AI编程
文章目录前言最新毕设选题（建议收藏起来）本科计算机人工智能专业相关的毕业设计选题毕设作品推荐前言2025全新毕业设计项目博主介绍：✌全网粉丝10W+,CSDN全栈领域优质创作者，博客之星、掘金/华为云/阿里云等平台优质作者。技术范围：SpringBoot、Vue、SSM、HLMT、Jsp、PHP、Nodejs、Python、爬虫、数据可视化、小程序、大数据、机器学习等设计与开发。主要内容：免费功能
如何用大模型评估大模型——PAI-Judge裁判员大语言模型的实现简介人工智能机器学习大模型llm
背景：为什么需要一个「裁判员大语言模型」？随着大模型（LLM）技术的爆发式应用，如何快速、客观评估模型回复质量成为行业痛点。对于回答客观问题的LLM，目前业内已经有比较成熟的数据集进行效果评测与模型打榜。但是如何对一个开放式生成LLM进行效果评估，尤其在知识问答、客服对话、内容合规、RAG（检索增强生成）等场景中，目前主流的评测方式仍存在一定的局限性：人工标注：成本高昂、效率低下；传统的自动化评估
【机器学习】建模流程 CH3_CH2_CHO 什么？！是机器学习！！机器学习人工智能线性回归逻辑回归
1、数据获取1.1来源数据获取是机器学习建模的第一步，常见的数据来源包括数据库、API、网络爬虫等。数据库是企业内部常见的数据存储方式，例如：MySQL、Oracle等关系型数据库，以及MongoDB等非关系型数据库，它们能够存储大量的结构化和非结构化数据API（应用程序编程接口）提供了从外部获取数据的便捷方式，例如：社交媒体平台的API可以获取用户发布的内容和互动信息网络爬虫则适用于从网页中提取
机器学习课堂4线性回归模型+特征缩放木尘152132 机器学习线性回归 python
一、实验2-2，线性回归模型，计算模型在训练数据集和测试数据集上的均方根误差代码：#2-2线性回归模型importpandasaspdimportnumpyasnpimportmatplotlib.pyplotasplt#参数设置iterations=3000#迭代次数learning_rate=0.0001#学习率m_train=3000#训练样本的数量flag_plot_lines=False
智见未来：多大模型协同的数据分析新范式一ge科研小菜菜人工智能大数据人工智能大数据
个人主页：一ge科研小菜鸡-CSDN博客期待您的关注1.引言随着大语言模型（LLM）的快速发展，ChatGPT、DeepSeek、Grok等AI模型在数据分析和洞察生成方面展现出巨大潜力。利用多个LLM的协同能力，可以增强数据分析的多角度解读、减少单一模型的偏差，并优化洞察生成的深度和精准度。本文探讨如何结合多个LLM，在数据分析领域实现更可靠的洞察生成，并提供具体的策略、方法和应用场景。2.主要
【机器学习】模型拟合 CH3_CH2_CHO 什么？！是机器学习！！机器学习人工智能欠拟合过拟合
1、欠拟合1.1现象欠拟合是机器学习和统计建模中的一种常见问题，表现为模型无法充分捕捉数据中的潜在规律和模式。无论是训练数据还是测试数据，模型的预测误差都居高不下。在实际应用中，欠拟合的模型往往显得过于简单和粗糙，无法对数据进行有效的拟合和描述。1.2原因模型过于简单是导致欠拟合的主要原因：例如，使用直线去拟合具有明显曲线趋势的数据，或者使用低阶多项式去拟合高阶的复杂函数关系。这种情况下，模型的表
JAVA中的Enum 周凡杨 java enum 枚举
Enum是计算机编程语言中的一种数据类型---枚举类型。在实际问题中，有些变量的取值被限定在一个有限的范围内。例如，一个星期内只有七天我们通常这样实现上面的定义： public String monday; public String tuesday; public String wensday; public String thursday
赶集网mysql开发36条军规 Bill_chen mysql 业务架构设计 mysql调优 mysql性能优化
(一)核心军规 (1)不在数据库做运算 cpu计算务必移至业务层； (2)控制单表数据量 int型不超过1000w，含char则不超过500w；合理分表；限制单库表数量在300以内； (3)控制列数量字段少而精，字段数建议在20以内
Shell test命令 daizj shell 字符串 test 数字文件比较
Shell test命令 Shell中的 test 命令用于检查某个条件是否成立，它可以进行数值、字符和文件三个方面的测试。数值测试参数说明 -eq 等于则为真 -ne 不等于则为真 -gt 大于则为真 -ge 大于等于则为真 -lt 小于则为真 -le 小于等于则为真实例演示： num1=100 num2=100if test $[num1]
XFire框架实现WebService(二) 周凡杨 java webservice
有了XFire框架实现WebService(一)，就可以继续开发WebService的简单应用。 Webservice的服务端(WEB工程)：两个java bean类： Course.java package cn.com.bean; public class Course { private
重绘之画图板朱辉辉33 画图板
上次博客讲的五子棋重绘比较简单，因为只要在重写系统重绘方法paint（）时加入棋盘和棋子的绘制。这次我想说说画图板的重绘。画图板重绘难在需要重绘的类型很多，比如说里面有矩形，园，直线之类的，所以我们要想办法将里面的图形加入一个队列中，这样在重绘时就
Java的IO流西蜀石兰 java
刚学Java的IO流时，被各种inputStream流弄的很迷糊，看老罗视频时说想象成插在文件上的一根管道，当初听时觉得自己很明白，可到自己用时，有不知道怎么代码了。。。每当遇到这种问题时，我习惯性的从头开始理逻辑，会问自己一些很简单的问题，把这些简单的问题想明白了，再看代码时才不会迷糊。 IO流作用是什么？答：实现对文件的读写，这里的文件是广义的； Java如何实现程序到文件
No matching PlatformTransactionManager bean found for qualifier 'add' - neither 林鹤霄
java.lang.IllegalStateException: No matching PlatformTransactionManager bean found for qualifier 'add' - neither qualifier match nor bean name match! 网上找了好多的资料没能解决，后来发现：项目中使用的是xml配置的方式配置事务，但是
Row size too large (> 8126). Changing some columns to TEXT or BLOB aigo column
原文：http://stackoverflow.com/questions/15585602/change-limit-for-mysql-row-size-too-large 异常信息： Row size too large (> 8126). Changing some columns to TEXT or BLOB or using ROW_FORMAT=DYNAM
JS 格式化时间 alxw4616 JavaScript
/** * 格式化时间 2013/6/13 by 半仙 [email protected] * 需要 pad 函数 * 接收可用的时间值. * 返回替换时间占位符后的字符串 * * 时间占位符:年 Y 月 M 日 D 小时 h 分 m 秒 s 重复次数表示占位数 * 如 YYYY 4占4位 YY 占2位<p></p> * MM DD hh mm
队列中数据的移除问题百合不是茶队列移除
队列的移除一般都是使用的remov();都可以移除的,但是在昨天做线程移除的时候出现了点问题,没有将遍历出来的全部移除, 代码如下; // package com.Thread0715.com; import java.util.ArrayList; public class Threa
Runnable接口使用实例 bijian1013 java thread Runnable java多线程
Runnable接口 a. 该接口只有一个方法：public void run(); b. 实现该接口的类必须覆盖该run方法 c. 实现了Runnable接口的类并不具有任何天
oracle里的extend详解 bijian1013 oracle 数据库 extend
扩展已知的数组空间，例： DECLARE TYPE CourseList IS TABLE OF VARCHAR2(10); courses CourseList; BEGIN -- 初始化数组元素，大小为3 courses := CourseList('Biol 4412 ', 'Psyc 3112 ', 'Anth 3001 '); --
【httpclient】httpclient发送表单POST请求 bit1129 httpclient
浏览器Form Post请求浏览器可以通过提交表单的方式向服务器发起POST请求，这种形式的POST请求不同于一般的POST请求 1. 一般的POST请求，将请求数据放置于请求体中，服务器端以二进制流的方式读取数据，HttpServletRequest.getInputStream()。这种方式的请求可以处理任意数据形式的POST请求，比如请求数据是字符串或者是二进制数据 2. Form
【Hive十三】Hive读写Avro格式的数据 bit1129 hive
1. 原始数据 hive> select * from word; OK 1 MSN 10 QQ 100 Gtalk 1000 Skype 2. 创建avro格式的数据表 hive> CREATE TABLE avro_table(age INT, name STRING)STORE
nginx+lua+redis自动识别封解禁频繁访问IP ronin47
在站点遇到攻击且无明显攻击特征，造成站点访问慢，nginx不断返回502等错误时，可利用nginx+lua+redis实现在指定的时间段内，若单IP的请求量达到指定的数量后对该IP进行封禁，nginx返回403禁止访问。利用redis的expire命令设置封禁IP的过期时间达到在指定的封禁时间后实行自动解封的目的。一、安装环境： CentOS x64 release 6.4(Fin
java-二叉树的遍历-先序、中序、后序（递归和非递归）、层次遍历 bylijinnan java
import java.util.LinkedList; import java.util.List; import java.util.Stack; public class BinTreeTraverse { //private int[] array={ 1, 2, 3, 4, 5, 6, 7, 8, 9 }; private int[] array={ 10,6,
Spring源码学习-XML 配置方式的IoC容器启动过程分析 bylijinnan java spring IOC
以FileSystemXmlApplicationContext为例，把Spring IoC容器的初始化流程走一遍： ApplicationContext context = new FileSystemXmlApplicationContext ("C:/Users/ZARA/workspace/HelloSpring/src/Beans.xml&q
[科研与项目]民营企业请慎重参与军事科技工程 comsci 企业
军事科研工程和项目并非要用最先进，最时髦的技术，而是要做到“万无一失” 而民营科技企业在搞科技创新工程的时候，往往考虑的是技术的先进性，而对先进技术带来的风险考虑得不够，在今天提倡军民融合发展的大环境下，这种“万无一失”和“时髦性”的矛盾会日益凸显。。。。。。所以请大家在参与任何重大的军事和政府项目之前，对
spring 定时器-两种方式 cuityang spring quartz 定时器
方式一：间隔一定时间运行 <bean id="updateSessionIdTask" class="com.yang.iprms.common.UpdateSessionTask" autowire="byName" /> <bean id="updateSessionIdSchedule
简述一下关于BroadView站点的相关设计 damoqiongqiu view
终于弄上线了，累趴，戳这里http://www.broadview.com.cn 简述一下相关的技术点前端：jQuery+BootStrap3.2+HandleBars，全站Ajax（貌似对SEO的影响很大啊！怎么破？），用Grunt对全部JS做了压缩处理，对部分JS和CSS做了合并（模块间存在很多依赖，全部合并比较繁琐，待完善）。后端：U
运维 PHP问题汇总 dcj3sjt126com windows2003
1、Dede(织梦)发表文章时,内容自动添加关键字显示空白页解决方法：后台>系统>系统基本参数>核心设置>关键字替换（是/否），这里选择“是”。后台>系统>系统基本参数>其他选项>自动提取关键字，这里选择“是”。 2、解决PHP168超级管理员上传图片提示你的空间不足网站是用PHP168做的，反映使用管理员在后台无法
mac 下安装php扩展 - mcrypt dcj3sjt126com PHP
MCrypt是一个功能强大的加密算法扩展库，它包括有22种算法，phpMyAdmin依赖这个PHP扩展，具体如下：下载并解压libmcrypt-2.5.8.tar.gz。在终端执行如下命令： tar zxvf libmcrypt-2.5.8.tar.gz cd libmcrypt-2.5.8/ ./configure --disable-posix-threads --
MongoDB更新文档 [四] eksliang mongodb Mongodb更新文档
MongoDB更新文档转载请出自出处：http://eksliang.iteye.com/blog/2174104 MongoDB对文档的CURD，前面的博客简单介绍了，但是对文档更新篇幅比较大，所以这里单独拿出来。语法结构如下： db.collection.update( criteria, objNew, upsert, multi) 参数含义参数
Linux下的解压，移除，复制，查看tomcat命令 y806839048 tomcat
重复myeclipse生成webservice有问题删除以前的，干净 1、先切换到：cd usr/local/tomcat5/logs 2、tail -f catalina.out 3、这样运行时就可以实时查看运行日志了 Ctrl+c 是退出tail命令。有问题不明的先注掉 cp /opt/tomcat-6.0.44/webapps/g
Spring之使用事务缘由(3-XML实现) ihuning spring
用事务通知声明式地管理事务事务管理是一种横切关注点。为了在 Spring 2.x 中启用声明式事务管理，可以通过 tx Schema 中定义的 <tx:advice> 元素声明事务通知，为此必须事先将这个 Schema 定义添加到 <beans> 根元素中去。声明了事务通知后，就需要将它与切入点关联起来。由于事务通知是在 <aop:
GCD使用经验与技巧浅谈啸笑天 GC
前言 GCD(Grand Central Dispatch)可以说是Mac、iOS开发中的一大“利器”，本文就总结一些有关使用GCD的经验与技巧。 dispatch_once_t必须是全局或static变量这一条算是“老生常谈”了，但我认为还是有必要强调一次，毕竟非全局或非static的dispatch_once_t变量在使用时会导致非常不好排查的bug，正确的如下： 1
linux（Ubuntu）下常用命令备忘录1 macroli linux 工作 ubuntu
在使用下面的命令是可以通过--help来获取更多的信息1,查询当前目录文件列表：ls ls命令默认状态下将按首字母升序列出你当前文件夹下面的所有内容，但这样直接运行所得到的信息也是比较少的，通常它可以结合以下这些参数运行以查询更多的信息： ls / 显示/.下的所有文件和目录 ls -l 给出文件或者文件夹的详细信息 ls -a 显示所有文件，包括隐藏文
nodejs同步操作mysql qiaolevip 学习永无止境每天进步一点点 mysql nodejs
// db-util.js var mysql = require('mysql'); var pool = mysql.createPool({ connectionLimit : 10, host: 'localhost', user: 'root', password: '', database: 'test', port: 3306 });
一起学Hive系列文章 superlxw1234 hive Hive入门
[一起学Hive]系列文章目录贴，入门Hive，持续更新中。 [一起学Hive]之一—Hive概述，Hive是什么 [一起学Hive]之二—Hive函数大全-完整版 [一起学Hive]之三—Hive中的数据库(Database)和表(Table) [一起学Hive]之四-Hive的安装配置 [一起学Hive]之五-Hive的视图和分区 [一起学Hive
Spring开发利器：Spring Tool Suite 3.7.0 发布 wiselyman spring
Spring Tool Suite(简称STS)是基于Eclipse，专门针对Spring开发者提供大量的便捷功能的优秀开发工具。在3.7.0版本主要做了如下的更新：将eclipse版本更新至Eclipse Mars 4.5 GA Spring Boot(JavaEE开发的颠覆者集大成者，推荐大家学习)的配置语言YAML编辑器的支持(包含自动提示，

模型偏差（model bias）	模型能够系统地做出错误预测的倾向
评估偏差（evaluation bias）	评估策略倾向于高估或低估模型有效性的趋势
抽样偏差（sampling bias）	如果训练或评估数据集不能代表总体，就打破了归纳学习假设

机器学习基础：模型评估（下）

1. 引言

2. 进一步评估

3. 机器学习中的偏差和方差种类

3.1 过拟合

3.2 欠拟合

3.3 训练曲线观察泛化性

3.4 模型偏差和方差（bias and variance）

3.4.1 偏差 Bias

3.4.2 方差 Variance

3.4.3 方差偏差总结

4. 模型的泛化性（Generalization）

4.1 导致泛化性错误的原因

4.2 诊断高偏差/方差问题

4.2.1 高偏差诊断

4.2.2 高方差诊断

5. 针对偏差和方差的补救措施

6. 评估偏差和方差（Evaluation bias / Variance）

6.1 如何解决Evaluation偏差和方差

你可能感兴趣的:(机器学习基础,机器学习,偏差,方差,模型评估)