文火冰糖的硅基工坊

[机器学习与scikit-learn-51]：模型评估-图解回归模型的评估指标MSE、MAE、RMSE、R2、RSS与代码示例

作者主页(文火冰糖的硅基工坊)：文火冰糖（王文兵）的博客_文火冰糖的硅基工坊_CSDN博客

本文网址：https://blog.csdn.net/HiWangWenBing/article/details/124413449

前言：

第1章残差residual error

1.1 残差的定义

1.2 残差的数学表达式

1.3 残差计算的几何图形

1.4 残差数值的几何图形

1.5 残差分析

1.6 残差的意义：

第2章平均绝对误差（mean absolute error, MAE）- L1损失

2.1 概述

2.2 MAE的数学表达式

2.3 MAE误差的几何含义

2.4 MAE的函数图形（红色图像）

2.5 代码演示

第3章残差的平方和RSS (Residual Square Summary)

3.1 残差平方和的定义

3.2 残差平方和的数学表达

3.3 残差平方和的意义

3.4 RSS的缺点

第4章均方误差MSE（Mean平均 Square Error） - L2损失

4.1 什么是均分误差

4.2 数学公式

4.3 几何意义

4.4 几何图形（黑色图形）

4.5 代码演示

第5章均方根误差（RMSE）

5.1 什么是均方根误差

5.2 数学公式

5.3 几何意义

5.4 几何图形

第6章方差

6.1 什么是方差

6.2 方差的数学公式

6.3 方差的几何图形

6.4 方差的意义

6.5 标准方差

第7章总离差平方和TSS（Total of Summary Square）

7.1 什么是离差/平均差deviation

7.2 总离差平方和TSS

7.3 总离差平方和TSS的数学公式

7.4 TSS的含义

第8章决定系数R^2（Coefficient of Determination）

8.1 均分误差MSE的缺点

8.2 什么是决定系数R^2

8.3 决定系数的计算方法

8.4 决定系数的优点

8.5 计算公式

8.6 R2的几何图形

第9章 scikit-learn对测量指标的支持

9.1 所有指标展示

9.2 生成测试数据集

9.3 模型定义与拟合（训练）

9.4 模型评估

9.5 交叉验证

9.6 关于scikit-learn 交叉验证时，MSE为负数的说明

前言：

本文探讨回归模型的评估指标。

第1章残差residual error

1.1 残差的定义

残差在数理统计中是指实际观察值与估计值（拟合值）之间的差。

“残差”蕴含了有关模型基本假设的重要信息。

如果回归模型正确的话，我们可以将残差看作误差的观测值（不是理论值）。

利用残差所提供的信息，来考察模型假设的合理性及数据的可靠性称为残差分析。

1.2 残差的数学表达式

1.3 残差计算的几何图形

1.4 残差数值的几何图形

残差值，残差是有符号的，可正可负。因此，残差的累计和接近0.

这就要求残差图满足就代表每个残差不相关(独立性)，分布满足正态性。

分布的正态性往往等同于随机。

1.5 残差分析

残差分析（residual analysis）就是通过残差所提供的信息（残留信息），分析出数据的可靠性、周期性或其它干扰，用于分析模型的假定正确与否的方法。

在回归分析中，测定值与按回归方程预测的值之差，以δ表示。残差δ遵从正态分布N(0，σ2)。(δ-残差的均值)/残差的标准差，称为标准化残差，以δ*表示。δ*遵从标准正态分布N(0，1)。

实验点的标准化残差落在(-2，2)区间以外的概率≤0.05。若某一实验点的标准化残差落在(-2，2)区间以外，可在95%置信度将其判为异常实验点，不参与回归直线拟合。

显然，有多少对数据，就有多少个残差。残差分析就是通过残差所提供的信息，分析出数据的可靠性、周期性或其它干扰。

残差图的分布趋势可以帮助判明所拟合的线性模型是否满足有关假设。如残差是否近似正态分布、是否方差齐次，变量间是否有其它非线性关系及是否还有重要自变量未进入模型等。.当判明有某种假设条件欠缺时，进一步的问题就是加以校正或补救。

1.6 残差的意义：

残差的重要意义：

看残差是否符合正态分布。

但残差累计和为0，并不能完全反应模型性能的好坏，只能反应拟合曲线正好落在样本点的中心。

为了进一步反应拟合效果，需要进一步的指标。

第2章平均绝对误差（mean absolute error, MAE）- L1损失

2.1 概述

MAE是目标值和预测值之差的绝对值之和，即每个残差值的绝对值之和。

其只衡量了预测值误差之和的平均，而不考虑方向，取值范围也是从0到正无穷。

2.2 MAE的数学表达式

2.3 MAE误差的几何含义

2.4 MAE的函数图形（红色图像）

2.5 代码演示

from sklearn.metrics import mean_absolute_error

第3章残差的平方和RSS (Residual Square Summary)

3.1 残差平方和的定义

把每个残差平方之后加起来称为残差平方和（残差面积和）（相当于实际值与预测值之间差的平方之和）。

3.2 残差平方和的数学表达

RSS = ∑(u)2称为残差平方和。

3.3 残差平方和的意义

它表示随机误差的效果

“残差和”RSS反应了：未拟合出来的信息总量的大小

（1）残差RSS越大，未拟合出来的信息总量越大，拟合效果越差。

（1）残差RSS越大，未拟合出来的信息总量越大，拟合效果越好。

3.4 RSS的缺点

（1）RSS指标与样本的个数相关，模型不变的情形下，样本个数越多，RSS越大，样本个数越少，RSS值越小。

因此，需要一种指标，能够消除样本个数带来的影响，这就是MSE.

第4章均方误差MSE（Mean平均 Square Error） - L2损失

4.1 什么是均分误差

均方误差(MSE)是最常用的回归损失函数，计算方法是求预测值与真实值之间距离的平方和，再求平均。

对比平均绝对误差，均方误差对异常值更敏感，因为均分误差对误差进行了放大（乘方）。

4.2 数学公式

4.3 几何意义

4.4 几何图形（黑色图形）

4.5 代码演示

4.6 MSE的缺点

（1）MSE是平方和，放大了残差的差易 =》对应策略：均分根误差

（2）无法发现异常点：=》应对策略： R2决定系数

MSE是所有样本残差平方求和之后的平均值，这就导致在局部的异常点，如上图红色部分，会被淹没在平均值中，样本个数越大, 则N越大，异常点处的误差，就会被平均后的值越小，越无法发现拟合曲线中的异常部分。

（3）MSE没有上界：=》应对策略： R2决定系数

不同模型之间的MSE没有可比性。

第5章均方根误差（RMSE）

5.1 什么是均方根误差

均方根误差是均分误差开根号。

5.2 数学公式

5.3 几何意义

同上

5.4 几何图形

同上

第6章方差

6.1 什么是方差

方差是在概率论和统计方差衡量随机变量或一组数据时离散程度的度量。

方差用来度量随机变量和其数学期望（即均值）之间的偏离程度。

统计中的方差（样本方差）是每个样本值与全体样本值的平均数之差的平方值的平均数。

6.2 方差的数学公式

方差用来计算每一个变量（观察值）与总体均数之间的差异。

为避免出现离均差总和为零，统计学采用方差的平方和来描述变量的变异程度。总体方差计算公式：

6.3 方差的几何图形

6.4 方差的意义

方差反应了数值的波动范围，方差越大，波动范围越大，如果方差位0，则表示没有波动，所有数值都相等。

另一方面，方差反应的是其所携带的信息量的大小：

方差越大，说明波动范围越大，不确定性越大，数据所携带的信息平均量越大。
方差越小，说明波动范围越小，不确定性越小，数据所携带的信息平均量越小。

6.5 标准方差

标准差是方差的算术平方根

第7章总离差平方和TSS（Total of Summary Square）

7.1 什么是离差/平均差deviation

方差是样本数据与均值差的平方和，再求平均。

其中样本数据预均值的差，我们给它取一个专门的名字，称为“离差”或平均差。

7.2 总离差平方和TSS

所有样本的离差的平方之后的累计和，称为总离差平方和TSS。

TSS与方差的唯一区别就是，方差进行了平均，TSS没有平均。

7.3 总离差平方和TSS的数学公式

7.4 TSS的含义

TSS越大，说明波动范围越大，不确定性越大，数据所携带的信息总量越大。
TSS越小，说明波动范围越小，不确定性越小，数据所携带的信息总量越小。

第8章决定系数R^2（Coefficient of Determination）

8.1 均分误差MSE的缺点

均分误差是一个非常简单有效的评估拟合效果的评估指标。

但MSE有2个缺点：

（1）隐藏了异常残差，异常残差被平均后，会被淹没在平均值中，在MSE中无法反应。

（2）MSE是一个绝对值，没有上限，不同模型之间无法比较。

为了克服上述缺点，引入了决定系数，它克服了上述两个缺点。

8.2 什么是决定系数R^2

这是一个比较难理解的参数，但有了前面的铺垫，就比如容易理解。

它反应了拟合模型模型对样本数据的拟合程度，是一个相对值，如90%的拟合程度。

8.3 决定系数的计算方法

（1）残差的平方和RSS (Residual Square Summary)

“残差和”RSS反应了：未拟合出来的信息总量的大小

残差RSS越大，未拟合出来的信息总量越大，拟合效果越差。
残差RSS越大，未拟合出来的信息总量越大，拟合效果越好。

（2）离差平方和TSS

离差平方和TSS反应了：样本数据中总信息总量的大小

TSS越大，说明波动范围越大，不确定性越大，数据所携带的信息总量越大。
TSS越小，说明波动范围越小，不确定性越小，数据所携带的信息总量越小。

（3）RSS/TSS = 未拟合出来的信息总量/数据所携带的信息总量越大

RSS/TSS是一个比值，它是未拟合出来的信息总量与样本数据中自身携带的信息总量的比值，它反应了模型未拟合出来的信息的比率。

（4）1- RSS/TSS

RSS/TSS反应的是未拟合出来的信息量的比值（比率）

1-RSS/TSS反应的就是模型能够拟合出来的信息量的比值（比率）

这就是决定系数！！！

8.4 决定系数的优点

（1）决定系数是一个相对值，数值在【0,1】之间，克服了MSE没有上边界的缺点。

（2）决定系数是一个相对值，它反应的是拟合出来的信息占样本自身总信息量的比率，这样不同样本，不同模型之间就可以进行比较了。

（3）它能够反应模型的异常效果：RSS残差平方和，不仅仅没有平均，它还通过平方的方式放大了异常拟合处的误差（残差值）值。

8.5 计算公式

8.6 R2的几何图形

第9章 scikit-learn对测量指标的支持

9.1 所有指标展示

import sklearn
sorted(sklearn.metrics.SCORERS.keys())

['accuracy',
 'adjusted_mutual_info_score',
 'adjusted_rand_score',
 'average_precision',
 'balanced_accuracy',
 'completeness_score',
 'explained_variance',
 'f1',
 'f1_macro',
 'f1_micro',
 'f1_samples',
 'f1_weighted',
 'fowlkes_mallows_score',
 'homogeneity_score',
 'jaccard',
 'jaccard_macro',
 'jaccard_micro',
 'jaccard_samples',
 'jaccard_weighted',
 'max_error',
 'mutual_info_score',
 'neg_brier_score',
 'neg_log_loss',
 'neg_mean_absolute_error',
 'neg_mean_absolute_percentage_error',
 'neg_mean_gamma_deviance',
 'neg_mean_poisson_deviance',
 'neg_mean_squared_error',
 'neg_mean_squared_log_error',
 'neg_median_absolute_error',
 'neg_root_mean_squared_error',
 'normalized_mutual_info_score',
 'precision',
 'precision_macro',
 'precision_micro',
 'precision_samples',
 'precision_weighted',
 'r2',
 'rand_score',
 'recall',
 'recall_macro',
 'recall_micro',
 'recall_samples',
 'recall_weighted',
 'roc_auc',
 'roc_auc_ovo',
 'roc_auc_ovo_weighted',
 'roc_auc_ovr',
 'roc_auc_ovr_weighted',
 'top_k_accuracy',
 'v_measure_score']

9.2 生成测试数据集

# 生成数据集 make_regression
from sklearn.datasets import make_regression

# 生成数据集
# n_samples：样本个数
# n_features：输入数据的维度，这里是1维x轴
# n_targets：输出数据的维度，这里是1为y轴
# bias：数据偏置大小
# noise：叠加的噪声大小
# random_state：随机种子
X,Y,coef = make_regression(n_samples=100, n_features=1, n_informative=1, n_targets=1, bias=5, effective_rank=None, tail_strength= 0, noise= 20, shuffle=True, coef=True, random_state=None)

print("X.shape:",X.shape)
print("Y.shape:",Y.shape)

plt.scatter(X, Y, s=20, edgecolor="black",c="darkorange", label="data")

X.shape: (100, 1)
Y.shape: (100,)

9.3 模型定义与拟合（训练）

# 模型定义与预测
from sklearn.linear_model import LinearRegression as LR
model = LR()
model = model.fit(X, Y)

# 模型预测
Y_pred = model.predict(X)

# 可视化数据
import matplotlib.pyplot as plt
plt.figure()
plt.scatter(X, Y, s=20, edgecolor="black",c="darkorange", label="data")
plt.plot(X, Y_pred)

9.4 模型评估

# 模型评估
from sklearn.metrics import mean_squared_error  #MSE
from sklearn.metrics import mean_absolute_error #MAE
from sklearn.metrics import r2_score            #R 2

print("MAE =", mean_absolute_error(Y,Y_pred))         # 残差绝对值
print("MSE =", mean_squared_error(Y, Y_pred))         # 通过平方放大了残差
print("RMSE=", np.sqrt(mean_squared_error(Y,Y_pred))) # 通过开方，还原被放大残差
print("R^2 =", r2_score(Y,Y_pred))                    # R2是相对比例值

MAE = 16.585193180133935
MSE = 485.6573763120239
RMSE= 22.037635451926867
R^2 = 0.8415042235651895

9.5 交叉验证

# 通过交叉验证进行评估
from sklearn.model_selection import cross_val_score

# 对训练好的模型进行交叉验证
# cv=交叉验证的次数
# scoring:打分指标：neg_mean_squared_error， 
# 在sklearn交叉验证中，损失/误差都是用负数表示，去掉负号，就是它的均分误差值
# 负号：表示损失！！！
mae_score = cross_val_score(model, X,Y,cv=5, scoring="neg_mean_absolute_error")
print("交叉验证的MAE=", mae_score.mean())

mse_score = cross_val_score(model, X,Y,cv=5, scoring="neg_mean_squared_error")
print("交叉验证的MSE=", mse_score.mean())

r2_score = cross_val_score(model, X,Y,cv=5, scoring="r2")
print("交叉验证的R2 =", r2_score.mean())

交叉验证的MAE= -16.74526871947979
交叉验证的MSE= -500.88726699513006
交叉验证的R2 = 0.8103022705307797

9.6 关于scikit-learn 交叉验证时，MSE为负数的说明

在scikit-learn中，我们会发现，回归的指标MSE和MAE的指标是负数，这与我们对这两个理解是不一致的，怎么会是负数呢？

这其实是scikit-learn实现的问题，scikit-learn认为，误差是带来负面效果的，因此，人为地在这些指标的计算结果之上增加了一个负号，并非这些指标的数学定义本身就是负数。

作者主页(文火冰糖的硅基工坊)：文火冰糖（王文兵）的博客_文火冰糖的硅基工坊_CSDN博客

本文网址：https://blog.csdn.net/HiWangWenBing/article/details/124413449

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
swagger访问路径 igotyback swagger
Swagger2.x版本访问地址：http://{ip}:{port}/{context-path}/swagger-ui.html{ip}是你的服务器IP地址。{port}是你的应用服务端口，通常为8080。{context-path}是你的应用上下文路径，如果应用部署在根路径下，则为空。Swagger3.x版本对于Swagger3.x版本（也称为OpenAPI3）访问地址：http://{ip
18、架构-可观测性之聚合度量大树~~ 架构 java python 后端架构
聚合度量聚合度量是指对系统运行时产生的各种指标数据进行收集、聚合和分析，以了解系统的健康状况和性能表现。聚合度量是可观测性的关键组成部分，通过对度量数据的分析，可以及时发现系统中的异常和瓶颈。以下是对聚合度量各个方面的详细解析，并结合具体的数据案例和技术支撑。指标收集收集系统运行时产生的各种指标数据是聚合度量的基础。常见的指标包括CPU使用率、内存使用率、请求处理时间、请求数、错误率等。以下是指标
【华为OD技术面试真题 - 技术面】- python八股文真题题库（1）算法大师华为od 面试 python
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选1.数据预处理流程数据预处理的主要步骤工具和库2.介绍线性回归、逻辑回归模型线性回归（LinearRegression）模型形式：关键点：逻辑回归（LogisticRegression）模型形式：关键点：参数估计与评估：3.python浅拷贝及深拷贝浅拷贝（Shal
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
Python开发常用的三方模块如下：换个网名有点难 python 开发语言
Python是一门功能强大的编程语言，拥有丰富的第三方库，这些库为开发者提供了极大的便利。以下是100个常用的Python库，涵盖了多个领域：1、NumPy，用于科学计算的基础库。2、Pandas，提供数据结构和数据分析工具。3、Matplotlib，一个绘图库。4、Scikit-learn，机器学习库。5、SciPy，用于数学、科学和工程的库。6、TensorFlow，由Google开发的开源机
Python实现简单的机器学习算法 master_chenchengg python python 办公效率 python开发 IT
Python实现简单的机器学习算法开篇：初探机器学习的奇妙之旅搭建环境：一切从安装开始必备工具箱第一步：安装Anaconda和JupyterNotebook小贴士：如何配置Python环境变量算法初体验：从零开始的Python机器学习线性回归：让数据说话数据准备：从哪里找数据编码实战：Python实现线性回归模型评估：如何判断模型好坏逻辑回归：从分类开始理论入门：什么是逻辑回归代码实现：使用skl
遥感影像的切片处理 sand&wich 计算机视觉 python 图像处理
在遥感影像分析中，经常需要将大尺寸的影像切分成小片段，以便于进行详细的分析和处理。这种方法特别适用于机器学习和图像处理任务，如对象检测、图像分类等。以下是如何使用Python和OpenCV库来实现这一过程，同时确保每个影像片段保留正确的地理信息。准备环境首先，确保安装了必要的Python库，包括numpy、opencv-python和xml.etree.ElementTree。这些库将用于图像处理
yolov5＞onnx＞ncnn＞apk 图像处理大大大大大牛啊 opencv实战代码讲解 yolo onnx ncnn 安卓
一.yolov5pt模型转onnx条件：colabnotebookyolov51.安装环境!pipinstallonnx>=1.7.0#forONNXexport!pipinstallcoremltools==4.0#forCoreMLexport!pipinstallonnx-simplifier2.修改common.py在classFocus下面
【自动化测试】UI自动化的分类、如何选择合适的自动化测试工具以及其中appium的设计理念、引擎和引擎如何工作 Lossya ui 自动化测试工具自动化测试 appium
引言UI自动化测试主要针对软件的用户界面进行测试，以确保用户界面元素的交互和功能符合预期文章目录引言一、UI自动化的分类1.1基于代码的自动化测试1.2基于录制/回放的自动化测试1.3基于框架的自动化测试1.4按测试对象分类1.5按测试层次分类1.6按测试执行方式分类1.7按测试目的分类二、如何选择合适的自动化测试工具2.1项目需求分析2.2工具特性评估2.3成本考虑2.4团队技能2.5试用和评估
ai绘画工具midjourney怎么下载？附作品管理教程设计师早上好
Midjourney是一款功能强大的AI绘画工具，它使用机器学习技术和深度神经网络等算法，可以生成各种艺术风格的绘画作品。在创意设计、广告宣传等方面有着广泛的应用前景。那么，ai绘画工具midjourney怎么下载？本文将为您介绍Midjourney的下载以及作品的相关管理。一、Midjourney下载Midjourney的下载非常简单，只需打开Midjourney官网（点击“GetMidjour
[实践应用] 深度学习之模型性能评估指标 YuanDaima2048 深度学习工具使用深度学习人工智能损失函数性能评估 pytorch python 机器学习
文章总览：YuanDaiMa2048博客文章总览深度学习之模型性能评估指标分类任务回归任务排序任务聚类任务生成任务其他介绍在机器学习和深度学习领域，评估模型性能是一项至关重要的任务。不同的学习任务需要不同的性能指标来衡量模型的有效性。以下是对一些常见任务及其相应的性能评估指标的详细解释和总结。分类任务分类任务是指模型需要将输入数据分配到预定义的类别或标签中。以下是分类任务中常用的性能指标：准确率(
信息系统安全相关概念(下) YuanDaima2048 基础概念课程笔记安全
文章总览：YuanDaiMa2048博客文章总览上篇指路：信息系统安全相关概念(上)信息系统安全相关概念[下]信息系统风险评估安全风险评估信息系统等级保护网络安全法等级保护等级保护工作流程环境安全信息系统风险评估安全风险评估对信息系统整体安全态势的感知和对重大安全事件的预警，实现“事前能预防，事中能控制，事后能处理”。安全风险组成的四要素：信息系统资产（Asset）信息系统脆弱性（Vulnerab
机器学习-聚类算法不良人龍木木机器学习机器学习算法聚类
机器学习-聚类算法1.AHC2.K-means3.SC4.MCL仅个人笔记，感谢点赞关注！1.AHC2.K-means3.SC传统谱聚类：个人对谱聚类算法的理解以及改进4.MCL目前仅专注于NLP的技术学习和分享感谢大家的关注与支持！
设计好了产品组合，获客没你想得那么难老姜观察
放眼望去，财富管理公司的综合服务已经成为大势所趋。所谓的综合服务，其实就是财富管理公司的产品组合逐渐丰富和完善。然而，在对客户进行综合服务的过程中，财富管理公司常常会面对各种问题。例如：如何评估公司是否应当开展一项服务或者产品？如何定义一项服务（产品）的考核指标？如何配置资源投入不同的产品线？以保险为例，财富管理公司经常需要考虑的问题有：我是否要导入保险业务？如何考核这项业务的发展？我应该投入多少
未来软件市场是怎么样的？做开发的生存空间如何？ cesske 软件需求
目录前言一、未来软件市场的发展趋势二、软件开发人员的生存空间前言未来软件市场是怎么样的？做开发的生存空间如何？一、未来软件市场的发展趋势技术趋势：人工智能与机器学习：随着技术的不断成熟，人工智能将在更多领域得到应用，如智能客服、自动驾驶、智能制造等，这将极大地推动软件市场的增长。云计算与大数据：云计算服务将继续普及，大数据技术的应用也将更加广泛。企业将更加依赖云计算和大数据来优化运营、提升效率，并
Kubernetes部署MySQL数据持久化沫殇-MS Kubernetes MySQL数据库 kubernetes mysql 容器
一、安装配置NFS服务端1、安装nfs-kernel-server：sudoapt-yinstallnfs-kernel-server2、服务端创建共享目录#列出所有可用块设备的信息lsblk#格式化磁盘sudomkfs-text4/dev/sdb#创建一个目录：sudomkdir-p/data/nfs/mysql#更改目录权限：sudochown-Rnobody:nogroup/data/nfs
Kubernetes的3种数据持久化方式 Seal^_^ 【云原生】容器化与编排技术持续集成 #Kubernetes kubernetes 容器云原生 EmptyDir 面试 HostPath
Kubernetes的3种数据持久化方式1.EmptyDir2.HostPath3.PersistentVolume(PV)TheBegin点点关注，收藏不迷路Kubernetes提供了几种数据持久化方式，以满足不同场景的需求：1.EmptyDir用途：临时数据存储，Pod内容器间共享。特点：生命周期与Pod相同，Pod删除时数据也删除。2.HostPath用途：访问宿主机特定文件或目录。特点：增
python中zeros用法_Python中的numpy.zeros()用法江平舟 python中zeros用法
numpy.zeros()函数是最重要的函数之一,广泛用于机器学习程序中。此函数用于生成包含零的数组。numpy.zeros()函数提供给定形状和类型的新数组,并用零填充。句法numpy.zeros(shape,dtype=float,order='C'参数形状：整数或整数元组此参数用于定义数组的尺寸。此参数用于我们要在其中创建数组的形状,例如(3,2)或2。dtype：数据类型(可选)此参数用于
自动化测试工程师面试，常问的问题有哪些？自动化测试老司机软件测试测试工程师自动化测试面试职场和发展软件测试 selenium 测试工具 android 测试工程师
自动化测试工程师面试是非常重要的环节，面试官会通过一系列的问题来评估候选人的技能和经验。下面是一些常见的问题，以及如何详细而规范地回答这些问题的建议。1.请介绍一下你的自动化测试经验。回答这个问题时，可以从项目经验、使用的自动化测试工具、编写的测试脚本等方面来介绍自己的经验。重点强调你在自动化测试领域的技能和擅长的领域。2.你在自动化测试中使用的编程语言是什么？为什么选择这种语言？回答这个问题时，
【NumPy】深入解析numpy.zeros()函数二七830 numpy
欢迎莅临我的个人主页这里是我深耕Python编程、机器学习和自然语言处理（NLP）领域，并乐于分享知识与经验的小天地！博主简介：我是二七830，一名对技术充满热情的探索者。多年的Python编程和机器学习实践，使我深入理解了这些技术的核心原理，并能够在实际项目中灵活应用。尤其是在NLP领域，我积累了丰富的经验，能够处理各种复杂的自然语言任务。技术专长：我熟练掌握Python编程语言，并深入研究了机
Python字符串比较：如何判断两个字符串是否相等？程序员杨弋 Python全栈工程师学习指南 python 开发语言
在Python编程中，字符串是最常用的数据类型之一。当我们需要比较两个字符串时，通常需要判断它们是否相等。这篇文章将详细介绍Python中比较两个字符串的方法。1、使用“==”运算符比较字符串在Python中，可以使用“==”运算符比较两个字符串是否相等。这个运算符返回True，表示两个字符串相等，返回False，表示两个字符串不相等。例如：str1="hello"str2="hello"ifst
【中国国际航空-注册_登录安全分析报告】风控牛验证码接口安全评测系列安全行为验证极验网易易盾智能手机
前言由于网站注册入口容易被黑客攻击，存在如下安全问题：1.暴力破解密码，造成用户信息泄露2.短信盗刷的安全问题，影响业务及导致用户投诉3.带来经济损失，尤其是后付费客户，风险巨大，造成亏损无底洞所以大部分网站及App都采取图形验证码或滑动验证码等交互解决方案，但在机器学习能力提高的当下，连百度这样的大厂都遭受攻击导致点名批评，图形验证及交互验证方式的安全性到底如何？请看具体分析一、中国国际航空PC
机器学习流形数据降维：UMAP 降维算法小嗷犬 Python 机器学习 #数据分析及可视化机器学习算法人工智能
✅作者简介：人工智能专业本科在读，喜欢计算机与编程，写博客记录自己的学习历程。个人主页：小嗷犬的个人主页个人网站：小嗷犬的技术小站个人信条：为天地立心，为生民立命，为往圣继绝学，为万世开太平。本文目录UMAP简介理论基础特点与优势应用场景在Python中使用UMAP安装umap-learn库使用UMAP可视化手写数字数据集UMAP简介UMAP（UniformManifoldApproximatio
七.正则化愿风去了
吴恩达机器学习之正则化（Regularization）http://www.cnblogs.com/jianxinzhou/p/4083921.html从数学公式上理解L1和L2https://blog.csdn.net/b876144622/article/details/81276818虽然在线性回归中加入基函数会使模型更加灵活，但是很容易引起数据的过拟合。例如将数据投影到30维的基函数上，模
梧桐数据库（WuTongDB）：数据库技术中都有哪些常见的优化器鲁鲁517 梧桐数据库梧桐数据库
以下是一些常见的数据库优化器：1.CBO（Cost-BasedOptimizer）应用场景：广泛应用于关系型数据库中，如Oracle、PostgreSQL、MySQL等。工作原理：通过计算不同执行计划的代价（如CPU、I/O等资源消耗），选择最低代价的执行计划。代表数据库：Oracle、PostgreSQL、MySQL。特点：CBO使用统计信息（如表大小、索引分布）来评估查询的代价。2.RBO（R
探索创新科技： Lite-Mono - 简约高效的小型化Mono框架杭律沛Meris
探索创新科技：Lite-Mono-简约高效的小型化Mono框架Lite-Mono[CVPR2023]Lite-Mono:ALightweightCNNandTransformerArchitectureforSelf-SupervisedMonocularDepthEstimation项目地址:https://gitcode.com/gh_mirrors/li/Lite-Mono如果你在寻找一个轻
DISC性格分析在职业发展中的重要性 2401_87247149 职场发展职场和发展求职招聘单一职责原则
DISC个性测验是国外企业广泛应用的一种人格测验，用于测查、评估和帮助人们改善其行为方式、人际关系、工作绩效、团队合作、领导风格等。‌提升团队效能‌：‌了解团队成员的DISC类型，‌有助于更好地沟通协作，‌增强信任感，‌发挥每个人优势‌。‌深入了解自己‌：‌帮助个体更好地洞察自己的特质和偏好，‌认清优势和劣势，‌挖掘潜能‌。‌‌改善人际关系‌：‌通过分析自己和他人的行为反应模式，‌适应不同的沟通风
机器学习-------数据标准化罔闻_spider 数据分析算法机器学习人工智能
什么是归一化，它与标准化的区别是什么？一作用在做训练时，需要先将特征值与标签标准化，可以防止梯度防炸和过拟合；将标签标准化后，网络预测出的数据是符合标准正态分布的—StandarScaler()，与真实值有很大差别。因为StandarScaler()对数据的处理是（真实值-平均值）/标准差。同时在做预测时需要将输出数据逆标准化提升模型精度：标准化/归一化使不同维度的特征在数值上更具比较性，提高分类
mondb入手木zi_鸣 mongodb
windows 启动mongodb 编写bat文件， mongod --dbpath D:\software\MongoDBDATA mongod --help 查询各种配置配置在mongob 打开批处理，即可启动，27017原生端口，shell操作监控端口扩展28017，web端操作端口启动配置文件配置，数据更灵活
大型高并发高负载网站的系统架构 bijian1013 高并发负载均衡
扩展Web应用程序一.概念简单的来说，如果一个系统可扩展，那么你可以通过扩展来提供系统的性能。这代表着系统能够容纳更高的负载、更大的数据集，并且系统是可维护的。扩展和语言、某项具体的技术都是无关的。扩展可以分为两种： 1.
DISPLAY变量和xhost(原创) czmmiao display
DISPLAY 在Linux/Unix类操作系统上, DISPLAY用来设置将图形显示到何处. 直接登陆图形界面或者登陆命令行界面后使用startx启动图形, DISPLAY环境变量将自动设置为:0:0, 此时可以打开终端, 输出图形程序的名称(比如xclock)来启动程序, 图形将显示在本地窗口上, 在终端上输入printenv查看当前环境变量, 输出结果中有如下内容:DISPLAY=:0.0
获取B/S客户端IP 周凡杨 java 编程 jsp Web 浏览器
最近想写个B/S架构的聊天系统，因为以前做过C/S架构的QQ聊天系统，所以对于Socket通信编程只是一个巩固。对于C/S架构的聊天系统，由于存在客户端Java应用，所以直接在代码中获取客户端的IP，应用的方法为： String ip = InetAddress.getLocalHost().getHostAddress(); 然而对于WEB
浅谈类和对象朱辉辉33 编程
类是对一类事物的总称，对象是描述一个物体的特征，类是对象的抽象。简单来说，类是抽象的，不占用内存，对象是具体的，占用存储空间。类是由属性和方法构成的，基本格式是public class 类名{ //定义属性 private/public 数据类型属性名； //定义方法 publ
android activity与viewpager+fragment的生命周期问题肆无忌惮_ viewpager
有一个Activity里面是ViewPager，ViewPager里面放了两个Fragment。第一次进入这个Activity。开启了服务，并在onResume方法中绑定服务后，对Service进行了一定的初始化，其中调用了Fragment中的一个属性。 super.onResume(); bindService(intent, conn, BIND_AUTO_CREATE);
base64Encode对图片进行编码 843977358 base64 图片 encoder
/** * 对图片进行base64encoder编码 * * @author mrZhang * @param path * @return */ public static String encodeImage(String path) { BASE64Encoder encoder = null; byte[] b = null; I
Request Header简介 aigo servlet
当一个客户端(通常是浏览器)向Web服务器发送一个请求是，它要发送一个请求的命令行，一般是GET或POST命令，当发送POST命令时，它还必须向服务器发送一个叫“Content-Length”的请求头(Request Header) 用以指明请求数据的长度，除了Content-Length之外，它还可以向服务器发送其它一些Headers，如：
HttpClient4.3 创建SSL协议的HttpClient对象 alleni123 httpclient 爬虫 ssl
public class HttpClientUtils { public static CloseableHttpClient createSSLClientDefault(CookieStore cookies){ SSLContext sslContext=null; try { sslContext=new SSLContextBuilder().l
java取反 -右移-左移-无符号右移的探讨百合不是茶位运算符位移
取反：在二进制中第一位，1表示符数，0表示正数 byte a = -1; 原码：10000001 反码：11111110 补码：11111111 //异或: 00000000 byte b = -2; 原码：10000010 反码：11111101 补码：11111110 //异或: 00000001
java多线程join的作用与用法 bijian1013 java 多线程
对于JAVA的join，JDK 是这样说的：join public final void join （long millis ）throws InterruptedException Waits at most millis milliseconds for this thread to die. A timeout of 0 means t
Java发送http请求(get 与post方法请求) bijian1013 java spring
PostRequest.java package com.bijian.study; import java.io.BufferedReader; import java.io.DataOutputStream; import java.io.IOException; import java.io.InputStreamReader; import java.net.HttpURL
【Struts2二】struts.xml中package下的action配置项默认值 bit1129 struts.xml
在第一部份，定义了struts.xml文件，如下所示： <!DOCTYPE struts PUBLIC "-//Apache Software Foundation//DTD Struts Configuration 2.3//EN" "http://struts.apache.org/dtds/struts
【Kafka十三】Kafka Simple Consumer bit1129 simple
代码中关于Host和Port是割裂开的，这会导致单机环境下的伪分布式Kafka集群环境下，这个例子没法运行。实际情况是需要将host和port绑定到一起， package kafka.examples.lowlevel; import kafka.api.FetchRequest; import kafka.api.FetchRequestBuilder; impo
nodejs学习api ronin47 nodejs api
NodeJS基础什么是NodeJS JS是脚本语言，脚本语言都需要一个解析器才能运行。对于写在HTML页面里的JS，浏览器充当了解析器的角色。而对于需要独立运行的JS，NodeJS就是一个解析器。每一种解析器都是一个运行环境，不但允许JS定义各种数据结构，进行各种计算，还允许JS使用运行环境提供的内置对象和方法做一些事情。例如运行在浏览器中的JS的用途是操作DOM，浏览器就提供了docum
java-64.寻找第N个丑数 bylijinnan java
public class UglyNumber { /** * 64.查找第N个丑数具体思路可参考 [url] http://zhedahht.blog.163.com/blog/static/2541117420094245366965/[/url] * 题目：我们把只包含因子 2、3和5的数称作丑数（Ugly Number）。例如6、8都是丑数，但14
二维数组（矩阵）对角线输出 bylijinnan 二维数组
/** 二维数组对角线输出两个方向例如对于数组： { 1, 2, 3, 4 }, { 5, 6, 7, 8 }, { 9, 10, 11, 12 }, { 13, 14, 15, 16 }, slash方向输出： 1 5 2 9 6 3 13 10 7 4 14 11 8 15 12 16 backslash输出： 4 3
[JWFD开源工作流设计]工作流跳跃模式开发关键点(今日更新) comsci 工作流
既然是做开源软件的,我们的宗旨就是给大家分享设计和代码,那么现在我就用很简单扼要的语言来透露这个跳跃模式的设计原理大家如果用过JWFD的ARC-自动运行控制器,或者看过代码,应该知道在ARC算法模块中有一个函数叫做SAN(),这个函数就是ARC的核心控制器,要实现跳跃模式,在SAN函数中一定要对LN链表数据结构进行操作,首先写一段代码,把
redis常见使用 cuityang redis 常见使用
redis 通常被认为是一个数据结构服务器，主要是因为其有着丰富的数据结构 strings、map、 list、sets、 sorted sets 引入jar包 jedis-2.1.0.jar (本文下方提供下载) package redistest; import redis.clients.jedis.Jedis; public class Listtest
配置多个redis dalan_123 redis
配置多个redis客户端 <?xml version="1.0" encoding="UTF-8"?><beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi=&quo
attrib命令 dcj3sjt126com attr
attrib指令用于修改文件的属性.文件的常见属性有:只读.存档.隐藏和系统. 只读属性是指文件只可以做读的操作.不能对文件进行写的操作.就是文件的写保护. 存档属性是用来标记文件改动的.即在上一次备份后文件有所改动.一些备份软件在备份的时候会只去备份带有存档属性的文件.
Yii使用公共函数 dcj3sjt126com yii
在网站项目中，没必要把公用的函数写成一个工具类，有时候面向过程其实更方便。在入口文件index.php里添加 require_once('protected/function.php'); 即可对其引用，成为公用的函数集合。 function.php如下： <?php /** * This is the shortcut to D
linux 系统资源的查看（free、uname、uptime、netstat） eksliang netstat linux uname linux uptime linux free
linux 系统资源的查看转载请出自出处：http://eksliang.iteye.com/blog/2167081 http://eksliang.iteye.com 一、free查看内存的使用情况语法如下： free [-b][-k][-m][-g] [-t] 参数含义 -b:直接输入free时，显示的单位是kb我们可以使用b(bytes),m
JAVA的位操作符 greemranqq 位运算 JAVA位移 <<>>>
最近几种进制，加上各种位操作符，发现都比较模糊，不能完全掌握，这里就再熟悉熟悉。 1.按位操作符：按位操作符是用来操作基本数据类型中的单个bit,即二进制位，会对两个参数执行布尔代数运算，获得结果。与（&）运算： 1&1 = 1, 1&0 = 0, 0&0 &
Web前段学习网站 ihuning Web
Web前段学习网站菜鸟学习：http://www.w3cschool.cc/ JQuery中文网：http://www.jquerycn.cn/ 内存溢出：http://outofmemory.cn/#csdn.blog http://www.icoolxue.com/ http://www.jikexue
强强联合：FluxBB 作者加盟 Flarum justjavac r
原文：FluxBB Joins Forces With Flarum作者：Toby Zerner译文：强强联合：FluxBB 作者加盟 Flarum译者：justjavac FluxBB 是一个快速、轻量级论坛软件，它的开发者是一名德国的 PHP 天才 Franz Liedke。FluxBB 的下一个版本(2.0)将被完全重写，并已经开发了一段时间。FluxBB 看起来非常有前途的，
java统计在线人数（session存储信息的） macroli java Web
这篇日志是我写的第三次了前两次都发布失败！郁闷极了！由于在web开发中常常用到这一部分所以在此记录一下，呵呵，就到备忘录了！我对于登录信息时使用session存储的，所以我这里是通过实现HttpSessionAttributeListener这个接口完成的。 1、实现接口类，在web.xml文件中配置监听类，从而可以使该类完成其工作。 public class Ses
bootstrp carousel初体验快速构建图片播放 qiaolevip 每天进步一点点学习永无止境 bootstrap 纵观千象
img{ border: 1px solid white; box-shadow: 2px 2px 12px #333; _width: expression(this.width > 600 ? "600px" : this.width + "px"); _height: expression(this.width &
SparkSQL读取HBase数据，通过自定义外部数据源 superlxw1234 spark sparksql sparksql读取hbase sparksql外部数据源
关键字：SparkSQL读取HBase、SparkSQL自定义外部数据源前面文章介绍了SparSQL通过Hive操作HBase表。 SparkSQL从1.2开始支持自定义外部数据源(External DataSource)，这样就可以通过API接口来实现自己的外部数据源。这里基于Spark1.4.0，简单介绍SparkSQL自定义外部数据源，访
Spring Boot 1.3.0.M1发布 wiselyman spring boot
Spring Boot 1.3.0.M1于6.12日发布，现在可以从Spring milestone repository下载。这个版本是基于Spring Framework 4.2.0.RC1,并在Spring Boot 1.2之上提供了大量的新特性improvements and new features。主要包含以下： 1.提供一个新的sprin

[机器学习与scikit-learn-51]：模型评估-图解回归模型的评估指标MSE、MAE、RMSE、R2、RSS与代码示例

前言：

第1章 残差residual error

1.1 残差的定义

1.2 残差的数学表达式

1.3 残差计算的几何图形

1.4 残差数值的几何图形

1.5 残差分析

1.6 残差的意义：

第2章 平均绝对误差（mean absolute error, MAE）- L1损失

2.1 概述

2.2 MAE的数学表达式

2.3 MAE误差的几何含义

2.4 MAE的函数图形（红色图像）

2.5 代码演示

第3章 残差的平方和RSS (Residual Square Summary)

3.1 残差平方和的定义

3.2 残差平方和的数学表达

3.3 残差平方和的意义

3.4 RSS的缺点

第4章 均方误差MSE（Mean平均 Square Error） - L2损失

4.1 什么是均分误差

4.2 数学公式

4.3 几何意义

4.4 几何图形（黑色图形）

4.5 代码演示

第5章 均方根误差（RMSE）

5.1 什么是均方根误差

5.2 数学公式

5.3 几何意义

5.4 几何图形

第6章 方差

6.1 什么是方差

6.2 方差的数学公式

6.3 方差的几何图形

6.4 方差的意义

6.5 标准方差

第7章 总离差平方和TSS（Total of Summary Square）

7.1 什么是离差/平均差deviation

7.2 总离差平方和TSS

7.3 总离差平方和TSS的数学公式

7.4 TSS的含义

第8章 决定系数R^2（Coefficient of Determination）

8.1 均分误差MSE的缺点

8.2 什么是决定系数R^2

8.3 决定系数的计算方法

8.4 决定系数的优点

8.5 计算公式

8.6 R2的几何图形

第9章 scikit-learn对测量指标的支持

9.1 所有指标展示

9.2 生成测试数据集

9.3 模型定义与拟合（训练）

9.4 模型评估

9.5 交叉验证

9.6 关于scikit-learn 交叉验证时，MSE为负数的说明

你可能感兴趣的:(机器学习,scikit-learn,评估指标,R2)

第1章残差residual error

第2章平均绝对误差（mean absolute error, MAE）- L1损失

第3章残差的平方和RSS (Residual Square Summary)

第4章均方误差MSE（Mean平均 Square Error） - L2损失

第5章均方根误差（RMSE）

第6章方差

第7章总离差平方和TSS（Total of Summary Square）

第8章决定系数R^2（Coefficient of Determination）