孙悟充

【机器学习笔记】——模型评价准则（Evaluation metrics）

1 模型选择
2 回归任务
- 2.1 MSE（Mean Square Error）均方误差
- 2.2 RMSE（Root Mean Square Error）均方根误差
- 2.3 RMSLE（Root Mean Square Log Error）均方根对数误差
- 2.4 MAE（Mean Absolute Error）平均绝对误差
- 2.5 $R^2$（R Squared）R方
  - 2.5.1 R方小于0？R方大于1？
  - 2.5.2 adjusted $R^2$ （adjusted R squared）调整后的R方
3 分类任务
- 3.1 error & accuracy（ACC）错误率和准确率
- 3.2 logloss
- 3.3 AUC & AUCPR & KS
  - 3.3.1 混淆矩阵
  - 3.3.2 查准率、查全率、P-R曲线、AUCPR、F值
    - 3.3.2.1 查全率
    - 3.3.2.2 查准率
    - 3.3.2.3 P-R曲线 & AUCPR & F值
  - 3.3.3 真正例率、假正例率、ROC曲线、AUC
    - 3.3.3.1 真正例率
    - 3.3.3.2 假正例率
    - 3.3.3.3 ROC曲线
    - 3.3.3.4 AUC
    - 3.3.3.5 AUC的计算方法（一）
    - 3.3.3.6 AUC的计算方法（二）
    - 3.3.3.7 AUC 和&ACC
    - 3.3.3.8 ROC Vs PR（AUC Vs AUCPR）
    - 3.3.3.9 AUC的优势
  - 3.3.4 K-S曲线与最佳阈值的选取
4 参考文献

1 模型选择

模型选择有两个思路，一是解释性。即在现有数据下哪些特征是重要的特征，应该用什么样的模型来解释数据。好的模型应该是最能解释现有数据的模型，也就是说更能拟合训练集数据的模型（训练误差小）。二是预测性，好的模型应该是泛化能力更强的模型，也就是说在测试集上表现更好的模型。笔记里主要关注的是后者，即如何评价一个训练好了的模型（已知参数的模型）的好坏

2 回归任务

2.1 MSE（Mean Square Error）均方误差

$\frac{1}{N} \sum_{i = 1}^{N} {(y_i - \hat{y_i})}^2 \tag{1}$

在训练模型时常被用作线性回归的损失函数，所以自然地也拿来在测试集上评价模型

2.2 RMSE（Root Mean Square Error）均方根误差

$\sqrt{MSE} = \sqrt{\frac{1}{N} \sum_{i = 1}^{N} {(y_i - \hat{y_i})}^2} \tag{2}$

常作为机器学习模型预测结果的评价准则，比如随机森林回归和XGBregressor的默认评价准则都是这个。RMSE和MSE的区别仅在于做了一个平方，使得量纲和变量保持一致，有点像平方差和标准差的感觉。所以对于评价模型两者没什么优劣之分，只不过RMSE可能有更好的解释性。

2.3 RMSLE（Root Mean Square Log Error）均方根对数误差

$\sqrt{\frac{1}{N} \sum_{i = 1}^{N} {(\log (y_i + 1) - \log (\hat{y_i} + 1))}^2} \tag{3}$

使用RMSLE的好处：

一个有趣的现象是使用RMSLE对于预测值较小的惩罚更大：考虑只有一个实例的学习，如果真实值为1000，预测值为1100，此时 $R M S E = 100$ ， $R M S L E = 0.095$ ；如果预测值为900，此时 $R M S E = 100$ ， $R M S L E = 0.105$ 。这一点可能对于特殊的情况有一些好处
取对数是一个变化量纲的变换，能够把一些大的值压缩，把一些小的值增大。所以当数据中有少量的值和真实值差别较大时，RMSLE能够降低这些值对于整体误差的影响，这会降低个别异常点对于模型评价的影响。
同前一条有点类似，如果要预测的数据的量纲很大，比如一个左偏的模型。那么如果模型在大的真实值处的误差就会使RMSE的结果很大，得出这个模型不好的结论；而如果一个事实上很差的模型在这个大的真实值上的预测很准确而在非常多的小的真实值处有一些误差，那么的RMSE反而会没有前面那个模型的大，得出这个模型更好的结论。RMSLE就是会降低这种错误的准则。另一个方法是先对标签取 $\log$ ，再用RMSE作为评价准则，这需要提前认识数据的分布。

2.4 MAE（Mean Absolute Error）平均绝对误差

$\frac{1}{N} \sum_{i = 1}^{N} {|y_i - \hat{y_i}|} \tag{4}$

因为这个函数不是处处可导，所以没有用作线性回归训练模型的损失函数，但是这不影响它可以作为测试集上的模型评价准则。MAE和RMSE具有同样的量纲，但是RMSE会对误差平方后再求和，也就是说它能够放大误差更大的样本的影响，而MAE就是真实误差的直接反映。RMSE越小说明最大误差越小，因为能反映最大误差，所以RMSE更常用一些。

2.5 $R^2$ （R Squared）R方

$R^2 = 1 - \frac{SSR}{SST} = 1 - \frac{\sum_{i = 1}^{N} {(y_i - \hat{y_i})}^2}{\sum_{i = 1}^{N} {(y_i - \bar{y_i})}^2} = 1 - \frac{MSE}{Var} \tag{5}$

R方是线性回归中非常常用的评价准则，先来了解一下R方的产生。我们先以RMSE为例，对于同一个预测身高的模型，如果把标签的单位从米换成厘米，那么RMSE就会变成原来的100倍，那么能不能说用米做单位的模型更好呢，这显然说不通，因为两个模型是等价的。一个自然的想法是，既然RMSE研究的是数据的绝对误差，那么只要用相对误差就好了，那么相对于什么呢？考虑先相对于原始数据的平方和

$\frac{\sum_{i = 1}^{N} {(y_i - \hat{y_i})}^2}{\sum_{i = 1}^{N} {y_i}^2} \tag{6}$

这样看似是不错的，但是仍然存在一些问题，就是如果 $Y$ 增加平移，结果就会产生变化。比如我们希望研究的是相对于海平面的身高而不是相对于地面的身高，那么所有的真实值和预测值都会加上一个所在地面的海拔高度。这样一来分子并不会因为这一段海拔高度变化，而分母却会产生变化。我们真正关心的是不同的人身高之间的差异与哪些因素有关，只是改变了测量身高的参考系，不应该改变模型对不同的人身高差异的预测能力，所以上面采用误差平方和与真实值比值的评分方式也需要改进。

为了使得我们的模型好坏评分系统不会因为模型里的预测值同时增加会减小一个固定值（比如像上面的例子那样将参考系从地面变成海平面）而改变，可以先将 $Y$ 的预测值先减去其平均值（这一过程也叫做中心化），再取平方和，叫做总平方和

$\frac{\sum_{i = 1}^{N} {(y_i - \hat{y_i})}^2}{\sum_{i = 1}^{N} {(y_i - \bar{y_i})}^2} \tag{7}$

我们也把分母表示的模型称为基准模型，即把平均值作为真实值的预测。到了这里我们就已经得到了一个不错的评价准则，但是在我们的惯性思维中一般都是评分高，结果越好，所以我们用 1 减去上面的分式作为最终结果，也就是R方。

$R^2 = 1 - \frac{\sum_{i = 1}^{N} {(y_i - \hat{y_i})}^2}{\sum_{i = 1}^{N} {(y_i - \bar{y_i})}^2} \tag{8}$

所以R方的一个好处是不会随着预测值单位的变化而变化，也不会因为预测值的平移而变化。

从上面我们知道R方越大，模型越好。当我们的预测完全正确时，那么R方等于最大值 1，当我们使用基准模型预测（预测值等于真实值的平均值）时，R方为0。因此R方的另一个好处就是将回归结果归约到了0~1间，允许我们对不同问题的预测结果进行比对（当然有时候R方也会出现小于0的情况）。

2.5.1 R方小于0？R方大于1？

我们知道 $S S T = S S R + S S E$ ，而且这三个平方和都是正的，那么一定有 $\ge SSR$ ，那么为什么会出现R方小于0呢？这是因为 $S S T = S S R + S S E$ 成立是需要条件的，即回归方程有截距。先看一下方差的分解式

$\begin{aligned} SST & = \sum {(y_i - \bar{y})}^2 \\ & = \sum {\left((y_i - \hat{y_i}) - (\bar{y} - \hat{y_i})\right)}^2 \\ & = \sum {(y_i - \hat{y_i})}^2 + \sum {(\bar{y} - \hat{y_i})} - 2\sum (y_i - \hat{y_i})(\bar{y} - \hat{y_i}) \\ & = SSR + SSE - 2\bar{y}\sum {(y_i - \hat{y_i})} + 2\sum \hat{y_i}(y_i - \hat{y_i}) \end{aligned}$

在有截距项的假设下： $\beta_0 + \beta_1 X$ ，我们要使SSR最小，于是让SSR分别对 $\beta_0$ 、 $\beta_1$ 求偏导得到：

$\frac{\partial SSR}{\partial\beta_0} = \frac{\partial \sum {(y_i - \hat{y_i})}^2}{\partial \beta_0} = -2\sum(y_i - \hat{y_i})\frac{\partial y_i}{\partial \beta_0} = -2\sum(y_i - \hat{y_i}) = 0 \tag{10}$

$\frac{\partial SSR}{\partial\beta_1} = \frac{\partial \sum {(y_i - \hat{y_i})}^2}{\partial \beta_1} = -2\sum(y_i - \hat{y_i})\frac{\partial y_i}{\partial \beta_1} = -2\sum(y_i - \hat{y_i})x_i = 0 \tag{11}$

由(10)和(11)式以及 $y_i = \beta_0 + \beta_1 x_i$ 得出方差分解式的后两项都是0，于是才有 $S S T = S S R + S S E$ 。

如果没有截距项，还是求偏导只能得到(11)式的结果，于是

$2\bar{y}\sum {(y_i - \hat{y_i})} \tag{12}$

所以当 $2\bar{y}\sum {(y_i - \hat{y_i})} \lt 0$ 时， $\gt SST$ ，就有了R方小于0。同样的道理，当 $2\bar{y}\sum {(y_i - \hat{y_i})} \lt 0$ 时，就会有R方大于 1。总之只要我们的回归方程是有截距项的，那么R方一定在 0 和 1 之间。

2.5.2 adjusted $R^2$ （adjusted R squared）调整后的R方

如果一个自变量对减小误差平方和完全没有帮助，则线性模型会自动放弃使用这一自变量，将它的回归系数设为 0。这也就是说，往模型里面加入新的自变量，模型的误差平方和只会减小不会增加，从而 R方只会增加不会减小。这就使得用 R方来比较包含不同数量的自变量的模型时候，总会对自变量多的模型比较偏心，这有时候并不合理。于是我们对增加变量进行惩罚，禁止随意的增加非显著变量

$R^2_{adjusted} = 1 - \frac{SSR / (n - p - 1)}{SST / (n-1)} \tag{13}$

3 分类任务

3.1 error & accuracy（ACC）错误率和准确率

很直观易懂，错误率就是错误样本数比上总样本数，准确率就是正确样本数比上总样本数。对于多分类问题也是这样。这是分类任务最直接有效的评价准则。

3.2 logloss

又称为逻辑损失（logistic regression loss）或者交叉熵损失（cross-entropy loss）。他根据给出每个实例对应的标签的概率给出一个值作为标准，比如对于二分类任务，模型判断一个实例的标签为真实值 $y$ 和它预测为真实值为 1 的概率 $p$ ，于是logloss定义为

$-\log (y/p) = -\left(y\log(p) +(1-y)\log(1-p)\right) \tag{14}$

推广到多分类任务

$-\log(Y/P) = -\frac{1}{N}\sum_{i = 1}^{N}\sum_{k = 1}^{K}y_{i, k}\log p_{i,k} \tag{15}$

3.3 AUC & AUCPR & KS

准确率是一个很好的评价指标了，那么为什么需要AUC等其他指标呢？加入一个数据中99%的样本是正例，只有1%的样本是负例，那么我们什么都不做，把所有样本预测为正例就可以。而AUC能够保证在样本不均衡的情况下也能准确评估模型的好坏，而K-S值不仅能告诉模型准确与否，还能告诉模型对正负样本是否有足够高的区分度

3.3.1 混淆矩阵

对于二分类问题我们可以根据预测结果和样本的真实情况分为四种组合，表示在矩阵中就是混淆矩阵。下图所示即为混淆矩阵

从混淆矩阵中我们可以得到一些有用的评价准则：

3.3.2 查准率、查全率、P-R曲线、AUCPR、F值

3.3.2.1 查全率

Recall（召回率/查全率），又称为sensitivity（灵敏度）或者 true positive rate（真正例率，TPR）。反映了被正确预测的正例样本在所有正例样本中的比例，在特殊的任务中该指标比错误率或者准确率更好，比如在地震预测中我们不在乎所有预报中预测成功的准确率是多少，而是在所有的地震中，我们能正确预测出多少次，即求全而不求准

$\frac{TP}{TP + FN} \tag{16}$

3.3.2.2 查准率

Precision（精准率/查准率），又称为Positive predictive value (PPV)。反映了被预测为正例的样本中真正为正例的比重，这个指标也适用于特殊的分类任务，比如在用人脸识别抓捕逃犯时，我们希望不冤枉一个好人不放过一个坏人，那么就要求被识别为逃犯的人是真的逃犯才行，即求准而不求全。

$\frac{TP}{TP + FP} \tag{17}$

为了增大求全率，我们就需要扩大预测为正例样本的数量，这会牺牲查准率，而为了增大查准率，我们需要尽可能减少我们不特别确定是正例的样本，这就会漏掉一些真正是正例的样本，牺牲了查全率，所以这两个指标是一对矛盾的度量。通常只有在样本量较小的简单任务中两者才会都比较高。

3.3.2.3 P-R曲线 & AUCPR & F值

把样本按照学习器认为是正例的概率从大到小进行排序，按此顺序逐个把样本作为正例进行预测（比如第一次第一个视为正例，剩余的视为反例，第二次前两个视为正例，剩余的视为反例。这样查全率从0到1查准率从1到0变化），那么每次可以得到当前的查准率和查全率，以查准率为纵轴，查全率为横轴，就得到了查准率-查全率曲线，即“P-R曲线”。因为这个概率是学习器学得的，所以每个学习器都能画出一条P-R曲线。

根据P-R图比较学习器的性能时，认为包在外面（这里的外指的是右上角）的曲线性能更好（查准率、查全率都更高），比如学习器B优于学习器C。当出现P-R曲线相交的情况时，一般需要根据具体情况判断学习器的好坏，或者比较两个曲线下方的面积AUCPR（Area under the PR Curve），下方面积更大的曲线对应的学习器好。但是这个值并不容易估算，所以又引入了另一个性能度量——“平衡点”。它是曲线与 $y = x$ 的交点，即查准率等于查全率，并认为平衡点更高的曲线对应的学习器性能更好，依次判断学习器A优于学习器B。

另一个更常用的评价标准是F值

$F_1 = 2 \times \frac{Precision \cdot Recall}{Precision + Recall} \tag{18}$

F值更高的学习器性能更好。

有时候任务对查全率和查准率的偏好不同，这时候引入F值的一般形式

$F_\beta = (1 + \beta^2) \times \frac{Precision \cdot Recall}{\beta^2 \times Precision + Recall} \tag{19}$

其中 $\beta \gt 0$ 度量了查全率对查准率的相对重要性， $\beta \gt 1$ 时更关注查全率， $\beta \lt 1$ 时更关注查准率

3.3.3 真正例率、假正例率、ROC曲线、AUC

3.3.3.1 真正例率

真正例率是前面查全率的别称，反映了被正确预测的正例样本在所有正例样本的比重

3.3.3.2 假正例率

False Positive Rate（假正例率），反映了实际为负例但被预测为正例的样本在所有负例样本中的比重

$\frac{FP}{FP + TN} \tag{20}$

3.3.3.3 ROC曲线

按照画P-R曲线的方式先对样本进行排序，每次计算真正例率和假正例率作为纵轴和横轴，画出的就是ROC曲线（Receiver Operating Characteristic，受试者工作特征）

上图所示记为ROC图，理想的ROC曲线是光滑的，但是基于数据画图时只能得到右边近似的结果（由于数据的有限性ROC曲线会呈现为阶梯状），当然P-R图也是近似的。

3.3.3.4 AUC

衡量学习器好怀的直接方法也是认为包在外面的曲线代表的学习器更好（这里的外是更靠近左上角）。当出现交叉时使用曲线下方的面积（Area Under the roc Curve，AUC）来判断学习器性能的好坏，AUC大的学习器性能更好。一般来讲AUC是大于0.5的，毕竟瞎猜的准确率应该在50%，除非你的学习器正好把所有的结果都预测反了，那AUC等于0

3.3.3.5 AUC的计算方法（一）

假定ROC曲线是由坐标为 $\{(x_1, y_1), (x_2, y_2), \cdots, (x_N, y_N)\}$ 的点（ $x_1 = 0, \ x_m = 1$ ， $x_i, y_i$ 是每次根据不同阈值计算得到的真正例率和假正例率）按序连接而形成，则AUC可估算为

$\frac{1}{2} \sum_{i = 1}^{N - 1} (x_{i + 1} - x_{i}) \cdot (y_{i + 1} + y_{i}) \tag{21}$

比如下面这个例子。假设已经得出一系列样本被划分为正类的概率，然后按照大小排序，下图是一个示例，图中共有20个测试样本，“Class”一栏表示每个测试样本真正的标签（p表示正样本，n表示负样本），“Score”表示每个测试样本属于正样本的概率。

接下来，我们从高到低，依次将“Score”值作为阈值threshold，当测试样本属于正样本的概率大于或等于这个threshold时，我们认为它为正样本，否则为负样本。举例来说，对于图中的第4个样本，其“Score”值为0.6，那么样本1，2，3，4都被认为是正样本，因为它们的“Score”值都大于等于0.6，而其他样本则都认为是负样本。每次选取一个不同的threshold，我们就可以得到一组FPR和TPR，即ROC曲线上的一点。这样一来，我们一共得到了20组FPR和TPR的值，将它们画在ROC曲线的结果如下图：

图中所有的“ $\times$ ”点就是我们依次把Score作为阈值计算得到的 $(T P R, F P R)$ 对。按照前面的AUC计算公式我们可以得到近似的AUC值。

$A U C = 0.68$

我们把这个例子用Python画出来看看

import numpy as np
import pandas as pd
from sklearn import metrics

# 因为上表给出的就是已经排好顺序的样本，所以直接写出来。当然也可以直接给出未排序的样本的
Class= np.array(['p', 'p', 'n', 'p', 'p', 'p', 'n', 'n', 'p', 'n', 'p', 'n', 'p', 'n', 'n', 'n', 'p', 'n', 'p', 'n'])
Scores = np.array([0.9, 0.8, 0.7, 0.6, 0.55, 0.54, 0.53, 0.52, 0.51, 0.505, 0.4, 0.39, 0.38, 0.37, 0.36, 0.35, 0.34, 0.33, 0.3, 0.1])

fpr, tpr, thresholds = metrics.roc_curve(y_true=Class, y_score=Scores, pos_label='p', drop_intermediate=False)

roc_point = pd.DataFrame({'FPR':fpr, 'TPR':tpr, 'thresholds':thresholds})
roc_point

上面第一行的threshold表示没有样本被预测，认为设定其值为 $max(y\_score) +1$

print('AUC: %s'%metrics.auc(fpr, tpr))

AUC: 0.68

# 直接计算AUC，但是只能用数字标签，更大的值代表正例
Class= np.array([1, 1, 0, 1, 1, 1, 0, 0, 1, 0, 1, 0, 1, 0, 0, 0, 1, 0, 1, 0])
Scores = np.array([0.9, 0.8, 0.7, 0.6, 0.55, 0.54, 0.53, 0.52, 0.51, 0.505, 0.4, 0.39, 0.38, 0.37, 0.36, 0.35, 0.34, 0.33, 0.3, 0.1])

print('AUC: %s'%metrics.roc_auc_score(y_true=Class, y_score=Scores))

AUC: 0.6799999999999999

import matplotlib.pyplot as plt

fig = plt.figure(dpi=120)

plt.plot(fpr, tpr, label='ROC curve')
plt.plot([0, 1], [0, 1], linestyle='--')
plt.xlabel('False Positive Rate')
plt.ylabel('True Positive Rate')
plt.title('')
plt.legend()
plt.grid()

plt.show()

3.3.3.6 AUC的计算方法（二）

AUC还有另一种计算方式，该方法不需要计算TPR和FPR，因此也不需要提前对样本进行排序。它和Wilcoxon-Mann-Witney Test有一些联系（为什么这两个是等价的暂不清楚）。从Mann–Whitney U statistic的角度来解释，AUC表示随机挑选一对正样本和负样本，当前分类算法依据计算出的Score将正样本排在负样本前面的概率（这也是AUC的实际意义）。它反映了分类算法的排序能力。

由于样本的有限性，我们无法得到这个概率值，但是可以近似的去估计它。最简单的方法就是用频率进行估计，即挑选出所有的正负样本对，看看有多少样本对中，正样本的Score大于负样本的Score，若成立记一个；若正样本的Score等于负样本的Score，则记0.5个。记正样本为 $\mathcal{x}^{+}$ ，负样本为 $\mathcal{x}^{-}$ ，设所有样本中正样本有 $N^{+}$ 个，负样本有 $N^{-}$ 个，正负样本集合为 $D^{+}$ ， $D^{-}$ 。那么正负样本对有 $N^{+}\cdot N^{-}$ 个，得到

$\frac{1}{N^{+}\times N^{-}} \sum_{\mathcal{x}^{+} \in D^{+}} \sum_{\mathcal{x}^{-} \in D^{-}} \left( \mathbb{I}(Score(\mathcal{x}^{+}) \gt Score(\mathcal{x}^{-}) + \frac{1}{2} \mathbb{I}(Score(\mathcal{x}^{+}) = Score(\mathcal{x}^{-}))\right) \tag{22}$

前面的例子中样本太多了，正负样本对有100个，不方便讲解，我们只取6、7、8、9号四个样本来说明用这种方法如何计算AUC

Inst#	Class	Score
6	p	0.54
7	n	0.53
8	n	0.52
9	p	0.51

我们得到正负样本对： $(6, 7)$ 、 $(6, 8)$ 、 $(9, 7)$ 、 $(9, 8)$ ，在 $(6, 7)$ 中正样本被预测为正例的概率 0.54 大于负样本被预测为正例的概率0.53，记为1，同理 $(6, 8)$ 也记为1，在 $(9, 7)$ 中正样本被预测为正例的概率 0.51 小于负样本被预测为正例的概率0.53，记为0，同理 $(9, 8)$ 也记为0。于是这 4 个样本的AUC为：

$\frac{1}{2 \times 2}(1 + 1 + 0 + 0) = 0.5$

因为每一对样本都要进行一次判断，所以用这种方法计算AUC的时间复杂度为 $O(N^2)$ 。有一个可以提高计算效率的方法，它的想法是先对所有的样本按照Score进行从大到小排序（Score相同的样本前后顺序无所谓），然后赋予每个样本一个Rank值，Score最大的样本Rank值为 $N$ ，然后依次是 $\cdots, 2, 1$ 。对于Score值相同的样本让它们的Rank值为平均值（比如有两个样本A、B的Score值为0.7，Rank值为2、3，那么取平均值后的Rank值都为2.5）。于是给出AUC的计算公式：

$\frac{1}{N^{+} \times N^{-}} \left( \sum_{\mathcal{x}^+ \in D^{+}} Rank(\mathcal{x}^{+}) - \frac{1}{2} N^{+}(N^{+} + 1)\right) \tag{23}$

其实这个公式比较容易理解，对样本进行排名后，先看第一个正样本 $\mathcal{x}_1^{+}$ ，和后面的所有样本配成 $Rank(\mathcal{x}_1^{+}) - 1$ 对，其中和正样本的配对是不需要计算的，所以再减去 $N^{+} - 1$ （减 1 是因为自己没有和自己配对），所以该样本对于AUC的贡献是 $Rank(\mathcal{x}_1^+) - N^{+}$ ；那么第二个正样本 $\mathcal{x}_2^{+}$ ，和后面的所有样本配成 $Rank(\mathcal{x}_2^+) - 1$ 对，其中和正样本的配对是不需要计算的，所以再减去 $N^{+} - 2$ （减 2 是因为自己没有和自己配对并且没有和前一个正样本配对），所以该样本对于AUC的贡献是 $Rank(\mathcal{x}_2^+) - (N^{+} - 1)$ 。以此类推最后一个正样本 $\mathcal{x}_{N^{+}}^+$ ，和后面的所有样本配成 $Rank(\mathcal{x}_{N^{+}}^+) - 1$ 对，其中和正样本的配对是不需要计算的，所以再减去 $0$ （因为是最后一个正样本所以后面没有正样本了），所以该样本对于AUC的贡献是 $Rank(\mathcal{x}_{N^{+}}^+) - 1$ 。综上

$\begin{aligned} AUC & = \frac{1}{N^{+} \times N^{-}} \sum_{i = 1}^{N^{+}} \left( Rank(\mathcal{x}_i^+) - (N^{+} - i + 1) \right) \\ & = \frac{1}{N^{+} \times N^{-}} \left( \sum_{\mathcal{x}^+ \in D^{+}} Rank(\mathcal{x}^{+}) - \frac{1}{2} N^{+}(N^{+} + 1)\right) \end{aligned}$

按照这个公式我们再计算一下最开始的例子的AUC值，因为已经进行了排名，所以Rank值从是20到1，则

$\frac{1}{10 \times 10} \left((20 + 19 + 17 + 16 + 15 + 12 + 10 + 8 + 4 + 2) - \frac{1}{2} \times 10 \times (10 + 1)\right) = 0.68$

3.3.3.7 AUC 和&ACC

在论文a Better Measure than Accuracy in Comparing Learning Algorithms中提到了AUC和ACC相反的一种情况，即AUC大反而ACC小。其原因是ACC是基于一个较佳的截断值判断的，比如在上面的例子中，学习器可能认为Score大于0.7的样本是正样本，那么ACC = 0.6；可能认为Score大于0.6的样本是正样本，那么ACC = 0.55；可能认为Score大于0.5的样本是正样本，那么ACC = 0.6。可以看到ACC是和我们人为选择的截断值有关的。而AUC是基于整体进行判断的，它将每一个Score作为阈值进行计算，再求一个整体。所以AUC是一个更加稳定的准则。论文给出的建议是选择AUC更大的模型进行后续的分析。

从公式的角度我们也可以解释这一现象。

另外论文还提到AUC更适合评价偏态分布的模型（正负样本比例不平衡）

3.3.3.8 ROC Vs PR（AUC Vs AUCPR）

从图(a)和图©可以看出，负样本增加10倍后，ROC曲线变化不大。分析一下为什么变化不大，其Y轴是TPR，x轴是FPR，当固定一个threshold来计算TPR和FPR的时候，虽然负样本增加了10倍，也就是FPR的分母虽然变大了，但是正常概率来讲，这个时候超过threshold的负样本量也会随之增加，也就是分子也会随之增加，所以总体FPR变化不大；而TPR是不变的。从这个角度来看的话正负样本稍微不均衡的话，对KS影响也不大（后面会讲到KS），因为KS=max(TPR-FPR)。这个前提是正负样本的量都比较大的情况下，因为只有样本量比较大的情况下，根据大数定律，计算出来的频率才非常接近于真实的概率值，有资料显示正负样本都超过6000的量，计算的频率就比较接近概率。所以在样本量都不是很大的情况下，如果样本还极端不均衡的话，就会有一些影响。由此可见，ROC曲线能够尽量降低不同测试集带来的干扰，更加客观地衡量模型本身的性能。

从图(b)和图(d)可以看出，负样本增加10倍后，PR曲线变化比较大。也分析一下为什们变化大，其Y轴是precision，x轴是recall，当负样本增加10倍后，在racall不变的情况下，必然召回了更多的负样本（TP不变，FP变大，即precision的分母变大），所以精确度会大幅下降，图(b)和图(d)示也非常明显的反映了这一状况，所以PR曲线变化很大，也就是说PR曲线对正负样本分布比较敏感。

如何选择呢？

在很多实际问题中，正负样本数量往往很不均衡。比如，计算广告领域经常涉及转化率模型，正样本的数量往往是负样本数量的1/1000，甚至1/10000。若选择不同的测试集，P-R曲线的变化就会非常大，而ROC曲线则能够更加稳定地反映模型本身的好坏。所以，ROC曲线的适用场景更多，被广泛用于排序、推荐、广告等领域。
但需要注意的是，选择P-R曲线还是ROC曲线是因实际问题而异的，如果研究者希望更多地看到模型在特定数据集上的表现，P-R曲线则能够更直观地反映其性能。
PR曲线比ROC曲线更加关注正样本，而ROC则兼顾了两者。
AUC越大，反映出正样本的预测结果更加靠前（分类准确度更高），推荐的样本更能符合用户的喜好
当正负样本比例失调时，比如正样本1个，负样本100个，则ROC曲线变化不大，此时用PR曲线更加能反映出分类器性能的好坏。这个时候指的是两个分类器，因为只有一个正样本，所以在画auc的时候变化可能不太大；但是在画PR曲线的时候，因为要召回这一个正样本，看哪个分类器同时召回了更少的负样本，差的分类器就会召回更多的负样本，这样precision必然大幅下降，这样分类器性能对比就出来了。

3.3.3.9 AUC的优势

AUC对样本类别是否均匀并不敏感，也就是说面对不同的测试集AUC能够能加稳定地反映模型本身的好坏，这也是不均衡样本通常选择AUC作为评价准则的原因。

3.3.4 K-S曲线与最佳阈值的选取

KS曲线（Kolmogorov-Smirnov，洛伦兹曲线）的数据来源和本质和ROC曲线是一致的，只是ROC曲线是把假正例率和真正例率当作横纵轴，而K-S曲线是把真正例率和假正例率都当作是纵轴，横轴则由样本的百分比来充当。KS指标用于模型风险区分能力进行评估，指标衡量的是好坏样本累计分布之间的差值。好坏样本累计差异越大，KS指标越大，那么模型的风险区分能力越强（区分正负样本能力越强）。当任务更关注正负样本的区分度时，KS指标优于AUC。另外我们也可以根据KS曲线选择用来判定正负样本的最佳阈值，即KS指标对应的阈值。

K-S曲线的作图步骤是：

(1) 根据分类模型返回的预测为正样本的概率（Score）对样本进行排序；

(2) 选定一组阈值，可以是把 0-1 之间 N 等分（N 一般取 10），以等分点为阈值；

(3) 对每个阈值计算TPR和FPR并进行描点作图（这里要注意横轴并不是阈值，而是样本的百分比，比如我们要把数据10等分，那么应该分别拿10%对应的样本的Score作为阈值。拿前面的例子举例，比如0%对应没有样本，这时TPR、FPR都是0，0%是横坐标，两个0是纵坐标；10%对应前两个样本，选择第二个样本的Score作为阈值计算此时的TPR、FPR，这时10%是横坐标，计算得出的TPR、FPR是纵坐标），就可以得到两条KS曲线。

KS值就是两条曲线垂直间距最大的间距的绝对值。表示了模型将正负样本区分开的能力，值越大，模型预测的越准。KS值小于0.2认为模型没有区分能力

继续使用前面的例子用Python画出KS曲线（选择样本的Score作为阈值）

print('KS: %0.2f'%max(tpr - fpr))

KS: 0.40

def plot_ks(tpr, fpr, thresholds, n=10):
    '''
    画KS曲线函数
    Param：
        tpr：metrics.roc_curve(drop_intermediate=False)返回的tpr结果
        fpr: metrics.roc_curve(drop_intermediate=False)返回的fpr结果
        thresholds：metrics.roc_curve(drop_intermediate=False)返回的thresholds结果
        n：横坐标，即样本划分百分比
    Return：
        ks_value: KS指标
    '''
    size = tpr.shape[0] - 1
    percent_coordinate = np.linspace(0, 1, n+1)    # 横坐标（样本百分比）
    index = np.array(percent_coordinate*size, dtype = np.int)
    tpr_coordinate = tpr[index]
    fpr_coordinate = fpr[index]
    ks = tpr_coordinate - fpr_coordinate
    
    ks_value = max(ks)
    ks_index = np.where(ks==ks_value)[0][0]
    
    plt.figure(dpi=120)
    plt.plot(percent_coordinate, tpr_coordinate, label='TPR')
    plt.plot(percent_coordinate, fpr_coordinate, label='FPR')
    plt.plot(percent_coordinate, ks, label='KS')
    for i in index:
        if i==ks_index:
            plt.plot([percent_coordinate[i], percent_coordinate[i]], [fpr_coordinate[i], tpr_coordinate[i]], color='red', linestyle='--')
        else:
            plt.plot([percent_coordinate[i], percent_coordinate[i]], [fpr_coordinate[i], tpr_coordinate[i]], color='grey', linestyle='--')
    plt.text(percent_coordinate[ks_index]-0.3, tpr_coordinate[ks_index]+0.05, 
            'KS= %0.2f at Percentage=%0.2f'%(ks_value, percent_coordinate[ks_index]))
    plt.legend()
    plt.ylabel('TPR/FPR')
    plt.xlabel('')
    plt.grid()
    plt.show()
    
    
    return ks_value

plot_ks(tpr, fpr, thresholds, n=20)

KS曲线多用于信贷场景下，将Score高于（包括等于）阈值的用户视为“bad”，小于阈值的用户视为“good”，此时KS值表示能将“bad”和“good”用户最佳区分的阈值

def PlotKS(preds, labels, n, asc):
    # preds is score: asc=1
    # preds is prob: asc=0

    pred = preds  # 预测值
    bad = labels  # 取1为bad, 0为good
    ksds = pd.DataFrame({'bad': bad, 'pred': pred})
    ksds['good'] = 1 - ksds.bad

    if asc == 1:
        ksds1 = ksds.sort_values(by=['pred', 'bad'], ascending=[True, True])
    elif asc == 0:
        ksds1 = ksds.sort_values(by=['pred', 'bad'], ascending=[False, True])
    ksds1.index = range(len(ksds1.pred))
    ksds1['cumsum_good1'] = 1.0*ksds1.good.cumsum()/sum(ksds1.good)
    ksds1['cumsum_bad1'] = 1.0*ksds1.bad.cumsum()/sum(ksds1.bad)

    if asc == 1:
        ksds2 = ksds.sort_values(by=['pred', 'bad'], ascending=[True, False])
    elif asc == 0:
        ksds2 = ksds.sort_values(by=['pred', 'bad'], ascending=[False, False])
    ksds2.index = range(len(ksds2.pred))
    ksds2['cumsum_good2'] = 1.0*ksds2.good.cumsum()/sum(ksds2.good)
    ksds2['cumsum_bad2'] = 1.0*ksds2.bad.cumsum()/sum(ksds2.bad)

    # ksds1 ksds2 -> average
    ksds = ksds1[['cumsum_good1', 'cumsum_bad1']].copy()
    ksds['cumsum_good2'] = ksds2['cumsum_good2']
    ksds['cumsum_bad2'] = ksds2['cumsum_bad2']
    ksds['cumsum_good'] = (ksds['cumsum_good1'] + ksds['cumsum_good2'])/2
    ksds['cumsum_bad'] = (ksds['cumsum_bad1'] + ksds['cumsum_bad2'])/2

    # ks
    ksds['ks'] = ksds['cumsum_bad'] - ksds['cumsum_good']
    ksds['tile0'] = range(1, len(ksds.ks) + 1)
    ksds['tile'] = 1.0*ksds['tile0']/len(ksds['tile0'])

    qe = list(np.arange(0, 1, 1.0/n))
    qe.append(1)
    qe = qe[1:]

    ks_index = pd.Series(ksds.index)
    ks_index = ks_index.quantile(q = qe)
    ks_index = np.ceil(ks_index).astype(int)
    ks_index = list(ks_index)

    ksds = ksds.loc[ks_index]
    ksds = ksds[['tile', 'cumsum_good', 'cumsum_bad', 'ks']]
    ksds0 = np.array([[0, 0, 0, 0]])
    ksds = np.concatenate([ksds0, ksds], axis=0)
    ksds = pd.DataFrame(ksds, columns=['tile', 'cumsum_good', 'cumsum_bad', 'ks'])

    ks_value = ksds.ks.max()
    ks_pop = ksds.tile[ksds.ks.idxmax()]
    #print ('ks_value is ' + str(np.round(ks_value, 4)) + ' at pop = ' + str(np.round(ks_pop, 4)))

    # chart
    plt.figure(dpi=120)
    plt.plot(ksds.tile, ksds.cumsum_good, label='cum_good',
                         color='blue', linestyle='-', linewidth=2)

    plt.plot(ksds.tile, ksds.cumsum_bad, label='cum_bad',
                        color='red', linestyle='-', linewidth=2)

    plt.plot(ksds.tile, ksds.ks, label='ks',
                   color='green', linestyle='-', linewidth=2)

    plt.axvline(ks_pop, color='gray', linestyle='--')
    plt.axhline(ks_value, color='green', linestyle='--')
    plt.axhline(ksds.loc[ksds.ks.idxmax(), 'cumsum_good'], color='blue', linestyle='--')
    plt.axhline(ksds.loc[ksds.ks.idxmax(),'cumsum_bad'], color='red', linestyle='--')
    plt.legend()
    plt.title('KS=%s ' %np.round(ks_value, 4) +  
                'at Pop=%s' %np.round(ks_pop, 4), fontsize=15)

    return ksds

模型评价准则还有很多，不过有的只应用于特殊场景，比如Gini、Left、Gain、PSI等，有的并不常用，比如NDCG、MAP等。这里不再介绍

4 参考文献

《机器学习》周志华
评价线性模型，R平方是个好裁判吗？ | 协和八
衡量线性回归法的指标：MSE, RMSE和MAE
回归问题的性能度量标准
为什么有些 Kaggle competition 用 Root Mean Squared Logarithmic Error (RMSLE) 评估算法？
多元线性回归建模如何确定选择哪些解释变量？
sklearn.metrics.log_loss
Terminology and derivations from a confusion matrix
Precision and recall
AUC计算方法总结
a Better Measure than Accuracy in Comparing Learning Algorithms
Evaluation measures (information retrieval)
P-R曲线及与ROC曲线区别
深入理解KS
Python绘制KS曲线

你可能感兴趣的:(模型评价准则,AUC,MSE,KS,R方,python,机器学习)

用mysql作excel数据分析_怎样用 Excel 做数据分析？一只帅鸟
基本Excel快捷键【最好用的复制命令】Ctrl+R向右复制Ctrl+D向下复制【选择格式粘贴】Ctrl+Alt+V【求和功能】Alt+=然后按回车键【格式调整】Ctrl+Shift+7加上外边框Ctrl+Shift+-去掉边框Ctrl+Shift+5改成%数值格式【视图调整及编辑】Ctrl+Shift+=插入行Ctrl+-删除【终极】开始工具栏所有的命令都可以通过Alt-H-调用(如下图键入相应
Docker 容器间通信：Link 与自定义网络
Docker容器间通信：Link与自定义网络关键词：Docker容器通信、容器网络模型、DockerLink、自定义网络、Bridge网络、Overlay网络、网络驱动摘要：本文深入解析Docker容器间通信的两种核心方式——传统Link机制与现代自定义网络方案。通过对比分析两者的技术原理、实现方式、适用场景及最佳实践，帮助读者理解Docker网络架构的演进逻辑。文章从容器网络基础概念出发，详细阐
Coze智能体开发：什么是提示词及其编写建议王国平 Coze AI Agent智能体开发人工智能大数据语言模型 python 开发语言
提示词(Prompt)是AIAgent的核心，它决定了模型生成结果的质量和准确性。提示词不仅影响输出，还决定了模型对输入信息的理解深度。通过科学的提示词设计，开发者能高效引导模型生成符合预期的高质量输出。基础概念提示词提示词（Prompt）是用户在与模型或智能系统互动时输入的指令或文本，用来引导系统生成回应或执行特定任务。它可以是问题、命令或描述性文字，帮助系统理解用户的意图并提供相应的结果。提示
Coze智能体开发：如何批量生成和处理图片王国平 Coze AI Agent智能体开发语言模型人工智能开发语言智能体 Agent
在绘本制作、图片后期制作等场景中，往往需要使用模型来批量生成和处理图片。扣子提供了多个图像处理类节点，支持图像生成、添加水印、画质优化等多种常见的图片处理方式，你可以在批处理节点中嵌套图像生成等图像处理节点，实现图片的批量操作。本文档以绘本制作工作流为例，演示如何通过批处理节点和图像节点实现图像的批量生成和批量处理。效果演示通过绘本制作工作流，你可以批量生成类似以下风格的图片。搭建过程中你也可以根
LangChain智能体开发：如何流式调用工具王国平 LangChain智能体开发 langchain 语言模型 python 人工智能开发语言
当在流式上下文中调用工具时，消息块将通过.tool_call_chunks属性填充为工具调用块的对象列表。一个ToolCallChunk包含工具name、args和id的可选字符串字段，并包含一个可选的整数字段index，可用于将块连接在一起。字段是可选的因为工具调用的部分内容可能会跨不同的块进行流式传输（例如，一个包含参数子字符串的块可能对工具名称和id的值为null）。因为消息块继承自其父消息
Django5.1（91）—— 如何删除一个 Django 应用小天的铁蛋儿 django Python django python 后端
如何删除一个Django应用Django提供了将一组功能组织成名为应用程序的Python包的能力。当需求发生变化时，应用程序可能会变得过时或不再需要。以下步骤将帮助你安全地删除一个应用程序。删除所有与该应用程序相关的引用（导入、外键等）。从相应的models.py文件中删除所有模型。通过运行makemigrations来创建相关的迁移。这一步会生成一个迁移，用于删除已删除模型的表，以及与这些模型相
【python实用小脚本-125】基于 Python 的 Gmail 邮件发送工具：实现高效邮件自动化 Kyln.Wu Python python 自动化网络
引言在现代办公和开发环境中，邮件通信是一种重要的沟通方式。自动化发送邮件可以大大提高工作效率，例如发送通知、报告或文件。本文将介绍一个基于Python的Gmail邮件发送工具，它能够通过Gmail的SMTP服务器发送邮件，并支持附件功能。该工具主要利用了Python的smtplib库和email库，结合了邮件构建和网络通信技术，为用户提供了一个简单易用的邮件发送解决方案。总体功能概述Gmail邮件
Python之聚合函数 _AndyLau 手把手学python python
Python聚合函数文章目录Python聚合函数聚合函数使用多个聚合函数结合`annotate`和`values`进行分组聚合注意事项F表达式和Q表达式F表达式Q表达式注意事项视图HTML中的表单概述Django中表单概述ModelForm关键点使用示例创建ModelForm在视图中使用ModelForm模板总结Cookie和SessionDjango中的Cookie操作Django中的Sessi
Python报错信息归类以及处理
ʕᵔᴥᵔʔPython的错误和异常可以分为多个类别，了解这些类别有助于更好地调试和处理错误。以下是Python中常见报错信息的归类和分析。1.语法错误(SyntaxError)在代码执行前被解析器捕获的错误，通常是由于代码不符合Python语法规则。常见子类：IndentationError：缩进错误TabError：Tab和空格混用示例：#缺少冒号ifTrueprint("Hello")#Syn
python 获取mac地址 Take_a_chestnut python 小工具 python 开发语言
python获取mac地址方法一：使用socket库使用了socket库中的ioctl函数和fcntl模块来获取MAC地址importsocketimportfcntlimportstructdefget_mac_address():interface='eth0'#替换为你的网络接口名称，例如eth0或en0sock=socket.socket(socket.AF_INET,socket.SOC
搜索架构中的NLP技术：提升搜索准确性的关键搜索引擎技术架构自然语言处理人工智能 ai
搜索架构中的NLP技术：提升搜索准确性的关键关键词：搜索架构、NLP技术、查询理解、语义搜索、相关性排序、意图识别、BERT模型摘要：本文将深入探讨现代搜索架构中NLP技术的核心应用，从查询理解到结果排序的全流程，揭示NLP如何提升搜索准确性。我们将通过生动的比喻解释复杂概念，分析关键技术原理，并提供实际代码示例，帮助读者全面理解搜索系统背后的NLP魔法。背景介绍目的和范围本文旨在解析NLP技术在
LRU缓存算法在搜索引擎中的应用数据结构与算法学习缓存算法搜索引擎 ai
LRU缓存算法在搜索引擎中的应用关键词：LRU算法、缓存淘汰、搜索引擎、哈希表、双向链表、性能优化、访问频率摘要：本文深入探讨了LRU(最近最少使用)缓存算法在搜索引擎中的关键应用。我们将从基本概念出发，通过生活化的比喻解释LRU的工作原理，分析其在搜索引擎架构中的具体实现方式，并通过Python代码示例展示如何构建一个高效的LRU缓存系统。文章还将讨论LRU算法的数学建模、实际应用场景以及未来发
React.js在前端移动端开发中的应用大厂前端小白菜前端 react.js 前端框架 ai
React.js在前端移动端开发中的应用关键词：React.js、移动端开发、跨平台、组件化、性能优化、ReactNative、PWA摘要：本文将深入探讨React.js在移动端开发中的应用场景和技术实现。从React的核心特性出发，分析其在移动端的优势，详细介绍ReactNative的工作原理，并通过实际案例展示如何构建高性能的移动应用。文章还将对比不同移动端开发方案，提供性能优化建议，并展望R
60天python训练计划----day59
在之前的学习中，我们层层递进的介绍了时序模型的发展，从AR到MA到ARMA，再到ARIMA。本质就是把数据处理的操作和模型结合在一起了，实际上昨天提到的季节性差分也可以合并到模型中，让流程变得更加统一。季节性差分用S来表示，所以这个模型叫做SARIMA模型一、SARIMA模型SARIMA(SeasonalAutoRegressiveIntegratedMovingAverage)是标准ARIMA模
【python实用小脚本-128】基于 Python 的 Hacker News 爬虫工具：自动化抓取新闻数据 Kyln.Wu Python python 爬虫自动化
引言在技术社区中，HackerNews是一个汇聚最新技术文章和讨论的热门平台。许多开发者和技术爱好者依赖它来获取行业动态和前沿资讯。然而，手动浏览和筛选这些文章可能耗时且低效。本文将介绍一个基于Python的HackerNews爬虫工具，它能够自动化地从HackerNews网站抓取最新文章，并将结果保存为CSV文件。该工具主要利用了Python的requests、BeautifulSoup和csv
python系列之：使用md5和sha256完成签名认证，调用接口快乐骑行^_^ 前端和后端开发 python系列使用md5和sha256 完成签名认证调用接口
python系列之：使用md5和sha256完成签名认证，调用接口MD5签名和sha256签名认证md5认证代码sha256认证代码拼接签名生成签名拼接url调用接口MD5签名和sha256签名认证MD5签名认证算法特性：生成128位(16字节)的哈希值计算速度快已被证明存在碰撞漏洞(不同输入可能产生相同输出)签名认证流程：发送方对原始数据计算MD5哈希值将哈希值附加到数据中发送接收方重新计算接收
Kafka系列之：不删除Kafka Topic，清理Kafka Topic中的数据快乐骑行^_^ Kafka Kafka系列不删除Kafka Topic 清理Kafka Topic数据
Kafka系列之：不删除KafkaTopic，清理KafkaTopic中的数据一、需求二、Java删除Topic中数据三、python删除Topic中数据一、需求需要清理topic中的数据但是不能通过删除topic删除数据，则采取基于topic的offset删除topic中的数据二、Java删除Topic中数据HashMapdeleteRecords=newHashMap<>();这一行创建了一个
python模拟行星运动_动态模拟运行太阳系的行星运转
在地理学科中，都要学习认识太阳系的知识，对于天体的运动，没有动态演示的话，学生们只能凭空想象，无法观看到九大行星之间到底是如何运转的。几何画板作为人教版指定教育软件，被老师们广泛用于教学中，不仅仅可以用来演示几何图形，还可以应用在地理学科中演示天体运动情况，下面就给大家介绍利用几何画板制作的动态模拟运行太阳系的九大行星课件。几何画板动态模拟运行太阳系的九大行星课件样图：几何画板课件模板——动态模拟
如何用 Python 实现模拟木星的运行轨道、自转、公转 wh3933 python 开发语言
用Python来模拟木星的轨道运行、自转和公转是一个非常有趣且富有挑战性的项目。这需要结合天文学知识和编程技巧。我们将使用VPython这个库来实现这个模拟。VPython非常适合创建简单的3D物理场景和动画，它的语法直观，能够让我们快速地将物理概念转化为可视化的三维模型。在开始之前，请确保您已经安装了VPython。如果尚未安装，可以通过pip进行安装：pipinstallvpython模拟思路
python输出小郭爱吃糖 python 开发语言
Python基础1.1基本的输出函数内置的函数print语法：print(输出内容)print()函数完整的语法格式print(value,……,sep="",end="\n",file=None)示例：a=50b=100print(90)print(a)print(a*b)print('HelloWorld')print("HelloWorld")print("""HelloWorld""")1
ASP.NET Web Pages - 教程 samFuB asp.net 前端后端
ASP.NET是一个使用HTML、CSS、JavaScript和服务器脚本创建网页和网站的开发框架。ASP.NET支持三种不同的开发模式：WebPages（Web页面）、MVC（ModelViewController模型-视图-控制器）、WebForms（Web窗体）：本教程介绍WebPages。WebPagesMVCWebForms从何入手？多数开发人员学习一个新技术，是从查看运行实例开始的。通
Python 中 Pendulum 库的详细使用：更精确的日期时间处理数据知道 python3案例和总结 python 开发语言 Pendulum库
文章目录一、Pendulum概述1.1Pendulum介绍1.2安装Pendulum1.3注意事项二、基本使用2.1创建Pendulum对象2.2格式化输出2.3时间运算三、高级使用3.1时区处理3.2时间间隔3.3日期比较四、实际应用案例4.1日志时间处理4.2会议时间提醒4.3工作日计算4.4Pendulum与datetime互操作一、Pendulum概述1.1Pendulum介绍Pendul
python库 arrow 库的各种案例的使用详解（更人性化的日期时间处理）数据知道 python3案例和总结 python 开发语言时间处理
文章目录一、arrow概述1.1arrow介绍1.2安装arrow1.3注意事项二、基本使用2.1创建Arrow对象2.2格式化输出2.3时间运算三、高级功能3.1时区处理3.2时间范围3.3时间间隔四、实际应用案例4.1日志时间处理4.2会议时间提醒4.3国际化时间显示5.Arrow与datetime互操作一、arrow概述1.1arrow介绍Arrow是一个Python库，提供了比标准库dat
Kafka 小熊哥^--^ kafka 分布式
一、什么是Kafka？Kafka的主要用途？Kafka是一个分布式流处理平台，是Apache的一个顶级项目，它被设计用于高吞吐量，分布式、持久性的数据流处理。Kafka实现了一套非常高效的一种发布订阅模型，应用场景非常广泛，比如日志聚合（收集日志）、数据流处理、数据仓库集成（传输数据到数据仓库）、应用程序集成（作为消息中间件来实现异步通信）、流媒体处理（列如实时监控，事件驱动的应用程序）二、top
人工智能动画展示人类的特征 AGI大模型与大数据研究院 AI大模型应用开发实战 java python javascript kotlin golang 架构人工智能
人工智能，动画，人类特征，情感识别，行为模拟，机器学习，深度学习，自然语言处理1.背景介绍人工智能（AI）技术近年来发展迅速，已渗透到生活的方方面面。从智能语音助手到自动驾驶汽车，AI正在改变着我们的世界。然而，尽管AI技术取得了令人瞩目的成就，但它仍然难以完全模拟人类的复杂行为和特征。人类的特征是多方面的，包括情感、认知、社交和创造力等。这些特征是人类区别于其他生物的重要标志，也是人类社会文明发
python 魔法方法常用_Python魔法方法指南 weixin_39603505 python 魔法方法常用
有很多人说学习Python基础之后不知道干什么，不管你是从w3c还是从廖雪峰的教程学习的，这些教程都有一个特点：只能引你快速入门，但是有关于Python的很多基础内容这些教程中都没介绍，而这些你没学习的内容会让你在后期做项目的时候非常困惑。就比如下面这篇我要给大家推荐的文章所涉及的内容，不妨你用一天时间耐心看完，把代码都敲上一遍。--11：33更新--很多人想要我的一份学习笔记，所以在魔法指南之前
排查 DeepSeek API HandshakeFailure 错误的全景式指南
在Chatwise中调用DeepSeek模型时，reqwest抛出的AlertReceived(HandshakeFailure)通常意味着TLS握手阶段被服务器中止。本文透视DeepSeekAPI的TLS要求、Rust网络栈的实现细节以及常见的环境陷阱，借助可直接运行的代码与真实案例，给出一条可复制的排障路线。1 错误现象与日志解码Errorreqwest::Error{kind:Request
无法删除或者修改注册表权限不够，如何修改注册表的权限番知了注册表 Windows 权限更改设置 Windows权限
目录1如何找到注册表项（详细步骤）方法步骤（图文步骤）此方法适用于你遇到的以下问题：2为什么这里不是文件位置？3执行修改时务必谨慎如何找到注册表项（详细步骤）方法步骤（图文步骤）打开注册表编辑器按键盘组合键Win+R输入命令：regedit点击确定，打开注册表编辑器。定位你需要修改的注册表项，如：注册表左侧面板树状结构中定位到路径：HKEY_LOCAL_MACHINE\SOFTWARE\Micro
Python 基础入门第十三讲魔法方法补充、单例模式、reflect反射（getattr、hasattr、__import__()）
第十三讲一、特殊成员和魔法方法在之前的课程中已经学习过如__init__、__str__、__dir__等魔法方法，现补充一些常用的魔法方法：1.__doc__魔法方法该魔法方法的作用为打印类的说明文档，举个例子：print(str().__doc__)###输出结果为：str(object='')->strstr(bytes_or_buffer[,encoding[,errors]])->str
python魔法方法长文详解千翻娃儿 python原生基础 python
python魔法方法详解1.什么是魔法方法魔法方式（Magicmethods）是python的内置函数，一般以双下划线开头和结尾，比如__add__,__new__等。每个魔法方法都有对应的一个内置函数或者运算符。当我们个对象使用这些方法时，相当于对这个对象的这类方法进行重写（如运算符重载）。魔法方法的存在是对类或函数进行了提炼，供python解释器直接调用。当使用len(obj)时，实际上调用的
Java开发中，spring mvc 的线程怎么调用？小麦麦子 spring mvc
今天逛知乎，看到最近很多人都在问spring mvc 的线程http://www.maiziedu.com/course/java/ 的启动问题，觉得挺有意思的，那哥们儿问的也听仔细，下面的回答也很详尽，分享出来，希望遇对遇到类似问题的Java开发程序猿有所帮助。问题：在用spring mvc架构的网站上，设一线程在虚拟机启动时运行，线程里有一全局
maven依赖范围 bitcarter maven
1.test 测试的时候才会依赖，编译和打包不依赖，如junit不被打包 2.compile 只有编译和打包时才会依赖 3.provided 编译和测试的时候依赖，打包不依赖，如：tomcat的一些公用jar包 4.runtime 运行时依赖，编译不依赖 5.默认compile 依赖范围compile是支持传递的，test不支持传递 1.传递的意思是项目A，引用
Jaxb org.xml.sax.saxparseexception : premature end of file darrenzhu xml premature JAXB
如果在使用JAXB把xml文件unmarshal成vo(XSD自动生成的vo)时碰到如下错误： org.xml.sax.saxparseexception : premature end of file 很有可能时你直接读取文件为inputstream，然后将inputstream作为构建unmarshal需要的source参数。InputSource inputSource = new In
CSS Specificity 周凡杨 html 权重 Specificity css
有时候对于页面元素设置了样式，可为什么页面的显示没有匹配上呢？ because specificity CSS 的选择符是有权重的，当不同的选择符的样式设置有冲突时，浏览器会采用权重高的选择符设置的样式。规则： HTML标签的权重是1 Class 的权重是10 Id 的权重是100
java与servlet g21121 servlet
servlet 搞java web开发的人一定不会陌生，而且大家还会时常用到它。下面是java官方网站上对servlet的介绍： java官网对于servlet的解释写道 Java Servlet Technology Overview Servlets are the Java platform technology of choice for extending and enha
eclipse中安装maven插件 510888780 eclipse maven
1.首先去官网下载 Maven： http://www.apache.org/dyn/closer.cgi/maven/binaries/apache-maven-3.2.3-bin.tar.gz 下载完成之后将其解压，我将解压后的文件夹：apache-maven-3.2.3，并将它放在 D:\tools目录下，即 maven 最终的路径是：D:\tools\apache-mave
jpa@OneToOne关联关系布衣凌宇 jpa
Nruser里的pruserid关联到Pruser的主键id，实现对一个表的增删改，另一个表的数据随之增删改。 Nruser实体类 //***************************************************************** @Entity @Table(name="nruser") @DynamicInsert @Dynam
我的spring学习笔记11-Spring中关于声明式事务的配置 aijuans spring 事务配置
这两天学到事务管理这一块，结合到之前的terasoluna框架，觉得书本上讲的还是简单阿。我就把我从书本上学到的再结合实际的项目以及网上看到的一些内容，对声明式事务管理做个整理吧。我看得Spring in Action第二版中只提到了用TransactionProxyFactoryBean和<tx:advice/>,定义注释驱动这三种，我承认后两种的内容很好，很强大。但是实际的项目当中
java 动态代理简单实现 antlove java handler proxy dynamic service
dynamicproxy.service.HelloService package dynamicproxy.service; public interface HelloService { public void sayHello(); } dynamicproxy.service.impl.HelloServiceImpl package dynamicp
JDBC连接数据库百合不是茶 JDBC编程 JAVA操作oracle数据库
如果我们要想连接oracle公司的数据库，就要首先下载oralce公司的驱动程序，将这个驱动程序的jar包导入到我们工程中; JDBC链接数据库的代码和固定写法; 1,加载oracle数据库的驱动; &nb
单例模式中的多线程分析 bijian1013 java thread 多线程 java多线程
谈到单例模式，我们立马会想到饿汉式和懒汉式加载，所谓饿汉式就是在创建类时就创建好了实例，懒汉式在获取实例时才去创建实例，即延迟加载。饿汉式： package com.bijian.study; public class Singleton { private Singleton() { } // 注意这是private 只供内部调用 private static
javascript读取和修改原型特别需要注意原型的读写不具有对等性 bijian1013 JavaScript prototype
对于从原型对象继承而来的成员，其读和写具有内在的不对等性。比如有一个对象A，假设它的原型对象是B，B的原型对象是null。如果我们需要读取A对象的name属性值，那么JS会优先在A中查找，如果找到了name属性那么就返回；如果A中没有name属性，那么就到原型B中查找name，如果找到了就返回；如果原型B中也没有
【持久化框架MyBatis3六】MyBatis3集成第三方DataSource bit1129 dataSource
MyBatis内置了数据源的支持，如： <environments default="development"> <environment id="development"> <transactionManager type="JDBC" /> <data
我程序中用到的urldecode和base64decode,MD5 bitcarter c MD5 base64decode urldecode
这里是base64decode和urldecode，Md5在附件中。因为我是在后台所以需要解码： string Base64Decode(const char* Data,int DataByte,int& OutByte) { //解码表 const char DecodeTable[] = { 0, 0, 0, 0, 0, 0
腾讯资深运维专家周小军：QQ与微信架构的惊天秘密 ronin47
社交领域一直是互联网创业的大热门，从PC到移动端，从OICQ、MSN到QQ。到了移动互联网时代，社交领域应用开始彻底爆发，直奔黄金期。腾讯在过去几年里，社交平台更是火到爆，QQ和微信坐拥几亿的粉丝，QQ空间和朋友圈各种刷屏，写心得，晒照片，秀视频，那么谁来为企鹅保驾护航呢？支撑QQ和微信海量数据背后的架构又有哪些惊天内幕呢？本期大讲堂的内容来自今年2月份ChinaUnix对腾讯社交网络运营服务中心
java-69-旋转数组的最小元素。把一个数组最开始的若干个元素搬到数组的末尾，我们称之为数组的旋转。输入一个排好序的数组的一个旋转，输出旋转数组的最小元素 bylijinnan java
public class MinOfShiftedArray { /** * Q69 旋转数组的最小元素 * 把一个数组最开始的若干个元素搬到数组的末尾，我们称之为数组的旋转。输入一个排好序的数组的一个旋转，输出旋转数组的最小元素。 * 例如数组{3, 4, 5, 1, 2}为{1, 2, 3, 4, 5}的一个旋转，该数组的最小值为1。 */ publ
看博客，应该是有方向的 Cb123456 反省看博客
看博客，应该是有方向的: 我现在就复习以前的，在补补以前不会的，现在还不会的，同时完善完善项目，也看看别人的博客. 我刚突然想到的: 1.应该看计算机组成原理，数据结构，一些算法，还有关于android,java的。 2.对于我，也快大四了，看一些职业规划的，以及一些学习的经验，看看别人的工作总结的. 为什么要写
[开源与商业]做开源项目的人生活上一定要朴素,尽量减少对官方和商业体系的依赖 comsci 开源项目
为什么这样说呢？因为科学和技术的发展有时候需要一个平缓和长期的积累过程，但是行政和商业体系本身充满各种不稳定性和不确定性，如果你希望长期从事某个科研项目，但是却又必须依赖于某种行政和商业体系，那其中的过程必定充满各种风险。。。所以，为避免这种不确定性风险，我
一个 sql优化（[精华] 一个查询优化的分析调整全过程！很值得一看） cwqcwqmax9 sql
见 http://www.itpub.net/forum.php?mod=viewthread&tid=239011 Web翻页优化实例提交时间: 2004-6-18 15:37:49 回复发消息环境： Linux ve
Hibernat and Ibatis dashuaifu Hibernate ibatis
Hibernate VS iBATIS 简介 Hibernate 是当前最流行的O/R mapping框架，当前版本是3.05。它出身于sf.net，现在已经成为Jboss的一部分了 iBATIS 是另外一种优秀的O/R mapping框架，当前版本是2.0。目前属于apache的一个子项目了。相对Hibernate“O/R”而言，iBATIS 是一种“Sql Mappi
备份MYSQL脚本 dcj3sjt126com mysql
#!/bin/sh # this shell to backup mysql #[email protected] (QQ:1413161683 DuChengJiu) _dbDir=/var/lib/mysql/ _today=`date +%w` _bakDir=/usr/backup/$_today [ ! -d $_bakDir ] && mkdir -p
iOS第三方开源库的吐槽和备忘 dcj3sjt126com ios
转自 ibireme的博客做iOS开发总会接触到一些第三方库，这里整理一下，做一些吐槽。目前比较活跃的社区仍旧是Github，除此以外也有一些不错的库散落在Google Code、SourceForge等地方。由于Github社区太过主流，这里主要介绍一下Github里面流行的iOS库。首先整理了一份 Github上排名靠
html wlwmanifest.xml eoems html xml
所谓优化wp_head()就是把从wp_head中移除不需要元素，同时也可以加快速度。步骤：加入到function.php remove_action('wp_head', 'wp_generator'); //wp-generator移除wordpress的版本号，本身blog的版本号没什么意义，但是如果让恶意玩家看到，可能会用官网公布的漏洞攻击blog remov
浅谈Java定时器发展 hacksin java 并发 timer 定时器
java在jdk1.3中推出了定时器类Timer,而后在jdk1.5后由Dou Lea从新开发出了支持多线程的ScheduleThreadPoolExecutor，从后者的表现来看，可以考虑完全替代Timer了。 Timer与ScheduleThreadPoolExecutor对比： 1. Timer始于jdk1.3,其原理是利用一个TimerTask数组当作队列
移动端页面侧边导航滑入效果 ini jquery Web html5 css javascirpt
效果体验：http://hovertree.com/texiao/mobile/2.htm可以使用移动设备浏览器查看效果。效果使用到jquery-2.1.4.min.js，该版本的jQuery库是用于支持HTML5的浏览器上，不再兼容IE8以前的浏览器，现在移动端浏览器一般都支持HTML5，所以使用该jQuery没问题。HTML文件代码： <!DOCTYPE html> <h
AspectJ+Javasist记录日志 kane_xie aspectj javasist
在项目中碰到这样一个需求，对一个服务类的每一个方法，在方法开始和结束的时候分别记录一条日志，内容包括方法名，参数名+参数值以及方法执行的时间。 @Override public String get(String key) { // long start = System.currentTimeMillis(); // System.out.println("Be
redis学习笔记 MJC410621 redis NoSQL
1)nosql数据库主要由以下特点：非关系型的、分布式的、开源的、水平可扩展的。 1，处理超大量的数据 2，运行在便宜的PC服务器集群上， 3，击碎了性能瓶颈。 1)对数据高并发读写。 2)对海量数据的高效率存储和访问。 3)对数据的高扩展性和高可用性。 redis支持的类型： Sring 类型 set name lijie get name lijie set na
使用redis实现分布式锁 qifeifei
在多节点的系统中，如何实现分布式锁机制，其中用redis来实现是很好的方法之一，我们先来看一下jedis包中，有个类名BinaryJedis,它有个方法如下： public Long setnx(final byte[] key, final byte[] value) { checkIsInMulti(); client.setnx(key, value); ret
BI并非万能，中层业务管理报表要另辟蹊径张老师的菜大数据 BI 商业智能信息化
BI是商业智能的缩写，是可以帮助企业做出明智的业务经营决策的工具，其数据来源于各个业务系统，如ERP、CRM、SCM、进销存、HER、OA等。 BI系统不同于传统的管理信息系统，他号称是一个整体应用的解决方案，是融入管理思想的强大系统：有着系统整体的设计思想，支持对所有
安装rvm后出现rvm not a function 或者ruby -v后提示没安装ruby的问题 wudixiaotie function
1.在~/.bashrc最后加入 [[ -s "$HOME/.rvm/scripts/rvm" ]] && source "$HOME/.rvm/scripts/rvm" 2.重新启动terminal输入： rvm use ruby-2.2.1 --default 把当前安装的ruby版本设为默