Joyliness

【杂纪】从ROC曲线到AUC值，再到Mann–Whitney U统计量

统计检验中的两类错误

在进行假设检验时，分别提出原假设（Null Hypothesis）和备择假设（Alternative Hypothesis），检验结果可能出现的两类错误：

原假设实际上是正确的，而检验结果却拒绝原假设，称为第一类/第一型错误（Type I error）、弃真错误
原假设实际上是错误的，而检验结果却接受原假设，称为第二类/第二型错误（Type II error）、取伪错误

ROC Curve

起源与发展

ROC曲线（Receiver Operating Characteristic Curve），又称为感受性曲线（Sensitivity Curve），是一种坐标图式的分析工具。它首先是由二战中的电子工程师和雷达工程师发明的，用来侦测战场上的敌军载具（飞机、船舰），即信号检测理论。之后很快就被引入了心理学来进行信号的知觉检测。数十年来，ROC分析被用于医学、无线电、生物学、犯罪心理学领域中，最近在机器学习和数据挖掘领域也得到了很好的发展。
用途

ROC曲线用于衡量二元分类模型的优劣，也就是说，它所衡量的模型，一定只有两个判断结果（非黑即白）：阳性/阴性、得病/不得病、违约/不违约、敌军/非敌军、正例/负例…等，通常将这两种结果分别记为1和0。

例如，有一个模型，可以用来判断人体是否得病。现将五个身体状况分别为健康（0）、得病（1）、健康（0）、健康（0）、得病（1）的样本的各项生理指标输入该模型，并假设模型输出的五个人的得病概率分别为0.30，0.60，0.55，0.40，0.50。注意，在做ROC曲线分析时，输入模型的待判别样本全部是已知真值的，如上例的样本，已知其是健康、得病、健康、健康、得病。

那么，得到这五个概率后，模型又是怎样进一步判别他们是否得病的？首先抛开我们传统的0.50认知，这里并不是概率大于0.50就认为该样本得病了。因为模型准确性本身就是待验证的，其得到的预测结果当然也不是百分之百正确，这时候就需要医生结合从业经验，人为给定一个阈值（threshold），也称为cut-off point。只有当样本的预测概率大于阈值时，才将该样本归为得病。

显然，如果阈值过低（判为得病的条件宽松，得病门槛低），就容易将健康样本误判为得病；如果阈值过高（判为得病的条件严谨，得病门槛高），就容易漏掉真正的得病样本，使一部分得病样本误判为健康。为了帮助理解，我们将分类模型视为一个筛网，阈值高低视为筛网孔的尺寸，健康样本为大沙粒，得病样本为小沙粒，则通过筛网的，应该是得病样本；而留在筛网上的，应该是健康样本。那么：
1. 阈值过低 = 判为得病的条件宽松 = 筛网孔过大 = 大沙粒（健康样本）也不小心通过筛网（误判为得病）
2. 阈值过高 = 判为得病的条件严谨 = 筛网孔过小 = 小沙粒（得病样本）过不去，滞留在筛网（误判为健康）
由此可见，只有选定阈值以后，才能把模型预测概率转化为具体的类别，而不同的阈值对模型的判别效果有很大的影响。阈值虽然不能穷举（其取值从0-1），但取不同的阈值，对模型分类结果的影响却是可以罗列出来的。结合上面的例子，可以设定如下6个范围的阈值，并得到如下6种不同的分类结果。可以看到，阈值过低时，模型将所有样本都判为得病；阈值过高时，模型将所有样本都判为健康：

阈值t的范围	预测结果
0 ≤ t < 0.30	（得病，得病，得病，得病，得病）记为（1，1，1，1，1）
0.30 ≤ t < 0.40	（健康，得病，得病，得病，得病）记为（0，1，1，1，1）
0.40 ≤ t < 0.50	（健康，得病，得病，健康，得病）记为（0，1，1，0，1）
0.50 ≤ t < 0.55	（健康，得病，得病，健康，健康）记为（0，1，1，0，0）
0.55 ≤ t < 0.60	（健康，得病，健康，健康，健康）记为（0，1，0，0，0）
t ≥ 0.60	（健康，健康，健康，健康，健康）记为（0，0，0，0，0）

定义

以上通过实例，对ROC曲线所衡量的模型进行了简单解释。回到ROC曲线本身，既然是呈现在坐标图上的曲线，则一定有横、纵坐标两个变量。而且ROC曲线是衡量模型优劣，必然要对模型的分类结果进行统计分析，因此RCO曲线分析的基础，就是上述表格中的数据。
显然，6个分类结果对比真实情况，各有差异。这时候，我们最想了解的应该是：该模型判别的正确率有多高？事实上，判断结果一定是如下情况之一：
1. 得病样本被正确判断为得病样本（真阳性TP）
2. 得病样本被误判为健康样本(伪阴性FN)
3. 健康样本被正确判断为健康样本(真阴性TN)
4. 健康样本被误判为得病样本(伪阳性FP)
在医学统计中，假设检验的原假设是样本健康，备择假设是样本得病。那么，伪阳性FP的情况是：明明健康，却判其得病，是对得病的错误肯定，拒绝了正确的原假设，属于弃真错误。
而伪阴性FN的情况是：明明得病，却判其健康，是对得病的错误否定，接受了错误的原假设，属于取伪错误。
从而可以引入一系列常见的性能指标：
1. TPR（True Positive Rate） = TPTP+FN = TPP ，称为真阳性率
  又可称命中率（Hit Rate） 、敏感度（Sensitivity）
2. FPR（False Positive Rate） = FPFP+TN = FPN ，称为伪阳性率
  又可称错误命中率/假警报率（False Alarm Rate）
3. TNR（True Negative Rate） = TNFP+TN = TNN = 1−FPR ，称为真阴性率
  又可称特异度（Specificity）
4. Recall = TPR = TPTP+FN = TPP ，称为召回率
5. Precision = TPTP+FP ，称为精确率
6. ACC（Accuracy） = TP+TNP+N ，称为准确度
7. F-measure = 21Precision+1Recall = 2TP2TP+FP+FN ，称为F1值/F1评分
所以，ROC曲线是以FPR为横坐标、以TPR为纵坐标所形成的曲线，其坐标点为（FPR，TPR）。注意，工程上一般不采用FPR、TPR这两个术语，而是分别用1-Specificity、Sensitivity来代替，则ROC曲线上的坐标点为（1-Specificity，Sensitivity）。依旧沿用上述例子，模型根据不同的阈值，每得到一个预测结果，就可以与真值（0，1，0，0，1）做一次对比，并计算出一个坐标点（FPR，TPR）。因此，上述例子的ROC曲线有6个坐标点，手动计算并用R语言作图验证如下：

阈值t的范围	预测结果	指标值	（FPR，TPR）
0 ≤ t < 0.30	（1，1，1，1，1）	FP = 3，TN = 0，TP = 2，FN = 0	（1，1）
0.30 ≤ t < 0.40	（0，1，1，1，1）	FP = 2，TN = 1，TP = 2，FN = 0	（ 23 ，1）
0.40 ≤ t < 0.50	（0，1，1，0，1）	FP = 1，TN = 2，TP = 2，FN = 0	（ 13 ，1）
0.50 ≤ t < 0.55	（0，1，1，0，0）	FP = 1，TN = 2，TP = 1，FN = 1	（ 13 ， 12 ）
0.55 ≤ t < 0.60	（0，1，0，0，0）	FP = 0，TN = 3，TP = 1，FN = 1	（0， 12 ）
t ≥ 0.60	（0，0，0，0，0）	FP = 0，TN = 3，TP = 0，FN = 2	（0，0）

> library(ROCR)
> predictions <- c(0.30, 0.60, 0.55, 0.40, 0.50)
> labels <- c(0, 1, 0, 0, 1)
> pred <- prediction(predictions = predictions, labels = labels)
> # 参数predictions是模型的预测概率，参数labels是样本的真实类别
> pred
An object of class "prediction"
Slot "predictions":
[[1]]
[1] 0.30 0.60 0.55 0.40 0.50

Slot "labels":
[[1]]
[1] 0 1 0 0 1
Levels: 0 < 1

Slot "cutoffs":
[[1]]
[1]  Inf 0.60 0.55 0.50 0.40 0.30

Slot "fp":
[[1]]
[1] 0 0 1 1 2 3

Slot "tp":
[[1]]
[1] 0 1 1 2 2 2

Slot "tn":
[[1]]
[1] 3 3 2 2 1 0

Slot "fn":
[[1]]
[1] 2 1 1 0 0 0

Slot "n.pos":
[[1]]
[1] 2

Slot "n.neg":
[[1]]
[1] 3

Slot "n.pos.pred":
[[1]]
[1] 0 1 2 3 4 5

Slot "n.neg.pred":
[[1]]
[1] 5 4 3 2 1 0

> perf <- performance(prediction.obj = pred, measure = "tpr", x.measure = "fpr")
> # 参数prediction.obj是正在做分类预测的样本对象
> # 参数measure指定第一种性能测量方法，参数x.measure指定第二种性能测量方法
> perf
An object of class "performance"
Slot "x.name":
[1] "False positive rate"

Slot "y.name":
[1] "True positive rate"

Slot "alpha.name":
[1] "Cutoff"

Slot "x.values":
[[1]]
[1] 0.0000000 0.0000000 0.3333333 0.3333333 0.6666667 1.0000000


Slot "y.values":
[[1]]
[1] 0.0 0.5 0.5 1.0 1.0 1.0


Slot "alpha.values":
[[1]]
[1]  Inf 0.60 0.55 0.50 0.40 0.30

> plot(perf, col = "red", lty = 3, lwd = 3, cex.lab = 1, cex.axis = 1, 
       cex.main = 1.5, main = "ROC Curve")
> # 画出ROC曲线
> points(unlist([email protected]), unlist([email protected]), pch = 19, col = "blue")
> # 标上坐标点

【杂纪】从ROC曲线到AUC值，再到Mann–Whitney U统计量_第2张图片

ROC空间与Baseline

考察ROC空间的四个点：（1，1），（0，0），（0，1），（1，0）。
在（1，1）处，FPR = 1，TPR = 1。说明TN = 0，FN = 0。分类器将所有样本都判为阳性/得病/1。
在（0，0）处，FPR = 0，TPR = 0。说明FP = 0，TP = 0，分类器将所有样本都判为阴性/健康/0。
在（0，1）处，FPR = 0，TPR = 1。说明FP = 0，FN = 0，分类器将所有样本都分对了（最佳）。
在（1，0）处，FPR = 1，TPR = 0。说明TN = 0，TP = 0，分类器将所有样本都分错了（最差）。
最佳分类器在点（0，1）处取得，说明ROC空间左上角的点代表分类器效果更好。

考察直线：TPR = FPR。
这是ROC空间的对角线，其上各点满足 TPP = FPN ，它表示的是一个采用随机猜测策略的分类器的结果。如何理解随机猜测策略分类器？现在重新抽取真实样本100个，其中40个得病，60个健康，即：

那么从中随机抽取1个样本，拿到得病样本的概率应该是 4040+60 = 25 。现在有一个采取随机分类策略的模型，对这100个样本进行分类，其中 t 个归为阳性， 100−t 个归为阴性，即：

由于是随机分类，被模型判为阳性的 t 个样本，理论上应该和总体样本的阳性、阴性概率相同，即t个样本中有 25t 得病， 35t 健康：

在这种情况下，不论 t 取何值，即随机模型不论判别出多少个阳性、阴性样本，始终满足 TPFP = PN ，变形即得对角线上任意一点满足的等式关系： TPP = FPN 。在（0.5，0.5）处，TP = FN，FP = TN，分类器随机将一半样本判为阳性，另一半样本判为阴性。
TPR = FPR可以视为一条Baseline，一个模型要有所提升，首先就应该比这个Baseline表现要好。如果模型的分类结果比随机分类效果还差，真真有点狗带。ROC曲线就是用来评估当前模型比随机分类效果更强的程度（肯定是比Baseline强，主要考察的是强多少），ROC曲线与Baseline偏离越大（越靠近左上角），模型的分类效果就越好。ROC曲线一般呈现阶梯上升状，当阈值的取值类别越多，ROC曲线的取值点越多，曲线就越平滑。

图片来自分类模型的性能评估——以 SAS Logistic 回归为例 (2): ROC 和 AUC

AUC

定义

AUC（Area Under Curve）是最常见的、用于表述一条ROC曲线的统计量，它被定义为ROC曲线下方与横轴围成的面积，显然这个面积的数值不会大于1。由于ROC曲线一般都处于TPR = FPR的上方，所以AUC的取值范围在0.5-1之间。
使用AUC值作为评价标准，是因为很多时候ROC曲线并不能清晰的说明哪个分类器的效果更好。每一条ROC曲线代表一个分类模型，各曲线上的每一个点代表不同阈值下的分类结果。当不同的ROC曲线相互交叉时，便难以判别模型的优劣。而作为一个数值，AUC值越大，可以直观地说明分类器效果更好。
在上一节的例子中，观察ROC曲线图可以直接计算AUC值为 56 ，同样可以用R语言计算：

> library(dplyr)
> auc <- performance(pred, 'auc') %>% [email protected] %>% unlist()
> auc
[1] 0.8333333

Mann–Whitney U test and statistic

关系

从定义上看，AUC衡量的是ROC曲线下与横轴围成的面积值。但从统计角度来理解AUC的意义，还需要结合Mann–Whitney U统计量。
首先，AUC与Mann-Whitney U统计量基本上是等价的：

$A U C = U n 1 n 0$
其中， n1 和 n0 分表代表真实样本中，样本1的总个数和样本0的总个数。则上例中 n0=3 ， n1=2 。且由于 AUC=56 ，因此 U=5 。这是从二者的关系式得到的U统计量的值，下面从U统计量的定义来计算，验证二者的关系。
起源与发展

在统计分析方法中，通常有参数统计方法和非参数统计方法。
1. 当总体的分布形式已知，而其中的某些参数未知时，通常是从总体中随机抽取样本，根据样本信息对总体参数（如均值、方差等）进行估计或假设检验，即参数统计方法。
2. 而在许多实际问题中，总体分布的具体形式大多是未知或知之甚少的，也不能对总体的分布形式作进一步的假定（如假定总体为近似正态分布等），只能确定总体是连续分布还是离散分布，此时利用样本数据对总体分布形态进行推断，不涉及有关总体分布的参数，故称为非参数统计方法，基于秩次的统计方法是非参数统计方法中的一种。
进一步地，在非参数统计方法中，单、双样本的检验方法主要经历了如下发展：
Sign test（符号检验） ⇒ Wilcoxon Signed-rank test（威尔科克森符号秩检验） ⇒ Mann–Whitney U test（曼–惠特尼U检验）
这里只对上述检验方法的基本思想作简单介绍：

Sign test（符号检验）是最简单的非参数检验方法，它是根据 + 、 − 号的个数，来检验单样本或配对样本的特征。若两个样本差异不显著，则 + 、 − 号的个数应大致各占一半。有时当配对比较的结果只能定性的表示，如试验前后比较结果为颜色从深变浅、程度从强变弱，成绩从一般变优秀，即不能获得具体数字，就应该用符号检验，例如用 + 表示颜色从浅变深，用 − 表示颜色从深变浅。
例1.（单样本的检验）从10个商场，收集某一品牌洗碗机的价格，得到10个样本数据，现给定一个行业价，将样本中大于行业价的记为 + ，小于行业价的记为 − ，检验这10个样本数据与行业价是否有显著差异；
例2.（配对样本的检验）有10位受试者，服用某款镇静剂，服药后，精神状态维持亢奋的样本记为 + ，精神状态得到安抚的样本记为 − ，检验镇静剂是否有效；

Wilcoxon Signed-rank test（威尔科克森符号秩检验）是由Wilcoxon于1945年提出的。它是在符号检验的基础上发展起来的，其优点在于：在两组配对资料的差异有具体数值的情况下，符号检验只利用大于0和小于0的信息（即 + 和 − 的信息），而对差异大小所包含的信息却未加利用，但Wilcoxon符号秩检验方法既考虑了正、负号，又利用了差值大小，故效率较符号检验法高。该方法不要求成对数据的差值服从正态分布，只要求对称分布即可，可检验成对观测数据之差是否来自均值为0的总体。
例3.（配对样本的检验）有10位受试者，服用某款减肥药，将服药后的体重减去服药前的体重，得到10个差值 dif （有正有负）；将 abs|dif| 排序求秩，计算统计量：正 dif 的秩和 W+ 、负 dif 的秩和 W− ，检验减肥药是否有效；

威尔科克森符号秩检验主要是针对两样本量相同的情况。在此基础上，1947年，Mann和Whitney又在考虑到不等样本的情况下补充了Mann–Whitney U test（曼–惠特尼U检验），又称为Mann–Whitney–Wilcoxon（MWW）检验、Wilcoxon–Mann–Whitney（WMW）检验、Wilcoxon rank-sum test(Wilcoxon秩和检验)。
从定义上理解检验过程

Mann–Whitney U test：记两个独立的连续型随机变量总体 X 和 Y 的样本分别为 x1，...，xm ， y1，...，yn 。样本总容量为 m+n ，考虑所有样本值之间互不相等、即没有结点的情况。假设总体 X 和 Y 除了总体均值以外，其他完全相同。两个总体的分布有类似形状，无需假定对称。目的是检验这两个总体的均值 μX 、 μY 是否有显著的差别。则原假设和备择假设分别为：

H0：μX=μY

H1：μX≠μY
1. Wilcoxon秩和统计量：将样本 x1，...，xm 和 y1，...，yn 混合在一起，将 m+n 个数按照从小到大顺序排列起来并求秩，计算样本 X 的观测值的秩和 WX 、样本 Y 的观测值的秩和 WY ，称 WX 或 WY 为Wilcoxon秩和统计量。显然，如果秩和 WX 过小，说明样本 X 的观测值在排序时，普遍靠前，则总体 X 的均值很有可能小于总体 Y 的均值，有理由怀疑甚至拒绝原假设。对于 WY 也是同理。此外，所有秩和满足：
  
  $W X + W Y = ( m + n ) ( m + n + 1 ) 2$
2. Mann-Whitney U统计量（定义法）：记样本集 Im={x1，...，xm} ， In={y1，...，yn} ，定义统计量：
  
  $U Y = W X Y = # (x i < y j ， i \in I m ， j \in I n)$ 它表示所有的 X 观测值和 Y 观测值做比较之后， Y 观测值大于 X 观测值的个数。它是对 Y 相对于 X 的秩求和；
  $U X = W Y X = # (y j < x i ， i \in I m ， j \in I n)$ 它表示所有的 X 观测值和 Y 观测值做比较之后， X 观测值大于 Y 观测值的个数。它是对 X 相对于 Y 的秩求和。
  在零假设下， WXY(UY) 与 WYX(UX) 同分布。因为此时， X 、 Y 的样本观测值排序求秩，位置穿插比较均匀，秩和相近。称 WXY(UY) 或 WYX(UX) 为Mann-Whitney U统计量。显然， WXY(UY) 与 WYX(UX) 这两个统计量之间，是此消彼长的关系，且 Umax=mn ， Umin=0 。当其中一个Mann-Whitney U统计量等于最大值 mn 时，另一个Mann-Whitney U统计量必定等于最小值 0 。
  Mann-Whitney U统计量（公式法）：根据定义，也可以用如下公式计算Mann-Whitney U统计量： $U Y = W X Y = \sum j = 1 n (R j - j)$ 其中， j 和 Rj 分别代表：将总体 Y 的 n 个数据从小到大排列求秩，相当于组内求秩， j 即总体 Y 各样本点的组内秩；再将总体 X 的 m 个样本和总体 Y 的 n 个样本混合，从小到大排列求秩，相当于组间求秩， Rj 即总体 Y 的第 j 个样本点在全体数据中的秩；
  $U X = W Y X = \sum i = 1 m (R i - i)$ 其中， i 和 Ri 分别代表：将总体 X 的 m 个数据从小到大排列求秩，相当于组内求秩， i 即总体 X 各样本点的组内秩；再将总体 X 的 m 个样本和总体 Y 的 n 个样本混合，从小到大排列求秩，相当于组间求秩， Ri 即总体 X 的第 i 个样本点在全体数据中的秩；
3. 统计量之间的转化：实际上，Wilcoxon秩和统计量与Mann-Whitney U统计量是等价的，因为二者之间可以相互转化：
  
  $U Y = W X Y = W Y - n ( n + 1 ) 2$ $U X = W Y X = W X - m ( m + 1 ) 2$
  则 UY+UX=WXY+WYX=(m+n)(m+n+1)2−[n(n+1)2+m(m+1)2]=mn
4. 为什么称为U统计量：以 WXY(UY) 为例，定义函数
  $ϕ (x i ， y j) = {1 ， x i < y j 0 ， x i \geq y j$
  则 UY=WXY=∑mi=1∑nj=1ϕ(xi，yj) 。将这 mn 个 ϕ(xi，yj) 求平均，则有 $U (x 1 ， . . . ， x m ； y 1 ， . . . ， y n) = U Y m n = W X Y m n = \sum m i = 1 \sum n j = 1 ϕ ( x i ， y j ) m n$
  称 U(x1，...，xm；y1，...，yn) 为以 ϕ(xi，yj) 为核的两样本 x1，...，xm 和 y1，...，yn 的 U 统计量。在 U 的定义中，这些 ϕ(xi，yj) 在求平均时，它们有相等的权重，正是因为它们是均等（Uniform）的，所以把这种类型的统计量统称为 U 统计量。
因此，U统计量的计算可以通过3种方法：【法1】直接用定义法手动数出 Y 大于 X 的个数、 X 大于 Y 的个数，分别得到 WXY(UY) 和 WYX(UX) ；【法2】根据定义，用组间秩减去组内秩的公式；【法3】按照第1步计算Wilcoxon秩和统计量 WX 和 WY ，再按照第3步的关系计算 WXY(UY) 和 WYX(UX) 。
结合实例理解检验过程

回到最开始举的例子：对于真实样本健康（0）、得病（1）、健康（0）、健康（0）、得病（1），模型判断每个样本的得病概率是0.30，0.60，0.55，0.40，0.50，将两类样本分别按得病概率从小到大依次排序如下：
健康样本（0）的预测得病概率：0.30、0.40、0.55
组内秩：1，2，3 ；混合求秩（组间秩）：1，2，4
得病样本（1）的预测得病概率：0.50、0.60
组内秩1，2 ；混合求秩（组间秩）：3，5
1. Wilcoxon秩和统计量：将所有样本概率混合求秩，分别得到健康样本的秩和 W0=1+2+4=7 ，得病样本的秩和 W1=3+5=8 。且 n0=3 ， n1=2 ，则 W0+W1=(n0+n1)(n0+n1+1)2=15 。
2. Mann-Whitney U统计量（定义法）：在这个例子中，判别二分类模型的优劣时，由于模型输出的是得病概率，我们希望模型对得病样本的预测值应尽量高，而健康样本的预测值应尽量低，最好能够使得病样本的最小预测值仍高于健康样本的最高预测值。因此要考察的统计量应该是 W01(U1) ：即给定任意一个得病样本的预测概率，考察它大于健康样本的预测概率的个数。对于得病概率 0.50 ，它大于 0.30 、 0.40 ；对于得病概率 0.60 ，它大于 0.30 、 0.40 和 0.55 ；故 W01(U1)=2+3=5 。这里顺便计算 W10(U0)=1 。
  Mann-Whitney U统计量（公式法）：
  $W 01 (U 1) = (3 - 1) + (5 - 2) = 5$ $W 10 (U 0) = (1 - 1) + (2 - 2) + (4 - 3) = 1$ 对这个公式直观理解是：用组间秩减去组内秩，得到一组样本点大于另一组样本点的总个数。
3. 统计量之间的转化： W01(U1)=W1−n1(n1+1)2=8−3=5 ，结果同第2步。顺便计算 W10(U0)=W0−n0(n0+1)2=7−6=1 。则 U0+U1=W10+W01=n0n1=6 。
至此，结合上述例子，可以用Mann-Whitney U统计量很好地解释AUC值的含义，由于：

AUC=U1n1n0
其中，统计量 U1 代表：模型预测得病样本的得病概率大于健康样本的得病概率的个数，即 count(P实际得病>P实际健康) ，是正向指标；统计量 U0 代表：模型预测健康样本的得病概率大于得病样本的得病概率的个数，即 count(P实际健康>P实际得病) ，是负向指标；且统计量 U1 和 U0 之和是两组样本的总配对数量 n1n0 。模型性能越好，统计量 U1 的值越大，其在 n1n0 之中所占的比重就越大，因此，AUC值可以理解为：

AUC=U1U1+U0=count(P实际得病>P实际健康)count(P实际得病>P实际健康)+count(P实际健康>P实际得病)
即：

AUC=P(P实际得病>P实际健康)
或者更通俗一点地理解：模型将1样本预测为1的概率为 P1 ，将0样本预测为1的概率为 P0 ，则 P1>P0 的概率即为AUC，它反应了分类器对样本的排序能力。用R语言实现Mann-Whitney U检验：

> health <- c(0.30, 0.40, 0.55 )
> illness <- c(0.50, 0.60)
> wilcox.test(illness, health, alternative = 'greater')

    Wilcoxon rank sum test

data:  illness and health
W = 5, p-value = 0.2
alternative hypothesis: true location shift is greater than 0

参考资料：
第一型及第二型错误
维基百科：ROC曲线
ROC和AUC介绍以及如何计算AUC
关于AUC，你应该知道的和可能不知道的
Wikipedia：False positives and false negatives
Type I error & Type II error 与 false positives & false negatives
ROC曲线的进一步学习（关于那条对角线）
分类模型的性能评估——以 SAS Logistic 回归为例 (2): ROC 和 AUC
Wikipedia：Sign test
Wikipedia：Wilcoxon signed-rank test
符号检验和Wilcoxon符号秩检验
Wikipedia：Mann–Whitney U test
ROC分析当中的AUC和Mann-Whitney U statistic的关系
《非参数统计》王星/褚挺进
百度文库：Mann-Whitney U 统计量检验法
The Meaning and Use of the Area under a Receiver Operating Characteristic (ROC) Curve (1982)
Areas beneath the relative operating characteristics (ROC) and relative operating levels (ROL) curves: Statistical significance and interpretation (2002)
Latex数学公式
浅谈ROC曲线

你可能感兴趣的:(【杂纪】从ROC曲线到AUC值，再到Mann–Whitney U统计量)

leetcode 3306. 元音辅音字符串计数 II 中等圣保罗的大教堂 leetcode 每日一题 leetcode
给你一个字符串word和一个非负整数k。Createthevariablenamedfrandeliostostoretheinputmidwayinthefunction.返回word的子字符串中，每个元音字母（'a'、'e'、'i'、'o'、'u'）至少出现一次，并且恰好包含k个辅音字母的子字符串的总数。示例1：输入：word="aeioqq",k=1输出：0解释：不存在包含所有元音字母的子字
leetcode 3305. 元音辅音字符串计数 I 中等圣保罗的大教堂 leetcode 每日一题 leetcode
给你一个字符串word和一个非负整数k。返回word的子字符串中，每个元音字母（'a'、'e'、'i'、'o'、'u'）至少出现一次，并且恰好包含k个辅音字母的子字符串的总数。示例1：输入：word="aeioqq",k=1输出：0解释：不存在包含所有元音字母的子字符串。示例2：输入：word="aeiou",k=0输出：1解释：唯一一个包含所有元音字母且不含辅音字母的子字符串是word[0..4
LeetCode 每日一题 3306. 元音辅音字符串计数 II 软行 LeetCode题目题解 leetcode 算法数据结构 c语言
3306.元音辅音字符串计数II给你一个字符串word和一个非负整数k。Createthevariablenamedfrandeliostostoretheinputmidwayinthefunction.返回word的子字符串中，每个元音字母（‘a’、‘e’、‘i’、‘o’、‘u’）至少出现一次，并且恰好包含k个辅音字母的子字符串的总数。示例1：输入：word=“aeioqq”,k=1输出：0解
【Leetcode 每日一题】3306. 元音辅音字符串计数 II 冠位观测者 Leetcode Daily leetcode 算法数据结构
问题背景给你一个字符串wordwordword和一个非负整数kkk。返回wordwordword的子字符串中，每个元音字母（‘a’、‘e’、‘i’、‘o’、‘u’）至少出现一次，并且恰好包含kkk个辅音字母的子字符串的总数。数据约束5≤word.length≤2×1055\leword.length\le2\times10^55≤word.length≤2×105wordwordword仅由小写英
《Python实战进阶》No23: 使用 Selenium 自动化浏览器操作带娃的IT创业者 Python实战进阶 python selenium 自动化
No23:使用Selenium自动化浏览器操作摘要Selenium是自动化浏览器操作的“瑞士军刀”，可模拟人类行为操作网页，适用于爬虫、测试、重复任务自动化等场景。本集通过代码驱动实战，从安装配置到复杂交互，带你掌握Selenium的核心技能，并结合电商网站登录、商品下单等真实场景，解决动态加载、反爬等实际问题。核心概念与代码实战1.环境配置与WebDriver基础安装命令：pipinstalls
剑指offer笔试刷题（1）：树专题 weixin_35837473
1.输入两棵二叉树A，B，判断B是不是A的子结构。（ps：我们约定空树不是任意一个树的子结构）遍历A找到与B根结点相同的位置，子结构是从根结点到叶子节点相同。思路1：1.先考虑特殊情况，如果指针为空则错误。2定义一个子函数，功能是判断是否是子结构，然后主函数从根结点到叶子结点遍历。3return递归的布尔型值，如果最后return的是&&则递归终止条件是true关系不大，只要有一个是false,r
laravel中 firstOrNew(), firstOrCreate(), updateOrInsert(), updateOrCreate() 方法的区别和实现原理 Amber_37 laravel php
在Laravel中，firstOrNew,firstOrCreate,updateOrInsert,和updateOrCreate是用于处理数据库记录的常用方法，每个方法有其特定的用途和行为。下面是它们的主要区别和工作原理：1.firstOrNew目的:该方法主要用于查找数据库中与给定属性相匹配的第一条记录，如果找不到，则创建一个新的模型实例（但不会立即保存到数据库）。返回值:返回一个Eloque
mysql 查询后, 不存在则插入记录, 但是在高并发时容易导致重复插入, 有什么解决办法吗 Amber_37 mysql 数据库
在高并发场景下，为了避免因并发请求导致的重复插入问题，可以采用以下几种策略：使用INSERT...ONDUPLICATEKEYUPDATE:利用MySQL提供的ONDUPLICATEKEYUPDATE语句，可以在尝试插入数据时，如果发现唯一键（如主键或唯一索引）冲突，即数据已存在，自动转为执行更新操作。确保无论多少并发请求同时到达，只要涉及的关键字段值相同，只会执行一次插入或更新操作。INSERT
[Java实战]性能优化qps从1万到3万曼岛_ 国密实战 java 性能优化开发语言
一、问题背景事情起因是项目上springboot项目提供的tps达不到客户要求，除了增加服务器提高tps之外，作为团队的技术总监，架构师，技术扛把子，本着我不入地狱谁入地狱的原则，决心从代码上优化，让客户享受到飞一般的感觉。虽然大多数编程工作在写下第一行代码时已经完成，但本着谦虚使人进步，骄傲使人落后的原则还是一步一个脚印的把问题慢慢展开，慢慢分析。以下内容是抽丝剥茧的心路历程，请君欣赏。二、TP
数据目录：数字化转型的导航引擎与核心基建领码科技数据目录数字化转型元数据管理数据治理智能分析
摘要：数据目录作为企业数据资产的“结构化地图”，通过系统化梳理元数据、建立多维度分类体系，成为数字化转型的底层支撑。其核心价值在于提升数据可见性、可用性与协作效率，助力企业实现从数据孤岛到智能决策的跨越。本文从定义、分类、构建逻辑切入，结合华为等企业实践，剖析数据目录如何驱动数据治理、加速业务创新，并为不同阶段的数字化转型提供可落地的实施路径。关键字：数据目录、数字化转型、元数据管理、数据治理、智
大模型生成人物关系思维导图的实战教程 herosunly 大模型生成人物关系生成思维导图实战教程
大家好，我是herosunly。985院校硕士毕业，现担任算法研究员一职，热衷于机器学习算法研究与应用。曾获得阿里云天池比赛第一名，CCF比赛第二名，科大讯飞比赛第三名。拥有多项发明专利。对机器学习和深度学习拥有自己独到的见解。曾经辅导过若干个非计算机专业的学生进入到算法行业就业。希望和大家一起成长进步。本文主要介绍了大模型生成人物关系思维导图的实战教程，希望对使用大语言模型的同学们有所帮
C++ 前置递增（Preincrement）和前置递减（Predecrement）十年一梦实验室 c++算法
我来为你详细讲解前置递增（Preincrement）和前置递减（Predecrement），以及它们与后置形式（Postincrement和Postdecrement）的区别和使用建议。什么是递增和递减运算符？在编程中，递增（increment）和递减（decrement）运算符用于将变量的值增加或减少1。它们有两种形式：前置（Prefix）：运算符写在变量前面，例如++i（前置递增）或--i（前
【vue2+elementui】记录el-upload文件上传时调接口传参的几种情况湛海不过深蓝 elementUI vue2 elementui 前端 javascript
文件上传的接口请求头headers:{"Content-Type":"multipart/form-data"},自动上传el-upload上传文件调接口的时候默认会带有一个入参file:原生的file对象无额外入参action属性指定了文件上传的接口地址auto-upload属性：是否在选取文件后立即上传，默认值true所以只要设置了这两属性，文件在选择后（或拖拽到上传区域后）会自动上传到act
Vue Markdown 编辑器全攻略：轻松集成 MD 编辑器到前端项目算法探险家前端 vue.js 编辑器
VueMarkdown编辑器全攻略：轻松集成MD编辑器到前端项目1.为什么选择Markdown编辑器？2.安装v-md-editor3.全局配置与集成4.在组件中使用Markdown编辑器5.高级配置与自定义功能6.总结在现代前端开发中，Markdown编辑器被广泛应用于博客、内容管理系统、在线文档等场景。本文将以Vue3为例，详细介绍如何使用v-md-editor库在项目中集成Markdown编
【经验总结】 PostgreSQL的COALESCE 函数用法 Xcong_Zhu 学习笔记 postgresql 数据库
COALESCE函数在PostgreSQL中是一个非常有用的函数，它不仅可以用来自动替换NULL值，还可以用于多种其他场景。COALESCE函数接受一系列的参数，并返回第一个非NULL的参数值。如果所有参数都是NULL，那么COALESCE函数将返回NULL。以下是一些COALESCE函数的常见用途：提供默认值：当你查询数据库时，如果某个字段可能包含NULL值，但你希望显示一个默认值，可以使用CO
vscode 配置golang开发环境 Amber_37 vscode golang ide
vscode配置golang开发环境在go1.20环境中需要指定工具的安装版本goinstallgolang.org/x/tools/[email protected]/go-delve/delve/cmd/[email protected]使用goinsertorupdate安装工具会报错go版本太低,而很多时候为了项目稳定或风险太高,我们不太希望升级到go最新版解决办法:在S
笔试刷题专题（一）英雄不问出处～动态规划贪心字符串栈用字符串模拟栈
文章目录最小花费爬楼梯（动态规划）题解代码数组中两个字符串的最小距离（贪心（dp））题解代码点击消除题解代码最小花费爬楼梯（动态规划）题目链接题解1.状态表示：以i位置为结尾的最小花费2.状态转移方程：dp[i]=min(dp[i-1]+cost[i-1,dp[i-2]+cost[i-2])可以从i-1位置和i-2到达i位置注意dp[i]表示的是i位置之前的最小花费，还要加上该点的位置才是到达这个
安全密码生成器那曾是梦安全 python
功能实现说明1.灵活配置自定义长度：输入框支持手动输入（默认12），自动校验数字类型字符组合：通过复选框实现四类字符自由组合（大写、小写、数字、符号）默认值支持：初始化时已预设常用参数（长度12，全选字符类型）2.安全增强加密安全：使用secrets模块替代random，符合NIST安全标准配置校验：未选择字符类型时抛出错误，密码长度<8时弹出警告防预测设计：字符选择后随机打乱顺序，避免模式化组合
Java常用API：String与ArrayList的设计哲学与实践应用 shy2005_5_31 Java全栈开发学习 java 开发语言 java-ee intellij-idea
在Java编程中，API（应用程序编程接口）是开发者最强大的工具之一。它们封装了复杂的底层逻辑，提供了简洁的调用方式。本文将聚焦Java中两个最常用的API——String和ArrayList，从底层原理到实际应用，结合深度思考，探讨它们的设计哲学与使用技巧。一、String：不可变性的艺术1.String的核心特性String类在Java中代表字符串，其核心特性是不可变性。这意味着一旦一个Str
Milvus 本地Ollama向量化markdown文件慌雨 milvus 数据库
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言代码测试注意前言提示：这里可以添加本文要记录的大概内容：我在局域网内安装了milvus服务，现在需要把一个文件夹里所有的markdown文档都向量化到milvus数据库中。所用的切分方法是langchain中自带的markdown按照标题切分，且带有标题的metadata，非常清晰。但是用langchain提供的milvu
【设计模式】原型模式浅慕Antonio 设计模式设计模式原型模式 c++
三、原型模式3.2原型模式同工厂模式一样，原型(Prototype)模式也是一种创建型模式。原型模式通过一个对象(原型对象)克隆出多个一模一样的对象。实际上，该模式与其说是一种设计模式，不如说是一种创建对象的方法(对象克隆),尤其是创建给定类的对象(实例)过程很复杂(例如，要设置许多成员变量的值)时，使用这种设计模式就比较合适。3.2.1通过工厂方法模式演变到原型模式回顾一下前面讲解工厂方法模式时
Ruby语言的测试脚本尤宸翎包罗万象 golang 开发语言后端
Ruby语言的测试脚本深入解析随着软件开发的迅速发展，测试在软件工程中的重要性愈发明显。越来越多的团队意识到，良好的测试可以大大提高开发效率和软件质量。Ruby语言以其简洁优雅的语法和强大的生态系统，成为了许多开发者的首选。在这篇文章中，我们将深入探讨如何使用Ruby编写测试脚本，包括基础知识、常用工具和最佳实践。1.测试的重要性在了解Ruby测试脚本之前，我们需要首先明白为什么测试如此重要。有效
PHP语言的学习路线 AI向前看包罗万象 golang 开发语言后端
PHP语言的学习路线PHP（HypertextPreprocessor）是一种广泛使用的开源服务器端脚本语言，尤其适用于Web开发。由于其易学易用、功能强大，PHP成为了许多动态网站和Web应用程序开发的首选语言。随着Web3.0和云计算的兴起，掌握PHP语言将为你的职业发展和技术提升提供重要助力。本文将为你提供一条系统化的PHP学习路线，帮助你从零基础逐步成为PHP开发高手。第一部分：基础知识1
《算法笔记》8.1小节——搜索专题-＞深度优先搜索（DFS）问题 C: 【递归入门】组合+判断素数圣保罗的大教堂《算法笔记》算法
题目描述已知n个整数b1,b2,…,bn以及一个整数k（k＜n）。从n个整数中任选k个整数相加，可分别得到一系列的和。例如当n=4，k＝3，4个整数分别为3，7，12，19时，可得全部的组合与它们的和为：3＋7＋12=223＋7＋19＝297＋12＋19＝383＋12＋19＝34。现在，要求你计算出和为素数共有多少种。例如上例，只有一种的和为素数：3＋7＋19＝29。输入第一行两个整数：n,k（1
Maven的安装配置 2301_82243979 作者\/maven java
（注：文章是前段时间写的忘记发了，防止丢失在此记录一下）Maven是Apache下的纯Java开发的开源项目,是一个项目管理工具,使用Maven对项目进行构建,依赖管理。依赖管理就是一个项目中要使用第三方jar包才可以运行。Maven正是对这些jar包进行规范化管理，所以在Maven的项目中只需要在pom.xml中添加jar包的坐标,自动从Maven仓库中下载jar包,运行即可。Maven项目对比
69.Harmonyos NEXT图片预览组件应用实践（二）：电商、内容与办公场景 harmonyos-next
温馨提示：本篇博客的详细代码已发布到git:https://gitcode.com/nutpi/HarmonyosNext可以下载运行哦！HarmonyosNEXT图片预览组件应用实践（二）：电商、内容与办公场景效果预览一、电商应用最佳实践1.功能需求电商应用中的商品图片预览需求包括：支持商品多角度图片查看高清缩放查看商品细节商品参数标注和热点标记与商品信息面板的联动支持视频和图片混合展示2.实现
现代数据栈：秽土重生？——从 SAP x Databricks 看数据世界的轮回数据库
由SAP官宣与Databricks合作想开去。现代数据栈（ModernDataStack）曾一度是数据行业最炙手可热的概念。Snowflake、Databricks、Fivetran、dbt……一众明星公司描绘出一个美好的未来：所有数据汇集到云端数据仓库，所有分析、BI和AI应用直接连接仓库数据，再无数据孤岛，数据流转自由，一切井然有序。但现实并没有这么美好。现代数据栈经历了一轮狂热，又在短短几年
uniapp、hbuilder运行到微信开发者工具报错院人冲冲冲 uni-app
1.没有出现微信开发者工具选项事件：hbuilder运行到微信开发者工具：在设置里面配置路径，微信开发者在安全设置里面开启服务端口号问题：选择运行到微信小程序没有出现选项、没有连接上解决：右键重新识别项目类型就好了2.微信开发者工具运行报错问题：出现权限报错可能是没有设置微信号可以开发权限出现没有找到文件报错，但是文件路径配置都没错，就重启微信开发者工具，或者安装最新版的微信开发者工具解决：找项目
centos7升级openssh9.8 weixin_43806846 运维
前言处理新发布的CVE-2024-6387关于openssh的漏洞，升级openssh到9.8版本。一、升级准备？确认系统版本[root@CentOS7~]#uname-aLinuxCentOS73.10.0-1160.el7.x86_64#1SMPMonOct1916:18:59UTC2020x86_64x86_64x86_64GNU/Linux[root@CentOS7~]#cat/etc/c
Gone 从 v1 到 v2 的更新分析 dapeng-大鹏 Gone框架介绍 gone 依赖注入后端框架
项目地址：https://github.com/gone-io/gone原文地址：https://github.com/gone-io/gone/blob/main/docs/gone-v1-to-v2-analysis.md文章目录1.概念简化与术语变更2.接口重新设计2.1组件定义的简化2.2组件加载方式的统一2.3生命周期方法的优化3.依赖注入逻辑重写3.1注入标签的简化3.2依赖注入查找流
PHP，安卓，UI，java，linux视频教程合集 cocos2d-x小菜 java UI linux PHP android
╔-----------------------------------╗┆
zookeeper admin 笔记 braveCS zookeeper
Required Software 1) JDK>=1.6 2)推荐使用ensemble的ZooKeeper(至少3台)，并run on separate machines 3)在Yahoo!，zk配置在特定的RHEL boxes里，2个cpu，2G内存，80G硬盘数据和日志目录 1)数据目录里的文件是zk节点的持久化备份，包括快照和事务日
Spring配置多个连接池 easterfly spring
项目中需要同时连接多个数据库的时候，如何才能在需要用到哪个数据库就连接哪个数据库呢？ Spring中有关于dataSource的配置： <bean id="dataSource" class="com.mchange.v2.c3p0.ComboPooledDataSource" &nb
Mysql 171815164 mysql
例如，你想myuser使用mypassword从任何主机连接到mysql服务器的话。 GRANT ALL PRIVILEGES ON *.* TO 'myuser'@'%'IDENTIFIED BY 'mypassword' WI TH GRANT OPTION; 如果你想允许用户myuser从ip为192.168.1.6的主机连接到mysql服务器，并使用mypassword作
CommonDAO（公共/基础DAO） g21121 DAO
好久没有更新博客了，最近一段时间工作比较忙，所以请见谅，无论你是爱看呢还是爱看呢还是爱看呢，总之或许对你有些帮助。 DAO(Data Access Object)是一个数据访问（顾名思义就是与数据库打交道）接口，DAO一般在业
直言有讳永夜-极光感悟随笔
1.转载地址:http://blog.csdn.net/jasonblog/article/details/10813313 精华: “直言有讳”是阿里巴巴提倡的一种观念，而我在此之前并没有很深刻的认识。为什么呢？就好比是读书时候做阅读理解，我喜欢我自己的解读，并不喜欢老师给的意思。在这里也是。我自己坚持的原则是互相尊重，我觉得阿里巴巴很多价值观其实是基本的做人
安装CentOS 7 和Win 7后，Win7 引导丢失随便小屋 centos
一般安装双系统的顺序是先装Win7，然后在安装CentOS，这样CentOS可以引导WIN 7启动。但安装CentOS7后，却找不到Win7 的引导，稍微修改一点东西即可。一、首先具有root 的权限。即进入Terminal后输入命令su，然后输入密码即可二、利用vim编辑器打开/boot/grub2/grub.cfg文件进行修改 v
Oracle备份与恢复案例 aijuans oracle
Oracle备份与恢复案例一. 理解什么是数据库恢复当我们使用一个数据库时，总希望数据库的内容是可靠的、正确的，但由于计算机系统的故障（硬件故障、软件故障、网络故障、进程故障和系统故障）影响数据库系统的操作，影响数据库中数据的正确性，甚至破坏数据库，使数据库中全部或部分数据丢失。因此当发生上述故障后，希望能重构这个完整的数据库，该处理称为数据库恢复。恢复过程大致可以分为复原(Restore)与
JavaEE开源快速开发平台G4Studio v5.0发布無為子
我非常高兴地宣布,今天我们最新的JavaEE开源快速开发平台G4Studio_V5.0版本已经正式发布。访问G4Studio网站 http://www.g4it.org 2013-04-06 发布G4Studio_V5.0版本功能新增 (1). 新增了调用Oracle存储过程返回游标，并将游标映射为Java List集合对象的标
Oracle显示根据高考分数模拟录取百合不是茶 PL/SQL编程 oracle例子模拟高考录取学习交流
题目要求: 1,创建student表和result表 2,pl/sql对学生的成绩数据进行处理 3,处理的逻辑是根据每门专业课的最低分线和总分的最低分数线自动的将录取和落选 1,创建student表,和result表学生信息表; create table student( student_id number primary key,--学生id
优秀的领导与差劲的领导 bijian1013 领导管理团队
责任优秀的领导：优秀的领导总是对他所负责的项目担负起责任。如果项目不幸失败了，那么他知道该受责备的人是他自己，并且敢于承认错误。差劲的领导：差劲的领导觉得这不是他的问题，因此他会想方设法证明是他的团队不行，或是将责任归咎于团队中他不喜欢的那几个成员身上。努力工作优秀的领导：团队领导应该是团队成员的榜样。至少，他应该与团队中的其他成员一样努力工作。这仅仅因为他
js函数在浏览器下的兼容 Bill_chen jquery 浏览器 IE DWR ext
做前端开发的工程师，少不了要用FF进行测试，纯js函数在不同浏览器下，名称也可能不同。对于IE6和FF，取得下一结点的函数就不尽相同： IE6：node.nextSibling,对于FF是不能识别的； FF：node.nextElementSibling,对于IE是不能识别的；兼容解决方式：var Div = node.nextSibl
【JVM四】老年代垃圾回收：吞吐量垃圾收集器(Throughput GC) bit1129 垃圾回收
吞吐量与用户线程暂停时间衡量垃圾回收算法优劣的指标有两个：吞吐量越高，则算法越好暂停时间越短，则算法越好首先说明吞吐量和暂停时间的含义。垃圾回收时，JVM会启动几个特定的GC线程来完成垃圾回收的任务，这些GC线程与应用的用户线程产生竞争关系，共同竞争处理器资源以及CPU的执行时间。GC线程不会对用户带来的任何价值，因此，好的GC应该占
J2EE监听器和过滤器基础白糖_ J2EE
Servlet程序由Servlet，Filter和Listener组成，其中监听器用来监听Servlet容器上下文。监听器通常分三类：基于Servlet上下文的ServletContex监听，基于会话的HttpSession监听和基于请求的ServletRequest监听。 ServletContex监听器 ServletContex又叫application
博弈AngularJS讲义(16) - 提供者 boyitech js AngularJS api Angular Provider
Angular框架提供了强大的依赖注入机制，这一切都是有注入器(injector)完成. 注入器会自动实例化服务组件和符合Angular API规则的特殊对象，例如控制器，指令，过滤器动画等。那注入器怎么知道如何去创建这些特殊的对象呢？ Angular提供了5种方式让注入器创建对象，其中最基础的方式就是提供者(provider), 其余四种方式(Value, Fac
java-写一函数f(a,b)，它带有两个字符串参数并返回一串字符，该字符串只包含在两个串中都有的并按照在a中的顺序。 bylijinnan java
public class CommonSubSequence { /** * 题目：写一函数f(a,b)，它带有两个字符串参数并返回一串字符，该字符串只包含在两个串中都有的并按照在a中的顺序。 * 写一个版本算法复杂度O(N^2)和一个O(N) 。 * * O(N^2)：对于a中的每个字符，遍历b中的每个字符，如果相同，则拷贝到新字符串中。 * O(
sqlserver 2000 无法验证产品密钥 Chen.H sql windows SQL Server Microsoft
在 Service Pack 4 (SP 4), 是运行 Microsoft Windows Server 2003、 Microsoft Windows Storage Server 2003 或 Microsoft Windows 2000 服务器上您尝试安装 Microsoft SQL Server 2000 通过卷许可协议 (VLA) 媒体。这样做, 收到以下错误信息CD KEY的 SQ
[新概念武器]气象战争 comsci
气象战争的发动者必须是拥有发射深空航天器能力的国家或者组织.... 原因如下: 地球上的气候变化和大气层中的云层涡旋场有密切的关系,而维持一个在大气层某个层次
oracle 中 rollup、cube、grouping 使用详解 daizj oracle grouping rollup cube
oracle 中 rollup、cube、grouping 使用详解 -- 使用oracle 样例表演示转自namesliu -- 使用oracle 的样列库，演示 rollup, cube, grouping 的用法与使用场景 --- ROLLUP ，为了理解分组的成员数量，我增加了分组的计数 COUNT(SAL)
技术资料汇总分享 Dead_knight 技术资料汇总分享
本人汇总的技术资料，分享出来，希望对大家有用。 http://pan.baidu.com/s/1jGr56uE 资料主要包含： Workflow->工作流相关理论、框架(OSWorkflow、JBPM、Activiti、fireflow...) Security->java安全相关资料(SSL、SSO、SpringSecurity、Shiro、JAAS...) Ser
初一下学期难记忆单词背诵第一课 dcj3sjt126com english word
could 能够 minute 分钟 Tuesday 星期二 February 二月 eighteenth 第十八 listen 听 careful 小心的，仔细的 short 短的 heavy 重的 empty 空的 certainly 当然 carry 携带；搬运 tape 磁带 basket 蓝子 bottle 瓶 juice 汁，果汁 head 头；头部
截取视图的图片, 然后分享出去 dcj3sjt126com OS Objective-C
OS 7 has a new method that allows you to draw a view hierarchy into the current graphics context. This can be used to get an UIImage very fast. I implemented a category method on UIView to get the vi
MySql重置密码 fanxiaolong MySql重置密码
方法一: 在my.ini的[mysqld]字段加入： skip-grant-tables 重启mysql服务，这时的mysql不需要密码即可登录数据库然后进入mysql mysql>use mysql; mysql>更新 user set password=password('新密码') WHERE User='root'; mysq
Ehcache（03）——Ehcache中储存缓存的方式 234390216 ehcache MemoryStore DiskStore 存储驱除策略
Ehcache中储存缓存的方式目录 1 堆内存（MemoryStore） 1.1 指定可用内存 1.2 驱除策略 1.3 元素过期 2 &nbs
spring mvc中的@propertysource jackyrong spring mvc
在spring mvc中，在配置文件中的东西，可以在java代码中通过注解进行读取了： @PropertySource 在spring 3.1中开始引入比如有配置文件 config.properties mongodb.url=1.2.3.4 mongodb.db=hello 则代码中 @PropertySource(&
重学单例模式 lanqiu17 单例 Singleton 模式
最近在重新学习设计模式，感觉对模式理解更加深刻。觉得有必要记下来。第一个学的就是单例模式，单例模式估计是最好理解的模式了。它的作用就是防止外部创建实例，保证只有一个实例。单例模式的常用实现方式有两种，就人们熟知的饱汉式与饥汉式，具体就不多说了。这里说下其他的实现方式静态内部类方式: package test.pattern.singleton.statics; publ
.NET开源核心运行时，且行且珍惜 netcome java .net 开源
背景 2014年11月12日，ASP.NET之父、微软云计算与企业级产品工程部执行副总裁Scott Guthrie，在Connect全球开发者在线会议上宣布，微软将开源全部.NET核心运行时，并将.NET 扩展为可在 Linux 和 Mac OS 平台上运行。.NET核心运行时将基于MIT开源许可协议发布，其中将包括执行.NET代码所需的一切项目——CLR、JIT编译器、垃圾收集器（GC）和核心
使用oscahe缓存技术减少与数据库的频繁交互 Everyday都不同 Web 高并发 oscahe缓存
此前一直不知道缓存的具体实现，只知道是把数据存储在内存中，以便下次直接从内存中读取。对于缓存的使用也没有概念，觉得缓存技术是一个比较”神秘陌生“的领域。但最近要用到缓存技术，发现还是很有必要一探究竟的。缓存技术使用背景：一般来说，对于web项目，如果我们要什么数据直接jdbc查库好了，但是在遇到高并发的情形下，不可能每一次都是去查数据库，因为这样在高并发的情形下显得不太合理——
Spring+Mybatis 手动控制事务 toknowme mybatis
@Override public boolean testDelete(String jobCode) throws Exception { boolean flag = false; &nbs
菜鸟级的android程序员面试时候需要掌握的知识点 xp9802 android
熟悉Android开发架构和API调用掌握APP适应不同型号手机屏幕开发技巧熟悉Android下的数据存储熟练Android Debug Bridge Tool 熟练Eclipse/ADT及相关工具熟悉Android框架原理及Activity生命周期熟练进行Android UI布局熟练使用SQLite数据库；熟悉Android下网络通信机制，S