什么样的数据能做ROC?

基本知识

首先,ROC曲线是为了评判某种判断方法的准确度(AUC值);这个方法最早来自于二战雷达对于地方飞机的判断上,总之,这是一个数学方法,在生物医学地理等各个领域都有广泛的应用。
roc只适用二分类变量的灵敏度/特异度判断;
多分类要转化为二分类来做;
本文不介绍TP FP TN FN等概念
在这里举个简单的例子,如果我们需要判断100个人的性别。然后我们有很多种方法,比如根据身高,根据激素;然后我们根据100个人的生殖器来确定100个人的性别(金标准)。
数据
编号 身高 激素 金标准
1 173 67 男
2 165 61 女
3 167 60 男
.....

根据上表,计算机可以画出两个roc曲线,肯定是激素的auc高于身高方法的auc;
比如我们根据身高法,计算机的计算原里是,肯定会找到一个身高点h,
这个h,然后身高大于h,判断为男 否则判断为女,
然后不停的去调整这个h,使得判断的准确率最高(和金标准去比较)。
然后可以根据不同h取值时的准确率,画出一个ROC曲线;

测量变量 roc

我们依据测量变量的大小将样本分类。


什么样的数据能做ROC?_第1张图片
测量变量roc.png

这种roc,我们成为测量变量roc;


什么样的数据能做ROC?_第2张图片
roc曲线.png

这种roc,我们需要测量变量和金标准

表中数字代表个数
数据中五级诊断 是/可能是/不清楚/可能不是/不是
需要我们把组别编码,是:5 ... 不是:1
然后...


什么样的数据能做ROC?_第3张图片
image.png

图中CT/CT增强下的数字代表等级(chen)
其实这个等级也就相当于第一种情况下的测量变量,需要我们把个数展开,才能计算。


什么样的数据能做ROC?_第4张图片
image.png
什么样的数据能做ROC?_第5张图片
代做联系QQ29997442

你可能感兴趣的:(什么样的数据能做ROC?)