图片可能上传不了,需要源文件评论
首先了解混淆矩阵
真实值是positive,模型认为是positive的数量(True Positive=TP)
真实值是positive,模型认为是negative的数量(False Negative=FN)
真实值是negative,模型认为是positive的数量(False Positive=FP)
真实值是negative,模型认为是negative的数量(True Negative=TN)
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-nkhQvU7W-1666008006239)(attachments/UUEDYFIT.png)]
预测性分类模型,肯定是希望越准越好。那么,对应到混淆矩阵中,那肯定是希望TP与TN的数量大,而FP与FN的数量小。所以当我们得到了模型的混淆矩阵后,就需要去看有多少观测值在第二、四象限对应的位置,这里的数值越多越好;反之,在第一、三象限对应位置出现的观测值肯定是越少越好。
混淆矩阵的二级指标
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-S4W6mL2e-1666008006241)(attachments/6PIU6ZGH.png)]
通过上面的四个二级指标,可以将混淆矩阵中数量的结果转化为0-1之间的比率。便于进行标准化的衡量。
混淆矩阵实例
当分类问题是二分问题是,混淆矩阵可以用上面的方法计算。当分类的结果多于两种的时候,混淆矩阵同时适用。
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-TjteNEh2-1666008006242)(attachments/CMFUPCWZ.png)]
Accuracy
在总共66个动物中,我们一共预测对了10 + 15 + 20=45个样本,所以准确率(Accuracy)=45/66 = 68.2%。
以猫为例,我们可以将上面的图合并为二分问题:
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-c2RdESrS-1666008006244)(attachments/Q7XEZI6V.png)]
精确度、召回率、特异度同样可以算出。
Dice(进入正题)
Dice 系数是一种评估相似度的函数,通常用于计算两个样本的相似度或者重叠度,在三维医疗图像分割应用也比较多。
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-BHT05aCa-1666008006246)(attachments/BQXT8JYD.png)]
我们把X当作Gt,Y当作Pred,dice系数就可以评价结果了。
X = FN + TP
Y = TP + FP
所以,上面公式可以转换为:
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-mUFDAe6m-1666008006255)(attachments/GTR6P8IZ.png)]
计算两个集合交集与其并集的重合比例。
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-4hdqvd42-1666008006257)(attachments/74P58VDS.png)]
计算正确分类的像素与所有像素数量的比值(当背景像素占比过多时,全部预测为背景MAP也会很高,所以感觉并没有什么卵有)
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-bWR5bFse-1666008006259)(attachments/ZNKNIXPP.png)]
仔细观察VOE和IoU的计算公式。在大多数医学分割的论文中,其实很多都用VOE代替IoU了。这两个参数本质上都是一样的,只计算一个就可以了,但是医学领域对错误率更加敏感。
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-7oPfGUBl-1666008006262)(attachments/UQ2P2QBF.png)]
Hausdorff distance是描述两组点集之间相似程度的一种量度,它是两个点集之间距离的一种定义形式:假设有两组集合A={a1,…,ap},B={b1,…,bq},则这两个点集合之间的Hausdorff distance定义为:
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-eVmKRTBr-1666008006263)(attachments/XU85TAB8.png)]
具体流程结构
1、取A集合中的一点a0,计算a0到B集合中所有点的距离,保留最短的距离d0
2、遍历A集合中所有点,图中一共两点a0和a1,计算出d0和d1
3、比较所有的距离{ d0, d1 },选出最长的距离d1
4、这个最长的距离就是h,它是A→B的单向豪斯多夫距离,记为h( A, B)
5、对于A集合中任意一点a,我们可以确定,以点a为圆心,h为半径的圆内部必有B集合中的
6、交换A集合和B集合的角色,计算B→A的单向豪斯多夫距离h( B, A ),选出h( A, B )和h( B, A )中最长的距离,就是A,B集合的双向豪斯多夫距离
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-24yZUMM6-1666008006265)(attachments/932E9E6T.png)]
在实际计算中,我们并不是选取的不是最大距离(上面只是列举了几个点的最小距离),而是将距离从大到小排列后,取排名为5%的距离。这么做的目的是为了排除一些离群点所造成的不合理的距离,保持整体数值的稳定性。所以也叫HD95
6.相对体积差RVD**
这个有待考证