该博客由EMMA原创,随意转载,博客原链接
原文链接:paper
出处:2010 IEEE International Symposium on Multimedia
最近在使用小波变换做原始图像预处理,然后用CNN训练多个模型进行分类,想找一个fusion的方法,所以找到了这篇论文。虽然最后本文使用的多数权重投票方法深不得我心,不过引言还是让我涨了姿势。文章通俗易懂,除了有些地方小题大做,在当时应该不错的论文吧。mark [16]19
如今显微镜技术的快速发展极大地促进了数据的生成。这些数据不仅在理论生物学研究起重要作用同时对于临床也有很大影响。为了降低内外部观测的差异性,以及保护人们对这些数据进行的各种努力(标注和分类),大量的努力贡献到生物学图像算法的发展中。在这些努力中,病理学图像分类是其中一个重要的领域,由于其在病理学诊断(比如,癌症诊断)中的广泛应用。本文提出一个新颖的框架Collateral Representative Subspace Projection Modeling (C-
RSPM) 。这是一个监督分类模型适用于大部分的病理学图像分类。在这个框架中,一个图像被分成25个块,目的是降低计算的空间复杂度,每个块都构建一个CRSPM模型,这个模型包含所有图像中该块位置的块。意思就是所有图像的同一位置构建一个模型,总共构建25个模型,因为一张图有25块。对于测试图像,我们先对它的每个块进行分类,然后使用多模型混合方法利用权重投票策略来决定整张图最后的类别。实验采用了3折交叉验证。
关键词:病理学图像分类;多模型混合;多数权重投票算法;C-RSPM模型
病理学图像分类有几个难点:1. 病理学图像不稳定,因为图像的任何一个区域都有不同的特性(这是所有图像分类的问题好吗,就是因为有不一样的特性才能分类呀,搞不懂原作者写这句话时怎么想的);2. 染色环境的差异以及个体的而不同,也给分类带来了困难;3. 类内差异有时很小,有时对于人类专家来说也很难正确分类。 在参考文献12中,我们可以看到相比于其他类型的数据,病理学图像分类的任务正确率要低很多。
有两个研究方向:
1. 提取特定特征,比如离散小波变换在提取特征之前实施为了提高分类系统的鲁棒性[16]. 不规则碎片,基于纹理特征的研究。
2. 目的是更好的分割物体。最近邻分类算法,通过腺体和细胞被分割之后提取的特征来进行前列腺癌评分,乳腺癌检测和乳腺癌评分[19]。
本文提出的C-RSPM方法是监督分类模型,它尝试训练一个主成分分析序列。每个成分都学习训练数据一类的分布为了判断测试图像的类别。
本文提出的模型具有general特性,
特征准备:
每张图首先被分成25块,所有 图片同一位置的块形成一组 Bk,1<=k<=25 .每组有505个特征,包含颜色纹理特征,从每个块中提取出来的。然后数据集被分成训练数据和测试数据。进行正则化。
分类:
每块训练一个模型,所以拥有25个模型。
根据多数投票算法( Weighted Majority Voting Algorithm )得到最终的分类结果。
训练多个主分量分类器Principal Component Classifiers (PCCs),
每个test经过分类后,有有25个模型,所以得到25个labels。因此能够得到概率矩阵。假设有U类,那么每个模型将产生U个概率预测值,那么概率值最大的就是这个模型的预测结果。我们把25个U维向量拼接起来,构成25 * U权重维矩阵。矩阵同一列相加,形成相加后的U维向量,哪维最大就是哪类。
(原文写的比较繁琐,居然还用到了公式,基本原理就是我上面翻译的,真搞不懂原作者为啥要小题大做。)
EMMA
SIAT
2017.04.19