【U-net】

1、U-Net基本原理

【U-net】_第1张图片

分为下采样和上采样过程。其中先用卷积和池化进行提取特征,然后用转置卷积和卷积进行重建。

2、池化

这里补充池化的知识:池化就是去除杂余信息,保留关键信息。

池化层也称下采样层,会压缩输入的特征图,一方面减少了特征,导致了参数减少,进而简化了卷积网络计算时的复杂度;另一方面保持了特征的某种不变性(旋转、平移、伸缩等)。池化操作主要有两种,一种是平均池化(Average Pooling),即对邻域内的特征点求平均;另一种是最大池化(Max Pooling),即对邻域内的特征点取最大。

池化方法特征提取误差主要来自两个部分:一是,邻域大小受限造成了估计值方差增大;二是,卷积层参数误差造成了估计均值的偏移。一般来说,在图像研究领域,对图像进行平均池化操作能减少第一种误差,同时更多地保留图像的背景信息;而另一方面,最大池化能减小第二种误差,更多地保留纹理信息。因此在进行卷积神经网络结构设计时,这两种池化方式往往交替使用。

池化的用处:

1、增大感受野

所谓感受野,即一个像素对应回原图的区域大小,假如没有pooling,一个3*3,步长为1的卷积,那么输出的一个像素的感受野就是3*3的区域,再加一个stride=1的3*3卷积,则感受野为5*5。假如我们在每一个卷积中间加上3*3的pooling呢?很明显感受野迅速增大,这就是pooling的一大用处。感受野的增加对于模型的能力的提升是必要的。

2、平移不变性

我们希望目标的些许位置的移动,能得到相同的结果。因为pooling不断地抽象了区域的特征而不关心位置,所以pooling—定程度上增加了平移不变性。

1、增大感受野
所谓感受野,即一个像素对应回原图的区域大小,假如没有pooling,一个3*3,步长为1的卷积,那么输出的一个像素的感受野就是3*3的区域,再加一个stride=1的3*3卷积,则感受野为5*5。
假如我们在每一个卷积中间加上3*3的pooling呢?很明显感受野迅速增大,这就是pooling的一大用处。感受野的增加对于模型的能力的提升是必要的,正所谓“一叶障目则不见泰山也”。
2、平移不变性
我们希望目标的些许位置的移动,能得到相同的结果。因为pooling不断地抽象了区域的特征而不关心位置,所以pooling—定程度上增加了平移不变性。
3、降低优化难度和参数
我们可以用步长大于1的卷积来替代池化,但是池化每个特征通道单独做降采样,与基于卷积的降采样相比,不需要参数,更容易优化。全局池化更是可以大大降低模型的参数量和优化工作量。
 

3、语义分割

对像素位置进行分类。输出层通道数=分类数。输出为概率矩阵。

比如在细胞图像分割时,U-Net的任务是,给细胞图像的每个像素进行分类。所以,数据集中,输入是细胞图像,标签是语义分割图。换句话讲,U-Net学习到了从细胞图像到语义分割图像的映射关系。

4、U-Net和计算成像

一般的计算成像系统由硬件部分和计算部分组成。在硬件部分中,光通过(穿过或反射)目标物体以及光学元件(例如透镜,棱镜等),最终在相机靶面上产生原始强度图像。对原始强度图像进行计算处理,从而得到目标物体的属性。

定量相位检索就是一个典型的计算成像任务。一束平行光照射到空间光调制器(相位型)的表面,反射回的光携带了相位信息,经反射后进入相机中,得到强度图(衍射强度图)。从强度图中得到空间光调制器表面的相位信息,就叫相位检索。U-Net可以学习从细胞图像到语义分割图的映射关系。对于相位检索来说,从强度图到相位图也存在着确定的映射关系。那么同样可以用U-Net来学习从强度图到相位图的映射关系(空间光调制器和相机可以采集大量数据作为数据集)

·输入:从细胞图换成强度图。

·标签:从语义分割图换成相位图。

·输出层:通道数从2改为1。

·损失函数:从交叉嫡误差成均方误差。

你可能感兴趣的:(机器学习)