深度学习调参经验分享(遥感建筑提取)

1.1初识
明确遥感解译任务目标,观察遥感影像和标注的基本形态和分布,地物特征
(1)看数据标注是否存在噪声?(因为比赛时他的影像和标注时间不一定一致,导致标注本身不一定完全正确)
1对于标记噪声是否进行人工清洗(不推荐,比赛中A榜存在问题,我么清洗了在A榜精度提升了,但是B榜也可能存在问题,那时候我们没有办法在改了);2考虑label smoothing降低对于标签的信心
(2)数据之间是否存在同物易谱(类内间差异大)或异物同谱(易混淆)现象?
1是否需要设计一些全局性的特征;2考虑是否要使用一些强大的特征提取网络;3是否要对该部分数据进行一些针对性的数据增强;4在光谱维度上不好分是否可以考虑一些其他波段的信息来进行数据增强
1.2统计
使用遥感软件对数据集统计均值方差等基本信息,了解下数据的大致分布。
(1)看数据类别是不是分布极不均衡?
1是否需要对样本进行平衡采样;2是否要考虑改进网络损失函数(加权交叉熵,focal);3对于数量特别少的类别,是不是需要设计专门的二分类模型来实验
(2)看训练集与测试集之间的统计差异是否很大?
1考虑使用一些泛化能力更强的特征提取器;2设计一些数据增强来提高对复杂数据的泛化能力;3考虑使用SWA训练策略提升模型的泛化能力;4使用IBN结构有效提升在不微调的基础上就可以泛化到另外一个域中
1.3简单实验:
采用简单的baseline(如unet)对目标进行测试,看看大致实验的精度看看提取效果
1.4难点分析:以建筑提取为例
1建筑目标大小:大房子提的差还是小房子提的差
能否考虑金字塔结构使网络对大小目标都提的比较好
2建筑目标光谱:蓝房子提的差还是灰房子差
能否考虑特征提取,泛化能力强的backbone提高网络的提取泛化能力
3建筑目标特征:密集房子提的差还是稀疏房子提的差
能否考虑金字塔结构使网络对多级特征均加以利用
4建筑目标形态:是长房子提的差还是宽房子提的差
能否考虑引入可变性卷积对特定形状的房屋进行进一步优化(这个更多体现在港口)
5建筑目标效果:是房子定位差(错检漏检多)还是边缘提的差
能否考虑定制策略对网络边缘进行进一步优化(边缘算子,双流模型等)
1.5针对性设计解决方案:
根据数据分析和实验结果与比赛数据特点和难点,针对性设计一些解决思路,模型优化,参数调整等
(1)数据增强技巧(albumentations库中提供了很多方法)
常用:随机旋转,随机水平垂直镜像,hsv变换,亮度和对比度增强
高级:mixup,cutmix,copypaste
遥感:大气校正(结果准确),图像融合(提升分辨率),归一化,均衡化,
(2)进阶的一些网络优化技巧
1使用IBN结构;2去除backbone结构中的第一个池化层来增加特征分辨率,提升对较小地物对象提取效果(尤其是对于低分辨率遥感影像,多次卷积池化对于小目标很容易丢失);3引入注意力机制,用于提高模型的特征提取能力
(3)常用的网络训练技巧
1)优化器选取
通常实验可以先使用adam让模型自适应快速收敛,其效果一般来说还可以,可以快速看下模型大致的能力,但是一般还是会低于经过精细调整的SGD+momentum+学习率调整策略的结果,但是这种组合对参数非常敏感,需要经过多次调节反复实验才能得到最优参数,一般用于最后比赛或论文最终完成的成果。
2)损失函数选取
1加权交叉熵;2组合损失函数;3focal loss;4label smooth
3)训练策略选取
1学习率调整策略选取;2warmup机制的引入;3swa策略
4)调参技巧
先选取一个正常的训练尺度和较小的backbone,利用控制变量法分别调整学习率和迭代次数,找到较优的参数;在比赛效率要求前提下,尽可能提高输入分辨率(一般来说提升最明显),然后换较大的backbone,当发现精度降低一般是过拟合,考虑数据增强,但数据增强需要一个个试,他可能使模型变强,也肯能变差,同时往往需要更多的训练次数
5)图像后处理
分类后发现网络产生许多噪声,能否考虑CRF后处理,对分割结果进行连通性分析从而去除椒盐噪声
1.6效率优化,模型融合:
在效果提取较好的结果下考虑效率问题,优化效率;对于如果多个模型,考虑进行模型融合等策略。

你可能感兴趣的:(深度学习,经验分享,神经网络)