redeemer 大佬聊赛事:【美食识别挑战(2)】的四分类问题,怎么破?

redeemer 大佬聊赛事:【美食识别挑战(2)】的四分类问题,怎么破?_第1张图片


redeemer 大佬聊赛事:【美食识别挑战(2)】的四分类问题,怎么破?_第2张图片

redeemer,毕业于电子科技大学,打比赛资深玩家,目前是一名算法工程师。

redeemer 大佬聊赛事:【美食识别挑战(2)】的四分类问题,怎么破?_第3张图片


“美食识别挑战(2):茄子、山药、苦瓜、西兰花”赛事链接:

https://god.yanxishe.com/26

redeemer 大佬聊赛事:【美食识别挑战(2)】的四分类问题,怎么破?_第4张图片

AI 研习社:redeemer 大佬好,能否简单介绍一下你的个人背景?

redeemer:坐标北京,目前是一名算法工程师~


AI 研习社:在这次的《美食识别挑战(2)》赛中,你以 99.6495 的优异成绩荣获第一。在这过程中,你认为赛事最大的挑战体现在哪里?

redeemer:首先第一个挑战在于四分类问题对比二分类问题有所区别,所涉及识别维度会有所增加,这对参赛者来说会是一个挑战;

其次,比赛数据集的图片质量各不相同(例如图片大小、分辨率等),因此一定要事先做好预处理工作。


AI 研习社:有没有哪些 baseline 是你觉得比较适合拿来打这场比赛的?原因是什么?

redeemer:我认为自己的 baseline 还不错(笑),主要因为其易于修改。(https://github.com/bochuanwu/aiyanxishe);而在 baseline 选用中,最重要的特性之一就是可修改、可理解。


AI 研习社:你认为正确运用好 baseline 的方法是什么?

redeemer:当我们拿到一个不熟悉的 baseline 时,一定要对 baseline 中数据处理、模型框架、训练技巧的代码片段有足够的理解,这样才会更好的做进一步的修改与提升。


AI 研习社:根据你的了解,多分类问题的主要解题思路有哪些?

redeemer:最简单的就是直接有几类分几类,还可以一对一或者一对多策略。

简而言之,就是训练二分类模型,把数据按类别二分,本次比赛中我就用了这种辅助方法。当然除此之外,还有一些比较冷门的方法;其中,我曾经用过的有 CNN 与 SVM 结合的方法。


AI 研习社:本场赛事的数据集具有哪些特点?对你后来的解题思路有哪些启发?

redeemer:本数据集的图片存在模糊、目标偏离正中、一些数据存在目标特征较小(细粒度)等问题;因此,在数据预处理以及模型选择上要有所测试。


AI 研习社:在本次比赛中,你的目标检测网络这块是怎么处理的呢?是否有用到很大的显存?

redeemer:我个人用了多模型融合以及 kfold 方案,模型融合不光采用概率还有投票方法,其中的 wideresnet 以及 efficientnet 还是需要较大显存的。

AI 研习社:参加这样的比赛,你认为感受最深的是什么呢?

redeemer:可以保持对深度学习工具的熟练度,吸取一些别人 baseline 中优秀的思路。


AI 研习社:对于一些刚入门的小白,你有什么经验或建议给到他们吗?

redeemer:多看开源代码,最好有完整注释或者教程。

但对于比赛的 baseline 要注意,并非所有的 baseline 都对新人很友好,要选择易于理解、易于修改的进行研究会更好。


AI 研习社:你认为什么才是打比赛的「正确姿势」?

redeemer:在我看来,主要分 4 步——

第一观察数据;

第二测试模型;

第三模型融合;

最后就是在细节问题上做到坚持不懈!




/ 限时活动 /

第 2 期 “ 分享代码赠日历 ” 活动来了!

2020 年 2 月 27 日 —— 2020 年 3 月 5 日期间,在《美食识别挑战(2):茄子、山药、苦瓜、西兰花 》比赛的“代码方案”上传参赛代码的选手,均有机会获得此前好评不断的 AI 日历 1 本。

扫码了解详情及参与活动 ↓

redeemer 大佬聊赛事:【美食识别挑战(2)】的四分类问题,怎么破?_第5张图片

美食识别挑战(2)比赛传送门:

https://god.yanxishe.com/26

你可能感兴趣的:(redeemer 大佬聊赛事:【美食识别挑战(2)】的四分类问题,怎么破?)