redeemer,毕业于电子科技大学,打比赛资深玩家,目前是一名算法工程师。
“美食识别挑战(2):茄子、山药、苦瓜、西兰花”赛事链接:
https://god.yanxishe.com/26
AI 研习社:redeemer 大佬好,能否简单介绍一下你的个人背景?
redeemer:坐标北京,目前是一名算法工程师~
AI 研习社:在这次的《美食识别挑战(2)》赛中,你以 99.6495 的优异成绩荣获第一。在这过程中,你认为赛事最大的挑战体现在哪里?
redeemer:首先第一个挑战在于四分类问题对比二分类问题有所区别,所涉及识别维度会有所增加,这对参赛者来说会是一个挑战;
其次,比赛数据集的图片质量各不相同(例如图片大小、分辨率等),因此一定要事先做好预处理工作。
AI 研习社:有没有哪些 baseline 是你觉得比较适合拿来打这场比赛的?原因是什么?
redeemer:我认为自己的 baseline 还不错(笑),主要因为其易于修改。(https://github.com/bochuanwu/aiyanxishe);而在 baseline 选用中,最重要的特性之一就是可修改、可理解。
AI 研习社:你认为正确运用好 baseline 的方法是什么?
redeemer:当我们拿到一个不熟悉的 baseline 时,一定要对 baseline 中数据处理、模型框架、训练技巧的代码片段有足够的理解,这样才会更好的做进一步的修改与提升。
AI 研习社:根据你的了解,多分类问题的主要解题思路有哪些?
redeemer:最简单的就是直接有几类分几类,还可以一对一或者一对多策略。
简而言之,就是训练二分类模型,把数据按类别二分,本次比赛中我就用了这种辅助方法。当然除此之外,还有一些比较冷门的方法;其中,我曾经用过的有 CNN 与 SVM 结合的方法。
AI 研习社:本场赛事的数据集具有哪些特点?对你后来的解题思路有哪些启发?
redeemer:本数据集的图片存在模糊、目标偏离正中、一些数据存在目标特征较小(细粒度)等问题;因此,在数据预处理以及模型选择上要有所测试。
AI 研习社:在本次比赛中,你的目标检测网络这块是怎么处理的呢?是否有用到很大的显存?
redeemer:我个人用了多模型融合以及 kfold 方案,模型融合不光采用概率还有投票方法,其中的 wideresnet 以及 efficientnet 还是需要较大显存的。
AI 研习社:参加这样的比赛,你认为感受最深的是什么呢?
redeemer:可以保持对深度学习工具的熟练度,吸取一些别人 baseline 中优秀的思路。
AI 研习社:对于一些刚入门的小白,你有什么经验或建议给到他们吗?
redeemer:多看开源代码,最好有完整注释或者教程。
但对于比赛的 baseline 要注意,并非所有的 baseline 都对新人很友好,要选择易于理解、易于修改的进行研究会更好。
AI 研习社:你认为什么才是打比赛的「正确姿势」?
redeemer:在我看来,主要分 4 步——
第一观察数据;
第二测试模型;
第三模型融合;
最后就是在细节问题上做到坚持不懈!
/ 限时活动 /
第 2 期 “ 分享代码赠日历 ” 活动来了!
2020 年 2 月 27 日 —— 2020 年 3 月 5 日期间,在《美食识别挑战(2):茄子、山药、苦瓜、西兰花 》比赛的“代码方案”上传参赛代码的选手,均有机会获得此前好评不断的 AI 日历 1 本。
扫码了解详情及参与活动 ↓