kaggle自动驾驶竞赛铜牌总结:Peking University/Baidu - Autonomous Driving—(Part 1)

前言

前段时间打了kaggle上的"Peking University/Baidu - Autonomous Driving"比赛,竞赛时间为三个月,前期一直在银牌区域,但到了比赛后期,各路大神出来一顿乱秀,最终获得铜牌,该系列博客是在比赛中采取的一些方法技巧及心得的总结。

  • 本系列博客分为两部分:
    Part 1、该Kaggle竞赛的赛题解读以及数据集分析
    Part 2、我在竞赛中采取的一些方法技巧总结

Part 1、Kaggle竞赛的赛题解读及数据集分析

竞赛平台:kaggle
什么?还不知道kaggle是什么?看这里:
推荐一个知乎高赞的回答:Kaggle入门,看这一篇就够了
竞赛题目:Peking University/Baidu - Autonomous Driving
赛题描述:百度的RAL联合北京大学基于工业级的CAD汽车模型,为竞赛者提供来自5277个真实图片的超过60000个带标签的3D汽车实例。要求参赛者开发一种算法,并据此估计来自真实交通环境的单一图片中车辆的绝对姿态(6个自由度)。
属于图像处理计算机视觉一类的竞赛。

大致了解了这个比赛是做什么的,接下来我们开始详细剖析。

1、数据集分析

图像处理当然首先关心图像数据集!

  • 训练数据集(train_images.zip):包含4262张带标签的图片,所有图片均在一辆车车顶相机位置拍摄
  • 带标签文件(train.csv):对应所有训练集图片的姿态信息(pose information)
  • 测试数据集(test_images.zip):包含2021张未带标签的图片
  • train_masks.zip、test_masks.zip:这两个文件夹中图像是做什么的呢?有何用?不着急,后面再来说它俩的作用
  • sample_submission.csv:提交结果的样本示例
  • car_models.zip:训练/测试集图片中未遮挡汽车的3D模型,可用于姿态估计,但一直没能找到方法利用它,可能这就是我们和前排队伍分数之间的差距吧。
  • camera.zip:相机固有参数

既然是车辆绝对姿态估计,Pose Information表示如下,但都表示什么意思呢?
model type, yaw, pitch, roll, x, y, z
我们取train.csv中实际数据说话!图片名称(ID_8a6e65317)的pose information如下:

ID_8a6e65317,
16 0.254839 -2.57534 -3.10256 7.96539 3.20066 11.0225
56 0.181647 -1.46947 -3.12159 9.60332 4.66632 19.339
70 0.163072 -1.56865 -3.11754 10.39 11.2219 59.7825
70 0.141942 -3.1395 3.11969 -9.59236 5.13662 24.7337
46 0.163068 -2.08578 -3.11754 9.83335 13.2689 72.9323

(16 56 70 70 46为(ID_8a6e65317)中对应不同车辆的model type标号)

orientation 方向
yaw 偏航角
pitch 俯仰角
roll 滚动角
position 位置
x x轴
y y轴
z z轴

好!现在问题进一步清楚了,我们要根据测试集图片中车辆的pose information来估计测试集图片中车辆对应的pose information,此外,还需提供你对预测的置信度得分(confidence)。
至此,数据集部分的分析到此结束。

2、Kaggle参赛技巧
  • 如果说你什么都不知道,那还是从了解kaggle开始吧;如果说你已经打了一些练习赛,并且掌握计算机视觉,图像处理相关知识的话,推荐几位Competitions Grandmaster大佬的kaggle技巧分析。
    Kaggle你问我答【1】——SeuTao
    Kaggle你问我答【2】——Jiwei Liu
    本科生晋升GM记录 & kaggle比赛进阶技巧分享

请跳转查看:Part 2、我在竞赛中采取的一些方法技巧总结

你可能感兴趣的:(Kaggle)