【kaggle】北大&百度发起的自动驾驶竞赛的初步了解

前言:

{

    最近在kaggle上瞎逛时,忽然看到了一些新竞赛,其中就有北大&百度联合发起的自动驾驶相关竞赛[1]。之前没有了解过自动驾驶,这次趁着这个机会了解一下。

}

 

正文:

{

    首先是竞赛任务

    此竞赛的任务是预测图片中车辆的型号朝向位置。值得一提的是,这次的任务不是分割,而且训练集和测试集都配有mask图片,不过这个mask遮住的是不需要预测的远处车辆。

    车辆的朝向有三个部分,分别为yaw, pitch和roll,其意义如图1(来自[2])所示。

图1

 

    车辆的位置分为x,y和z,其应该为目标车辆对某原点的相对位置,即相对于图片视角,x为从左到右的轴的坐标,y为垂直的轴的坐标,z为从后到前的轴的坐标。

 

    竞赛的数据不止图片和标签。

    camera.zip里是摄像机的内参。所有样本都对应同一组摄像机内参,我还不确定这组内参该怎么用。

    car_models.zip和car_models_json.zip里都是各种车型的3D模型,其区别为:前一个包含的模型文件为pkl格式,而后一个包含的模型文件为json格式。图2(来自[3])是某一模型的数据的展示。

    

【kaggle】北大&百度发起的自动驾驶竞赛的初步了解_第1张图片 图2

    train_images.zip和test_images.zip里分别是训练图像和测试图像。

    train_masks.zip和test_masks.zip里分别是训练图像的mask图像和测试图像的mask图像。

    如上所述,被mask遮住的车辆是不需要预测的。当然,训练图像中被遮住的车辆也不会有对应标签。

    train.csv里是标签数据,其中PredictionString列的数据的格式为“型号 yaw pitch roll x y z 型号 yaw pitch roll x y z 型号 yaw pitch .....”。表1是train.csv中的第91条数据。

    【kaggle】北大&百度发起的自动驾驶竞赛的初步了解_第2张图片

    基于上表可知,图像ID_b8d616497包含的第一辆车的型号为43,其yaw pitch roll x y z分别为0.119055 -2.97995 -3.09862 -4.01331 7.58885和39.1835,第二辆车的型号为35,其yaw pitch roll x y z分别为0.158565 2.66062 -3.10528 -11.2328 6.31401 32.8338,等等。这里的yaw,pitch和roll值都是弧度制。

    sample_submission.csv是提交文件的样本,其格式与train.csv的格式一致。

 

    关于初步方案

    我还没做过相关项目,目前只搜到了一篇谷歌的专利[5],其大概过程是先进行目标检测,之后再对检测到的车辆进行姿态评估。

}

 

结语:

{

    具体数据分析可以看看[3]和[4]。

    能力有限,欢迎拍砖。

    参考资料:

    {

        [1] https://www.kaggle.com/c/pku-autonomous-driving/overview

        [2] https://carsexplained.wordpress.com/2017/02/21/fundamentals-of-car-science-pitch-and-roll/

        [3] https://www.kaggle.com/robikscube/autonomous-driving-introduction-data-review

        [4] https://www.kaggle.com/seshadrikolluri/vehicle-angle-prediction-understanding-eda

        [5] http://pdfaiw.uspto.gov/.aiw?docid=20190012548&SectionNum=1&IDKey=B8934DC9425F&HomeUrl=http://appft.uspto.gov/netacgi/nph-Parser?Sect1=PTO1%2526Sect2=HITOFF%2526d=PG01%2526p=1%2526u=%25252Fnetahtml%25252FPTO%25252Fsrchnum.html%2526r=1%2526f=G%2526l=50%2526s1=%25252220190012548%252522.PGNR.%2526OS=DN/20190012548%2526RS=DN/20190012548

    }

}

 

你可能感兴趣的:(零散知识,问题探究,神经网络与机器学习)