Kaggle比赛分类与winner资料汇总(更新中)

Kaggle比赛分类与winner资料汇总(更新中)

1.介绍

把比赛分为四类,Data Mining、Images、NLP、Speech Recognition,举几个例子:

  1. Data Mining:比如ctr预估、推荐,基本是不包括Deep Learning的比赛
  2. Images:图像类,Google AI Open Images - Object Detection Track
  3. NLP:自然语言处理类,Quora Question Pairs
  4. Speech Recognition:语音识别,TensorFlow Speech Recognition Challenge

本篇博客会介绍一些结束的比赛或者博主经历过的比赛,一开始会将比赛进行分类,介绍基本的任务,然后根据需要深入了解一些比赛后再更新前几名的solution、一些资料的链接、一些trick和分享一些心得等。

大致介绍一下接下来的结构,首先按照类别把比赛分进行分类,每一类里按照比赛的结束时间由最近的介绍到以前的。

目前更新到Plant Seedlings Classification



2.比赛

忽略的比赛有:

Flavours of Physics: Finding τ → μμμ (Kernels Only)

TrackML Particle Tracking Challenge

iNaturalist Challenge at FGVC5

Google Cloud & NCAA® ML Competition 2018-Men’s

Google Cloud & NCAA® ML Competition 2018-Women’s

2.1 Data Mining

2.1.1 分类(Classification)


Forest Cover Type (Kernels Only)

结束时间:2018-09-25 Playground Multi-class Classification

1.任务介绍:根据森林的土壤、海拔等信息预测数的类型,accuracy计算得分。


What’s Cooking? (Kernels Only)

结束时间:2018-09-25 Playground Multi-class Classification

1.任务介绍:根据烹饪中用的材料,预测它是哪个地区的烹饪方式,accuracy计算得分。


Costa Rican Household Poverty Level Prediction

结束时间:2018-09-18 Playground Multi-class Classification

1.任务介绍:根据家庭情况,预测家庭的贫困等级,macro F1 score计算得分。


Home Credit Default Risk

结束时间:2018-08-29 Featured Binary Classification

1.任务介绍:根据贷款申请者的情况判断是否通过其贷款申请,ROC area计算得分.


TalkingData AdTracking Fraud Detection Challenge

结束时间:2018-05-07 Featured ctr, Predict probability

1.任务介绍:预测用户在点击移动应用广告后下载应用的概率,ROC area计算得分。


2.1.2 分类(综合)


Avito Demand Prediction Challenge

结束时间:2018-06-27 Featured Predict probability

1.任务介绍:根据商品的信息(标题、图片、描述等)预测卖出去的概率,RMSE计算得分。


DonorsChoose.org Application Screening

结束时间:2018-04-25 Playground Predict probability

1.任务介绍:根据项目描述的文本和项目的其他元数据预测被批准的概率,ROC area计算得分。



2.1.3 回归(Regression)


New York City Taxi Fare Prediction

结束时间:2018-09-25 Playground

  1. 任务介绍:根据上下车的地点预测纽约出租车的计费,大规模数据,RMSE 计算得分

Store Item Demand Forecasting Challenge

结束时间:2018-09-25 Playground

  1. 任务介绍:根据过去5年的商品销售数据,预测未来3个月的商品销售额,时间序列,SMAPE计算得分。

Santander Value Prediction Challenge

结束时间:2018-08-20 Featured

1.任务介绍:预测潜在客服的交易价值,RMSLE 计算得分。



2.2 Images

计算机视觉四大基本任务(分类、定位、检测、分割)

2.2.1 图像分类(Image Classification)


给定一张输入图像,图像分类任务旨在判断该图像所属类别。

The 2nd YouTube-8M Video Understanding Challenge

结束时间:2018-08-06 Featured Multi-label Classification

1.任务介绍:给YouTube视频打标签,Global Average Precision计算得分。


Humpback Whale Identification Challenge

结束时间:2018-07-15 Playground Multi-class Classification

1.任务介绍:根据鲸鱼的尾巴图片对鲸鱼分类,MAP@5计算得分。


iMaterialist Challenge (Fashion) at FGVC5

结束时间:2018-05-30 Research Multi-label Classification

1.任务介绍:为每张时尚图片分配多个属性,Mean F1 score(micro-averaged)计算得分。


iMaterialist Challenge (Furniture) at FGVC5

结束时间:2018-05-30 Research Multi-class Classification

1.任务介绍:对每张家具照片分类,每张图片只有一个标签,average error计算得分。


Google Landmark Recognition Challenge

结束时间:2018-05-29 Research Multi-label Classification

1.任务介绍:对每张景点照片分配0/1/more地标标签,Global Average Precision (GAP) at k计算得分。


Google Landmark Retrieval Challenge

结束时间:2018-05-29 Research 图像检索

1.任务介绍:对于每个查询,检索包含相同地标(如果有的话)的所有数据库图像,mAP@100计算得分。


Plant Seedlings Classification

结束时间:2018-03-12 Playground Multi-class Classification

1.任务介绍:对每张植物图片预测其物种类别,micro-averaged F1-score计算得分。



2.2.2 目标定位(Object Localization)


在图像分类的基础上,我们还想知道图像中的目标具体在图像的什么位置,通常是以包围盒的(bounding box)形式。

RSNA Pneumonia Detection Challenge

结束时间:2018-10-31 Featured

  1. 任务介绍:找到医学图像中肺炎的位置,用bounding box包围,IoU计算得分。


2.2.3 目标检测(Object Detection)


在目标定位中,通常只有一个或固定数目的目标,而目标检测更一般化,其图像中出现的目标种类和数目都不定。因此,目标检测是比目标定位更具挑战性的任务。

Google AI Open Images - Object Detection Track

结束时间:2018-08-30 Featured

1.任务介绍:识别图片中的物体,目标种类和数目不定,用bounding box包围,Mean Average Precision计算得分。


Google AI Open Images - Visual Relationship Track

结束时间:2018-08-30 Featured

1.任务介绍:识别带有关系的物体,mAP&recall计算得分。



2.2.4 语义分割(Semantic Segmentation)


语义分割是目标检测更进阶的任务,目标检测只需要框出每个目标的包围盒,语义分割需要进一步判断图像中哪些像素属于哪个目标。

TGS Salt Identification Challenge

结束时间:2018-10-17 Featured

  1. 任务介绍:在卫星地图上找出是盐的pixel,IoU计算得分。

CVPR 2018 WAD Video Segmentation Challenge

结束时间:2018-06-11 Research

1.任务介绍:在图片中分割出七种不同的移动的物体,IoU计算得分。


2018 Data Science Bowl

结束时间:2018-04-16 Featured

1.任务介绍:在细胞图片中找到细胞核的pixels,IoU计算得分。



2.3 NLP

2.3.1 情感分析(Sentiment Analysis)


Movie Review Sentiment Analysis (Kernels Only)

结束时间:2018-09-24 Playground Multi-class Classification

1.任务介绍:为Rotten Tomatoes的影评进行情感分类,accuracy计算得分。


Toxic Comment Classification Challenge

结束时间:2018-03-20 Featured Multi-headed Classification

1.任务介绍:建立一个multi-headed模型,检测出不同类型的毒性,如威胁,淫秽,侮辱和仇恨,对每一类预测概率,mean column-wise ROC AUC计算得分。



2.4 Speech Recognition

2.4.1 语音分类


Freesound General-Purpose Audio Tagging Challenge

结束时间:2018-07-31 Research Multiclass Classification

1.任务介绍:对语音进行分类,MAP@3计算得分。

你可能感兴趣的:(Kaggle,Kaggle)