2019年字节跳动短视频内容理解和推荐竞赛

目录

1、简介

2、任务

3、数据

4、时间


官方地址:https://biendata.com/competition/icmechallenge2019/

1、简介

一图胜千言,仅一张图片就包含大量信息,难以用几个词来描述,更何况是短视频这种富媒体形态。面对短视频内容理解的难题,字节跳动作为一家拥有海量短视频素材和上亿级用户行为数据的公司,通过视频内容特征和用户行为数据,可以有充足的数据来预测用户对短视频的喜好。

本次竞赛提供多模态的短视频内容特征,包括视觉特征、文本特征和音频特征,同时提供了脱敏后的用户点击、喜爱、关注等交互行为数据。参赛者需要通过一个视频及用户交互行为数据集对用户兴趣进行建模,然后预测该用户在另一视频数据集上的点击行为,这两个数据集的视频ID交集为空。

 

2、任务

通过构建深度学习模型,预测测试数据中每个用户id在对应作品id上是否浏览完作品和是否对作品点赞的概率加权结果。 本次比赛使用 AUC(ROC曲线下面积)作为评估指标。AUC 越高,代表结果越优,排名越靠前。

 

3、数据

训练集:(2019年1月发布)
- Byte-Recommend100M交互数据集,包含数万用户的亿级别交互数据。
- Byte-Recommend100M中的多模态功能包括面部特征,视频内容特征,标题特征和BGM特征,这些特征都是嵌入向量的形式。 参与者能够将它们结合起来以获得更好的推荐。

验证集:(2019年1月发布)
- 与训练集相同的分布。
- 与训练集相同的用户id。


测试集:
- 与训练集相同的分布。
- 与训练集相同的用户id。

用户与作品的交互数据,具体每个字段代表的含义如下:

 

4、时间

2019年1月10日:比赛上线,开放参赛选手注册

2019年1月30日:发布完毕训练集(包括验证集)和baseline方法代码

2019年2月11日:发布测试集,开放测试集结果提交入口

2019年4月1日:参赛报名截止

2019年4月7日:测试集结果提交截止,计算排名

2019年4月22日:公布最终排名,胜出赛队需要提交参赛方法说明

*以上时间均为 23:59p.m UTC

你可能感兴趣的:(推荐系统)