KDD cup2020推荐赛道的数据分析

在上一篇博客https://blog.csdn.net/weixin_45459911/article/details/106148695中,对比赛进行了基本的介绍并提供了一个baseline,今天就来详细介绍一下比赛数据。

数据查看
1、查看…/data/underexpose_train/underexpose_user_feat.csv数据(分别是用户id、年龄水平、用户性别、城市等级):
KDD cup2020推荐赛道的数据分析_第1张图片
2、查看…/data/underexpose_train/underexpose_item_feat.csv数据:
KDD cup2020推荐赛道的数据分析_第2张图片
由以下部分组成:
item_id:商品的唯一标识符
txt_vec:项目的文本特征,它是由预先训练的模型生成的128维实值向量
img_vec:项目的图像特征,它是由预先训练的模型生成的128维实值向量

3、查看…/data/underexpose_train/underexpose_train_click-0.csv数据
KDD cup2020推荐赛道的数据分析_第3张图片
分别为:用户id,item_id,点击时间(数据已脱敏)。

4、查看…/data/underexpose_test/underexpose_test_click-0/underexpose_test_click-0.csv数据
KDD cup2020推荐赛道的数据分析_第4张图片
5、查看…/data/underexpose_test/underexpose_test_click-0/underexpose_test_qtime-0.csv数据
KDD cup2020推荐赛道的数据分析_第5张图片

你可能感兴趣的:(KDD cup2020推荐赛道的数据分析)