JData大数据竞赛18年赛题-如期而至-用户购买时间预测

年前做的,也是学习别人的作品作为记录

 

一、赛题

  

表1:sku基本信息表(jdata_sku_basic_info)

 

 JData大数据竞赛18年赛题-如期而至-用户购买时间预测_第1张图片

JData大数据竞赛18年赛题-如期而至-用户购买时间预测_第2张图片

 

 

表2:用户基本信息表(jdata_user_basic_info)

 

 JData大数据竞赛18年赛题-如期而至-用户购买时间预测_第3张图片

 

 

 

表3:用户行为表(jdata_user_action)

 JData大数据竞赛18年赛题-如期而至-用户购买时间预测_第4张图片

 

 

 JData大数据竞赛18年赛题-如期而至-用户购买时间预测_第5张图片

 

 

表4:用户订单表(jdata_user_order)

 

 JData大数据竞赛18年赛题-如期而至-用户购买时间预测_第6张图片

JData大数据竞赛18年赛题-如期而至-用户购买时间预测_第7张图片

 

 

 

表5:评论分数数据表(jdata_user_comment_score)

 JData大数据竞赛18年赛题-如期而至-用户购买时间预测_第8张图片

 

 

 

数据说明:

 JData大数据竞赛18年赛题-如期而至-用户购买时间预测_第9张图片

 

 

任务:

根据提供的数据,预测未来一个月内最有可能购买目标品类的用户,并预测首次购买日期

 

 

二、思路

  1.提取数据及预处理        data_load.py

    ①加载数据

    ②将日期转为pandas形式,处理分别得到年月日

    ③统计订单评价等级和次数

    ④得到三个dataframe

Jdata_user_order:user_id,sku_id,o_id,o_date,o_area,o_sku_num,o_date_y,o_date_m,           o_date_d,price,cate,para_1,para_2,para_3,score_level_1_count,score_level_2_count,

        Score_level_3_count,cost

Jdata_user_action:user_id,sku_id,a_date,a_num,a_type,a_date_y,a_date_m,a_date_d,price,cate,para_1,para_2,para_3

 

Jdata_user_basic_info:user_id,age_-1,age_1,age_2,age_3,age_4,age_5,age_6,sex_0,sex_1,sex_2,user_lv_cd_1, user_lv_cd_2, user_lv_cd_3, user_lv_cd_4, user_lv_cd_5

    ⑤特征选择     feat_main.py  feature.py

 


参考特征:

与购买相关的特征:

订单数/商品数/商品种类/购买次数/有购买行为的天数/有购买行为的月数

与浏览和收藏相关的特征:

行为(浏览或收藏)商品数/行为(浏览或收藏)商品种类/行为(浏览或收藏)天数/收藏商品数/收藏商品种类/有收藏行为的天数

地理信息:

用户下单过的地点数/用户订单数最大的地点编号

参数信息:

用户所购买商品price/para1/para2/para3的最大值最小值平均值中位数

用户花费:

用户的总花费

用户购买集中度:

用户购买集中度=购买的商品次数/购买的商品种类

用户商品忠诚度:

用户购买同一sku的最大次数

用户购买转化率:

用户购买转化率=用户购买的商品种类/用户有行为(浏览或收藏)的商品种类

日期特征:

购买的最小的day/最大的day/平均的day

近3个月/5个月 月首购买日期的最大、最小、平均、中位数

 

三、代码

不知道博客园怎么上传文件,zzz

先不上传了

转载于:https://www.cnblogs.com/1113127139aaa/p/10385916.html

你可能感兴趣的:(JData大数据竞赛18年赛题-如期而至-用户购买时间预测)