某比赛-年纪预测

数据预处理清洗:

  1. 所有appid,都转化成类别
  2. 统计出低频的手机型号过滤掉用unk代替

特征提取:

  1. 手机品牌+型号 3259个手机型号
  2. app使用类别使用做为特征(45大类,288细类)
  3. 手机使用时间段偏好(每四小时分段)
  4. app类别 使用时长 top 5 (替换掉特征2)
  5. 手机使用总时长

 

网络结构,256->128->64->num_classes

 

train size: 45000 test size:5000

不用brand2id, 2.7775

使用全量brand2id, 2.7656 (basic_brand_freq_threshold=0)

使用全部映射的brand2id 2.7717

使用全量brand2id, 2.7691 (basic_brand_freq_threshold=10)

 

使用全量brand2id+系统应用 2.7669

 

model-deep-044-2.7554.hdf5

 

你可能感兴趣的:(杂)