2019-08-13工作进展

昨天工作:
尝试使用mv-dssm进行query关联title的效果改善,将封片图信息加入到网络的输入中。当前mv-dssm网络已经搭建完成。训练数据生成中,采用的阿里预训练的resnet50模型来得到图片特征,但是由于数据比较多,程序跑了13h也只完成了10%。

今天计划:

  1. 完成训练数据生成,开始mv-dssm网络的训练

  2. 寻找其他可以改善query关联video效果的方式

  3. 商品主图比较纯粹,没有什么背景,但是有些图片很模糊

select title, concat(https://img.alicdn.com/imgextra/ + pict_url) as pic_url from tbcdm.dim_tb_itm where ds=MAX_PT('tbcdm.dim_tb_itm') and is_online="Y" limit 100;

  1. hs_query_ugc_co_video_final_result_info_1最原始的结果,效果非常不好;将query关键词的权重调到70,结果在hs_query_ugc_co_video_final_result_info_6,效果基本上是当前最好,将query关键词的权重调到150,效果变差,在表hs_query_ugc_co_video_final_result_info_7中

  2. 训练集中title对应的封面图:2658153552,我觉得需要每张图进行特征提取,但是费时

  3. 关于专利(内容、时间)

你可能感兴趣的:(2019-08-13工作进展)