2021-02-05

1、完成80w+的3C数码数据预打标与统计分析,对数据去重去链接之后发现老模型的覆盖率约为29%,新模型的覆盖率约为32%,都是偏低。

2、抽取真实流量50w(保留链接等),进行新老模型+正则的打标处理,等待结果出来后统计cover。

3、品类包中属性聚类:去头去尾后删选出了88个属性,但是发现不同类目间共有的属性完全没有规律,人工都没有办法将相似的聚类到一起更何况聚类算法,感觉此路不太通。

你可能感兴趣的:(2021-02-05)