(24)数据挖掘和用户理解

用户推荐系统,一方面是用户特征的挖掘,另一方面是内容标签的匹配。通过协同过滤等方式进行推荐。实践中很多时候直接根据标签划分人群进行推荐了(当然对于单一需求来说)。
用户特征包括其固有特征,年龄,性别等,以及兴趣特征,而兴趣特征又分为长期兴趣和短期兴趣。
对于短期兴趣特征,可以通过近期点击量,访问率等圈选,长期特征可以划分垂类标签。同时很多标签是成体系层次的,如NBA--某明星等。
标签不足时,可能会出现信息孤岛现象。比如某一类内容多次推荐,容易反感。因此还要注意惊喜度等指标。可以通过热门推荐(大部分人都喜欢️)的方式,包括(分类热门和全局热门)试出用户的标签来。另一方面根据网关位置等可以为用户聚群,从而得到某些特征标签。
对于内容标签,主要是通过概率上等强关联来实现的,一般有文本的打标签方法,lda,lsa等。视频最难打,一般为编辑或者上传着选择标注。
对于突发事件等需要人工干预,很多时候需人工运营,如(网易音乐);机器做等分类推荐,都会有准确性和实效性等问题,人工干预再说难免,很多时候也比机器分类效果好的多。

你可能感兴趣的:((24)数据挖掘和用户理解)