怎么设计用户画像体系?


1.为什么要做用户画像系统?

2.怎么设计用户画像的数据框架?

2.2 用户画像的数据框架解读

第一层:数据源,分为静态数据和动态数据。

对动态数据来说,

(1)不同行为的权重是不同的(Who/When/Where/How /What)。比如对于一亩田的集市业务,对胡萝卜这个产品点击打电话>浏览的权重。

(2)不同的行为的权重衰减周期也是不同的,比如搜索胡萝卜后打电话超过5次,那么胡萝卜类的农产品供应推荐就应该减少或降低。不过作为农业更为复杂的一点是,不同的农产品它自身也存在这“衰退”周期,比如大葱是一年四季都有的产品,但是西瓜是夏天5-8月才会大量上市。搜索大葱的人#大葱的购买意向是更持久的,搜索西瓜的人#西瓜的购买意向只能在上市周期内推荐才更有效。所以我们有专门管理数千种农产品上下市时间的数据库。

(3)对历史数据的使用要审慎。因为历史数据可能存在一些未知的统计或埋点错误,需要交叉比对和有效性确认。


第二层:input层

这块是离线处理层,对内容进行理解,索引化处理,形成分类标签、实体标签(有实际意义的词)

对这一层的要求就是充足、过滤、字段标准化。

这里的数据转换,我们业务采用了“处理但不归类”的原则(其他的有“不处理不归类”,“处理并归类”),输出永久存储文件,字段经过标准化形成画像规范。

第三层:预处理层

为计算层提供数据支持,我们把所有的事件(nearline层,更快的更新用户画像)


第四层:在线计算层

这一层是在线计算的,主要是理解用户的请求,对内容进行筛选、排序。做数据源的关联、聚合、权重计算(计算层不要调用自己这一次的输出)


五、output层

字段存储的规范、字段存储。


3. 在用户画像体系中,pm可以做的事情

一是在数据源上,把静态数据和动态数据做有效区分归类。底层的数据分类、标签分类要根据业务和公司需要进行有效整理。

二是在nearline层(预处理层),把一些时效性要求比较强的数据提出预处理的规则。

三是在计算层:基于业务理解,做数据的权重调整、聚合调整

四是在输出层:做样式的优化,让用户界面更友好,更容易实现项目的目标

你可能感兴趣的:(怎么设计用户画像体系?)