我理解的用户画像

我理解的用户画像

​ 用户画像介于数仓 推荐系统的中间. 用户画像能用来做什么? 比如精准营销、精细化运营、推荐系统等等 应用于电商 金融 医疗 等等
我来一下简单的架构流程
​ 用户画像的目的就是为了分群,为了给用户贴上标签。 这些标签从哪里来呢,从业务系统来,从数仓来。

  • 标签目前主流是到5级标签。这里运用springboot开发weib管理系统 标签信息存储到mysql数据库中,数据存储到HBASE中。 标签呢,根据模型类型可以分为三类。匹配型标签,统计型标签,挖掘型标签。 mysql 数据库存储有标签表 标签信息表 最终目的就是抽取出相应字段 为用户打上标签。
  • 重新hbase方法,自定义source 和sink,抽取公共类方法做成基类。这样就可以减少一些重复性操作 后期标签开发就是只是处理相应逻辑就好了。
    挖掘类标签是重点也是难点。这里我用sparkmlib开发以电商为例,举几个模型。以及用到的算法. RFM 用户价值度模型 RFE 用户活跃度模型 PSM 消费敏感度模型 这里用到了KEMANS模型,一种最简单最常用的聚类模型.感兴趣的小伙伴,可以点一点小例子 USG用户购物性别模型 用到了决策树算法,是最常用分类算法. BP 品牌偏好模型 用到了ALS算法 协同过滤 原理类似矩阵想乘,为不同向量点附上一些属性. 双十一购买金额预埋 用到线性回归的算法 恶意差评/刷单行为识别 用到了朴素贝叶斯算法
  • ​ 通过不同的算法生成不同的模型,数据根据模型预测到不同的结果. 结果写入HBASE中,保存好标签供上游应用来使用. HBASE中虽然对于存储量级没压力,但是rowkey查询是个问题. 所有还要用ES后者phonenix 二级索引做成相应的接口供上游使用.
  • ​ 简单说到这里. 算法是一个坎,好多人想要进去.统计学和数学是基础. 我基础太差,了解太少,以前丢的东西.想要拾起来,也是心有余而力不足. 能说上来也就这些了.挖掘型标签我只是做了一些. 学习是一个终身的过程,任何时候都不应该放下. 好了,鸡汤我就不说了.希望我们活成我们自己想要的样子.
  • 最后附上真个项目的架构.希望给各位小伙能带来一些收获.

我理解的用户画像_第1张图片

3557925458)]

你可能感兴趣的:(大数据,用户画像)