近期阅读《数据挖掘与数据化运营实战》一书,作者卢辉是阿里巴巴商业智能部数据分析专家,从事数据库营销和数据化运营分析多年,全书穿插了大量真实的实践案例,是本值得推荐的好书。
本文为书籍阅读后的理解与相关笔记,从“分析用户特征,打造用户画像,建设推荐系统”、“运营行为”、“全局指标”几个维度描述大数据与运营的结合应用。
一、运营了解
运营的目的[1]
运营的目的有两点:
一是让产品活的更久,即延长产品的生命周期,延长用户的生命周期
二是让产品活的更好,即能赚钱,或者有赚钱的潜力
何为精细化运营?[1]
精细化运营就是一种建立在数据基础上的思维方式,用较少的成本获得较好的效果。
二、数据化运营
在 数据分析挖掘常见项目汇总一文中,整理了书籍中提到的数据分析挖掘算法。
考虑到脱离业务的分析挖掘都是空中楼阁,所以本文从业务角度描述大数据与运营的结合。
1、分析用户特征,打造用户画像,建设推荐系统
推荐算法主要有两种模式:一种是寻找和你相似的群体,向你推荐相似群体喜欢的东西;还有一种是寻找和你喜欢的产品相似的产品,向你推荐这些相似的产品。
其背后是一套庞大的标签体系。
如何找到和你相似的群体?从行为角度上是否有类似的行为,从用户特征角度上是否存在大量的一致性,我们把这些行为信息,特征信息提取,丰富用户画像内容。
(1)用户特征分析
用户特征分析一方面用户划分用户群体做针对性运营,一方面用于完善用户画像内容。
在数据获得的初期是没有群体分类的标签的,我们需要根据数据上的填写信息、行为信息等获得用户特征,然后划分群体,对每一类群体做精细化运营。
共享单车APP根据特征划分群体
单车行业用户:根据单车APP安装与使用特征可用于区分活跃用户和沉默用户,将推广投放人群聚焦在APP新用户以及有唤醒价值的沉默用户上
大学生人群:在大学生人群标签的基础上,加上年龄段、常住地等能提高区分度的特征,进一步瞄准学生人群
白领人群:在白领人群标签的基础上,加上工作时间段、职业场景等能提高区分度的特征,进一步筛选白领人群
地铁人群:利用LBS地理围栏技术圈选地铁站点场景,更精准覆盖通勤人群
高密度人群:通过APP渗透率和线下场景结合找到单车需求旺盛的地区和人群[5]
(2)用户画像建设
用户画像的建设根据用户基础属性、用户行为等设置标签,有些是直接的获取的,有些是间接获取的。
建设一个信息准确、丰富的用户画像是需要较多投入的,那么用户画像能够带来什么价值?
用户画像源于企业对用户认知的渴求,解答:
我的现存用户是谁?为什么买我的产品?他们有什么偏好?哪些用户价值最高?
我的潜在用户是谁?为什么买我的产品?他们有什么偏好?哪些用户价值最高?
对内指导完善产品,对外推动精细化运营
生产逻辑从“造什么用户买什么”逐渐转变为“用户需要什么就造什么”;
根据产品特点,更加精准地找到目标用户,对这类用户做针对性精准营销[6]。
(3)推荐系统
好的推荐系统和一套完善的用户画像是分不开的,使用推荐系统做精准营销有很多优秀、成功的案例。
今日头条—针对性推荐
在新闻媒体领域,有一家很“神奇”的创业公司,它自己不生产内容,仅是通过新闻搬运的方式在平台内聚焦内容,然后以算法推送机制让每篇文章都能找到相符合的用户,就是通过这样的方式,截止到现在,已经累计有66亿的激活用户,1.4亿活跃用户,这就是家喻户晓的今日头条,今日头条数据算法推荐带动增长的模式是国内数据驱动增长的经典案例[3]。
美图—针对性推荐
美图广告平台的背后是一套大数据的算法应用,对其APP用户进行深入洞察,了解用户的兴趣偏好,根据用户浏览习惯、喜欢的形式,将不同流量和广告位进行智能分层、分级、分价格精细化运营,将其流量价值最大化,实现了广告收入的翻倍[3]。
小红书—相似产品推荐
使用过小红书的用户都会被其“千人千面”的展现形式吸引,因此小红书能够做到以第一次展示的内容就留住95%以上的新用户。当用户下拉页面刷新的时候,更新的展示内容则是根据用户在页面上的点击与停留页面的内容等所推算的新内容,更新后所推送的内容,往往更具有粘性,更让用户上瘾[3]。
小结
从分析用户特征,打造用户画像,到建设推荐系统,整个生态圈的搭建是比较困难的,工作量庞大;
其次要与公司实际业务结合,虽然口号上是说各行各业都需要用户画像,但如果这整个生态圈的搭建,在投入与产出上无法获得满意的收益,那么是不推荐先做这个业务的。
2、运营行为
(1)漏斗模型
运营行为很大程度上和漏斗模型关联在一起,通过运营提高各个阶段的转化率。
例如电商购物流程的漏斗模型如下左图所示[7],运营过程中需要监控每个层级上的用户转化,寻找每个层级的可优化点。
很多运营算法的开发都是为了提高漏斗各个阶层的转化率。所谓万变不离其宗,漏斗模型就是运营行为的“宗”。
(2)潜在用户预测
大数据指导运营决策中很重要的一个功能是潜在用户预测,例如,借贷行业预测高危风险用户,预警欺诈用户,漏斗转化中预测最易转化用户、流失用户预警等。
潜在用户预测用于对特殊群体的提前预判。都是在事前发生之前,见微知著,基于长久的、积累的历史数据信息对未发生事件提前预判,减少损失风险、转化目标指数。
交易用户预测
例如某B2B网站平台,商业模式是通过买卖双方在平台产生交易收取提成费[2]。
【需求】 本次需求针对新进商户,想要知道哪些卖家短期内会发生初次成交,对于这些潜力卖家做针对性运营。
【指标特征】 了解背景后,打算先从服装类商家入手,梳理相关的特征指标:商家的类目专注度、优质商品占比、可在线交易offer占比,仅一周登陆次数、信用状况、平均在线时长、网站流量、网站活跃度等,数据清理、变量处理,到这一步整理出一份历史的样本数据:初次成交用户样本、未成交用户样本。
【建模】 建立有监督预测模型,做算法选型,模型调优,然后真实数据验证,输出每个卖家近期内会发生初次交易的预测概率。
【运营决策】 根据数据结果做出对于的运营决策:模型打分TOP 10%的卖家近期内最有可能发生初次交易,运营团队可以给这些用户群体提供更大的流量,有效提升初次成交转化率。对于TOP 10%-TOP 30%的卖家可以根据特征信息针对性运营,例如对于活跃度不够的,通过相关运营帮助卖家提高活跃度。
【跟踪落地】 当然我们需要跟踪模型落地情况,经实践采用以上运营策略后服装类卖家的初次成交数增长了132%,相比单纯运营的自然增长,本次重点运营的活动效果总体提升了99%。
风险用户预测
借贷行业比较出名的是用户的风险预测模型。
用户贷款风险预测 通过举办商提供的用户基本身份信息,消费行为,银行还款等数据,进行数据处理特征选取并建立逾期预测模型,来预测用户是否会逾期还款。
【特征提取】性别、职业、教育程度、婚姻状况、户口类型、平均每笔支出金额、平均每笔工资收入、上期还款差额、信用卡额度、消费笔数等
【模型建立】二分类用户逾期预判模型
【输出】对于未发生结果的用户提前判断,对于模型判断高概率可能发生逾期行为的用户采取相应运营措施
小结
(1)历史数据与预测
潜在用户预测本质上是基于历史数据库里目标用户,提取他们的特征,使用算法的方式寻找和目标用户最相似的新兴用户,在某结果未发生之前预防/促进结果。
(2)样本建设是难点
由于实际业务中并不像我们在kaggle、github上的分析挖掘学习案例那样已经整理好模型的输入数据了,而搭建一个有效的潜在用户预测模型真正的困难正是在于模型输入数据的构建上。
(3)紧贴业务
老生常谈再说明一下,数据分析挖掘是离不开业务的,如果预测的结果不能指导运营、落地行动的话,模型准确率表现的再好也是意义不大的。
(4)【杂谈】
所谓“读史知今”就是基于历史信息预测当下发展。
曹操赤壁跑路遇到三个地形三次大笑,其他人不知丞相因何大笑,可能曹操在常年历史作战中已建立了一套战场胜负模型,例如输入地形、双方军力等因素,华容道伏击90%可胜;
曾国藩大大冰鉴面相看人才,估计是根据面部特征、行为特征在心里建立了一套人才预测模型,例如XXX 65%是个得以重用的人才。
所谓见微知著,未卜先知,给自己建个历史样本库,毕竟面临同样困境的肯定不止你一个,多参照参照别人的例子,然后解决自己的。
3、全局指标
(1)大数据不是炫酷大屏
随着大数据口号的号召,几乎任何行业都有数据自己的一堆衡量指标、高端炫酷可视化的大屏,可往往一轮看下来没获得什么有效的信息,这难道就是大数据吗?
尽管网上案例都说大数据是发展主流,没有大数据的企业是注定要被时代淘汰的,同时今日头条等企业以其优秀的大数据应用能力成为行业标杆。企业自身要如何发挥其大数据的能力,真正作用于业务生产?如何让指标数据不仅仅是局限在大屏展示而是能指导运营、指导市场?
炫酷的大屏只能在大数据发展初期“忽悠”客户,但随着业务的发展,只有展示作用的大屏除了接待以外的功能已经无法满足市场的需求。
(2)综合指标
度量整体状态,搭建综合指标。
活跃度搭建
数据化运营与传统粗放型运营最主要的区别是前者可以用数据衡量。这种衡量至始至终地贯穿于数据化运营的全过程。
活跃度是运营的一个综合的衡量指标,对于活跃度的衡量没有统一的描述,一般根据特定业务场景和运营需求量身定做。
【原则】活跃度的组成指标是业务场景中最核心的行为因素;是否能回答业务需求的终极目标。
PM产品活跃度搭建[2]
【背景】PM产品一款实时捕捉买家信息,提供交流功能,付费商家能拥有更多能力。
【运营行为】向所有商家提供PM产品,部分优质商家提供一段时间的免费全功能。
【需求】定义“PM产品用户活跃度”,要求该满足一定分值的商家比较容易转换为PM产品的付费用户,同时该指标帮助监控PM产品的运营效果与效率。
【模型搭建】使用商家使用PM产品与买家洽谈次数,在线登陆次数等相关指标搭建,一般使用主成分分析和标准化,把多个指标转化为一个综合分数
【检验】用活跃度定义的群体里,可以覆盖多是实际的PM产品的付费用户,覆盖率越高越好。如果覆盖率比较低的话,该活跃度定义的不成功,需要改进。
4、其他
除了分析用户特征,打造用户画像,建设推荐系统、潜在用户预测、综合指标搭建等方面以外,还有其他很多运营方的大数据应用,例如页面路径优化,趋势预测等,结合实际需求推进吧。
三、补充
1、需求是自己找的
一个企业如果是依靠满足客户需求发展是不长久的。想要拉拢客户要想客户未想,想客户不敢想之事。要知道在今日头条之前没有一个客户会向新闻平台提出“要为我针对性推送新闻"的需求。
2、小结
对运营不是很了解,全文根据阅读的资料以及自己的理解书写,以上如果存在不合理的内容欢迎指正。
参考资料
[1] 数据运营,一些理论:https://blog.csdn.net/weixin_42619659/article/details/81983497
[2] 《数据挖掘与数据化运营实战》 卢辉
[3] 如何用数据指导产品优化、用户运营和流失用户召回:https://www.jianshu.com/p/604e152f813f
[4] 如何巧借用户画像让流量价值再飞跃:https://www.jianshu.com/p/88610ad75127
[5] APP用户增长背后的数据逻辑:https://www.jianshu.com/p/fb647e055e58
[6] 用户画像的价值:https://wenku.baidu.com/view/c088448d767f5acfa0c7cd67.html
[7] 漏斗模型:http://www.sohu.com/a/202094172_99910245