数据分析之数据获取

当今时代最抢手的一种软实力被称为“互联网思维”,再对互联网思维进行细分会发现其中又有一个不可缺失的能力,称为“数据能力”。本文将具体说明互联网常用的数据获取方式有什么,enjoy reading~

1 产品的生命周期是什么?

不同口径下产品的生命周期会有很大的差异,大家都比较耳熟能详的“开发、引入、成长、成熟、衰退”是从一个比较大的层面来将产品像人一样分析其从出生到衰老的整个历程,当然在这种大的历程下更需要数据的介入和支撑,只是这种阐述会更加宏观,在这里我们先从微观、具象的角度来理解数据的嵌入。

我们这里聊的生命周期可以理解为产品发展过程中的一次功能改进和迭代,比如以前的弹幕是会遮挡人脸的,后来经过一次产品迭代后弹幕绕到了人的背后,这份优化经历了一个从发现问题到解决问题的流程,我们简单的将其抽象为产品功能迭代的生命周期。

2 产品功能迭代的生命周期是什么?

1)发现问题及产出需求:pm通过多途径多方式发现产品中不合理的地方并从思维层面给出解决方案;

2)开发需求:当pm的解决方案确定可实现后,技术同学开始介入,把pm的思维产物物理化;

3)需求落地:在技术同学交付代码后,pm通过离线和线上实验验证指标是否符合预期并逐步完成上线。

2.1 发现问题及产出需求

前文有说pm可以从通过多途径,多方式发现问题,这些发现问题的方式包括数据监控指标的异常、用户对badcase的投诉、用户调研数据的集中反映等等。

我举一个非常简单的例子:高德地图对用户进行调查,发现80%的人表示在开车路过主辅路的时候手机导航会误偏航,50%的人表示路过隧道导航自车点会不移动,这两点都是我们要解决的问题,如果在技术实现难度相同的情况下,问题一显然是要先做的,因为影响面更大,而问题2可以在人力释放后再行优化。

2.2 开发需求

当pm发现问题并将思维产物细化为PRD之后,技术同学开始介入,在开发阶段数据简单分成两方面的作用:

1)充当“数据集”:抖音为什么可以精准的为你推荐感兴趣的东西?滴滴怎么就能猜到你要去哪?这都是算法的功劳,而算法又需要依托无比庞大的数据才能产出和优化。这部分属于数据产品范畴,本文不做具体说明,后续会专门发文探;

2)验证代码合理性:技术同学虽然优秀,但面对逻辑无比复杂的代码也是存在一些可能犯错的,为了避免代码bug对业务的影响,保证可以及时发现,技术同学通常会在代码中埋点,通过对埋点产出数据的相互对比验证代码开发的合理性。埋点数据也是理解业务的常用手段。

2.3 需求落地

技术同学费劲千辛万苦把需求实现后我们也不能马上就上线,理想很丰满现实却很骨感,做的东西也不知道用户到底买账不买账,这个时候就要进行一些线上的实验来对比数据验证我们的解决方式是不是真的有作用了,“AB测”、“灰度上线”这个时候也就派上用场了。

可见数据就像一个标尺:不断的帮助我们发现问题,衡量问题,确定是否解决问题。

3 数据的获取方式可以简单的根据是否直接面向用户分为两类。

3.1  面向用户的数据获取

大家相对耳熟能详的用户访谈、用户调查问卷、以及用户主动的触达,他们有很多名字类似feedback、CPO投诉、客服进线等等都属于直接面向用户的这类范畴。这部分比较重要的是问题的制定,以及对回答的清洗和整理,从用户需求中提取出产品需求。

用户需求和产品需求有很大的不同,首先用户需求由于其个性化我们无法将其等同为大范围用户群体的需求,同时受到思维局限和描述准确性的影响会导致真正的需求被隐匿,pm也很容易陷入思维误区。

就像福特汽车的创始人亨利福特所说“如果当初让我去问顾客他们想要什么,他们只会告诉我:一匹更快的马。”

不管是我们的主动触达还是用户的投诉进线,其好处都是可以很明确的反映用户的需求帮助我们快速止损,定位到策略的不足之处,缺点在于样本量小,且单一样本的获取时间长,我们通常要付出极大的精力但得到的指标的指示性意义不足,我们无法明确衡量这类问题的占比。

3.2 面向数据的获取方式

“埋点统计”、“AB实验”“灰度放量”都属于通过大数据来进行统计性指标分析的范畴。

我们先来看看埋点,前面有说技术会在实现代码的过程中埋几个点,这些点可以理解成程序里安插了一个“照相机”,当按动了照相机开关的时候他就会记录下这个片段。

这么说肯定很难理解,你可能会好奇那是谁按开关呢?记录什么片段呢?我们来举一个例子,我想知道所有看了我文章人的信息,那么“点击进入文章”就是照相机开关,而我具体想看的信息(比如ip、country-code等)就是照片,照相机会把拍摄记录下来的信息储存起来,也就是落表。

我们再来看看“AB实验”和“灰度放量”,这两者像一对孪生兄弟总是形影不离。我们先来分开解释:

AB实验:简单来说ABTest就是为同一个目标制定两种解决方案,通过用户的使用情况,数据呈现来分析哪个策略是更优的。

灰度放量:它实际上不是一种策略收益衡量方式,而是为了保证策略上线稳定性而进行的一种阶段性放量模式。

我们举个例子看看这对儿孪生兄弟是怎么干活的,比如抖音为了让大家永远都别学习再次优化了推荐算法,新的推荐算法好用不好用他们需要试一试,贸然的切换肯定是不行的。

于是他们把用户分成了两组,A组和B组,首先观测他们平均的app使用时长,之后将A组的推荐算法偷摸摸的换成新的,几天过去之后再观测他们的平均app使用时长是否有变化,这种比较方式就可以很好的帮助我们衡量新老策略的优劣。

那我们再来说说这个和灰度有什么关系,有一个误区是大家觉得AB实验就一定是50%对50%的流量,其实不是,对于一个Dau很高的产品来说10%的流量产出的数据就很具有代表性了,那这改变的10%我们就可以理解为灰度上线了,当确定新策略更好之后,我们可以逐步对灰度流量进行放大,也就是扩量,最终扩量100%。

这个新策略代替老策略的“温水煮青蛙”式过程也就完成了,我们的策略也终于实现了落地。

你可能感兴趣的:(数据分析之数据获取)