一篇文章搞定数据分析

一、数据分析的层级

产品的数据分析经常会遇到这样的问题:只有数据,没有分析。仅仅是描述数据,告诉你产品发生了什么。

比如次日留存率只有5%,这个数据偏低,可以看出该功能的用户粘性不好。

然后呢?往往就没有然后了。

为什么同样的数据给不同的人能看出不同的内容?高手们究竟是如何通过数据找出产品中的问题的。

本文将告诉你分析产品数据时,如何从数据中解读出比描述现状更深层次的信息。

数据分析过程要解决的问题往往有四个层级。

第一层,发生了什么?如留存率降低,用户粘性下降。初级分析基本到此结束。

第二层,为什么?这个答案要落实到用户层面,是第一步的延伸。是用户找不到想要的功能,还是功能不符合用户的预期?及格的数据分析基本分析到这一层。

第三层,继续问为什么?这个问题的答案要落实产品层面,即我们的产品的哪项内容造成了用户出现了第二层的问题。优秀的数据分析可以分析到这一层。

第四层,我们该怎么办?后续该如何改进产品。高级的数据分析到此结束。

以这种思维方式作为整个分析的核心思想,就不容易走弯路,更快更好地找出产品的问题,而掌握各种数据技巧,图表的优化等等都是为了最终找到问题,解决问题这个目的服务的,因此这种层级的思想是数据分析的核心。

我们本文主要讨论前两个步骤:发生了什么,以及为什么发生(用户层面)。

二、从数据中找问题

下面就要开始讲解如何从数据中找问题,只有找到了问题才能有继续分析的方向。要注意,这里的问题不单单是指不足之处,而是指数据的异常之处,过高和过低都是异常。

我们首先来解决第一个层级的问题,发生了什么。

最简单的方法就是观察单个指标找问题。比如某个产品或功能的留存率很低,那么可以得出结论是该页面的用户粘性较差。这个结论解决了“发生了什么”的问题。刚入门的数据分析,往往也就到这个深度就停止了。

至于为什么较差,留存率这个数据本身无法告诉我们。

其他的例子如停留时长很短,说明用户可能对页面不感兴趣,至于为什么不感兴趣,我们无法得知。

要达到这个水平只需要了解各个数据的含义,有基本的业务理解就可以了。

想要分析得更深入,一般需要多个指标结合起来一起看。

比如刚才的例子,一款粘性较差的产品,到底是页面信息不吸引人,还是页面设计太混乱,抑或是入口位置太深?有了这些猜想,我们可以通过不同的维度组合去找到问题所在。从而解决“为什么发生”的问题。

举几个例子。

image.png

这是一个双维度的数据矩阵,该矩阵模拟了几种虚拟产品。其中点击率是指进入产品/功能后的各按钮的点击率,留存率是指该产品/功能的整体留存率。

两个数据维度能够得到的信息比单维度数据的信息要丰富的多。我们能够通过两个数据模拟出一点用户真实的使用场景了。

比如右下角低点击率、高留存率的功能或产品,往往是已经迭代优化过多次的版本。如果不是的话,这样的页面由于页面内点击率较低,我们不知道用户的真实行为,我们很难从数据中了解用户的真实需求在哪,也就谈不上后期的迭代。

我们看一下右上角,高点击率,高留存率。这样的产品看起来已经非常不错了,但是前面提到过,我们从数据中不单单是找不足之处,要看到的是异常。这样的高点击高留存是有问题的,这个问题就是过高的点击率。

我们还原到用户的使用场景,如果一个用户每天都要来用这个产品(留存率高),而且还天天要来点击这个按钮(点击率高),那么这个按钮里的内容能不能直接拿出来呢(省去点击动作,直接使用)?

我们再看左上角,高点击率,低留存率。用户点击很高,说明用户在找东西?留存率低是不是因为没有找到?

矩阵中其他的问题可以自己去思考,我在图上写下了我的猜想,当然这些猜想也不一定适合所有产品,这张图只是希望能发散你的思维,让你养成这样的思维方式。

维度的组合多种多样,你可以尝试多种不同的维度组合从而确认问题所在。比如点击率分散度和留存率的维度组合。

点击率分散程度是一种主观的感觉,但有时也能反映出某些问题。

image.png

我们以图中左下角的低留存率,点击率分散的情况为例。这种情况下,每个功能用户都有意愿去点,但是留存率却不高,模拟一下用户的使用场景,会不会用户点了之后发现解决不了自身需求?当然,这需要结合实际的产品形态,结合自己的产品页面特点,模拟一下用户的实际使用过程,你应该能得到一系列的猜想。

再比如左上角,点击率集中,留存率低。这种情况我们想象一下,用户进入页面后,直奔着一个功能而去,其他功能不太关心,但是用了这个功能之后,用户之后不再来这个页面了。什么原因?是不是用了那个功能,但是却让他失望了,没有解决他的问题?带着这样的猜想,我们重点分析点击率集中的那个功能,可以猜测用户到底想做什么。

各种不同维度的矩阵在此就不再多做介绍,只是希望大家能够掌握通过数据找到问题的方法。读者可以自己再将各类不同的数据组合成矩阵,分别分析各个不同的数据组合的含义。以此来增强从数据解读信息的能力。

通过这种组合数据找问题的这种方式,你就能轻松突破描述数据的阶段,进入到数据分析的及格线。

产品的五种问题类型

我们已经学习了前两个步骤,通过单维度数据描述数据问题,以及通过多维度的数据读取出更深层的信息,不过我们还是无法知道如何改进产品以解决这个问题。

我们需要将用户遇到的问题定位到我们的产品层面,比如说:究竟是字体颜色不鲜明导致用户不能快速找到目标功能,还是核心功能的点击链路过长导致用户记不住目标路径?

产品的问题纷繁复杂,我们在思考产品问题时往往不能做到面面俱到。那么怎么样才能将可能出现的产品问题全部疏离一遍,并且确保没有遗漏某一方面的问题呢?

我们可以从五个方面思考产品可能出现的问题,而这五个方面就是用户体验要素中的五个层级:

  1. 战略层;
  2. 范围层;
  3. 结构层;
  4. 框架层;
  5. 表现层。

《用户体验五要素》这本书作为产品经理的必读书之一,想必读者对这五个层级的概念非常了解,因此在这里我就不再详细介绍。

越高层级的”能量”越强,应当优先解决更高层级的问题。如果战略层出现了问题,那么不管如何调整结构层、框架层,都只是隔靴搔痒,不能从根本上解决产品的问题。

因此,我们应当首先考虑战略层,而表现层的改动永远是最后考虑的。不过由于一般产品上线都会进行一定的调研和分析,战略层出现问题的概率不高,因此真正在战略层上进行改动的情况并不多见。而表现层由于能量太低,改动的优化空间太小,因此也一般不会纳入分析的范围。

我们最常见的层级定位一般集中在范围层、结构层和框架层。

五要素思考法

当我们掌握了用户体验五要素的概念之后,就能一步一步对产品的各个要素进行思考,找到问题的所在。

我们回到之前的那个问题矩阵。

image.png

比如:其中高页面内点击率,低留存率的产品。这样的产品可能是用户“没有找到想要的东西”,那么为什么用户没找到呢?

多问几个为什么,这是数据分析的金科玉律,但是开放式的提问往往最难回答。没有成体系的思维方式,往往就要绞尽脑汁思考,得到的结果还不一定是客观的。

我们试着沿五要素从具体到抽象的顺序思考这个问题。

  1. 表现层:是不是核心功能的字体颜色不够醒目,用户没注意到?
  2. 框架层:是不是核心功能的位置不好,导致曝光不足?
  3. 结构层:是不是结构不合理,核心功能的链路过长,导致用户找不到想要的东西?
  4. 范围层:是不是用户想要使用的功能、关心的内容根本不在页面中?
  5. 战略层:是不是这个产品的定位有问题,用户根本没有这个需求?

以上这些问题是我针对“用户可能没找到想要的功能”的情况,在每一个用户体验要素临时想到的一些思考方向,只是作为一个参考。相信你在具体的分析情况下,在面对一个具体的产品页面时,一定能提出更符合实际的问题。

这里举一个我自己的分析案例。

某工具类APP的某辅助功能上线后,进入该功能的用户量相比同页面分发的功能更高,功能页面内部的点击率也较高,但是留存率非常低。

当时的思考大概是这样的,既然那么多用户愿意进入该功能,说明这个功能的名称对用户具有一定的吸引力,那么这个功能的战略基本是没有问题的。

那么接下来考虑范围层的问题,由于当时这个页面的结构比较简单,几乎所有的信息在一级页面都得到了展示。说明该页面让用户看到该功能得到所有信息后还是无法留住用户。

因此初步判定,该功能页面提供的内容和用户对功能名称的预期不符,即很有可能是范围层出现了问题。既然范围层有问题,那么应该首先解决这个出现问题的最高层级。较低层级的结构层、框架层的优化都不能解决当前的问题。

于是下一步的修改方向就不是优化现有功能,而是考虑用户在看到这样的功能名称后,究竟有什么样的具体需求。

之后的产品迭代计划就需要创造新的页面内容,通过不断迭代找到用户想要的信息,最终的改版提升效果非常明显。拥有一个确定的改版方向对于产品团队来说至关重要,这大大降低了试错的成本。

有了这样一个思考问题的框架,通过数据定位产品问题就变得非常简单了。你可以尝试将问题矩阵中的其他问题,或者目前实际的产品问题再列举出每个层级的问题,训练自己这一思考方法的熟练程度。

预估改进效果

提出改进建议以及预估改进效果是产品数据分析的最后一步,前一个步骤我们了解到了产品的问题,最后一步就是对可能的改版进行效果的预估。

由于种种原因,我们有时并不一定能在相同的层级解决该层级的问题。比如结构层的问题:核心功能在二级页面,链路过长。如果调整结构层,将核心功能放到一级页面上,那么整个产品的改动会比较大,不仅耗费的工时很长,而且如果频繁改动结构层,用户容易混乱。

我们可以在更低层级的框架层上进行改动,在二级页面上增加核心功能的展示,方便用户使用。这样的改动一般耗费工时更少,而且对于已经养成使用习惯的用户来说更为方便。

上述这个例子中如果优化结构层,那么改动效果会比较好,但是耗费精力更多,而且对用户来说也需要重新学习如何使用。

如果优化框架层,那么优化的效果会差一些,但是耗费时间更短,而且对于用户来说也没有学习的成本。面对这样的问题,仅仅是“好”,“上线时间快”等这样定性的字眼,我们是很难做出决策的。我们需要知道究竟这样改版之后,数据的表现会是什么样的,才能评估到底如何改版。

由于战略层、范围层的改动太大,这样的改动是很难估算的,只能通过快速迭代,验证数据的方式选择更好的版本。而结构层、框架层、表现层由于内容没有更改,只改变了内容的组合方式,因此这样的改动是可以预估的。

我们可以通过一些简单的方法估算。

结构层改动

结构层改动最常见的就是将二级页面的内容放置道一级页面上来,通过缩短链路的方式增加功能的曝光,方便用户使用。

这样的结构层改动如何预估效果呢?

一般我们将二级页面的功能点击率乘以3,基本上就是将其放到一级页面上的点击率。

举个例子:

image.png

上图中,功能A入口的点击率是5%,进入功能A的二级页面后,功能A-1的点击率是20%,那么相对于入口的流量,有1%的用户使用了功能A-1。

image.png

如果我将功能A-1直接放到入口处,那么点击率一般乘以3倍,即1%×3=3%。虽然不同产品的区别会很大,不过这样的改动一般也不会低于2倍。

有了具体的3%这个数字,我们评估这样的改动就有了依据,是否通过结构层改动产品也就能够做到心中有数。

框架层改动

说完结构层,再说框架层,这可能是日常产品迭代中最常见的改动方式。其中最常见的方式之一就是调整功能的位置。

将位置靠下的功能挪到页面靠上的地方,究竟能提高多少曝光和点击?

这个效果的预估要比结构层更容易,一般的页面都会有“到达底部”的埋点,不同产品不同,这里以30%为例。

如果页面一共三屏,到达底部的用户比例是30%,那么到达第二屏底部的用户数一般是30%×2,即60%。如果页面一共四屏,到达底部的用户比例是30%,那么到达第三屏底部的用户数一般是50%,到达第二屏底部的用户数是70%。

当然,这只是一种估算。如果你想要适合你产品的数字,那么多看几个你们产品的底部到达率的数据,培养出这样的感觉,对今后的数据估算就有很大的帮助。

如果能够预估出用户到达页面的比例,那么就能知道从第三屏挪到第二屏的曝光量会增加多少。

还有一种常见的改版是将信息展开,由于用户的下拉操作要比点击操作更方便,因此将信息展现方式从主动点击“展开”按钮改成直接将信息放置在页面上。虽然会将页面长度拉长,但是用户获取信息的难度会大大下降。

虽然取消了“展开”按钮,我们没有埋点去了解用户究竟有没有查看的动作,不过这样的改动实际上有些类似结构层的变化,往往服务的用户群体会扩大3倍。

预估改动后的数据表现需要对自家产品过去的数据有相当程度的经验,有意识地记住产品的几项关键数据有助于这种经验的快速形成。当你能够对产品的改动进行数据预估,并且能做到与最终效果非常接近时,你就成为了产品数据分析的高手。

作者:三元方差 公众号:三元方差(sanyuanfangcha)

你可能感兴趣的:(一篇文章搞定数据分析)