数据分析心得

#读《红楼梦》所感
最近在读《红楼梦脂评汇校本》,在第二回“贾夫人仙逝扬州城 冷子兴演说荣国府”前有一段脂评描述红楼梦的写作手法,很有感触,摘录如下:

本旨只在冷子兴一人,即俗谓“冷中出热,无中生有”也。其演说荣府一篇者,盖因族大人我,若从作者笔下一一叙出,尽一二回不能得明,则成何文字?故借用冷子一人,略出其大半,使阅者心中,已有一荣府隐隐在心,然后用黛玉、宝钗等两三次皴染,则耀然于心中眼中矣。此即画家三染法也

数据分析千头万绪,知识和结论往往隐藏在细节之中。数据分析可以分成几个层次:

  • 按照需求提取数据。根据确定的需求(表样、统计逻辑等)编写脚本,从数据仓库中获取“粗加工”后的数据。做到这一步,需要的是对底层数据结构的熟悉,能将业务需求转换成数据,但不能将数据联系起来,发现数据中间隐藏的规律。
  • 数据分析与组织,能把提取出来的数据与业务场景结合起来,对于数据的正确性可以做交叉验证,能从数据中发现规律和异常,能够将数据以合适的形式组织起来,有助相关用户从中发现有价值的知识。
  • 数据提炼与解读,可以从数据中发现知识,进而提炼成结论,进一步给出建议。

上面三个层次中,最后一步最有价值,通过数据形成决策,用于指导业务实践。最关键的是第二步,也就是数据分析与组织,通过分析发现其中隐藏的规律,通过有条理的组织数据,引导读者形成结论。数据是业务过程的量化,缺乏组织的数据是一团乱麻。在组织数据的时候,往往有把所有的细节都呈现给读者的冲动,担心漏掉任何的蛛丝马迹,这样做反而会把重要的内容隐藏起来。借鉴脂评中红楼梦的写法,数据分析的组织也可以遵循这种“画家三染法”:

  • 确定分析报告的主题,运用“冷子兴”的介绍手法,将主题涉及的宏观指标组织到一起,用数据描述出主要所涉及到的对象,比如,客户的购买力、财务指标等。
  • 运用对比、趋势、构成三种方法,对单个指标进行细节分析。其中,对比是横向间的的对比,比如,地域、类别、群体等。趋势是时间维度上对比,年度趋势、季度趋势等;构成是对指标的组成进行分析,比如,销售额的品类、缴费的用户群等。通过这三种“手法”对指标的渲染,数据中所蕴含的规律就会自然浮现出来,剩下的结论和建议也就是顺理成章的事了。

分析报告组织的好坏,决定了读者从数据中获取到知识的多少,虽说不同的人有不同的分析思路,但分析报告编写者的思路,决定和引导了读者的分析框架,以及在这个基础上可以发挥的程度。过多的数据会让读者无所适从,过少的数据获取不到有价值的知识。

你可能感兴趣的:(数据分析,数据分析)