数据分析系列(四):常用的数据处理工具和技巧

前言
本篇文章是数据分析系列的最后一篇,主要讲讲常用的数据处理工具和技巧。我们的原始数据来源常常来自于:专业数据系统(三方及自研)、办公系统&工具(比如广告投放平台)、收集/购买的第三方数据(比如爬虫数据)、原始数据库(SQL Server)。在日常工作中,我们经常需要通过自己的业务需求,获取各类原始数据,然后通过EXCEL进行数据处理、分析、可视化呈现。

这里,我认为普通的产品运营人熟练掌握EXCEL技能就足够支撑日常业务所需。至于SQL\Python等是否有必要学习,会在最后一个部分进行说明。

01 原始数据处理

拿到原始数据我们先需要确定以下几个我们的原始数据是否符合以下几个特征:

1、必须是一维表,即每一列都是独立属性,方便后面进行数据透视;

这里简单说下一维表和二维表的区别:

第一张表格是一张二维表,金额491,同时对应产品A和4月1日

第二张表格是一张一维表:491对应金额,4月1日对应日期,A对应产品。也就是说,一维表每个数据都只有一个对应值,而二维表每个数据有两个对应值。

其实还有一个更简单的方法,为什么必须选择一维表呢?因为二维表没办法支持数据透视分析,所以把表格进行数据透视就可以得到答案。

2、统一&干净的数据格式,格式统一:数字、日期、文本,没有脏数据:包括重复值、逻辑错误、格式不统一;

3、不包含无关字段及计算字段(各种“率”,会扰乱后续计算)。

如果原始数据有以上几个特征,建议先进行原始数据处理,这里特别强调一定要先保存一份原始数据表格,以免数据处理过程中产生问题,破坏了原始数据,又无法找到对应。

个人总结常用的方法及清单如下,我一般也不会刻意记忆,等到具体使用场景以后,对应到哪个方法,如果记不起来,会去百度经验上找一下具体操作方法。

基础方法(必须掌握的一些小技巧)

高频函数(必须掌握的一些高频函数)

最后,如果遇到一些更为复杂的问题:

比如原始数据是一张二维表,而需要快速转化为一维表,可以通过表格查询编辑器等方法来搞定;

比如中文数字/阿拉伯数字转化、100张工作表合并、特定文本的插入、截取、删除、手机号、固定电话、电子邮箱等信息直接提取,这里不推荐使用VBA(一种编程语言,学习成本大),可以使用插件来解决以上问题,常见的插件有方方格子等。

02 数据分析

处理完原始数据以后我们就可以进入数据分析环节,说到数据分析,就要说到的大家最高频使用的数据透视表。通过筛选、列、行、和值四个字段的应用,我们可以快速进行汇总、分类、求和、均值、计数等操作。

这个大家应该不陌生,所以不多描述了,推荐大家可以学习一下「切片器」的使用,在对内/对外汇报时比较实用,「切片器」在比较复杂的数据透视表中,可以让别人快速选择需要重点观察的信息,不至于眼花缭乱。

03 可视化呈现

最后一步进入可视化呈现,这个部分肯定是通过图表形式。如果针对原始数据进行图表呈现,直接选择合适的图表类型就可以;如果针对数据透视的结果进行图表呈现,可以一步到位,选择「数据透视图」形式。

但是,无论如何,最先需要回答的问题,肯定是如何选择合适的图表?

这里,推荐参考以下图表指南。

来自:E维课堂(ID:EWoffice)

作者:表姐凌祯

总体来说,个人认为日常工作中较多使用的还是以下3类:柱状图、折线图、饼图(环形图)。此外,如果单一图表无法反映问题,我们可以使用组合图形式让图表更为清晰。

如果是供个人分析使用,我觉得选择合适的图表就足以帮助我们完成数据的可视化呈现。但是,如果面临汇报展示等情况下,需要更多高大上的图表来支撑,可以使用「条件格式」「迷你图」「设置形状格式」「设置数据系列格式」等小技巧。更多图表制作的玩法,可以参考以下文章:

【表姐干货】让你的数据会说话--Excel数据图表制作合集

04 其它数据技能

最后,聊一聊其它数据技能有没有学习的必要。比如统计学相关知识(相关系数、回归分析等)、Tabelau分析(BI分析软件)、SQL(数据库取数工具)、还有前阵子被各个教育机构各炒得火热的Python。

个人认为需要用到的时候再去补充,才是最高效的学习方式,不然看完课程,没有实用场景,很快就会忘记。当然,其实这些技能用到的概率也是比较低的。毕竟对于绝大多数人的产品运营人来说,数据分析只是辅助帮助你完成决策的技能,而不是核心竞争力。

你可能感兴趣的:(数据分析系列(四):常用的数据处理工具和技巧)