上新 | 数据分析师用这个姿势学

--  学到的就要教人,赚到的就要给人。-- 

上次欠大家一篇数据分析学习套路,阿乐想讲又不敢讲,怕讲的不好。不过阿乐扭头一想,都立秋了,天高气爽,宜说话。

01  数据分析师要学哪些?

无论做哪行都是要用什么优先学什么。这点就像游泳运动员,如果不是游的快而是跑的快,一样拿不了游泳金牌。

数据分析师的岗位工作内容大致就是 收集数据处理数据基于数据和业务产出内容(报表、报告、工具、策略等)。

「收集数据」

一个公司只会拥有基于自己业务产出的各类数据, 而缺少其他方面数据。每个公司关于数据的收集会有自己的一套流程和方法,如果是做产品的业务就会收集用户行为数据并存储到数据库或者数据仓库。对数据分析师而言,收集数据主要就两大类:内部数据的提取和外部数据的收集。

收集数据的目的就是产出数据,哪些数据是要收集的呢?自然是对业务有评价和指导作用的。而评价哪些数据要收集主要是业务和技术一起确定。

如果你是处于数据源端的数据分析,那你的业务就是要知道哪些行为要日志log,从log上能获取什么信息,方便后面进一步的数据数据、模型挖掘、A/Btest、客户画像等。

收集完数据就要清洗后存储到数据库、数据仓库,如果你做ETL工程师的,那正好是你的刚需业务。

上面讲的都是比较偏大数据相关的数据分析岗,如果是常见的数据分析师,那源数据已经由上游或者相关部门入库了,那收集数据就是由业务问题触发的数据提取工作。我要看什么数据,要统计什么样的指标,要分析什么样的问题,从而去提取数据。

要提取数据就要看业务的数据量,如果是量大的、多维的,可能就要公司就已经建设了数据仓库,你要学习和掌握的就是HQL这个大数据工具;如果是量大,但是存放在常见的数据库mysql 、SQL server 里面,那你要学习和掌握的就是SQL;如果数据量不大,Excel都能处理,那你要学习的就是Excel 。

上面都是针对内部的自有数据,如果要看的数据没有,那怎么办?可能是购买第三方数据、爬取其他平台的数据,也可能是其他渠道,这时数据收集的手段和成本也变了,如果你的业务与爬虫相关,那可能你就要学习和掌握爬虫软件和相关语言的工具。

学习一个工具或者一门语言,都有大致了解它的作用和功能,然后从基础的使用上手,不断加强和扩大这个过程。

HQL 、SQL 、Excel等工具都不难,为什么说不难,是因为语法简单、网上基础教程很多。学习不难,难得是和业务结合之后的取数逻辑。逻辑是影响做事的顺序、方向、业务分析结果。

例如通过两个时间点算一段时间差很容易,但是实际业务中,可能是计算人群中每个人的停留时间。

毛主席说过,在战略上藐视敌人,在战术上重视敌人。同样的,对学习工具心态,我们就是要心态觉得学起来不难,但是学习的过程要重视积累,反复的去使用就能达到熟能生巧。

「处理数据」

我们要看什么数据,要分析什么指标,那我们就要通过整理原始的数据,经过规整数据、按口径汇总等一系列处理后才能获取我们想要的数据指标。因此数据分析师一个很重要的技能就是学会整理拿到的数据。

那数据分析经常用什么处理数据呢?还是脱离不了Excel 、SQL 、其他语言(R &Python等)三件套。

Excel 是处理数据的常青树,功能全面、处理灵活,做表出图都十分方便,但是现在DT时代了,数据量都在猛增。一般实际的业务是SQL跑出汇总级别或者小量的数据,然后放在Excel里面处理。R或者Python是两个最主流的数据科学相关的语言,有大量的模块与数据处理相关,同时有相应的数据库接口,能直接读取数据到内存后直接处理。不过,基于内存的、同时又是单机的,因此处理的数据级别也就有了限制。总体的一个学习纲领就是,SQL 、Excel熟练掌握,能解决业务数据的大部分问题,掌握一门编程语言方便自己、拔高自己。

嗯,知道这些工具后,我们又应该怎么学呢?

Excel的功能太全,知乎的上也有不少奇技文章。其实阿乐也与同事做过很复杂的Excel自动化系统,但是时代在进步,不推荐大家把过多的时间放在一些很偏门的技巧性的工具学习,我用这个工具1分钟能做完的事情干嘛要用那个工具折腾10分钟。时间宝贵,力要使在刀刃上。我们工作目的是用数据解读业务现状,帮助业务解决问题。所以,Excel够用就是阿乐的标准。什么是够用,那就是掌握常用的功能,基本的图表、透视、匹配这些。

比如你现在想看A和B的组合分布,sql按它俩group by出来,放excel里添加透视表,行列分别是clktype和osid,就能看到一个二维表格了,只用sql要得到这个二维表也不是不行,只是犯不着费这劲了。反正sql和excel都必备,那它俩取长补短配合就好了。然后,在透视表插入图表就可视化了。

网上搜Excel常用公式,技巧等就有很多教程,阿乐就不接着展开了。

再谈谈SQL。没有比sql更合适的“语言”了——简洁友好上手快,对sql的使用,无非4点:行列过滤、数据变换、合并连接、聚合透视。会用这4招,你就能搞定90%的数据分析需求了。

这里推荐初学者先上菜鸟课程 把基础课程给刷了,跟着课程多练习几次就有感觉了。同时为了减少大家放在搜相关学习资料的时间和精力,也在公众号放了相关的学习视频和资料,可以关注公众号后查看 好物 模块获取下载链接。

然后说说R和Python,在临时行分析任务,其实效率并不高。你写完代码,人家SQL + Excel跑数出图早完事了。不过,语言工具自然有它的好处。两个语言都有强大完整的生态,做图、做工具、做自动化、做模型那是强项。

这两个语言十分本书都说不完,以后阿乐慢慢给你们讲,你们要的资料学习资料都在公众号。阿乐在这里讲讲我们经常遇到的一个问题:我要学R还是Python?

阿乐的回答是,不用纠结,你先挑一个自己容易上手的。先把其中一个好好掌握了,遇到问题就用它去解决就行了。在数据分析这块,R能做的,Python也能做,两者各有优异,但是差别不大。放下纠结,用好任何一个都是极好的。

在不同的部门,你遇到不同的业务习惯,用的工具自然不一样。在数据分析领域,R和Python就是刀和剑的关系,没有什么优劣之分,看你喜欢,充分掌握了,都是大师,都能入道。也许你以后有机会还能刀剑双修嘞,但是时间和精力有限,咱们要优先掌握好一个。

没有最好的工具,只有最合适的工具。在处理数据问题上,什么工具的原理都是一样的,都是通过各种变换和统计,获取自己想要的指标结果。

「产出」

前面阿乐墨迹了一堆,只是说了数据分析的过程和工具,这是是数据分析的基石。如果基石不稳,会严重影响数据分析的效率和结论的完备性。但这些不是价值,价值是我们的产出,我们的分析结果。

工具只是手段,你更需要的是数据分析。“我要分析什么”来指导“我要怎样用好分析工具”。事实上,分析并不难,你只需要把合适的数据摆出来,旁边放上合适的对标数据,或者在脑子里对标其他数据,你就是在做分析了。就是说,“分”做好了,“析”是水到渠成的。再从分析到结论,就需要业务人员协助了,或者分析人员本身就非常熟悉业务。

这里提几个经常分析的点和方向。

宏观分析 

主要是对kpi相关指标的趋势、拆解、产品体验漏斗的分析;甚至产品所处的宏观大环境的分析,需要外部数据辅助了。

这些最频繁的数据分析,一般都有报表来承载,不需要投入分析人力。有人有疑问,每天看报表,也是在做分析?没错,单个数字的没意义的,对比才有意义。表面上,每天看报表的数字,实际上是在拿某天的数字和历史上每一天的数字做对比。

除了这两个,还有用户生命周期分析、漏斗分析、流量分析、用户行为分析、AB测试等等。

利用前面工具,把我们的结果搞出来,这就是数据分析。

无论怎么学,我们都要盯着对当前工作有用的先学。之前的文章也提到了,先定行业,再看公司要求,针对性得把基础工具掌握了,这对于入门和入行就是足够了。学好学精是靠长期的积累。学海无涯,集中精力学会一个,扩宽自己的眼睛是为了看世界,不是让自己纠结。

数据分析就这点事,很容易整明白的,也可以总结出固定的范式:<各种视角的现状分析+实施增长措施+验证措施效果>

02

要学到什么程度才能找工作?

经常有人问阿乐,我要学多久才能找到工作?我能找到工资多高的工作?

这个是和谈情说爱一毛一样的。阿乐我长的不帅就不能谈恋爱了吗?当然不是,但是会影响爱情的质量。如果阿乐没有打扮和提高自己,很难追到自己想要的女神。数据分析这个岗位就考核两方面:技能 + 经验。

技能是对工具的掌握程度,经验是相关的业务经验和行业知识,这些能反馈在你以往的工作产出上。如果你不是急于找工作,有闲余时间可以多准备一点,自己底气越足,找工作谈薪资都有底气。不过也不能一直闭门造车,与业务多打交道,多磨练自己的实际工作应用,也会慢慢找到自己的定位和方向。

工资和能力挂钩,在没buff加成的情况下,很难跳出常规的工资帽。在不同的能力阶段,工资自然不一样。高富帅不一定都能追到女生,但是追女生很容易。

03

报班还是自学?

最后困扰大家比较多的问题就是到底要报班还是自学

因为各大高校本身没有数据分析这个专业,所以很多这个岗位人员的专业都是数学、统计相关专业的;又因为这个行业不需要什么证书作为门槛,也没什么国家认证证书证明你的能力,所以也有很多其他专业转行过来的朋友。

既然前面已经有很多人转行过来,你也不用担心你不能转行。存在即是合理,培训机构既然存在也自然有它存在的价值。不过互联网的岗位都是繁杂的,运营、产品、数据都是如此,要学的很多,入门容易,提高难,同时培训广告的宣传都是抓住你的痛点才做的广告。

学习投入,我建议考虑性价比和个人精力。如果你不差钱,能安排全部时间出来去培训,这也没有问题;如果你预算有限,有一定安排的时间,不急着转行,可以给自己规划一段时间自学。

培训无非是有人把基础的东西告诉你怎么做,自学是自己规划自己做,问题就是会遇到很多疑惑,但无论哪种,消化和掌握相关知识和技能都是要靠自己。有的同学花钱后就马上后悔,也有的花钱了没坚持下去,而阿乐希望你认真做好自己的选择和规划,这比花钱更重要。

心急也吃不了热豆腐,功夫不负有心人。

最后,阿乐会坚持在这里写更多的东西,希望这篇文章有你有一点点用。

感谢您的阅读,请顺手点个「在看」,谢谢。

你可能感兴趣的:(上新 | 数据分析师用这个姿势学)