转行的你,不能靠Python数据分析

非常高兴再次以这样的方式和大家交流。上一篇文章我们介绍了数据分析火爆的背景,以及数据分析到底是不是最近才产生的等概念,大家都对数据分析有了一定的了解。上次的文章反响不错,说明作为转行的数据分析师,困惑重重,仍然迷茫。别急,我们今天继续答疑释惑。上次的文章中提到目前的数据分析岗位基本分为三大类:传统的数据分析、常见的数据分析以及大数据分析。如果你还不知道这些,记得回顾《转行的你,其实不懂数据分析》。不同的岗位对应的技能、面试要求都不同。今天,我们主要从数据分析岗位必备的技能谈起。

技能篇

上次的文章中说道,传统的数据分析以Excel为主,当然不只是Excel,可能还会用到SPSS、SAS等软件。Excel很多人自认为特别熟悉了,用它做数据分析的工具没有技术含量,其实不然。Excel是个巨大的宝藏,各种函数,还有宏与VBA。在工作中,我就会用到VBA。处理多表格数据靠VB脚本可以帮我们轻松搞定。其次,对于当今的数据分析,SQL更是应用广泛。SQL也是面试的必备技能。增删改查、索引优化是作为数据分析师的必备。对于复杂的SQL逻辑,还是需要大量的练习为好。如果有幸你能进入大数据分析团队,那么Hive是必备的技能。学习Hive之前,一定要先去学习Hadoop,这样你才能对HiveSQL有个更加深刻的认识,毕竟HiveSQL并不是SQL,面试中经常会问HiveSQL的原理。当然了,现在还需要去学学Spark以及SparkSQL才能做真正的大数据分析,否则只能叫数据分析。

最最重要的Python到底需不需要啊?上次的文章中我没有提及Python,很多人都留言问我,难道Python没有作用吗?!答案当然是Python很重要了。但是,对于数据分析岗位来说,python似乎并不是占主体地位。绝对不是我个人的情况,我和很多数据分析大佬聊过天,python在工作中的占比真的不是特别高,肯定是会用到的。一般情况下,python用于两大类数据分析岗位:需要网络爬虫的数据分析师、需要算法挖掘的数据分析师。这两者绝对需要Python,而且对Python的要求也较高,还要求一些其他的知识。比如爬虫需要掌握一些网页解析、网络服务、线程进程等问题,甚至还需要掌握一门前端语言。至于数据挖掘,那肯定需要掌握统计算法知识,回归、聚类、支持向量机、随机森林、文本挖掘等等。所以说,最基本的数据分析工作用Python的机会并不多。能以Python为主的数据分析必然会涉及数据挖掘,也更高大上一些。

0

1

Excel

需要掌握各类常见常用函数,如sum、if、mid、lookup族、sumif、count、match、offset等;还需要掌握数据透视表、数据透视图,分类汇总,以及熟悉各类图表的适用场景;再深入一点,还可以进行曲线的拟合、系数的求解。

0

2

SQL

SQL,即Structured Query Language(结构化查询语言),是一种数据库查询和程序设计语言,用于存取数据以及查询、更新和管理关系数据库系统;同时也是数据库脚本文件的扩展名。首先要熟练地掌握查询语句,即select语句,多表查询、各类子查询、分组聚合、以及开窗函数一定要非常熟悉,增删改了解即可。

0

3

Python

Python的基础知识仍然是重中之重,深刻理解条件、循环等控制流语句,熟练掌握列表、元组、字典等知识,深刻理解函数及函数的调用,掌握类的创建、实例化,深刻理解一切皆对象的内涵;熟练掌握常见数据分析第三方库,Pandas、Numpy、Matplotlib、Seaborn、pyecharts。还可以根据自己的兴趣爱好及业务方向,学习其他对应的第三方库,爬虫相关或者算法相关。

方法篇

对于刚转行的萌新,或许认为掌握了Python就大功告成了,就可以去BAT等大厂做数据分析师了,而现实会给你一记重重的耳光——别太天真。虽说工欲善其事必先利其器,但是你心中无方法,脑海没思路,是做不好数据分析的。一些冷冰冰的数据放在你面前,如何让它们化作人形,注入灵魂?最重要的就是工具与方法!工具——可以使杂乱的数据化作人形即数据处理过程,工具极大地提高了处理效率;方法——可以让冰冷的数据注入灵魂即数据分析结论,恰当的分析方法才能让数据产生意义,结论指导现实。

常见的分析模型

实话实说,我不可能了解各行各业的数据分析师的工作,每一行的数据分析师工作内容都不尽相同,对于大公司可能不同的项目组分析师的作用也不同。比如字节跳动,有今日头条、抖音、火山小视频等,各个产品的定位不同、风格不同,分析的点就不会相同。但是,作为一个萌新,作为一个转行的新人,我们需要掌握一些共通的思考。

既然数据分析这么火爆,我也来学习吧。于是,大家都抱着相同的想法开始进行数据分析的学习。有需求就有市场,有市场就有培训机构。手动滑稽~大家都默契地前往培训机构学习。【嘿嘿,此处预留广告位】机构的好处是能够帮你介绍工具的使用,面试的技巧,坏处就是讲的都是空洞的理论,和现实工作脱节。

0

1

漏斗模型

漏斗模型,指的是多个自定义事件序列按照指定顺序依次触发的流程中的量化转化模型。

比如,我们要分析某购物APP注册流程、购物流程等,即用户是为了某个目标而进入了一个相对标准有序的路径,是为了达到“出口”,而非随意游荡。通过对关键路径转化率的分析,来确定整个流程的设计是否合理,各步骤的优劣,是否存在优化的空间等,进而提高最终目标的转化率。

漏斗模型不仅显示了用户在进入流程到实现目标的最终转化率,同时还可以展示整个关键路径中每一步的转化率。

0

2

AARRR模型

AARRR是Acquisition、Activation、Retention、Revenue、Refer,这五个单词的缩写,分别对应用户生命周期中的5个重要环节——获客、活跃、留存、收入、传播。这是绝大多数移动应用的产品分析思路,会对各个环节的转化率进行深入分析、研究,从而优化产品,提高产品收入。

0

3

常见的指标

同比,一般情况下是今年第N月与去年第N月之比。同比发展速度主要是为了消除季节变动的影响,用以说明本期发展水平与去年同期发展水平对比而达到的相对发展速度。

同比增长率=(本期数-同期数)/|同期数|*100%

环比,表示连续2个统计周期(比如连续两月)内的量的变化比。

环比增长率=(本期数-上期数)/上期数*100%

反映本期比上期增长了多少;环比发展速度,一般是指报告期水平与前一时期水平之比,表明现象逐期的发展速度。

数据分析师的技能,指的是两方面内容。一方面是工具的使用,另一方面是方法的运用。前者可以使杂乱的数据化作人形,进而为分析提供便利,熟练地使用工具可以大大提高处理数据的能力;后者可以让无生命的数据变得更有意义,像注入灵魂一般,影响未来的决策,指导现实生产。看到这了,你也想成功转行数据分析,到底该如何通过面试呢?!我们下期讲一讲我是如何通过数据分析师面试的——数据分析面试篇。

在看”的永远18岁~

你可能感兴趣的:(转行的你,不能靠Python数据分析)