从一名0基础的用户运营自学成为数据分析师,我花了大半年的时间,但是抛开工作时间,系统性的学习只花了3个月。
这篇文章会从学习资源和学习路径两个方面分享我的自学经验,希望能对大家有所帮助。
对于一名数据分析师,最重要的就是分析思维,这里给大家推荐3本入门数据分析的必读读物:
这三本书中:
初期学习读这三本完全足够了,书单太长容易进收藏夹吃灰,毕竟万事开头难,能够开心愉快地学习才是坚持下去的基础。
关于分析思维,除了这三本书,大家还可以多学习一些常见的业务分析模型如漏斗模型、分层模型、留存模型、画像分析、路径分析,经典的还有有RFM、SWOT、PEST等等等等,直接百度搜索,然后阅读相关文章即可。
SQL是分析师必须熟练掌握的技能,毕竟取数永远是数据分析中绕不开的一步。
SQL入门学习直接推荐给大家这本《SQL必知必会》,大家记得购买最新版。
刷完本书后SQL的基础语法和原理基本上就搞懂了,每天两个小时,一周左右就能搞定。
学完《SQL必知必会》后,直接去sqlzoo做题,这是一个特别良心的sql练习网站,难度逐步递增,让你刷着刷着就学会了SQL。
SQL Tutorial/zh - SQLZOOsqlzoo.netPython课程方面推荐coursera上的《零基础 Python 入门 专项课程》,课程免费,认真看完就能入门。
https://www.coursera.org/specializations/pythonwww.coursera.org但是编程语言一定要勤加练习,初期练习的话推荐大家和鲸社区的专栏,从基础入门一直到深度学习,专栏里都有项目可以学习参考。
社区专栏链接:
和鲸社区 - Kesci.comwww.kesci.com推荐新手练习的项目:
和鲸社区 - Kesci.comwww.kesci.comPython书籍方面推荐大家这本“松鼠书”《利用Python进行数据分析》,虽然这本书不适合直接拿来上手Python,但是适合当语法速查手册,在大家有一定基础后进行查缺补漏。
R是一门由统计学家专门设计的数据分析语言,在大规模数据分析上和Python的作用是一样的。
R的学习直接推荐阿里云大学上免费的R课程:
大数据之R语言速成与实战 - 阿里云大学 - 官方网站,云生态下的创新人才工场edu.aliyun.com这个课程系统全面,撸一遍,R基本上就会用了。
这里强推吴恩达老师的《Machine Learning Yearning》,这本书深入浅出、提纲挈领,看完马上明白机器学习的基础原理和应用。
如果想要练习,建议大家跟着网易云课堂或者coursera上吴恩达老师的课程系统地进行学习:
https://mooc.study.163.com/smartSpec/detail/1001319001.htmmooc.study.163.com当然,如果想要深入学习算法原理,推荐给大家“西瓜书”和“花书”。
“西瓜书”《机器学习》、“花书”《深度学习》回顾我刷这两本书的过程还是很痛苦的,但是刷完之后才真正弄懂了现代算法技术的原理。大家有时间的话一定要静下心来啃完这两本书。
注意,不要光看不练,看书的同时一定要找些相近的项目和数据进行练习,自己敲一遍代码才能更加真正领会。
除了书籍和课程,大家也可以在Kaggle、天池、和鲸、Datafoutain和FlyAI等竞赛社区找一些比赛练练手,如果能有不错的排名,在简历上会是一个加分项。
统计学一直是转型数据分析的小伙伴们比较担心的地方。
因为很多人的数理基础不是很好,对于毕业后的大多数小伙伴,拿出专门的时间学习统计学已经不太现实,并且很容易在初期挫伤大家的学习积极性。
所以我并不建议大家在学习初期把自己绕到数理基础里。初期宝贵的时间应该拿来培养兴趣,上手一门具体的生产力工具(Excel/Tableau/PowerBI/Python/R)。
真正适合大家的学习方法应该是在用到统计学等专业知识的时候再具体补充,例如:
所以统计学的学习资料就推荐一本李航的《统计学习方法》,供大家补充知识点之用:
再强调一下,没有数理基础的小伙伴一定不要直接钻研统计学,需要用到的时候再去补充才是统计学等专业知识最高效的学习方式。
快速通关Excel直接推荐刘伟老师的课程,大家可以去B站搜索“刘伟Excel"免费学习,也可以去刘伟老师的官网购买课程。
则秀教育 - 强大的在线教育培训 - Powered By EduSohowww.zesow.com刘伟老师的Excel课程非常非常良心,从函数到VBA基本上都讲完了,课程系统高效,跟他过一遍就不用了再学Excel了。
目前市面上的Tableau书籍和教程都比较老,很多还是照搬的官方文档,所以Tableau这方面没有特别好的学习资源推荐。
而我自己的Tableau是在一次Linda老师的线下课程上学会的,高阶技能则一直在请教Tableau第一届可视化大赛的冠军——纪洋。
Linda和纪洋都是我第一份工作上的业务伙伴,特别感谢他们一直以来对我在Tableau学习上的帮助!
但是我会在《数据分析300讲》中先从Tableau讲起,希望自己可以尽自己一点小小的努力补充这部分学习内容的空白,为后来的小伙伴们铺平学习的道路。
这里推荐我自己的专栏《数据分析300讲》,我会尽力把Tableau的学习内容做得有趣而又系统,欢迎大家与我在专栏中交流~
数据分析300讲zhuanlan.zhihu.com一、初学阶段一定要快速上手一门分析工具,保持学习的新鲜感,建立持续的正反馈
一开始我是直接从Python开始上手数据分析的,因为那个时候Python特别火,感觉数据分析就是要用Python做才显得专业。
学了之后才发现学Python数据分析前期投入太大了,基础语法要学3天,然后才能开始做一些基础的数据分析,并且出图效率还特别低。
后来接触了Tableau,一天就上手了,惊奇地发现原来数据分析可以这么高效有趣。
往往Python需要很多代码才能解决的图表,Tableau只需要拖拽几步就可以轻松实现。
Python VS Tableau在初学阶段我基本都在补充图表知识和分析框架,并且深入学习Tableau这款高效的生产力工具,用来实现自己的分析思路。
但这些分析都是基于现有的数据,没有直接连接到数据库,所以就没学SQL。
二、熟练掌握一门分析工具后,学习SQL提升取数和分析效率
熟练掌握Tableau后,要分析的东西太多,数据需求实现得又太慢,这个时候就不得不用SQL自己取数了。
直接请教了公司的数据分析师如何学习SQL,分析老哥甩给了我一本《SQL必知必会》,让我看完之后去sqlzoo刷题。
因为那个时候我的很多分析已经必须要直连数据库才能进行,所以学习SQL的动力很大,不到一周看完了《SQL必知必会》,3天就刷完了sqlzoo。
使用SQL高效取数从此之后,我再也不用提取数需求了,想要看什么数都可以用SQL自己取出来,特别特别开心。
三、遇到大规模的数据处理和建模再学Python
其实Tableau+SQL已经能解决我当时99%的数据分析问题了,不过随着分析技能的提升,想看的数越来越大,数据也越来越复杂。
虽然Tableau百万级的数据都能随便玩,但是大规模的数据处理和建模上还是有短板的,这个时候就必须借助Python或R来解决问题了。
Python和R我都学过,学下来的感觉是Python更全能,所以当初主要学了Python,R只是过了一遍。
实际应用过程中,Python在商业数据分析场景下比R更流行,招聘需求也更大,所以只学一个的话,我推荐大家学Python。
四、最后补充数据爬虫、数据挖掘、统计学等知识
等SQL取数+Tabelau分析+Pyhon处理与建模的基本工作流程熟练后,我们可以开始补充数据爬虫、数据挖掘、统计学等知识。
具体如何学习这些知识取决于工作场景。
以爬虫为例,工作中我只需要用Pyhton爬高德的API数据,就算有网页数据,量级不大的话我也直接用后羿采集器(一款巨好用的爬虫工具)解决。
后羿采集器_真免费!导出无限制网络爬虫软件_人工智能数据采集软件www.houyicaiji.com专业的爬虫所需要的背景知识特别多,学会了基本赶上半个开发,所以我也是需要什么学什么,实在解决不了会直接提爬虫需求。
至于数据挖掘和统计学也是同理,需要的时候再去学,一点点拓展自己的知识边界。
以上就是我在3个月的时间内自学成为数据分析师的全部经验分享啦~
关于如何在工作中应用学到的数据技能,大家可以看我的上一篇文章:
数据戴师兄:毕业半年,我如何用数据技能让自己薪资3翻zhuanlan.zhihu.com在熟练掌握这些数据技能和工具后,通过海投和面试,我成功拿到了7个数据分析岗位的offer,具体的笔试面试经验我会在下一篇文章中跟大家分享。
觉得这篇自学经验好的小伙伴们可以给我点个赞,觉得不好的欢迎大家在评论区与我讨论~
最后感谢大家的支持,希望大家都能早日入门数据分析,加油加油!