成为一名数据分析师的关键在于:结合实际业务,建立一套解决问题框架的能力,工具只是完成目的的手段而已。
所以,我把数据分析师的学习路径归纳为:
鉴于不同行业,不同公司对数据分析师的要求不同。大家可以根据自身情况来判断到底该学啥:
金融行业:SAS/SQL
中大厂:R/Python、SQL、A/B test
小型互联网公司:SQL
以中大厂为例,成为数据分析师需要掌握以下几点:
这里用一道大厂真题举例,主要考察DELETE语句中的子查询的用法
现需要删除课程表中所有教师年龄小于 21 岁(不包括 21 岁)的课程,请你使用相关的 SQL 语句实现。
首先我们需要在教师表 teachers 中查询到教师年龄小于 21 岁的老师的教师 id ,再根据其教师 id 在课程表 course 中查询该教师 id 所创建的课程并将课程删除。
因此,这里我们首先需要通过嵌套子查询到的信息为符合条件的教师 id,而整个语句是为了删除数据。
使用 SQL 中子查询的方式如下:
执行输出结果:
在删除成功后,我们再对 courses 表进行查询,查看插入结果:
掌握了这类题型后,可以来做下这道练习题删除在 2020 年前创建过课程的教师
除此之外,SQL相关的查询、运算符、函数、约束和多表连结的相关知识点及习题,就不一一介绍了,大家可以移步SQL教程学习。
这里重点安利下LintCode最新上线的SQL学习教程,非常适合从零起步学数据分析的朋友,因为他不仅是个刷题网站,连关键知识点,例题,源码都给你总结的清清楚楚,非常绝~
分享一些我曾经刷过的题,大家可以拿来练手:
初阶:
查询授课教师编号
向表中插入当前的日期
查询课程创建日期按 ‘年-月-日 时:分:秒’ 显示
查询在第一季度创建的课程
超过3名球员所得到的分数
中阶:
寻找特定身高的同学
连续的空箱子
张三的故事 III
挂科最多的同学 II
网课上课情况分析 II
其实SQL就是个熟能生巧的过程,主要就是多刷题,然后论坛面经都过一遍,基本就没啥问题了
最后,分享一些提升数据分析技能的网站、书籍
数据分析项目实战:
SQL刷题路径
分享了SQL的学习路径及刷题指南,非常适合新手打基础。
kaggle
提供学习竞赛,在掌握基础知识后,可以来组队竞赛提升个人技术水平,难度中等。
提高数据分析能力:
《精益数据分析》
这本书是建立在掌握数据分析知识体系的基础上,教你如何拥有数据驱动的思维模式
《深入浅出数据分析》
这本书涵盖了数据分析人员必须掌握的技术知识点,数据分析十大要务等。为深入研究数据分析搭建桥梁。
好了,就先分享到这里吧!
后续如果有新的学习资料会继续补充,在此之前,我想要个赞。