数据分析学习目录

在未来5个月里,将会陪伴大家一起来学习关于数据分析的相关内容,包括从数据思维,数据工具(Excel,Mysql,Hive,Python),数据方法论,数据展示(Tableau,BI),数据挖掘、数据实战项目一整套的内容,同步会将可能用到的以及有用的知识点整理出来。内容会慢慢更新。
 

如下为数据分析的整个目录

一、数据分析思维与方法论

1.1、从0-1搭建指标体系、用户标签体系

        1.1.1、指标体系搭建-专项1

1.2、业务策略效果评估与量化

1.3、指标波动归因分析

        1.3.1、数据异常问题分析方法(1)

1.4、用户增长分析

1.5、活动复盘分析

1.6、业务问题专项分析

        1.6.1、数据分析思维模型和方法

1.7、统计推断、假设检验、ABtest、因果推断

1.8、SQL、Python、Excel、BI工具

1.9、数分面试题库

        1.9.1、数分面试(一)--与业务相关

                难点梳理(条件相连、顺序相连、连续值统计@、窗口排序)

                留存问题分析

                        基础指标:每日uv、pv、浏览深度、留存

                 RFM模型

                        用户最近购买日期

                        购买频率

                        购买金额

                        用户分类正在上传…重新上传取消

         1.9.2、数分面试(二)--纯SQL题

                作者断更的最大天数

                格式转换  、     pv、        浏览深度、留存、留存      

                求和、计数的窗口函数应用

                计数的窗口函数应用(2)

1.10、国内互联网数分的面试真题

二、数据分析中常用的Excel技巧

2.1、计算两个日期(带时刻)之间的时间差

2.2、VLOOKUP函数之反向查找

2.3、Text格式转换函数

2.4、SUMIF函数条件求和

2.5、COUNTIFS函数

2.6、Ctrl+E 快速填充

2.7、Datedif函数

Excel中常用的85个函数语法与应用(在文章最后,附上百度网盘的链接,请自行获取)

三、MySQL编程

3.0、MySQL的增删改

3.1、Mysql查询

        3.1.1、简单查询

        3.1.2、运算符操作查询

        3.1.3、排序查询

        3.1.4、聚合查询

        3.1.5、分组查询

        3.1.6、分页查询

3.1.-3.2、SQL约束(单表与多表之间的关系过渡)

        ①主键约束

        ②非空约束

        ③唯一约束

        ④外键约束

        ⑤默认值约束

3.2、Mysql多表联合查询

        3.2.1、交叉连接查询

        3.2.2、内连接查询

                隐式内连接

                显式内连接

        3.2.3、外连接查询

                3.2.3.1、SQL外连接之交集、并集、差集查询

        3.2.4、子查询

                子查询关键字

        3.2.5、自关联查询

3.3、Mysql函数

        3.3.1、数学函数

        3.3.2、字符串函数

        3.3.3、日期时间函数

        3.3.4、条件判断函数

        3.3.5、系统信息函数

        3.3.6、高级的窗口函数

                累计计算函数

                排序函数

                        row_number () over ()

                        rank () over ()

                        dense_rank () over ()

                偏移分析函数

                        lag()over()

                        lead()over()

                        first_value()over()

                        last_value()over()

                分布分析函数

                其他分析函数

                       ntile()over()

                高级窗口函数的面试案例            

3.4、Mysql索引

3.5、Mysql正则表达式

3.6、其他Mysql事项

        3.6.1、Mysql三大范式

        3.6.2、Mysql优化

        3.6.3、Mysql锁机制

        3.6.4、Mysql事务

        3.6.5、Mysql日志

        3.6.6、Mysql触发器

 3.7、Mysql重点难题1

          Mysql重点难题2

3.8、Mysq项目

        3.8.1、实现用户、商品的精准推荐(MySQL方式实现)

 3.9、大厂面试真题

3.10.零散化的数据库问题汇总

        3.10.1、日期格式以及编码格式错误的转换处理

        3.10.2、字符串提取函数substring以及substring_index

        3.10.3、电商领域用户的留存分析

        3.10.4、MySQL之分组查询group by

        3.10.5、子查询作为检索表时的不同使用场景以及是否需要添加别名的问题

四、可视化BI软件

数据可视化资料

        人人都是数据分析师:图灵原创《作者刘红阁博士》

4.1、初识Tableau

        4.1.1、视图

        4.1.2、 页面图

        4.1.3、筛选器

        4.1.4、数据融合

                4.1.4.1、数据连接

                4.1.4.2、数据合并

                4.1.4.1、数据混合

4.2、数据的初阶可视化

        4.2.1、条形图

        4.2.2、直方图

        4.2.3、折现图

        4.2.4、饼图

        4.2.5、圆环图

        4.2.6、散点、气泡图

        4.2.7、靶心图

        4.2.8、地图

4.3、数据的高阶可视化

        4.3.1、帕累托图

        4.3.2、盒须图

        4.3.3、瀑布图

        4.3.4、动态图

        4.3.5、漏斗图

4.4、函数

        4.4.1、特殊函数:快速表计算

                4.4.1.1、累计汇总

                4.4.1.2、差异

                4.4.1.3、百分比差异

                4.4.1.4、合计百分比

                4.4.1.5、排序

                4.4.1.6、排序

                4.4.1.7、百分位

                4.4.1.8、复合增长率

        4.4.2、特殊函数:详细表达式

                4.4.2.1、Include函数

                4.4.2.1、Exclude函数

                4.4.2.1、Fixned函数

4.5、数据的高级操作

        4.5.1、分层结构

        4.5.2、组结构

        4.5.3、集结构

        4.5.4、参数创建

        4.5.5、字段创建

        4.5.6、参考线创建

4.6、数据可视化的项目

五、大数据

5.1、Hadoop环境介绍

        5.1.1、Hadoop MapReduce入门

5.2、数据仓库HIve

        5.2.1、【数据仓库Hive系列】Hadoop及Hive环境介绍

        5.2.1、【数据仓库Hive系列】Hive与MySQL的技术差异点

                5.2.1.1、数据库数据表的定义

                        ①数据类型

                        ②分隔符

                        ③分区表

                        ④分桶表

                        ⑤外部表

                5.2.1.2、数据导入导出删除

                        数据装载

                        数据导入

                        数据导出

                5.2.1.3、HIve常用的查询语句

5.3、Hive的数据实战项目

六、数据分析的编程基础

 6.1、Python基础

 6.2、Numpy科学计算库

        6.2.1、数组创建、查看

        6.2.2、文件IO操作

                保存数组

                文件读取

                读写CSV、text文档

        6.2.3、数据类型

                数据类型转换

        6.2.4、数组运算

        6.2.5、复制和视图

                完全没有复制/查看

                浅拷贝

                深拷贝

        6.2.6、索引、切片以及迭代

                数组变形

                数组转置

                数组堆叠

                数组拆分

        6.2.7、广播

        6.2.8、常用函数

6.3、Pandas数据分析库

6.4、Matplotlib数据绘图

6.5、pyeacharts数据绘图

6.6、爬虫框架

6.7、项目实战         

七、统计学理论

八、数据挖掘

九、数据分析项目

你可能感兴趣的:(数据分析进阶之路,#,数据分析目录,数据分析)