数据分析课程

课程安排(参照使用,具体见课表安排)

第一阶段 Excel数据分析

Excel数据处理技巧和高效方法

Excel数据收集、整合、规范化

Excel公式、函数、数组及数据分析

Excel可视化数据分析(排序、筛选、透视表等)

Excel图表化数据呈现

第二阶段 数据库管理

数据库简介

MySQL 增删改语句

MySQL select查询语句

MySQL综合案例

SQLserver应用

Oracle应用

第三阶段 Power BI 商业案例

Power Query基本功能介绍

Power Query进行数据导入

Power Query横向合并与纵向合并数据

Power Query M函数与数据预处理

Power Pivot数据导入功能

Power Pivot搭建多维数据集与多维数据透视

Power Pivot创建层次结构及KPI

Power Pivot综合应用案例:商机相关企业信息

Power Map数据地图创建及应用方法

Power View交互式仪表板创建方法

案例:全国主要城市空气质量地图、餐饮业店铺销售状况仪表盘

第四阶段 Tableau数据可视化

Tableau公司和产品介绍

使用Tableau连接多源数据

Tableau可视化界面介绍

Tabelau数据分析P1:排序、筛选、计算字段、分层结构

Tableau数据分析P2:集和参数、趋势线、预测区间

初级图表:条形图、折线图、饼图、文字云、散点图、地图、树形图、气泡图、图表组合

高级图表:子弹图、环形图、瀑布图、Bump Chart、Table Formatting

使用Tableau制作仪表板与故事

实战项目1:某公司销售数据可视化

实战项目2:航班运营状况分析

第五阶段 Python编程基础

python基础语法

python基本数据类型

python的运算符

python字符串、列表、元组等

python条件控制

python循环语句

python函数、类、模块

python文件操作、异常处理

第六阶段 Python数据清洗

Numpy的ndarray

数组的索引和切片

数组的运算

常用的数组方法

Series数据结构

DataFrame数据结构

汇总计算

缺失值处理

数据合并、重塑

Groupby技术

数据透视表和交叉表

第七阶段 Python数据可视化

可视化基本概念和设计原则

利用pandas进行数据可视化

python可视化工具Matplotlib的安装和使用

Matplotlib高阶绘图

seaborn绘图

pyecharts绘图

第八阶段 Python网络爬虫

爬虫的基本原理

HTML简介

发送请求和网页抓取

设置浏览器代理

数据解析-Xpath

BeautifulSoup简介

数据解析-正则表达式

动态渲染页面抓取

新闻爬虫案例

招聘爬虫案例

第九阶段 商业BI项目案例实践

使用MySQL+Excel制作关键指标监控仪

使用Excel+SQL制作销售情况分析仪案例:

Step1:理解数据分析业务背景,确定分析目标

Step2:使用Power Query连接Mysql进行数据导入和数据预处理

Step3:使用Power Pivot创建多维数据分析环境

Step4:使用Excel和Power View制作数据分析仪交互式可视化界面

商业报告撰写

第十阶段 数学基础

函数

极限

微分

定积分

级数

向量、线性组合

线性变换与矩阵、矩阵乘法

行列式、逆矩阵和矩阵的秩

非方阵

点乘,内积

叉乘,外积

特征值与特征向量

奇异值分解

第十一阶段 统计与建模

集中趋势

离散测度

统计量

分布

样本均值的分布与中心极限定理

样本比例的抽样分布

两个样本均值之差的抽样分布

关于样本方差的分布

参数估计

一个总体参数的区间估计

两个总体参数的区间估计

估计量的求法

样本量的确定

假设检验、单样本t检验

配对样本的t检验、两独立样本t检验

分类数据与卡方统计量

拟合优度检验

列联分析:独立性检验

列联分析相关测量

两个变量间线性关系的方向和强度

协方差

相关系数

一元线性回归模型

多元线性回归模型

逻辑回归模型

第十二阶段 Python机器学习

机器学习入门介绍与技术概览

线性回归、岭回归、lasso回归

矩阵分解与降维方法(PCA)

逻辑回归、KNN

集成算法:AdaBoost、随机森林、XGboost

朴素贝叶斯

决策树

聚类

支持向量机

关联规则与序列模式

神经网络

第十三阶段 项目实战

金融行业项目案例

信用风险指的是交易对手未能履行约定合同中的义务造成经济损失的风险,即受信人不能履行还本付息的责任而使授信人的预期收益与实际收益发生偏离的可能性,它是金融风险的主要类型。借贷场景中的评分卡是一种以分数的形式来衡量风险几率的一种手段,也是对未来一段时间内违约、逾期、失联概率的预测。一般来说,分数越高,风险越小。

电商零售行业项目案例

由于电商发展的日趋成熟,电商商家之间的竞争愈来愈激烈。该玩具公司销售额突破6千万后,公司的发展便遇到了瓶颈。

公司现状描述,公司属于中型发展公司,资金链充足;该公司的玩具货品来源,来着品牌代理加工工厂,玩具质量和款式以及性价比均为亮点;公司运营团队的规模20人。该玩具公司希望通过数据分析分析,给予突破瓶颈+提升销售额的方案。

你可能感兴趣的:(数据分析课程)