python数据分析与可视化从入门到精通_零基础学Python爬虫、数据分析与可视化从入门到精通...

第1章 Python编程环境搭建

1.1 为什么用Python进行大数据分析和可视化

1.2 安装和配置anaconda

1.3 安装和配置Jupyter Notebook

1.4 模块的安装与导入

1.4.1 常规导入法

1.4.2 from语句导入法

第2章 Python的基础语法

2.1 变量与编码基本规范

2.1.1 变量的命名与赋值

2.1.2 缩进

2.1.3 注释

2.2 数据类型

2.2.1 数字

2.2.2 字符串

2.2.3 列表

2.2.4 字典

2.3 运算符

2.3.1 算术运算符

2.3.2 比较运算符

2.3.3 赋值运算符

2.3.4 逻辑运算符

2.4 Python语句

2.4.1 if条件语句

2.4.2 for循环语句

2.4.3 while循环语句

2.4.4 嵌套语句

2.4.5 break、countinue、pass、else语句

2.5 Python函数

2.5.1 内置函数

2.5.2 自定义函数

第3章 数组计算的数学模块——Nmupy

3.1 Ndarray对象

3.1.1 创建ndarray数组

3.1.2 ndarray数组的基本属性

3.2 数组的索引与切片

3.2.1 一维数组的索引和切片

3.2.2 多维数组的索引和切片

3.3 数组重塑

3.3.1 一维数组的重塑

3.3.2 多维数组的重塑

3.3.3 数组的转置

3.4 数组的处理

3.4.1 数组类型的转换

3.4.2 处理缺失值、重复值

3.4.3 数组的拆分与合并

3.5 数组的运算

第4章 数据导入和整理模块——pandas

4.1 pandas数据结构

4.1.1 series数据结构

4.1.2 dataframe数据结构

4.2 数据的读取、查看与导出

4.2.1 导入外部数据(导入xlsx、csv等)

4.2.2 查看部分数据

4.2.3 数据文件导出格式和路径的设置(导出为xlsx,csv等)

4.3 数据类型的转换

4.4 数据的替换和查找

4.4.1 一对一替换

4.4.2 多对一替换

4.4.3 多对多替换

4.4.4 数值查找

4.5 数据的处理

4.5.1 处理空值、缺失值、重复值和异常值

4.5.3 数据的筛选

4.5.4 数据的排序

4.5.5 数据的删除

4.5.6 数据的分组与分列

4.5.7 数据的合并

4.5.8 数据透视表

4.6 数据表的处理

4.6.1 查看数据表的大小

4.6.2 行列互换

4.6.2 长宽表的转换

4.6.2 数据表的拼接

4.7 索引设置

4.7.1 添加索引

4.7.2 重新设置索引

4.7.3 重命名索引

4.7.4 重置索引

4.8 数据的运算

4.8.1 数据的汇总

4.8.3 数值分布情况(均值、最值)

第5章 使用Python进行基本的数据分析

5.1 相关性分析

5.2 方差分析

5.3 描述统计

5.4 线性回归分析

5.4.1 一元线性回归分析

5.4.2 多元线性回归

5.5 逻辑回归

5.6 预测分析

5.5.1 指数平滑

5.5.2 移动平均

5.6 假设检验

第6章 爬虫基础

6.1 网页结构初步认识

6.2 requests库使用:

6.3 案例

6.4 正则表达式详解

6.5 BeautifulSoup解析

6.6 数据乱码处理方法

6.7 综合案例

第7章 复杂爬虫与反爬虫

7.1 Selenium基础

7.2 Selenium进阶

7.3 综合案例

7.4 IP反爬

7.5 Cookie池模拟登陆反爬

第8章 爬虫数据结构化与数据存储

8.1 表格类数据的快速获取

8.2 数据结构化

8.3 数据库存与读取

8.4 综合案例

第9章 中文数据处理

9.1 jieba模块概述

9.2 读取文本内容并进行分词

9.3 提取特定长度的分词

9.4 统计高频词汇的词频

9.5 实战案例

第10章 线性与逻辑回归

10.1 线性回归概念

10.2一元线性回归

10.1.2 一元线性回归编程实践

10.2.1 一元线性回归模型与

10.3多元线性回归

10.3.1 多元线性回归模型与

10.3.2 多元线性回归编程实践

10.4 逻辑回归

10.4.1 逻辑回归概念与模型

10.4.2 逻辑回归编程实践

第11章 决策树模型与分析

11.1 决策树模型概述

11.2 ID3算法

11.2.1 特征选择——信息增益

11.2.2 ID3决策树的构造

11.2.3 ID3决策树的剪枝

11.3 其他树模型

11.3.1 C4.5算法

11.3.2 CART算法

第12章 数据聚类与分群分析

12.1 聚类分析概述

12.2 Kmeans算法

12.2.1 Kmeans算法的原理

12.2.2 Kmeans算法的代码实现

12.3 DBSCAN算法

12.3.1 DBSCAN算法的原理

12.3.2 DBSCAN算法的代码实现

第13章 关联规则分析

13.1 关联分析概述

13.2 Apriori算法

13.2.1 Apriori算法的数学模型

13.2.2 Apriori算法的代码实现

13.3 FP-Growth算法

13.3.1 FP-Growth算法的数学模型

13.3.2 FP-Growth算法代码实现

第14章 数据可视化模块——Matplotlib

14.1 绘制简单的图表

14.1.1柱形图和条形图

14.1.2折线图和面积图

14.1.3散点图和气泡图

14.1.4 饼图和圆环图

14.1.5 组合图

14.2 添加和设置图表元素

14.2.1添加图表标题和坐标轴标题

14.2.2设置图例和数据系列

14.2.3调整刻度范围和数据标签

14.2.4设置坐标轴的刻度样式

14.3 绘制特殊图表

14.3.1雷达图

14.3.2箱型图

14.3.3热力图

14.3.4旭日图

14.4 图表的绘制技巧

14.4.1 同画布上绘制多个图表

14.4.2 给不同段的线设置不同的颜色

14.4.3 为图表添加描述或注释

14.4.4添加拟合曲线

第15章 数据可视化模块——Pyecharts

15.1三维柱形图

15.2玫瑰饼图

15.3漏斗图

15.4 云图

15.5雷达图

15.6仪表盘

15.7水球图

15.8 3D图表

第16章 综合案例:当当图书销售信息获取与分析

16.1 项目分析

16.2 数据爬取

16.3 数据清洗

16.3 数据分析

16.4 数据可视化

第17章 综合案例:股票信息获取与分析

17.1 项目分析

17.2 数据爬取

17.3 数据清洗

17.3 数据分析

17.4 数据可视化

你可能感兴趣的:(python数据分析与可视化从入门到精通_零基础学Python爬虫、数据分析与可视化从入门到精通...)