对比excel 轻松学python电子书_对比Excel,轻松学习Python数据分析

商品参数

对比Excel,轻松学习Python数据分析

定价 59.00

出版社 电子工业出版社

版次 1

出版时间 2019年01月

开本 16开

作者 张俊红

装帧 平装

页数 284

字数 369000

ISBN编码 9787121357930

内容介绍

集Python、Excel、数据分析为一体是本书的一大特色。本书围绕整个数据分析的常规流程:工具熟悉-获取数据-数据熟悉-数据处理-数据分析-分析结果进行Excel 和Python 对比实现,告诉你每一个过程中都会用到什么?过程与过程之间有什么联系。这样一本书既可以作为系统学习数据分析流程操作的说明书,也可以作为一本数据分析师案头BB的实操工具书,随时备查。本书通过对比Excel 功能操作去学习Python 的实现代码,而不是直接上来J学习Python代码,大大降低了学习门槛,消除了读者对代码的恐惧心理。适合刚入行的数据分析师,也适合对Excel 比较熟练的数据分析师,或从事其他岗位想提高工作效率的职场人。

目录

入门篇

D1 章 数据分析基础 . 2

1.1 数据分析是什么 2

1.2 为什么要做数据分析 2

1.2.1 现状分析 . 3

1.2.2 原因分析 . 3

1.2.3 预测分析 . 3

1.3 数据分析究竟在分析什么 4

1.3.1 总体概览指标 . 4

1.3.2 对比性指标 . 4

1.3.3 集中趋势指标 . 4

1.3.4 离散程度指标 . 5

1.3.5 相关性指标 . 5

1.3.6 相关关系与因果关系 . 6

1.4 数据分析的常规流程 6

1.4.1 熟悉工具 . 6

1.4.2 明确目的 . 7

1.4.3 获取数据 . 7

1.4.4 熟悉数据 . 7

1.4.5 处理数据 . 7

1.4.6 分析数据 . 8

1.4.7 得出结论 . 8

1.4.8 验证结论 . 8

1.4.9 展示结论 . 8

1.5 数据分析工具:Excel 与Python .. 8

实践篇

D2 章 熟悉锅——Python 基础知识 . 12

2.1 Python 是什么 .. 12

2.2 Python 的下载与安装 .. 13

2.2.1 安装教程 ... 13

2.2.2 IDE 与IDLE . 17

2.3 介绍Jupyter Notebook 17

2.3.1 新建Jupyter Notebook 文件 17

2.3.2 运行你的D一段代码 ... 19

2.3.3 重命名Jupyter Notebook 文件 19

2.3.4 保存Jupyter Notebook 文件 19

2.3.5 导入本地Jupyter Notebook 文件 20

2.3.6 Jupyter Notebook 与Markdown ... 21

2.3.7 为Jupyter Notebook 添加目录 21

2.4 基本概念 .. 26

2.4.1 数 ... 26

2.4.2 变量 ... 26

2.4.3 标识符 ... 27

2.4.4 数据类型 ... 28

2.4.5 输出与输出格式设置 ... 28

2.4.6 缩进与注释 ... 29

2.5 字符串 .. 30

2.5.1 字符串的概念 ... 30

2.5.2 字符串的连接 ... 30

2.5.3 字符串的复制 ... 30

2.5.4 获取字符串的长度 ... 30

2.5.5 字符串查找 ... 31

2.5.6 字符串索引 ... 31

2.5.7 字符串分隔 ... 32

2.5.8 移除字符 ... 32

2.6 数据结构——列表 .. 33

2.6.1 列表的概念 ... 33

2.6.2 新建一个列表 ... 33

2.6.3 列表的复制 ... 34

2.6.4 列表的合并 ... 34

2.6.5 向列表中插入新元素 ... 34

2.6.6 获取列表中值出现的次数 ... 35

2.6.7 获取列表中值出现的位置 ... 35

2.6.8 获取列表中指定位置的值 ... 36

2.6.9 删除列表中的值 ... 36

2.6.10 对列表中的值进行排序 . 37

2.7 数据结构——字典 .. 37

2.7.1 字典的概念 ... 37

2.7.3 字典的keys()、values()和items()方法 ... 37

2.8 数据结构——元组 .. 38

2.8.1 元组的概念 ... 38

2.8.2 新建一个元组 ... 38

2.8.3 获取元组的长度 ... 38

2.8.4 获取元组内的元素 ... 39

2.8.5 元组与列表相互转换 ... 39

2.8.6 zip()函数 ... 39

2.9 运算符 .. 40

2.9.1 算术运算符 ... 40

2.9.2 比较运算符 ... 40

2.9.3 逻辑运算符 ... 41

2.10 循环语句 41

2.10.1 for 循环 ... 41

2.10.2 while 循环 ... 42

2.11 条件语句 43

2.11.1 if 语句 . 43

2.11.2 else 语句 .. 44

2.11.3 elif 语句 .. 45

2.12 函数 46

2.12.1 普通函数 . 47

2.12.2 匿名函数 . 48

2.13 GJ特性 49

2.13.1 列表生成式 . 49

2.13.2 map 函数 . 50

2.14 模块 50

D3 章 Pandas 数据结构 . 51

3.1 Series 数据结构 ... 51

3.1.1 Series 是什么 51

3.1.2 创建一个Series 52

3.1.3 利用index 方法获取Series 的索引 53

3.1.4 利用values 方法获取Series 的值 ... 53

3.2 DataFrame 表格型数据结构 ... 53

3.2.1 DataFrame 是什么 53

3.2.2 创建一个DataFrame 54

3.2.3 获取DataFrame 的行、列索引 ... 56

3.2.4 获取DataFrame 的值 ... 56

D4 章 准备食材——获取数据源 .. 57

4.1 导入外部数据 .. 57

4.1.1 导入.xlsx 文件 .. 57

4.1.2 导入.csv 文件 ... 60

4.1.3 导入.txt 文件 63

4.1.4 导入sql 文件 65

4.2 新建数据 .. 67

4.3 熟悉数据 .. 67

4.3.1 利用head 预览前几行 . 67

4.3.2 利用shape 获取数据表的大小 68

4.3.3 利用info 获取数据类型 .. 69

4.3.4 利用describe 获取数值分布情况 71

D5 章 淘米洗菜——数据预处理 .. 73

5.1 缺失值处理 .. 73

5.1.1 缺失值查看 ... 73

5.1.2 缺失值删除 ... 75

5.1.3 缺失值填充 ... 77

5.2 重复值处理 .. 78

5.3 异常值的检测与处理 .. 81

5.3.1 异常值检测 ... 81

5.3.2 异常值处理 ... 82

5.4 数据类型转换 .. 83

5.4.1 数据类型 ... 83

5.4.2 类型转换 ... 84

5.5 索引设置 .. 86

5.5.1 为无索引表添加索引 ... 86

5.5.2 重新设置索引 ... 87

5.5.3 重命名索引 ... 88

5.5.4 重置索引 ... 89

作者介绍

张俊红:某互联网公司数据分析师,擅长Python、Sql、Excel,对数据分析、机器学习领域比较熟悉。喜欢分享,致力于做一个数据科学路上的终身学习者,实践者,分享者。个人微信公众号“张俊红”定期推送数据分析、机器学习、网络爬虫、Python 编程系列文章。

你可能感兴趣的:(对比excel,轻松学python电子书)