目录
序 言... 2
第一部分:商业数据分析理论篇... 13
1.1 商业数据分析的思维... 15
1.1.1 结构化:按不同的方向去分类... 15
1.1.2 公式化:对数据进行量化分析... 16
1.1.3 业务化:以理解业务为基础... 16
1.2 商业数据分析的七种技巧... 17
1.2.1 象限法:运用坐标的方式分析... 17
1.2.2 多维法:运用多维的方法呈现... 17
1.2.3 假设法:运用假设推理的方式... 18
1.2.4 指数法:整合与计算多个指标... 18
1.2.5 二八法:运用帕累托法则分析... 18
1.2.6 对比法:运用对比法对比分析... 18
1.2.7 漏斗法:挖掘有价值的新用户... 19
1.3 商业数据分析的典型方法... 20
1.3.1 推荐引擎... 20
1.3.2 购物篮分析... 20
1.3.3 保修分析... 20
1.3.4 价格优化分析... 20
1.3.5 库存管理... 21
1.3.6 选址分析... 21
1.3.7 情感分析... 21
1.3.8 品类分析... 21
1.3.9 生命价值预测... 21
1.3.10 反欺诈分析... 22
1.3.11 留存分析... 22
1.4 商业数据可视化分析工具... 23
1.4.1 Tableau Desktop. 23
1.4.2 Microsoft Power BI 23
1.4.3 Smartbi Insight 24
1.4.4 QlikView.. 25
1.4.5 FineBI 25
常见问题解答... 27
练习题... 28
2.1 KANO分析模型... 30
2.2 5W2H分析模型... 31
2.3 战略钟分析模型... 32
2.4 RFM客户价值模型... 33
2.5 用户行为分析模型... 34
2.6 关联分析模型... 35
2.7 SWOT分析模型... 36
2.8 鱼骨图分析模型... 37
2.9 波士顿矩阵分析... 38
2.10 波特五力分析模型... 39
2.11 PDCA执行模型... 40
2.12 AARRR模型... 41
2.13 营销漏斗模型... 42
2.14 ABC分类模型... 43
2.15 杜邦分析模型... 44
2.16 平衡计分卡模型... 45
2.17 营销漏斗模型... 46
2.18 SCP分析模型... 47
2.19 逻辑树分析模型... 48
2.20 波士顿三四矩阵... 49
常见问题解答... 50
练习题... 51
3.1 商业数据分析师前世今生... 53
3.2 商业数据分析步骤与阶段... 54
3.3 商业数据分析师的必备技能... 57
常见问题解答... 58
练习题... 59
第二部分:Tableau之新手入门篇... 60
4.1 Tableau Desktop简介... 62
4.1.1 新增主要功能... 62
4.1.2 “开始”页面... 63
4.1.3 “数据源”页面... 64
4.2 数据类型... 66
4.2.1 主要的数据类型... 67
4.2.2 更改数据类型... 67
4.3 文件类型... 70
4.3.1 工作簿文件... 70
4.3.2 打包工作簿... 70
4.3.3 其他文件类型... 70
4.4 运算符及优先级... 70
4.4.1 算术运算符... 70
4.4.2 逻辑运算符... 71
4.4.3 比较运算符... 71
4.4.4 运算符优先级... 71
4.5 Tableau软件概况... 71
4.5.1 Tableau Desktop. 72
4.5.2 Tableau Prep. 72
4.5.3 Tableau Online. 73
4.5.4 Tableau Server 73
4.5.5 Tableau Public. 73
4.5.6 Tableau Mobile. 74
4.5.7 Tableau Reader 74
常见问题解答... 75
练习题... 76
5.1 连接到文件... 78
5.1.1 Microsoft Excel 78
5.1.2 文本文件... 80
5.1.3 JSON文件... 81
5.1.4 Microsoft Access. 83
5.1.5 PDF文件... 85
5.1.6 空间文件... 86
5.1.7 统计文件... 88
5.2 连接到数据库... 90
5.2.1 Microsoft SQL Server 90
5.2.2 MySQL. 91
5.2.3 Oracle. 92
5.2.4 Amazon Redshift 93
5.2.5 更多数据库... 94
5.3 连接到MongoDB. 95
5.3.1 MongoDB简介... 95
5.3.2 MongoDB安装与配置... 96
5.3.3 连接MongoDB步骤... 97
常见问题解答... 100
练习题... 101
6.1 维度和度量... 103
6.1.1 维度字段的可视化... 103
6.1.2 度量字段的可视化... 104
6.1.3 度量转换为维度案例... 105
6.2 连续和离散... 109
6.2.1 连续字段的可视化... 109
6.2.2 离散字段的可视化... 109
6.2.3 日期类型的转换案例... 110
6.3 工作区操作... 112
6.3.1 “数据”窗格的操作... 113
6.3.2 “分析”窗格的操作... 115
6.3.3 工具栏按钮及说明... 115
6.3.4 状态栏功能及说明... 116
6.3.5 功能区和卡的简介... 117
6.3.6 语言和区域的设置... 118
6.4 工作表的基本操作... 118
6.4.1 如何创建工作表... 118
6.4.2 如何复制工作表... 120
6.4.3 如何导出工作表... 121
6.4.4 如何删除工作表... 122
6.5 创建上下文筛选器提升性能... 123
6.5.1 如何创建“上下文筛选器” 123
6.5.2 为“地区”添加上下文筛选器... 123
常见问题解答... 127
练习题... 128
7.1 表计算:快速统计门店销售额的占比... 130
7.2 创建字段:创建每件商品的利润字段... 132
7.3 创建参数:生成商品类型的参数列表... 134
7.4 聚合函数:统计商品利润率波动情况... 140
7.5 缺失值处理:处理销售额中的缺失值... 143
7.6 案例实战:各个门店利润的差异分析... 144
常见问题解答... 147
练习题... 148
8.1 单变量的可视化... 150
8.1.1 条形图:不同类别商品的利润分析... 150
8.1.2 饼形图:不同地区销售额占比分析... 151
8.1.3 直方图:每类商品的利润分布分析... 153
8.1.4 折线图:月度销售额历史趋势分析... 155
8.2 多变量的可视化... 157
8.2.1 散点图:销售额和利润额的特征分析... 157
8.2.2 气泡图:不同地区利润额的比较分析... 158
8.2.3 树形图:不同用户类型的销售额分析... 160
8.2.4 瀑布图:不同产品类别的利润额分析... 161
8.2.5 盒须图:按区域和客户类型分析折扣... 166
8.2.6 靶心图:不同地区发货天数的分析... 169
8.2.7 环形图:不同地区的利润额结构分析... 171
8.2.8 甘特图:不同用户类型送货时间分析... 176
8.2.9 漏斗图:客户购买流程的漏斗分析... 179
8.2.10 帕累托图:用户消费等级结构分析... 183
常见问题解答... 188
练习题... 189
第三部分:Tableau之新手升级篇... 190
9.1 设置地理角色:将城市字段设置为地理角色... 192
9.2 标记地理位置:用生成的纬度和经度标记地图... 193
9.3 添加字段信息:统计每个城市的销售额情况... 194
9.4 设置地图外观:设置地图的背景颜色和图层... 195
9.5 完善美化地图:按销售额大小进一步美化地图... 197
9.6 自定义地图选项:按城市搜索销售额的地图... 198
常见问题解答... 199
练习题... 200
10.1 创建高效仪表板的原则... 202
10.1.1 了解业务需求、周密规划... 202
10.1.2 依据充分信息、专业设计... 202
10.1.3 完善修正视图、避免错误... 203
10.2 如何创建美观的仪表板... 204
10.2.1 拖拽字段制作仪表板... 204
10.2.2 设置仪表板大小和布局... 207
10.3 进一步完善与改进仪表板... 212
10.3.1 如何改进仪表板... 212
10.3.2 创建视图选择菜单... 213
10.3.3 重塑仪表板的形象... 215
10.3.4 创建仪表板布局... 217
10.3.5 使用仪表板扩展程序... 220
10.4 案例实战:超市运营状况分析... 222
10.4.1 客户分析的仪表板... 222
10.4.2 配送分析的仪表板... 225
10.4.3 销售分析的仪表板... 229
10.4.4 利润分析的仪表板... 232
10.4.5 退货分析的仪表板... 234
10.4.6 预测分析的仪表板... 238
常见问题解答... 242
练习题... 243
11.1 故事:让故事替代烦人的PPT制作... 245
11.2 创建故事:对历史数据创建故事点... 246
11.3 故事格式:完善故事使其更加生动... 248
11.3.1 标题:调整标题方向和大小... 249
11.3.2 页面:使仪表板更适合故事... 249
11.3.3 格式:设置合适的故事格式... 250
11.4 演示故事:让商业汇报更加简便... 251
常见问题解答... 252
练习题... 253
第四部分:Tableau之大数据篇... 254
12.1 Hadoop简介... 256
12.1.1 Hadoop分布式文件系统... 256
12.1.2 MapReduce计算框架... 257
12.1.3 Apache Hadoop发行版... 257
12.2 连接基本条件... 260
12.2.1 Hive版本:连接的必备条件... 260
12.2.2 驱动程序:安装ODBC驱动... 260
12.2.3 启动服务:运行Hive的服务... 260
12.3 连接主要步骤... 262
12.3.1 Cloudera Hadoop. 262
12.3.2 Hortonworks Hadoop Hive. 266
12.3.3 MapR Hadoop Hive. 268
12.4 连接注意事项... 271
12.4.1 日期/时间数据的处理... 271
12.4.2 连接集群的几种限制... 271
常见问题解答... 272
练习题... 273
13.1 Apache Spark简介... 275
13.1.1 快速通用的计算引擎... 275
13.1.2 Hadoop与Spark的比较... 275
13.2 连接步骤:Tableau连接Spark集群... 277
13.2.1 安装SparkSQL的ODBC驱动... 277
13.2.2 启动集群和Spark相关进程... 277
13.2.3 配置SparkODBC数据源... 278
13.3 测试SparkODBC数据连接... 279
常见问题解答... 280
练习题... 281
14.1 提升连接性能的一般技术... 283
14.2 常用的性能提升高级技术... 285
14.2.1 “筛选器”形式的分区字段... 285
14.2.2 分组字段形式的群集字段... 285
14.2.3 设置初始化SQL的参数... 285
14.3 提升数据提取效率的主要方法... 286
14.3.1 明确数据的存储文件格式... 286
14.3.2 合理利用数据分区字段... 286
14.3.3 计算分组字段的哈希值... 286
常见问题解答... 287
练习题... 288
第五部分:Tableau之综合应用篇... 289
15.1 搭建基于Tabpy的运行环境... 291
15.1.1 安装Python集成环境... 291
15.1.2 安装Tabpy Server服务... 293
15.1.3 安装Tabpy Client服务... 294
15.1.4 连接Tableau到Tabpy. 294
15.2 基于案例数据集的机器学习... 296
15.2.1 案例数据集简介... 296
15.2.2 分类算法的比较... 296
15.3 创建聚类分析的可视化视图... 299
15.3.1 自定义数据准备... 299
15.3.2 可视化聚类结果... 300
常见问题解答... 301
练习题... 302
16.1 搭建基于Rserve的运行环境... 304
16.1.1 安装R集成环境... 304
16.1.2 连接Tableau到R. 306
16.2 基于案例数据集的机器学习... 307
常见问题解答... 310
练习题... 311
17.1 Tableau Prep简介... 313
17.1.1 新增的主要功能... 313
17.1.2 安装与注册Prep. 314
17.1.3 Prep连接数据源... 315
17.2 Tableau Prep清洗数据源... 317
17.2.1 如何实现添加步骤... 317
17.2.2 如何实现添加聚合... 318
17.2.3 如何实现添加转置... 318
17.2.4 如何实现添加关联... 319
17.2.5 如何实现添加并集... 319
17.2.5 如何实现添加输出... 319
17.3 Tableau Prep发布服务器... 321
17.4 案例实战:门店经营数据清洗... 322
17.4.1 连接到门店经营数据... 322
17.4.2 浏览数据源发现问题... 323
17.4.3 清理数据源问题字段... 325
17.4.4 合并清洗后的数据源... 329
17.4.5 生成清洗过程的输出... 332
常见问题解答... 334
练习题... 335
第六部分:Tableau之服务器篇... 336
18.1 Tableau Online的试用和注册... 338
18.2 Tableau Online用户界面简介... 341
18.3 Tableau Online的基础操作... 344
18.3.1 如何导入已有的数据源... 345
18.3.2 如何快速搜索相应内容... 346
18.3.3 如何找到感兴趣的内容... 347
18.3.4 设置我的账户及其内容... 349
18.4 Tableau Online的用户和组... 349
18.4.1 设置用户的站点角色... 349
18.4.2 向站点添加多个用户... 350
18.4.3 如何批量的添加用户... 351
18.4.4 如何创建用户所在组... 352
18.4.5 如何管理和删除用户... 353
18.5 Tableau Online的项目... 354
18.5.1 “内容”页面添加新的项目... 354
18.5.2 如何在项目间移动工作簿... 355
18.5.3 如何删除项目及注意事项... 356
常见问题解答... 358
练习题... 359
19.1 系统必备条件及其要求... 361
19.2 Tableau Server安装步骤... 362
19.2.1 下载软件及配置安装环境... 362
19.2.2 Tableau Server的安装过程... 363
19.2.3 如何激活Tableau Server 364
19.3 配置Tableau Server 366
19.3.1 配置“常规”选项... 366
19.3.2 配置“数据连接”选项... 366
19.3.3 配置“服务器”选项... 367
19.3.4 配置“SMTP”选项... 368
19.3.5 配置“通知和订阅”选项... 368
19.3.6 配置“SSL”选项... 369
19.3.7 配置“SAML”选项... 370
19.3.8 配置“Kerberos”选项... 371
19.3.9 配置“SAP HANA”选项... 372
19.3.10 配置“OpenID”选项... 373
19.4 登录Tableau Server 373
19.5 Linux环境下安装Tableau Server 374
19.5.1 正式安装前的必要准备... 375
19.5.2 安装Tableau Server步骤... 375
19.5.3 注册与激活Tableau Server 375
19.5.4 配置与初始化Tableau Server 376
19.5.5 登录Tableau Server服务器... 377
常见问题解答... 378
练习题... 379
附录A:Tableau的主要函数... 380
附录B:如何安装MongoDB. 401
附录C:快速安装Cloudera. 404
附录D:Tableau面试问题及答案... 406
参考文献... 409