python大数据分析入门实例-Python大数据分析与机器学习商业案例实战

大数据分析与机器学习技术已成为各行各业实现数字化变革的关键驱动力。本书以功能强大且较易上手的Python语言为编程环境,全面讲解了大数据分析与机器学习技术的商业应用实战。全书共16章,讲解了线性回归模型、逻辑回归模型、决策树模型、朴素贝叶斯模型、K近邻算法模型、随机森林模型、AdaBoost与GBDT模型、XGBoost与LightGBM模型、PCA(主成分分析)模型、聚类与分群模型(KMeans与DBSCAN算法)、协同过滤算法模型、Apriori关联分析模型、神经网络模型等十余种机器学习模型的原理和代码实现,每种模型都配有一到两个典型案例,涵盖金融、营销、医疗、社会科学、企业办公与管理等多个领域。本书适合具备一定数学知识和编程基础、希望快速在工作中应用大数据分析与机器学习技术的读者阅读,也适合Python编程爱好者或对大数据分析与机器学习技术感兴趣的读者参考。

前言如何获取学习资源章 Python与数据科学1.1 大数据分析与机器学习概述131.1.1 大数据分析与机器学习的应用领域131.1.2 机器学习的基本概念141.1.3 Python在数据科学中的作用161.2 Python编程环境部署与基本操作161.2.1 Python的安装161.2.2 Pycharm的安装与设置181.2.3 Jupyter Notebook的使用221.3 Python基础知识概要28第2章 数据分析利器:NumPy、pandas与Matplotlib库2.1 NumPy库基础292.1.1 NumPy库与数组292.1.2 数组与列表的区别302.1.3 创建数组的几种方式312.2 pandas库基础332.2.1 二维数据表格DataFrame的创建332.2.2 Excel工作簿等文件的读取和写入382.2.3 数据的选取与处理412.2.4 数据表拼接472.3 Matplotlib库基础512.3.1 基本图表绘制512.3.2 数据可视化常用技巧562.4 案例实战:股票数据读取与K线图绘制612.4.1 初步尝试:股票数据读取与可视化622.4.2 进阶实战:股票K线图绘制65第3章 线性回归模型3.1 一元线性回归733.1.1 一元线性回归的数学原理733.1.2 一元线性回归的代码实现753.1.3 案例实战:不同行业工龄与薪水的线性回归模型773.2 线性回归模型评估833.2.1 模型评估的编程实现833.2.2 模型评估的数学原理843.3 多元线性回归873.3.1 多元线性回归的数学原理和代码实现873.3.2 案例实战:客户价值预测模型88第4章 逻辑回归模型4.1 逻辑回归模型的算法原理924.1.1 逻辑回归模型的数学原理924.1.2 逻辑回归模型的代码实现944.1.3 逻辑回归模型的深入理解954.2 案例实战:客户流失预警模型984.2.1 案例背景984.2.2 数据读取与变量划分984.2.3 模型的搭建与使用994.3 模型评估方法:ROC曲线与KS曲线1044.3.1 ROC曲线的基本原理1054.3.2 案例实战:用ROC曲线评估客户流失预警模型1084.3.3 KS曲线的基本原理1114.3.4 案例实战:用KS曲线评估客户流失预警模型112第5章 决策树模型5.1 决策树模型的基本原理1155.1.1 决策树模型简介1155.1.2 决策树模型的建树依据1165.1.3 决策树模型的代码实现1195.2 案例实战:员工离职预测模型1235.2.1 模型搭建1235.2.2 模型预测及评估1265.2.3 决策树模型可视化呈现及决策树要点理解1315.3 参数调优:K折交叉验证与GridSearch网格搜索1385.3.1 K折交叉验证1385.3.2 GridSearch网格搜索139第6章 朴素贝叶斯模型6.1 朴素贝叶斯模型的算法原理1456.1.1 一维特征变量下的贝叶斯模型1456.1.2 二维特征变量下的贝叶斯模型1466.1.3 n维特征变量下的贝叶斯模型1476.1.4 朴素贝叶斯模型的简单代码实现1476.2 案例实战:肿瘤预测模型1486.2.1 案例背景1486.2.2 数据读取与划分1486.2.3 模型的搭建与使用149第7章 K近邻算法7.1 K近邻算法的原理和代码实现1527.1.1 K近邻算法的基本原理1527.1.2 K近邻算法的计算步骤1537.1.3 K近邻算法的代码实现1557.2 案例实战:手写数字识别模型1577.2.1 案例背景1577.2.2 手写数字识别的原理1577.2.3 手写数字识别的代码实现1597.3 图像识别原理详解162第8章 随机森林模型8.1 随机森林模型的原理和代码实现1668.1.1 集成模型简介1668.1.2 随机森林模型的基本原理1678.1.3 随机森林模型的代码实现1688.2 案例实战:股票涨跌预测模型1708.2.1 股票基本数据获取1708.2.2 股票衍生变量生成1738.2.3 多因子模型搭建1818.2.4 模型使用与评估1848.2.5 参数调优1868.2.6 收益回测曲线绘制188第9章 AdaBoost与GBDT模型9.1 AdaBoost算法原理1909.1.1 AdaBoost算法的核心思想1909.1.2 AdaBoost算法的数学原理概述1919.1.3 AdaBoost算法的数学原理举例1949.1.4 AdaBoost算法的简单代码实现2009.2 AdaBoost算法案例实战:信用卡精准营销模型2019.2.1 案例背景2019.2.2 模型搭建2019.2.3 模型预测及评估2029.2.4 模型参数介绍2059.3 GBDT算法原理2069.3.1 GBDT算法的核心思想2069.3.2 GBDT算法的数学原理概述2089.3.3 GBDT算法的数学原理举例2089.3.4 GBDT算法的简单代码实现2139.4 GBDT算法案例实战:产品定价模型2149.4.1 案例背景2149.4.2 模型搭建2149.4.3 模型预测及评估2179.4.4 模型参数介绍2190章 机器学习神器:XGBoost与LightGBM算法10.1 XGBoost算法原理22310.1.1 XGBoost算法的核心思想22410.1.2 XGBoost算法的数学原理概述22410.1.3 XGBoost算法的简单代码实现22510.2 XGBoost算法案例实战1:金融反欺诈模型22610.2.1 案例背景22610.2.2 模型搭建22610.2.3 模型预测及评估22810.2.4 模型参数调优23010.3 XGBoost算法案例实战2:信用评分卡模型23310.3.1 案例背景23310.3.2 多元线性回归模型23410.3.3 GBDT回归模型23510.3.4 XGBoost回归模型23710.4 LightGBM算法原理24110.4.1 LightGBM

你可能感兴趣的:(python大数据分析入门实例-Python大数据分析与机器学习商业案例实战)