python数据分析入门书籍-Python极简讲义:一本书入门数据分析与机器学习

"1.轻松入门:文笔流畅,通俗易懂,从Python基础、NumPy、Pandas、Matplotlib,到机器学习算法,循序渐进,帮助零基础读者快速入门。2.图文并茂:一图胜千言,书中配有精心绘制的近200幅插图,形象生动,融会一心。3.实战相随:实战出真知,每章均配备思考与提高环节,习题选自知名公司面试题目,针对性和实用性强,可在AI求职之路上助你一臂之力。"

本书以图文并茂的方式介绍了Python的基础内容,并深入浅出地介绍了数据分析和机器学习领域的相关入门知识。章至第5章以极简方式讲解了Python的常用语法和使用技巧,包括数据类型与程序控制结构、自建Python模块与第三方模块、Python函数和面向对象程序设计等。第6章至第8章介绍了数据分析推荐技能,如NumPy、Pandas和Matplotlib。第9章和0章主要介绍了机器学习的基本概念和机器学习框架sklearn的基本用法。对人工智能相关领域、数据科学相关领域的读者而言,本书是一本极简入门手册。对于从事人工智能产品研发的工程技术人员,本书亦有一定的参考价值。

张玉宏,大数据分析师(不错),2012年于电子科技大学获得博士学位,2009—2011年美国西北大学访问学者,2019—2020年美国IUPUI不错访问学者,YOCSEF郑州2019—2020年度副主席。现执教于河南工业大学,主要研究方向为大数据、机器学习。发表学术论文30余篇,先后撰写《深度学习之美:AI时代的数据处理与很好实践》《品味大数据》等科技图书7本,参与编写英文学术专著2部。

第1章 初识Python与Jupyter11.1 Python概要21.1.1 为什么要学习Python21.1.2 Python中常用的库21.2 Python的版本之争41.3 安装Anaconda51.3.1 Linux环境下的Anaconda安装51.3.2 conda命令的使用61.3.3 Windows环境下的Anaconda安装71.4 运行Python111.4.1 验证Python111.4.2 Python版本的Hello World121.4.3 Python的脚本文件131.4.4 代码缩进151.4.5 代码注释171.5 Python中的内置函数171.6 文学化编程―Jupyter201.6.1 Jupyter的由来201.6.2 Jupyter的安装211.6.3 Jupyter的使用231.6.4 Markdown编辑器261.7 Jupyter中的魔法函数311.7.1 %lsmagic函数311.7.2 %matplotlib inline函数321.7.3 %timeit函数321.7.4 %%writefile函数331.7.5 其他常用的魔法函数341.7.6 在Jupyter中执行shell命令351.8 本章小结351.9 思考与提高36第2章 数据类型与程序控制结构402.1 为什么需要不同的数据类型412.2 Python中的基本数据类型422.2.1 数值型(Number)422.2.2 布尔类型(Boolean)452.2.3 字符串型(String)452.2.4 列表(List)492.2.5 元组(Tuple)592.2.6 字典(Dictionary)622.2.7 集合(Set)652.3 程序控制结构672.3.1 回顾那段难忘的历史672.3.2 顺序结构692.3.3 选择结构702.3.4 循环结构742.4 高效的推导式802.4.1 列表推导式802.4.2 字典推导式832.4.3 集合推导式832.5 本章小结842.6 思考与提高84第3章 自建Python模块与第三方模块903.1 导入Python标准库913.2 编写自己的模块933.3 模块的搜索路径973.4 创建模块包1003.5 常用的内建模块1033.5.1 collection模块1033.5.2 datetime模块1103.5.3 json模块1153.5.4 random模块1183.6 本章小结1213.7 思考与提高122第4章 Python函数1244.1 Python中的函数1254.1.1 函数的定义1254.1.2 函数返回多个值1274.1.3 函数文档的构建1284.2 函数参数的“花式”传递1324.2.1 关键字参数1324.2.2 可变参数1334.2.3 默认参数1364.2.4 参数序列的打包与解包1384.2.5 传值还是传引用1424.3 函数的递归1464.3.1 感性认识递归1464.3.2 思维与递归思维1484.3.3 递归调用的函数1494.4 函数式编程的高阶函数1514.4.1 lambda表达式1524.4.2 filter()函数1534.4.3 map()函数1554.4.4 reduce()函数1574.4.5 sorted()函数1584.5 本章小结1594.6 思考与提高160第5章 Python不错特性1655.1 面向对象程序设计1665.1.1 面向过程与面向对象之辩1665.1.2 类的定义与使用1695.1.3 类的继承1735.2 生成器与迭代器1765.2.1 生成器1765.2.2 迭代器1835.3 文件操作1875.3.1 打开文件1875.3.2 读取一行与读取全部行1915.3.3 写入文件1935.4 异常处理1935.4.1 感性认识程序中的异常1945.4.2 异常处理的三步走1955.5 错误调试1975.5.1 利用print()输出观察变量1975.5.2 assert断言1985.6 本章小结2015.7 思考与提高202第6章 NumPy向量计算2046.1 为何需要NumPy2056.2 如何导入NumPy2056.3 生成NumPy数组2066.3.1 利用序列生成2066.3.2 利用特定函数生成2076.3.3 Numpy数组的其他常用函数2096.4 N维数组的属性2126.5 NumPy数组中的运算2156.5.1 向量运算2166.5.2 算术运算2166.5.3 逐元素运算与张量点乘运算2186.6 爱因斯坦求和约定2226.6.1 不一样的标记法2226.6.2 NumPy中的einsum()方法2246.7 NumPy中的“轴”方向2316.8 操作数组元素2346.8.1 通过索引访问数组元素2346.8.2 NumPy中的切片访问2366.8.3 二维数组的转置与展平2386.9 NumPy中的广播2396.10 NumPy数组的不错索引2426.10.1 “花式”索引2426.10.2 布尔索引2476.11 数组的堆叠操作2496.11.1 水平方向堆叠hstack()2506.11.2 垂直方向堆叠vstack()2516.11.3 深度方向堆叠hstack()2526.11.4 列堆叠与行堆叠2556.11.5 数组的分割操作2576.12 NumPy中的随机数模块2646.13 本章小结2666.14 思考与提高267第7章 Pandas数据分析2717.1 Pandas简介2727.2 Pandas的安装2727.3 Series类型数据2737.3.1 Series的创建2737.3.2 Series中的数据访问2777.3.3 Series中的向量化操作与布尔索引2807.3.4 Series中的切片操作2837.3.5 Series中的缺失值2847.3.6 Series中的删除与添加操作2867.3.7 Series中的name属性2887.4 DataFrame 类型数据2897.4.1 构建DataFrame2897.4.2 访问DataFrame中的列与行2937.4.3 DataFrame中的删除操作2987.4.4 DataFrame中的“轴”方向3017.4.5 DataFrame中的添加操作3037.5 基于Pandas的文件读取与分析3107.5.1 利用Pandas读取文件3117.5.2 DataFrame中的常用属性3127.5.3 DataFrame中的常用方法3147.5.4 DataFrame的条件过滤3187.5.5 DataFrame的切片操作3207.5.6 DataFrame的排序操作3237.5.7 Pandas的聚合和分组运算3257.5.8 DataFrame的透视表3347.5.9 DataFrame的类SQL操作3397.5.10 DataFrame中的数据清洗方法3417.6 泰坦尼克幸存者数据预处理3427.6.1 数据集简介3427.6.2 数据集的拼接3447.6.3 缺失值的处理3507.7 本章小结3537.8 思考与提高353第8章 Matplotlib与Seaborn可视化分析3658.1 Matplotlib与图形绘制3668.2 绘制简单图形3668.3 pyplot的不错功能3718.3.1 添加图例与注释3718.3.2 设置图形标题及坐标轴3748.3.3 添加网格线3788.3.4 绘制多个子图3808.3.5 Axes与Subplot的区别3828.4 散点图3888.5 条形图与直方图3928.5.1 垂直条形图3928.5.2 水平条形图3948.5.3 并列条形图3958.5.4 叠加条形图4008.5.5 直方图4028.6 饼图4078.7 箱形图4098.8 误差条4118.9 绘制三维图形4138.10 与Pandas协作绘图―以谷歌流感趋势数据为例4168.10.1 谷歌流感趋势数据描述4168.10.2 导入数据与数据预处理4178.10.3 绘制时序曲线图4218.10.4 选择合适的数据可视化表达4238.10.5 基于条件判断的图形绘制4278.10.6 绘制多个子图4308.11 惊艳的Seaborn4318.11.1 pairplot(对图)4328.11.2 heatmap(热力图)4348.11.3 boxplot(箱形图)4368.11.4 violin plot(小提琴图)4428.11.5 Density Plot(密度图)4468.12 本章小结4508.13 思考与提高450第9章 机器学习初步4599.1 机器学习定义4609.1.1 什么是机器学习4609.1.2 机器学习的三个步骤4619.1.3 传统编程与机器学习的差别4649.1.4 为什么机器学习不容易4659.2 监督学习4679.2.1 感性认识监督学习4679.2.2 监督学习的形式化描述4689.2.3 损失函数4709.3 非监督学习4719.4 半监督学习4739.5 机器学习的哲学视角4749.6 模型性能评估4769.6.1 经验误差与测试误差4769.6.2 过拟合与欠拟合4779.6.3 模型选择与数据拟合4799.7 性能度量4809.7.1 二分类的混淆矩阵4809.7.2 查全率、查准率与F1分数4819.7.3 P-R曲线4849.7.4 ROC曲线4859.7.5 AUC4899.8 本章小结4899.9 思考与提高4900章 sklearn与经典机器学习算法49210.1 机器学习的利器―sklearn49310.1.1 sklearn简介49410.1.3 sklearn的安装49610.2 线性回归49710.2.1 线性回归的概念49710.2.2 使用sklearn实现波士顿房价预测49910.3 k-近邻算法51610.3.1 算法简介51610.3.2 k值的选取51810.3.3 特征数据的归一化51910.3.4 邻居距离的度量52110.3.5 分类原则的制定52210.3.6 基于sklearn的k-近邻算法实战52210.4 Logistic回归52710.4.1 为什么需要Logistic回归52710.4.2 Logistic源头初探52910.4.3 Logistic回归实战53210.5 神经网络学习算法53610.5.1 人工神经网络的定义53710.5.2 神经网络中的“学习”本质53710.5.3 神经网络结构的设计54010.5.4 利用sklearn搭建多层神经网络54110.6 非监督学习的代表―k均值聚类55010.6.1 聚类的基本概念55110.6.2 簇的划分55210.6.3 k均值聚类算法核心55210.6.4 k均值聚类算法优缺点55410.6.5 基于sklearn的k均值聚类算法实战55510.7 本章小结56110.8 思考与提高562

"Python语言是快速实现数据分析、机器学习及相关领域理论与技术的利器。本书以通俗易懂的语言和丰富的实战案例介绍了Python基础内容、数据分析和机器学习推荐知识,理论结合实战,娓娓道来,是一本难得的入门好书。知名Python讲者、16本Python系列图书作者,董付国Python是时下很好值得学习的编程语言,也是从事数据分析和机器学习相关工作的重要基石。张玉宏博士凭借多年的Python教学经验,为大家带来了图文并茂、简单易读的Python极简讲义,相信能够带领大家轻松学习Python语言,入门数据分析与机器学习,建议大家持卷品读。微信公众号“程序员小灰”作者、《漫画算法》作者,魏梦舒近几年,随着数据科学领域的发展,越来越多的非计算机专业人士也开始用计算机进行辅助数据处理,Python无疑是优选语言。这本《Python极简讲义》有着很好良好的阅读体验,简单明了,案例丰富,手把手引导,很好适合跨界学习。相信它能带给你不同的入门体验。《白话强化学习与PyTorch》作者、金山办公AI技术专家,高扬博士本书以掌握“很少必要知识”(MAKE)为写作理念,融合了Python编程、数据分析和机器学习等热门领域的入门知识,文笔流畅,语言幽默,对初学者十分友好。相信任何有志于从事数据分析和机器学习相关工作的读者,都能从此书中收获良多。CSDN千万级流量博主、七月在线CEO,July在数据科技(DT)时代,数据分析与机器学习基本上是每个DT职场人士的推荐技能。本书以DT时代很好流行的编程语言Python为抓手,轻松幽默地讲解了数据分析和机器学习的“很少必要知识”。本书中时有体现哲学思想的内容点缀,耐人寻味,是一本很好的入门图书,不仅适合初学者阅读,对于具有一定经验的工程师也颇具参考价值。SIGAI创始人、《机器学习:原理、算法与应用》作者、百度前不错软件工程师,雷明"

你可能感兴趣的:(python数据分析入门书籍-Python极简讲义:一本书入门数据分析与机器学习)