Numpy、Pandas、SciPy、Scikit-Learn、Matplotlib的关系以及学习资料

Numpy、Pandas、SciPy、Scikit-Learn、Matplotlib的关系以及学习资料

  • 1. Numpy、Pandas、SciPy、Scikit-Learn、Matplotlib的关系
  • 2. 安装方法
    • 2.1 下载anaconda
    • 2.2 配置anaconda仓库的镜像
  • 3. 学习资料
    • 3.1. Python的学习资料
    • 3.2. Numpy的学习资料
    • 3.3. Pandas的学习资料
    • 3.4. scikit-learn 的学习资料
    • 3.5. Matplotlib的学习资料
  • 4.学习路径
    • 4.1 确定学习目的-->搜索相关资源-->制定学习计划
    • 4.2 制定学习路径的原则:
    • 4.3 我的学习计划

1. Numpy、Pandas、SciPy、Scikit-Learn、Matplotlib的关系

Numpy、Pandas、SciPy、Scikit-Learn、Matplotlib的关系以及学习资料_第1张图片

2. 安装方法

2.1 下载anaconda

官方网站在国外,所以我们下载安装文件速度很慢。
推荐到清华镜像下载anaconda,网速很快。
清华大学开源软件镜像站:https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/

具体安装操作可以参考下面这个博客:
Google机器学习(一) 安装Anaconda以及Scikit-learn等必备库
https://blog.csdn.net/tz_zs/article/details/73459800)

对于没有安装过 NumPy、 SciPy等各种库的新手来说,最简单的方法是使用Anaconda软件(强烈推荐)
Anaconda软件中包含了Numpy、Scipy、pandas、Scikit-learn等常用的数据分析包。

2.2 配置anaconda仓库的镜像

清华大学开源软件镜像站提供了 Anaconda 仓库的镜像,貌似还就只有这一家

地址:http://mirrors.tuna.tsinghua.edu.cn/help/anaconda/

打开Anaconda Prompt,输入以下命令即可添加

conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
conda config --set show_channel_urls yes

3. 学习资料

3.1. Python的学习资料

a.廖雪峰python学习笔记
https://blog.csdn.net/datawhale/article/category/7779959

b.python入门笔记
作者李金,这个是jupyter notebook文件,把python的主要语法演示了一次,值得推荐。下载链接:
https://pan.baidu.com/s/1IPZI5rygbIh5R5OuTHajzA 提取码: 2bzh

c.代码规范:
https://zhuanlan.zhihu.com/p/59763076

3.2. Numpy的学习资料

a. NumPy 教程 | 菜鸟教程
https://www.runoob.com/numpy/numpy-tutorial.html

b. numpy练习题:
https://zhuanlan.zhihu.com/p/57872490

c. 实战经验:from-python-to-numpy
http://www.labri.fr/perso/nrougier/from-python-to-numpy/

d. Numpy中文文档
https://www.numpy.org.cn/index.html

3.3. Pandas的学习资料

a. Pandas教程
https://www.yiibai.com/pandas

b. Pandas练习题:
https://zhuanlan.zhihu.com/p/56644669

c. Pandas官网:
http://pandas.pydata.org/

3.4. scikit-learn 的学习资料

a.sklearn库的学习:
https://blog.csdn.net/u014248127/article/details/78885180
推荐理由:用一篇文章讲清楚了整个sklearn库的概貌,主要包括:
(1)sklearn官方文档的类容和结构;
(2)从机器学习重要步骤出发讲清楚sklearn的使用方法。

b. scikit-learn (sklearn) 官方文档中文版
http://sklearn.apachecn.org/#/

c. 官方网站:
https://scikit-learn.org/stable/
Numpy、Pandas、SciPy、Scikit-Learn、Matplotlib的关系以及学习资料_第2张图片

3.5. Matplotlib的学习资料

a. 简单入门
有这5小段代码在手,轻松实现数据可视化(Python+Matplotlib)
http://baijiahao.baidu.com/s?id=1598516679213415904&wfr=spider&for=pc
这张地图能指引你根据不同情况选择正确的可视化方法:
Numpy、Pandas、SciPy、Scikit-Learn、Matplotlib的关系以及学习资料_第3张图片

b. 对Numpy格式的数据进行可视化
https://www.runoob.com/numpy/numpy-matplotlib.html

c. Matplotlib的详细实例
中文版本:https://liam.page/2014/09/11/matplotlib-tutorial-zh-cn/
英文版本:https://github.com/rougier/matplotlib-tutorial

d. Ten Simple Rules for Better Figures
https://journals.plos.org/ploscompbiol/article?id=10.1371/journal.pcbi.1003833

4.学习路径

4.1 确定学习目的–>搜索相关资源–>制定学习计划

4.2 制定学习路径的原则:

(1)自顶向下,以实现某个机器学习算法为目的。
(2)从简单的算法入手,从模仿前辈的代码入手。
(3)动手,动手,动手写代码。

4.3 我的学习计划

学习目的:Scikit-Learn 实现快速实现某个简单的机器学习算法。
例如:使用Scikit-Learn 实现《机器学习实战》中第二章的K近邻算法,并用Matplotlib进行数据可视化。
关于《机器学习实战》,可以参考如下博客:
https://blog.csdn.net/u014410989/article/details/89182869

步骤1. 搭建环境
下载软件、
安装软件、
配置环境、
下载文档、
下载示例代码

步骤2. 理解《机器学习实战》中给出的算法原理和Python程序

步骤3. 选择Scikit教程中一个类似的示例
阅读3.4.a.sklearn库的学习
找到K近邻算法的示例。

步骤4. 模仿Scikit示例和《机器学习实战》,使用Scikit-Learn 编写程序

步骤5. 使用Matplotlib进行数据可视化

步骤6. 尝试使用Scikit实现《机器学习实战》中的其它算法,例如决策树算法。

步骤7. 尝试3.5.a中的5种Matplotlib绘图方法

步骤8. 详细阅读 3.5.d Ten Simple Rules for Better Figures

步骤9. 快速浏览 3.2.a NumPy 教程 | 菜鸟教程,认真完成 3.2.b numpy练习题

步骤10. 参考3.1.b,在jupyter notebook中通过修改代码,掌握Python的主要语法

你可能感兴趣的:(机器学习)