官方网站在国外,所以我们下载安装文件速度很慢。
推荐到清华镜像下载anaconda,网速很快。
清华大学开源软件镜像站:https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/
具体安装操作可以参考下面这个博客:
Google机器学习(一) 安装Anaconda以及Scikit-learn等必备库
https://blog.csdn.net/tz_zs/article/details/73459800)
对于没有安装过 NumPy、 SciPy等各种库的新手来说,最简单的方法是使用Anaconda软件(强烈推荐)
Anaconda软件中包含了Numpy、Scipy、pandas、Scikit-learn等常用的数据分析包。
清华大学开源软件镜像站提供了 Anaconda 仓库的镜像,貌似还就只有这一家
地址:http://mirrors.tuna.tsinghua.edu.cn/help/anaconda/
打开Anaconda Prompt,输入以下命令即可添加
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
conda config --set show_channel_urls yes
a.廖雪峰python学习笔记
https://blog.csdn.net/datawhale/article/category/7779959
b.python入门笔记
作者李金,这个是jupyter notebook文件,把python的主要语法演示了一次,值得推荐。下载链接:
https://pan.baidu.com/s/1IPZI5rygbIh5R5OuTHajzA 提取码: 2bzh
c.代码规范:
https://zhuanlan.zhihu.com/p/59763076
a. NumPy 教程 | 菜鸟教程
https://www.runoob.com/numpy/numpy-tutorial.html
b. numpy练习题:
https://zhuanlan.zhihu.com/p/57872490
c. 实战经验:from-python-to-numpy
http://www.labri.fr/perso/nrougier/from-python-to-numpy/
d. Numpy中文文档
https://www.numpy.org.cn/index.html
a. Pandas教程
https://www.yiibai.com/pandas
b. Pandas练习题:
https://zhuanlan.zhihu.com/p/56644669
c. Pandas官网:
http://pandas.pydata.org/
a.sklearn库的学习:
https://blog.csdn.net/u014248127/article/details/78885180
推荐理由:用一篇文章讲清楚了整个sklearn库的概貌,主要包括:
(1)sklearn官方文档的类容和结构;
(2)从机器学习重要步骤出发讲清楚sklearn的使用方法。
b. scikit-learn (sklearn) 官方文档中文版
http://sklearn.apachecn.org/#/
c. 官方网站:
https://scikit-learn.org/stable/
a. 简单入门
有这5小段代码在手,轻松实现数据可视化(Python+Matplotlib)
http://baijiahao.baidu.com/s?id=1598516679213415904&wfr=spider&for=pc
这张地图能指引你根据不同情况选择正确的可视化方法:
b. 对Numpy格式的数据进行可视化
https://www.runoob.com/numpy/numpy-matplotlib.html
c. Matplotlib的详细实例
中文版本:https://liam.page/2014/09/11/matplotlib-tutorial-zh-cn/
英文版本:https://github.com/rougier/matplotlib-tutorial
d. Ten Simple Rules for Better Figures
https://journals.plos.org/ploscompbiol/article?id=10.1371/journal.pcbi.1003833
(1)自顶向下,以实现某个机器学习算法为目的。
(2)从简单的算法入手,从模仿前辈的代码入手。
(3)动手,动手,动手写代码。
学习目的:Scikit-Learn 实现快速实现某个简单的机器学习算法。
例如:使用Scikit-Learn 实现《机器学习实战》中第二章的K近邻算法,并用Matplotlib进行数据可视化。
关于《机器学习实战》,可以参考如下博客:
https://blog.csdn.net/u014410989/article/details/89182869
步骤1. 搭建环境
下载软件、
安装软件、
配置环境、
下载文档、
下载示例代码
步骤2. 理解《机器学习实战》中给出的算法原理和Python程序
步骤3. 选择Scikit教程中一个类似的示例
阅读3.4.a.sklearn库的学习
找到K近邻算法的示例。
步骤4. 模仿Scikit示例和《机器学习实战》,使用Scikit-Learn 编写程序
步骤5. 使用Matplotlib进行数据可视化
步骤6. 尝试使用Scikit实现《机器学习实战》中的其它算法,例如决策树算法。
步骤7. 尝试3.5.a中的5种Matplotlib绘图方法
步骤8. 详细阅读 3.5.d Ten Simple Rules for Better Figures
步骤9. 快速浏览 3.2.a NumPy 教程 | 菜鸟教程,认真完成 3.2.b numpy练习题
步骤10. 参考3.1.b,在jupyter notebook中通过修改代码,掌握Python的主要语法