深入浅出Python机器学习2——基于Python语言的环境配置

Python的下载与安装

       不同系统安装教程后面暂时没写,后面补上。

       linux和MAC OS X自带了Python2.7.x,需另外安装最新版本。但是系统运行依赖于自带的Python2.7.x,因此请务必不要删除系统自带的版本。

Jupyter Notebook 的安装与使用方法

       在linux下,运行如下命令

	pip3 install jupyter

一些必需库的安装及功能简介

       在linux系统或者MAC OS X,只需要在终端输入

	sudo pip3 install numpy scipy matplotlib ipython pandas scikit-learn
  • Numpy——基础科学计算库
           Numpy包含高维数组(array)计算、线性代数计算、傅里叶变换以及伪随机数等。Numpy对于scikit-learn来说至关重要,因为scikit-learn使用Numpy数组形式的数据来进行处理,所以我们需要吧数据都转化成Numpy数组的形式,而多维数组(n-dimensional array)也是Numpy的核心功能之一。
           例:
    深入浅出Python机器学习2——基于Python语言的环境配置_第1张图片

  • Scipy——强大的科学计算工具集
           Scipy是Python中用于进行科学计算的工具集,它有很多功能,如计算统计学分布、信号处理、计算线性代数方程等。scikit-learn需要使用Scipy来对算法进行执行,用的最多的就是Scipy中的sparse函数。sparse用来生成稀疏矩阵,而稀疏矩阵用来存储那些大部分数值为0的np数组,这种类型在scikit-learn的实际应用中非常常见。
           例:

深入浅出Python机器学习2——基于Python语言的环境配置_第2张图片

  • pandas——数据分析的利器
           pandas是一个Python中用于进行数据分析的库,它可以生成类似Excel表格式的数据表,而且可以对数据表进行修改操作。pandas还有个强大功能,它可以从很多不同种类的数据中提取数据,如SQL数据库、Excel表格甚至CSV文件。pandas还支持在不同列中不同类型的数据,如整数型、浮点型或字符串。
           例:
    深入浅出Python机器学习2——基于Python语言的环境配置_第3张图片
    从数据表中进行查询操作,例如把不在北京的同学信息显示出来,

深入浅出Python机器学习2——基于Python语言的环境配置_第4张图片

  • matplotlib——画出优美的图形
           matplotlib是Python的绘图库,它以各种硬拷贝格式和跨平台的交互环境生成出版质量级别的图形,它能够输出的图形包括折线图、散点图、直方图等。
           例:
    深入浅出Python机器学习2——基于Python语言的环境配置_第5张图片
           注意:在代码中%matplotlib inline允许Jupyter Notebook进行内置实时绘图。如果不写这一行代码,则需要在最后加入plt.show()这一句,才能让图形显示出来。

scikit-learn——非常流行的Python机器学习库

       scikit-learn是一个建立在Scipy基础上用于机器学习的Python模块。而在不同的应用领域中,已发展出为数众多的基于Scipy的工具包,它们被统一称为Scikits。而在所有的分支版本中,scikit-learn是最有名的。它是开源的,任何人都可以免费地使用它或者进行二次发行。
       scikit-learn包含了众多顶级机器学习算法,它主要有六类的基本功能,分别是分类、回归、聚类、数据降维、模型选择和数据处理

你可能感兴趣的:(机器学习,深入浅出python机器学习)