机器学习必要的库和工具介绍

《Python机器学习基础教程》笔记

       本书的所有例程都是基于Scikit-Learn,用Python实现的,因此,首先要保证已经装上了Python,然后,强烈推荐使用Jupyter notebook运行代码,另外,numpy,scipy,matplotlib,pandas也是不可或缺的。如果已经安装了Python和Jupyter notebook,便可以在Jupyter notebook中用pip安装所有的包:

!pip install numpy scipy matplotlib scikit-learn pandas

下面对各种库/工具做一个简单的介绍。

1.Jupyter notebook

Jupyter notebook是可以在浏览器中运行代码的交互环境

2.numpy

numpy是Python科学计算的基础包之一。它的功能包括多维数组、高级数学函数以及伪随机数生成器。在scikit-learn中,numpy数组是基本数据结构。而numpy的核心功能是ndarray类,即多维数组。

3.scipy

scipy是Python中用于科学计算的函数集合。它具有线性代数高级程序、数学函数优化、信号处理、特殊数学函数和统计分布等多项功能。scikit-learn利用scipy中的函数集合来实现算法。

4.matplotlib

matplotlib是Python主要的科学绘图库,其功能为生成可发布的可视化内容。在Jupyter notebook中,可以使用%matplotlib notebook 或%matplotlib inline魔法命令,将图像直接显示在浏览器中(注意,如果没有用这个魔法命令,则浏览器中不会显示图像,那么就需要调用plt.show来显示图像)

5.pandas

pandas是用于处理和分析数据的Python库。它基于一种叫作DataFrame的数据结构,类似于excel表格。pandas中包含大量用于修改表格和操作表格的方法。

 

你可能感兴趣的:(机器学习必要的库和工具介绍)