《零基础学机器学习》读书笔记四之Python和机器学习框架

《零基础学机器学习》读书笔记四之Python和机器学习框架

一、机器学习快速上手路径(续)

1.4 Python和机器学习框架

1.4.1 机器学习和深度学习框架

Python的机器学习框架,也就是各种Python库,里面包含定义好的数据结构以及很多库函数、方法、模型等(即API)。
我们只需要选择一个适合的框架,通过调用其中的API,就可以快速建立机器学习模型了。
良好的框架不仅易于理解,还支持并行化计算(即硬件加速),并能够自动计算微分、链式求导。

8个机器学习常用库:

  • Pandas和NumPy提供数据结构,支持数学运算;
  • Matplotlib和Seaborn用于数据可视化;
  • 提供算法的4个库,Scikit-learn是机器学习框架,TensorFlow、Keras和PyTorch是深度学习框架。
1、Pandas

Pandas是基于NumPy的数据分析工具,里面预置了大量库函数和标准数据结构,可以高效地操作大型数据集。
Pandas预置数据结构有:

  • Series:1D数组,与NumPy中的一维数组(array)类似。与Python基本的数据结构列表(list)也很相似。
  • TimeSeries:以时间为索引的Series。
  • DataFrame:2D的表格型数据结构,Series的容器。
  • Panel:3D的数组,DataFrame的容器。
2、NumPy

NumPy是Python进行科学计算的基础库,提供一个强大的多维数组对象array。
NumPy自带的向量化运算功能在机器学习中也属于不可或缺的功能。目前CPU和GPU都有并行处理的处理器,能够无缝衔接NumPy的向量化运算,大幅提升机器学习的效率。

3、Matplotlib

Matplotlib是Python及NumPy的可视化操作,通过API提供嵌入式绘图功能。

4、Seaborn

Seaborn是在Matplotlib基础上设计出的绘图库,可以直接画图。

5、Scikit-learn

简称Sklearn,是一个相当强大的Python机器学习库,也是简单有效的数据挖掘和数据分析工具。Sklearn基于NumPy、SciPy、Matplotlib构建,功能涵盖了从数据预处理到训练模型,以及性能评估的各个方面。

6、TensorFlow

TensorFlow是深度学习的设计利器。TensorFlow编程建立在”图“这个抽象的概念之上。

7、Keras

Keras建立在TensorFlow、CNTK或Theano这些后端框架之上。写Keras的时候是在对其后端进行调用,相当于还是在TensorFlow上运行程序。

8、PyTorch

PyTorch是TensorFlow的竞争对手。里面所有的算法都是用Python写的。

你可能感兴趣的:(机器学习,人工智能,python,开发语言)