简述 Python 的 Numpy、SciPy、Pandas、Matplotlib 的区别

 

From:https://www.jianshu.com/p/32cb09d84487

 

  1. Numpy:基础的数学计算模块,以矩阵为主,纯数学。
  2. SciPy:基于Numpy,提供方法(函数库)直接计算结果,封装了一些高阶抽象和物理模型。比方说做个傅立叶变换,这是纯数学的,用Numpy;做个滤波器,这属于信号处理模型了,在Scipy里找。
  3. Pandas:提供了一套名为DataFrame的数据结构,适合统计分析中的表结构,在上层做数据分析,

更简洁的说:

  1. NumPy:N维 数组 容器
  2. SciPy:科学计算 函数库
  3. Pandas:表格 容器

 

非数学研究,建议直接入手 pandas,包含基础的 Numpy 方法

 

Numpy:

来存储和处理大型矩阵,比Python自身的嵌套列表(nested list structure)结构要高效的多,本身是由C语言开发。这个是很基础的扩展,其余的扩展都是以此为基础。数据结构为ndarray,一般有三种方式来创建。

numpy 主要用来做一些科学运算,主要是矩阵的运算。NumPy为Python带来了真正的多维数组功能,并且提供了丰富的函数库处理这些数组。它将常用的数学函数都进行数组化,使得这些数学函数能够直接对数组进行操作,将本来需要在Python级别进行的循环,放到C语言的运算中,明显地提高了程序的运算速度。

 

Pandas:

基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。最具有统计意味的工具包,某些方面优于R软件。数据结构有一维的Series,二维的DataFrame(类似于Excel或者SQL中的表,如果深入学习,会发现Pandas和SQL相似的地方很多,例如merge函数),三维的Panel(Pan(el) + da(ta) + s,知道名字的由来了吧)。

学习Pandas你要掌握的是:

  • 1.汇总和计算描述统计,处理缺失数据 ,层次化索引
  • 2.清理、转换、合并、重塑、GroupBy技术
  • 3.日期和时间数据类型及工具(日期处理方便地飞起)

 

Matplotlib:

Python中最著名的绘图系统,很多其他的绘图例如seaborn(针对pandas绘图而来)也是由其封装而成。
绘制的图形可以大致按照ggplot的颜色显示,但是还是感觉很鸡肋。但是matplotlib的复杂给其带来了很强的定制性。其具有面向对象的方式及Pyplot的经典高层封装。

需要掌握的是:

  • 1.散点图,折线图,条形图,直方图,饼状图,箱形图的绘制。
  • 2.绘图的三大系统:pyplot,pylab(不推荐),面向对象
  • 3.坐标轴的调整,添加文字注释,区域填充,及特殊图形patches的使用
  • 4.金融的同学注意的是:可以直接调用Yahoo财经数据绘图

 

Scipy:

方便、易于使用、专为科学和工程设计的Python工具包.它包括统计,优化,整合,线性代数模块,傅里叶变换,信号和图像处理,常微分方程求解器等等。基本可以代替Matlab,但是使用的话和数据处理的关系不大,数学系,或者工程系相对用的多一些。
近期发现有个statsmodel可以补充scipy.stats,时间序列支持完美

scipy 主要是一些科学工具集,信号处理工具集(如线性代数使用LAPACK库,快速傅立叶变换使用FFTPACK库)及数值计算的一些工具(常微分方程求解使用ODEPACK库,非线性方程组求解以及最小值求解等)。

 

scikit-learn

scikit-learn:里面有很多机器学习相关的算法(如聚类算法,SVM等)。

 

 

用Python来编写机器学习方面的代码是相当简单的,因为Python下有很多关于机器学习的库。其中三个库 numpy,scipy,matplotlib,scikit-learn是常用组合,分别是科学计算包,科学工具集,画图工具包,机器学习工具集。

Python安装完Numpy,SciPy和MatplotLib后,可以成为非常犀利的科研利器。网上关于这三个库的安装都写得非常不错,但是大部分人遇到的问题并不是如何安装,而是安装好后因为配置不当,在使用时总会出现import xxx error之类的错误。我也是自己摸索了很久才发现如何去正确配置的

详解Python中的Numpy、SciPy、MatPlotLib安装与配置:https://www.jb51.net/article/128468.htm

 

 

Numpy和Scipy是机器学习项目中最受欢迎的函数库 

 

参考:http://www.sohu.com/a/291941853_506163

 

 

 

你可能感兴趣的:(Python)