Numpy和Pandas的区别

Numpy和Pandas都是数据分析常用工具包,但是功能是类似的。

Numpy

Numpy是Numericel Python的简称,也是目前Python数值计算中最重要的基础包。大多数计算包都提供了基于Python的科学函数功能,将Numpy的数组对象作为数据交换的通用语。

  • ndarray一种高效多维数组,提供了基于数组的便捷算数操作以及灵活的广播功能。
  • 对所有数据进行快速的矩阵计算,而无须编写循环程序。
  • 对硬盘数组数据进行读写的工具,并对内存映射进行操作。
  • 线性代数、随机数生成以及傅里叶变换功能。
  • 用于连接Numpy到C、C++和FORRTRAN语言类的C语言API。

Pandas

pandas是一个数据分析包,他所包含的数据结构和数据处理工具的设计使得在Python中进行数据清洗和分析非常快捷。Pandas经常和其他数值计算工具,比如Numpy和Scipy,以及数据可视化工具比如matplotlib一起使用。Pandas支持大部分Numpy语言风格的数值计算,尤其在数组函数以及没有for循环的各种数据处理

Numpy和Pandas的区别在哪里呢?

  • Numpy是数值计算的扩展包,能够高效处理N维数组,即处理高维数组或矩阵时会方便。Pandas是python的一个数据分析包,主要是做数据处理用的,以处理二维表格为主。但注意这不是说Numpy就处理不了二维数据,它也可以处理。

  • Numpy只能存储相同类型的array,Pandas能处理不同类型的数据,例如二维表格中不同列可以是不同类型的数据,一列为整数一列为字符串。

  • Numpy支持并行计算,所以TensorFlow2.0、PyTorch都能和numpy能无缝转换。Numpy底层使用C语言编写,效率远高于纯Python代码。

  • Pansdas是基于Numpy的一种工具,该工具是为了解决数据分析任务而创建的。Pandas提供了大量快速便捷地处理数据的函数和方法。
    Python因为有了NumPy与Pandas而不同于Java、C#等程序语言,Python也因为NumPy与Pandas而又一次的焕发了光彩。

你可能感兴趣的:(python,数据挖掘,数据分析)