Numpy和Pandas都是数据分析常用工具包,但是功能是类似的。
Numpy是Numericel Python的简称,也是目前Python数值计算中最重要的基础包。大多数计算包都提供了基于Python的科学函数功能,将Numpy的数组对象作为数据交换的通用语。
pandas是一个数据分析包,他所包含的数据结构和数据处理工具的设计使得在Python中进行数据清洗和分析非常快捷。Pandas经常和其他数值计算工具,比如Numpy和Scipy,以及数据可视化工具比如matplotlib一起使用。Pandas支持大部分Numpy语言风格的数值计算,尤其在数组函数以及没有for循环的各种数据处理
Numpy是数值计算的扩展包,能够高效处理N维数组,即处理高维数组或矩阵时会方便。Pandas是python的一个数据分析包,主要是做数据处理用的,以处理二维表格为主。但注意这不是说Numpy就处理不了二维数据,它也可以处理。
Numpy只能存储相同类型的array,Pandas能处理不同类型的数据,例如二维表格中不同列可以是不同类型的数据,一列为整数一列为字符串。
Numpy支持并行计算,所以TensorFlow2.0、PyTorch都能和numpy能无缝转换。Numpy底层使用C语言编写,效率远高于纯Python代码。
Pansdas是基于Numpy的一种工具,该工具是为了解决数据分析任务而创建的。Pandas提供了大量快速便捷地处理数据的函数和方法。
Python因为有了NumPy与Pandas而不同于Java、C#等程序语言,Python也因为NumPy与Pandas而又一次的焕发了光彩。