重要的Python库概述

Python库概述

最近在学习python数据分析基础,对python常用的库进行一个简要介绍和归纳。
参考书籍:Wes McKinney 著《利用Python进行数据分析》

NumPy

NumPy的全称是Numerical Python,是Python科学计算的基础包,它为Python提供了快速数据处理功能,在数据处理方面,还可作为在算法之间传递数据的容器。由于它处理数值型数据要比内置的Python数据结构高效许多,并且可以被低级语言编写的库直接操作,因此使用起来就方便许多。

常见功能如下:

  1. 快速高效的多维数组对象ndarray
  2. 数组运算函数
  3. 读写数据集
  4. 线性代数运算、傅里叶变换、随机数生成
  5. 集成低级语言代码(如:C、Fortran)

Pandas

Pandas这个名字源于panel data(面板数据),是计量经济学中关于多维结构化数据集的一个术语,它提供了处理结构化数据和大量数据结构的函数,为Python进行数据分析提供了强大而高效的支持。

Pandas兼具高性能的数组运算功能及电子表格和关系型数据库灵活的数据处理功能,它所提供的精细索引更加方便用户完成重塑、切片和切块、聚合以及选取数据子集等操作。常用的Pandas对象是DataFrame,一个面向列的二维表结构。

matplotlib

matplotlib是最流行的用于绘制数据图表的Python库,与IPython的完美结合,为Python提供了异种非常好用的交互式数据绘图环境,适用于创建出版物上用的图表。

IPython

IPython是一个增强的Python shell,目的是为了提高编写、测试、调试代码的速度。主要用于交互式数据处理和利用matplotlib对数据进行可视化处理。

SciPy

SciPy是一组专门解决科学计算中各种问题的包的集合,与NumPy的有机结合能够完全代替MATLAB的计算功能。

SciPy主要包括的包有:

  1. scipy.integrate:数值积分例程和微分方程求解器
  2. scipy.linalg:扩展了NumPy提供的线性代数例程和矩阵分解功能
  3. scipy.optimize:函数优化器以及根查找算法
  4. scipy.signal:信号处理工具
  5. scipy.sparse:稀疏矩阵和稀疏线性系统求解器
  6. scipy.special:SPECFUN,实现了许多常用数学函数的包装器
  7. scipy.stats:标准连续和离散概率分布、各种统计检验方法,以及更好的描述统计法
  8. scipy.weave:利用内联C++代码加速数组计算的工具

你可能感兴趣的:(重要的Python库概述)