对数据进行分析,探索性计算时方便的库是提供编程效率的基石。Python有着庞大的库家族,这些库自身还不断改良,因此使用Python进行数据处理非常方便,高效。下面对科学计算相关的库做以介绍:
1.Numpy
Numpy(全称是Numerical Python)是Python科学计算的基础库,对数组的存储和计算都十分高效。也是许多科学计算库的基础库。它提供了以下优势:
1)快速高效的多维数组ndarray
2)对数组的元素计算 或 对数组执行数学计算
3)线性代数运算、傅里叶变换,以及随机数生成
4)读写基于数组的数据集,保存数组数据更加高效
2.Pandas
Pandas的名字源于panel data(面板数据)。它兼具了Numpy的高性能数组计算能力,还提供了更为复杂精细的索引功能。方便对数据进行切片,切块和聚合等能力。是Python中最为重要的一个计算库。
3.Scipy
Scipy是一组专门解决科学计算中各种标准问题域的包的集合,主要包括下面这些包:
scipy.integrate: 数值积分例程和微积分方程求解器。
scipy.linalg:扩展了由numpy.linalg提供的线性代数例程和矩阵分解功能。
scipy.optimize:函数优化器(最小化器)以及根查找算法
scipy.signal:信号处理工具
scipy.sparse:稀疏矩阵和系数线性系统求解器
scipy.special:SPECFUN的包装器,实现了许多常用数学函数
scipy.stats:标准连续和离散概率分布(如密度函数、采样器、连续分布函数等)、各种统计检验方法,以及更好的描述统计法。
scipy.weave:利用内联C++代码加速数组计算的工具。
Numpy和Scipy的有机结合可以替代Matlib的计算功能。
参考《利用Python进行数据分析》