利用Python进行数据分析的笔记-1

重要的Python库

  • Numpy
  • pandas
  • matplotlib
  • IPython
  • Scipy
  • Numpy

Numpy ( Numerical Python简称)是Python科学计算的基础包。
提供以下功能(不限于此):

  • 快速高效的多维数组对象ndarray
  • 用于对数组执行元素级别计算以及直接对数组执行数学运算的函数
  • 用于读写硬盘上基于数组的数据集的工具
  • 线性代数运算、傅里叶变换、以及随机数的生成
  • 用于将C C++ Fortran代码集成到Python的工具
    除了为Python提供快速的数组处理能力,Numpy在数据分析方面还有另外一个主要作用,即作为在算法之间传递数据的容器 对于数值型数据,Numpy数组在存储和处理数据时要比内置的Python数据结构高效得多。另外,由低级语言(比如C和Fortran)编写的库可以直接操作Numpy数组中的数据。
  • Pandas

pandas提供了使我们能够快速便捷地处理结构化数据的大量数据结构和函数,其中用的最多的是pandas对象是DataFrame,它是一个面向列的二维表结构,且含有行标和列标。
pandas兼具Numpy高性能的数组计算功能以及电子表格和关系型数据库灵活的数据处理能力。它提供了复杂精细的索引功能,以便更为便捷地完成重塑、切片、切块、聚合以及选取数据子集等操作。
对于金融行业的用户,pandas提供了大量适用于金融数据的高性能时间序列功能和工具。

  • Matplotlib

matplotlib是最流行用于绘制数据图表的Python库,提供了一种非常好用的交互式数据绘图环境,可以利用绘图窗口中的工具栏放大图表中的某个区域或对整个图表进行平移浏览。

  • SciPy

SciPy是一组专门解决科学计算中各种标准问题域的包的集合。

  • scipy.integrate 数值积分例程和微分方程求解器
  • scipy.linalg 扩展了由numpy.linalg提供的线性代数例程和矩阵分解功能
  • scipy.optimize 函数优化器(最小化器)以及根查找算法
  • scipy.signal 信号处理工具
  • scipy.sparse 稀疏矩阵和稀疏线性系统求解器
  • scipy.special SPECFUN (这是一个实现许多常用数学函数(如伽玛函数)的Fortran库)的包装器
  • scipy.stats 标准连续和离散概率分布(如密度函数、采样器、连续分布函数等),各种统计检验方法,以及更好的描述统计方法
  • scipy.weave 利用内联C++代码加速数组计算的工具

你可能感兴趣的:(利用Python进行数据分析的笔记-1)