利用Python进行数据分析——第一章:重要Python库安装配置

一. NumPy

NumPy全称为Numerical Python,是Python科学计算的基础包。提供功能有:

  • 快速高效的多维数组对象ndarray;
  • 用于对数组执行元素级计算及直接执行数学运算的函数;
  • 用于读写硬盘上基于数组的数据集工具;
  • 线性代数运算、傅立叶变换与随机数生成;
  • 用于将C、C++、Fortran代码集成到Python的工具;

二. pandas
提供了使我们能快速便捷地处理结构化数据的大量数据结构与函数。它是使得Python成为强大而高效的数据分析环境的重要因素之一。
三. matplotlib
最流行的用于绘制数据图表的Python库。
四. IPython
是Python科学标准工具集的组成部分,将所有其它东西联系在一起。是一个增强的Python shell,主要用于交互式数据处理和利用matplotlib对数据进行可视化处理。
五. SciPy
SciPy是一组专门解决科学计算中各种标准问题域的包的集合。与NumPy有机结合完全可以替代MATLAB的计算功能。
六. 安装配置
在Ubuntu下安装Python模块通常可以使用apt-get和pip命令。apt-get命令是Ubuntu自带的包管理命令,而pip则是Python安装扩展模块的工具,通常pip会下载扩展模块的源代码并编译安装。
Ubuntu 12.04中缺省安装了Python2.7.3,首先通过下面的命令安装pip,pip是Python的一个安装和管理扩展库的工具。
sudo apt-get install python-pip
安装Python开发环境,方便今后编译其他扩展库,占用空间92.8M:
sudo apt-get install python-dev
    一、NumPy,SciPy、pandas和matplotlib
通过apt-get命令可以快速安装这三个库:
sudo apt-get install python-numpy
sudo apt-get install python-scipy
sudo apt-get install python-pandas
sudo apt-get install python-matplotlib
如果需要通过pip编译安装,可以先用apt-get命令安装所有编译所需的库:
sudo apt-get build-dep python-numpy
sudo apt-get build-dep python-scipy
然后通过pip命令安装:
sudo pip install numpy
sudo pip install scipy
sudo pip install pandas

    二、安装ipython

在Ubuntu下,安装ipython很简单:

$sudo apt-get install ipython

Ubuntu默认的python为2,所以如果要使用ipython3需要运行

$sudo apt-get install ipython3

如果想要使用ipython-qt,对于python2而言可以直接在软件中心中安装(当然,ipython也可以),对于ipyhon3-qt,则要麻烦一些。

$sudo apt-get source python-slip

$sudo apt-get python-qt4

然后对于新下载的源码,都进入源码目录后执行:

$sudo python3 configure.py

$sudo make

$sudo make install

另外可以安装IPython notebook:

sudo apt-get install ipython
sudo pip install tornado
sudo apt-get install libzmq-dev
sudo pip install pyzmq
sudo pip install pygments



你可能感兴趣的:(利用Python进行数据分析——第一章:重要Python库安装配置)