在数据分析和交互、探索性计算以及数据可视化等方面,Python将不可避免地接近于其他开源和商业领域特定编程语言/工具,如R、MATLAB、SAS、Stata等。近年来,由于Python有不断改良的库(主要是pandas),使其成为数据处理任务的一大替代方案。结合其在通用编程方面的强大实力,我们完全可以只使用python这一种语言去构建以数据为中心的应用程序。——《利用Python进行数据分析》
在Python官网选择合适的Python版本下载,本文将在win8.1-64-python3.5环境下进行。
若在控制台中输入Python后,显示如图:
这说明Python运行程序没有添加环境变量。这是需要手动添加环境变量:我的电脑 -> 属性 -> 高级系统设置 -> 环境变量 -> PATH -> 添加Python安装位置 -> 点击确定。
如下则说明安装成功:
注:本文介绍的是科学计算库的手动安装方法,若觉得麻烦,可以下载Python(x,y)或者Enthought Python Distribution,前者收集了众多的函数库以及文档、教程。并且提供了一个方便的启动界面,将近400M;而后者是一个商业的Python发行版本,同样包括了众多的科学软件包,而且作为教学使用是免费的,大小约为250M。
NumPy系统是Python的一种开源的数值计算扩展。这种工具可用来存储和处理大型矩阵,比Python自身的嵌套列表(nested list structure)结构要高效的多(该结构也可以用来表示矩阵(matrix))。
点击这里,进入页面,下载Numpy的whl包,这里选用的是numpy-1.11.1+mkl-cp35-cp35m-win_amd64.whl
打开控制台,切换到文件目录
输入pip install numpy-1.11.1+mkl-cp35-cp35m-win_amd64.whl运行
安装成功:
Processing e:\numpy-1.11.1+mkl-cp35-cp35m-win_amd64.whl
Installing collected packages: numpy
Successfully installed numpy-1.11.1+mkl
SciPy是一款方便、易于使用、专为科学和工程设计的Python工具包.它包括统计,优化,整合,线性代数模块,傅里叶变换,信号和图像处理,常微分方程求解器等等.
点击这里,进入页面,下载Scipy的whl包,这里选用的是scipy-0.18.0-cp35-cp35m-win_amd64.whl
打开控制台,切换到文件目录
输入pip install scipy-0.18.0-cp35-cp35m-win_amd64.whl运行
安装成功:
Processing e:\scipy-0.18.0-cp35-cp35m-win_amd64.whl
Installing collected packages: scipy
Successfully installed scipy-0.18.0
matplotlib 是python最著名的绘图库,它提供了一整套和matlab相似的命令API,十分适合交互式地进行制图。而且也可以方便地将它作为绘图控件,嵌入GUI应用程序中。
点击这里,进入页面,下载Matplotlib的whl包,这里选用的是matplotlib-2.0.0b3-cp35-cp35m-win_amd64.whl
打开控制台,切换到文件目录
输入pip install matplotlib-2.0.0b3-cp35-cp35m-win_amd64.whl运行
安装成功:
Downloading pytz-2016.6.1-py2.py3-none-any.whl (481kB)
Installing collected packages: pyparsing, python-dateutil, cycler, pytz, matplotlib
Successfully installed cycler-0.10.0 matplotlib-2.0.0b3 pyparsing-2.1.6 python-dateutil-2.5.3 pytz-2016.6.1
ipython是一个 python 的交互式 shell,比默认的python shell 好用得多,支持变量自动补全,自动缩进,支持 bash shell 命令,内置了许多很有用的功能和函数。在ubuntu 下只要 sudo apt-get install ipython 就装好了,通过 ipython 启动。
点击这里,进入页面,下载Ipython的zip包,这里选用的是ipython-5.0.0.zip (md5)
打开控制台,切换到文件目录
输入pip install ipython-5.0.0.zip运行
安装成功:
Installing collected packages: decorator, pickleshare, simplegeneric, ipython-genutils, traitlets, wcwidth, six, prompt-toolkit, pygments, colorama, win-unicode
-console, ipython
Running setup.py install for simplegeneric ... done
Running setup.py install for win-unicode-console ... done
Running setup.py install for ipython ... done
Successfully installed colorama-0.3.7 decorator-4.0.10 ipython-5.0.0 ipython-genutils-0.1.0 pickleshare-0.7.3 prompt-toolkit-1.0.5 pygments-2.1.3 simplegeneric-0.8.1 six-1.10.0 traitlets-4.2.2 wcwidth-0.1.7 win-unicode-console-0.5
点击这里,进入页面,下载Pyreadline的zip包,这里选用的是pyreadline-2.1.zip (md5)
打开控制台,切换到文件目录
输入pip install pyreadline-2.1.zip运行
安装成功
Python Data Analysis Library 或 pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。pandas提供了大量能使我们快速便捷地处理数据的函数和方法。你很快就会发现,它是使Python成为强大而高效的数据分析环境的重要因素之一。
点击这里,进入页面,下载Pandas的whl包,这里选用的是pandas-0.18.1-cp35-cp35m-win_amd64.whl
打开控制台,切换到文件目录
输入pip install pandas-0.18.1-cp35-cp35m-win_amd64.whl运行
安装成功:
Installing collected packages: pandas
Successfully installed pandas-0.18.1