利用Python进行数据分析 - 准备工作

概述

该系列是关于《利用Python进行数据分析》的学习笔记。

涉及内容

主要介绍如何利用Python来进行数据控制、处理、整理、分析等方面的内容,涉及了多个在数据分析中常用的Python库:

  • NumPy
    NumPy是Python科学计算的基础包,本书大部分内容都基于NumPy以及构建于其上的库。
  • pandas
    pandas在吸收NumPy高性能的数组计算功能之外,还提供了复杂精细的索引功能,以便更为便捷地完成重塑、切片和切块、聚合以及选取数据子集等操作。
  • matplotlib
    matplotlib是最流行的用于绘制数据图表的Python库。
  • SciPy
    SciPy是一组专门解决科学计算中各种标准问题域的包的集合。
    此外,还介绍了一种交互式的Python编程环境:IPython

安装配置

该部分没有遵从该书的内容,通过安装Spider来获得IPython环境。
具体而言,我安装Spider的环境是在Windows 10的64位机器侠进行的,安装过程可以参看Installation - Spyder 2.3。
之后,进入到Spyder的IDE环境中,输入如下代码进行测试:

import numpy as np
import matplotlib.pylab as pylab
pylab.plot(np.arange(10))

运行成功,得到如下图片:


利用Python进行数据分析 - 准备工作_第1张图片
test-1.png

相关数据

本书的代码及数据都存放在pydata-book - github上,记得下载吼。

你可能感兴趣的:(利用Python进行数据分析 - 准备工作)