利用Python进行数据分析 第5章 pandas入门

pandas库,含有使数据清洗和分析工作变得更快更简单的数据结构和操作工具。pandas是基于NumPy数组构建。

pandas常结合数值计算工具NumPy和SciPy、分析库statsmodels和scikitlearn,和可视化库matplotlib等工具一同使用。

5.1 pandas数据结构介绍

pandas的主要数据结构:Series和DataFrame

(1)Series

Series是一种类似于一维数组的对象,由一组数据(各种NumPy数据类型)以及一组与之相关的数据标签(即索引)组成:

利用Python进行数据分析 第5章 pandas入门_第1张图片

可通过Series的values和index属性获取其数组表示形式和索引对象:

可创建自定义的索引:

利用Python进行数据分析 第5章 pandas入门_第2张图片

1)与普通NumPy数组相比,可通过索引的方式选取Series中的单个或一组值:

利用Python进行数据分析 第5章 pandas入门_第3张图片

 

 

 

 2)

 

(2)DataFrame

 

 

(3)索引对象

 

5.2 基本功能

 

你可能感兴趣的:(利用Python进行数据分析 第5章 pandas入门)