python padas入门(一)Series

开始实习啦 以后不想再因为自己菜错过很多很好的机会,决定开始好好写博客。

第一天上班发现同事都用pandas做东西,查了下觉得确实有很多很好用的数据结构,学习一下,记录如下:

(一)导入方法

import pandas as pd
from pandas import Series,Dataframe

pandas库中有两种特殊的数据结构,Series和Dataframe,下面一一介绍。

(二)Series

Series 类似于excel中的列表,数字索引(类似excel中的行号)对应相应的内容。任意的一维数据都可以用来构建Series类型。

s = Series([1,2,'a','abc'])

打印s的结果应该为:

0     1
1     4
2    ww
3    tt
dtype: object

类似于python中的list结构,Series中的元素结构也可以任意定义。但是更灵活的是Series可以自定义索引。

a = Series(['ren','female','guess'],index = ['name','gender','age'])

打印a的结果如下:

name         ren
gender    female
age        guess
dtype: object

这样看,Series又有点类似于python中的dict结构呢,有索引,索引有对应的值,因此也可以像字典结构一样根据索引查看值和修改值。同理也可以用dict结构直接构建Series。例如:

data = {'name':'ren','gender':'female','age':'guess'}
b = Series(data)

打印b的结果如下

age        guess
gender    female
name         ren
dtype: object

并且更强的一点是,用字典构建的Series结构也可以自定义索引,代码如下:

data = {'name':'ren','gender':'female','age':'guess'}
c = Series(data,index = ['name','gender','single'])

结果如下:

name         ren
gender    female
single       NaN
dtype: object

在 Pandas 中,如果没有值,都对齐赋给 NaN。

Pandas 有专门的方法来判断值是否为空。Series 对象也有同样的方法。

print(pd.isnull(c))
print(c.isnull())

结果如下:

name      False
gender    False
single     True
dtype: bool
name      False
gender    False
single     True
dtype: bool


另外,对索引的名字,是可以重新定义的。还可以对Series中的数据做批量运算。

Series就介绍到这啦,下一篇介绍DataFrame.











你可能感兴趣的:(python)