开始实习啦 以后不想再因为自己菜错过很多很好的机会,决定开始好好写博客。
第一天上班发现同事都用pandas做东西,查了下觉得确实有很多很好用的数据结构,学习一下,记录如下:
(一)导入方法
import pandas as pd
from pandas import Series,Dataframe
pandas库中有两种特殊的数据结构,Series和Dataframe,下面一一介绍。
(二)Series
Series 类似于excel中的列表,数字索引(类似excel中的行号)对应相应的内容。任意的一维数据都可以用来构建Series类型。
s = Series([1,2,'a','abc'])
打印s的结果应该为:
0 1
1 4
2 ww
3 tt
dtype: object
类似于python中的list结构,Series中的元素结构也可以任意定义。但是更灵活的是Series可以自定义索引。
a = Series(['ren','female','guess'],index = ['name','gender','age'])
打印a的结果如下:
name ren
gender female
age guess
dtype: object
这样看,Series又有点类似于python中的dict结构呢,有索引,索引有对应的值,因此也可以像字典结构一样根据索引查看值和修改值。同理也可以用dict结构直接构建Series。例如:
data = {'name':'ren','gender':'female','age':'guess'}
b = Series(data)
打印b的结果如下
age guess
gender female
name ren
dtype: object
并且更强的一点是,用字典构建的Series结构也可以自定义索引,代码如下:
data = {'name':'ren','gender':'female','age':'guess'}
c = Series(data,index = ['name','gender','single'])
结果如下:
name ren
gender female
single NaN
dtype: object
在 Pandas 中,如果没有值,都对齐赋给 NaN。
Pandas 有专门的方法来判断值是否为空。Series 对象也有同样的方法。
print(pd.isnull(c))
print(c.isnull())
结果如下:
name False
gender False
single True
dtype: bool
name False
gender False
single True
dtype: bool
另外,对索引的名字,是可以重新定义的。还可以对Series中的数据做批量运算。
Series就介绍到这啦,下一篇介绍DataFrame.