在平时数据分析时,通过describe和groupby生成的统计数据,更多的时候是属于series格式的。
而我们在后续的分析或者数据合并的过程中,我们往往需要将series格式转换成dataframe格式,往往存在以下两种情况
#生成序列,这里注意pd.Series的S一定要大写
series = pd.Series(['杭州','宁波','嘉兴','湖州'])
series
Out[57]:
0 杭州
1 宁波
2 嘉兴
3 湖州
dtype: object
#将序列转化为字典
df = {'序号':series.index,'城市':series.values}
#将字典转化为DF, pd.DataFrame中D和F注意大写,否则会报错
#AttributeError: module 'pandas' has no attribute 'dataframe'
DF = pd.DataFrame(df)
DF
Out[53]:
城市 序号
0 杭州 0
1 宁波 1
2 嘉兴 2
3 湖州 3
单个的series也可以用to_frame变成dataframe
aa = a.to_frame()
aa
Out[74]:
0
0 1
1 2
2 3
3 4
a = pd.Series([1,2,3,4])
b = pd.Series([5,6,7,8])
c = pd.Series([8,5,6,9])
df = pd.DataFrame({'a':a,'b':b,'c':c})
a
Out[67]:
0 1
1 2
2 3
3 4
dtype: int64
b
Out[68]:
0 5
1 6
2 7
3 8
dtype: int64
c
Out[69]:
0 8
1 5
2 6
3 9
dtype: int64
df
Out[70]:
a b c
0 1 5 8
1 2 6 5
2 3 7 6
3 4 8 9
d = pd.DataFrame([a,b,c])
d
Out[72]:
0 1 2 3
0 1 2 3 4
1 5 6 7 8
2 8 5 6 9