初识series和dataframe

series:序列,由索引index和值value一一对应组成,series.values();series.index()分别可获得序列的所有索引和值;可根据序列值获得索引:series[series.value==a].index;  也可根据索引获得值:series[series.index==a].values.

逐行合并两个series序列:pd.concat([series1,series2]);

逐列合并两个series序列:pd.concat([series1,series2],axis=1);

concat合并series最大的特点是保留索引,合并后的结果里各行的索引与合并前的索引保持一致。当合并后索引产生了重复值,可使用多级索引。而当索引无实际意义时,可选择忽略索引,pd.concat([series1,series2],ingore_index=True,axis=1).

dataframe:数据框,类似excel中的表格,可用.iloc[i,j]获得特定单元格的数据;

实现分类求和或分类计数:data.groupby(['key'].sum();data.groupby(['key'].size()  ;data.groupby(['key'].mean();返回一个series数据;;  也可根据两个属性进行分类:data.groupby(['key1','key2']).size();

series转换为dataframe形式:pd.DataFrame(series);

matplotlib.pyplot画折现图

对于dataframe和series格式数据,可直接dataframe.plot(),series.plot();

函数xlabel()和ylabel()为每条坐标轴设置标题;  plt.title()-----设置图像标题;plt.legend(['name1','name2'],loc='best'/'upper left/lower right)---设置图标和位置;

你可能感兴趣的:(python)