series:序列,由索引index和值value一一对应组成,series.values();series.index()分别可获得序列的所有索引和值;可根据序列值获得索引:series[series.value==a].index; 也可根据索引获得值:series[series.index==a].values.
逐行合并两个series序列:pd.concat([series1,series2]);
逐列合并两个series序列:pd.concat([series1,series2],axis=1);
concat合并series最大的特点是保留索引,合并后的结果里各行的索引与合并前的索引保持一致。当合并后索引产生了重复值,可使用多级索引。而当索引无实际意义时,可选择忽略索引,pd.concat([series1,series2],ingore_index=True,axis=1).
dataframe:数据框,类似excel中的表格,可用.iloc[i,j]获得特定单元格的数据;
实现分类求和或分类计数:data.groupby(['key'].sum();data.groupby(['key'].size() ;data.groupby(['key'].mean();返回一个series数据;; 也可根据两个属性进行分类:data.groupby(['key1','key2']).size();
series转换为dataframe形式:pd.DataFrame(series);
matplotlib.pyplot画折现图
对于dataframe和series格式数据,可直接dataframe.plot(),series.plot();
函数xlabel()和ylabel()为每条坐标轴设置标题; plt.title()-----设置图像标题;plt.legend(['name1','name2'],loc='best'/'upper left/lower right)---设置图标和位置;