http://pandas.pydata.org/pandas-docs/stable/getting_started/10min.html#object-creation
照着这个教程学
Series:一维“数组”
DataFrame:二维“表格”
排序:
按照列的名字排序:df.sort_index(axis=1,ascending=False)
按照行的名字排序:df.sort_index(axis=0,asending=False)
其中axis=0表示行,axis=1表示列
DataFrame的选择:
df['c']选取C这一列,等价于df.c
df[0:5]选取第0-4行
用loc[]来选元素:
df.loc['row'] 选row指定的那一行。如果行是数字,就用int型
df.loc['row','column']指定矩阵中一个具体元素
df.loc[:,'col']选定矩阵中col那一列,同df['col']
df.loc[['row1','row2']] 注意双重方括号,选定row1和row2之间的这个dataFrame
df.loc['row1':'row2','c1']选中row1到row2, 列为c的
df.loc[[False,True,True]]双重括号中加boolean,False为不选中,True为选中,长度与行数一致
因为形如df['col']>0的表达式返回一个boolean型的列表,所以可以用这个返回值来选取特定的数据
df.loc[df.c>0]返回所有c列数据>0的行
给元素设置值:
df.loc['row']='somevalue' 将row这一整行的值全部设置为somevalue
df.loc['row']=[1,2,2,3]将row这一整行设置为1,2,2,3,注意要与列数一致
df.loc[:,'col']='somevalue' 将所有行的col列设置为somevalue
df.loc[df['col']>0]=0 将所有col列>0的行的数据都设置为0。注意不仅是将col列设置为0。如果想仅将col列设置为0,使用 df.loc[df['col']>0,'col']=0
用数字下标定位:df.iloc
df.iloc[1,1] 返回第一行第一列的值
df.iloc[:,4:6]返回所有行,第4,5列
df.iloc[3]返回第三行
添加一列:
df['newcol']=0 添加一列名字为newcol,值全为0
添加一行:df.loc['newrow']=0 添加一行,名字为newrow,值全为0
给列改名字:
df=df.rename(columns={‘old_col1’:'new_col2','old_col2':'new_col2'}) 行的话改成index=
画图
plot,横轴是行的名字,纵轴是列的名字