pandas

http://pandas.pydata.org/pandas-docs/stable/getting_started/10min.html#object-creation

照着这个教程学

Series:一维“数组”

DataFrame:二维“表格”

排序:

按照列的名字排序:df.sort_index(axis=1,ascending=False)

按照行的名字排序:df.sort_index(axis=0,asending=False)

其中axis=0表示行,axis=1表示列

DataFrame的选择:

df['c']选取C这一列,等价于df.c

df[0:5]选取第0-4行

用loc[]来选元素:

df.loc['row'] 选row指定的那一行。如果行是数字,就用int型

df.loc['row','column']指定矩阵中一个具体元素

df.loc[:,'col']选定矩阵中col那一列,同df['col']

df.loc[['row1','row2']] 注意双重方括号,选定row1和row2之间的这个dataFrame

df.loc['row1':'row2','c1']选中row1到row2, 列为c的

df.loc[[False,True,True]]双重括号中加boolean,False为不选中,True为选中,长度与行数一致

因为形如df['col']>0的表达式返回一个boolean型的列表,所以可以用这个返回值来选取特定的数据

df.loc[df.c>0]返回所有c列数据>0的行

给元素设置值:

df.loc['row']='somevalue' 将row这一整行的值全部设置为somevalue

df.loc['row']=[1,2,2,3]将row这一整行设置为1,2,2,3,注意要与列数一致

df.loc[:,'col']='somevalue' 将所有行的col列设置为somevalue

df.loc[df['col']>0]=0 将所有col列>0的行的数据都设置为0。注意不仅是将col列设置为0。如果想仅将col列设置为0,使用 df.loc[df['col']>0,'col']=0

用数字下标定位:df.iloc

df.iloc[1,1] 返回第一行第一列的值

df.iloc[:,4:6]返回所有行,第4,5列

df.iloc[3]返回第三行

添加一列:

df['newcol']=0  添加一列名字为newcol,值全为0

添加一行:df.loc['newrow']=0 添加一行,名字为newrow,值全为0

给列改名字:

df=df.rename(columns={‘old_col1’:'new_col2','old_col2':'new_col2'})  行的话改成index=


画图

plot,横轴是行的名字,纵轴是列的名字

你可能感兴趣的:(pandas)