Pandas常用方法总结(不断更新)

Update time:2019-9-18

Pandas

写文件:

df.to_csv(path,sep='\t', index=False)
df['id'].to_csv(path,  header=False, index=False)

数据合并concat:

# 简单的行合并和列合并操作。参数如下
pandas.concat(objs, axis=0, join='outer', join_axes=None, ignore_index=False, keys=None, levels=None, names=None, verify_integrity=False, sort=None, copy=True)
# join默认为”outer”,即如果列名不一致,用NaN填充;"inner"代表取交集,axis=1代表对列进行操作,横向合并
df3= pd.concat([df1, df2, df3], axis=1, join='inner')

Dataframe

创建Dataframe:

# 使用【字典类】数据创建
df = pd.Dataframe(data))
# 或从文件读取
df = pd.read_table('path')
df = pd.read_csv('path')
# 也可直接初始化一个空Dataframe
df = pd.Dataframe()
# 创建带行列名的空Dataframe
df = pd.DataFrame(columns=list_like, index=list_like2)

遍历Dataframe:

for i, s in fst.iterrows()

插入列:

fst = fst.insert(0, 'ID', fst_id)   # 参数:位置,列名,数据

合并行:

# 简单的合并行,常用来追加行。参数如下
DataFrame.append(self, other, ignore_index=False, verify_integrity=False, sort=None)
# 例子
df3 = df2.append(df1, ignore_index=True)

合并列:

# 简单的合并列。参数如下:
DataFrame.join(self, other, on=None, how='left', lsuffix='', rsuffix='', sort=False)

数据合并merge:

# 数据库模式的数据合并操作,功能多。参数如下:
DataFrame.merge(right, how='inner', on=None, left_on=None, right_on=None, left_index=False, right_index=False, sort=False, suffixes=('_x', '_y'), copy=True, indicator=False, validate=None)

剔除数据:

# 去掉曼哈顿图不需要的列
fst_mht = fst.drop(['BIN_END', 'N_VARIANTS', 'WEIGHTED_FST'], axis=1)

行列重排:

# 按曼哈顿图标准对剩余列进行排序
fst_mht = fst_mht.reindex(['ID', 'CHROM', 'BIN_START', 'MEAN_FST'], axis=1)

修改行列名:

xp_mht = xp_mht.rename(columns={"chrom": "chr", "start": "pos", "xpclr_norm": "xpclr"})

去除空值:

# 去掉带有空值的行,any代表只要有空值就去掉整行
fst_mht = fst_mht.dropna(axis=0, how='any') 

设置行名(index):

 # 默认drop=True,从原数据中删掉用作index的列
fst_mht = fst_mht.set_index('id', drop=True) 

删除DataFrame:

del df

Series

剔除数据:

fst.drop(listlike, inplace=True)     # inplace=True:直接改变原数据

你可能感兴趣的:(Python)