pandas学习笔记

1. 创建一个空的DataFrame

df_empty = pd.DataFrame(columns=['A', 'B', 'C', 'D'])


2.分组

使用聚合函数时,可以不生成索引。

df.groupby(['a','b'],as_index=False).mean()


3.转换

聚合只是其中的一种方法,转换也是。

4.层次化索引选取

根据索引获取数据。因为现在有两层索引,当通过外层索引获取数据的时候,可以直接利用外层索引的标签来获取。当要通过内层索引获取数据的时候,在list中传入两个元素,前者是表示要选取的外层索引,后者表示要选取的内层索引。

# 外层选取
print(ser_obj['c'])
# 内层选取
print(ser_obj[:, 1])
# 外层+内层选取
print(ser_obj['c', 2])

可以利用索引来筛选数据:使用query()

#使用query

arrays = [['bar', 'bar', 'baz', 'baz', 'foo', 'foo', 'qux', 'qux'], ['one', 'two', 'one', 'two', 'one', 'two', 'one', 'two']]
index = pd.MultiIndex.from_arrays(arrays, names=['first', 'second'])

df = pd.DataFrame({'A': [1, 1, 1, 1, 2, 2, 3, 3], 'B': np.arange(8)},index=index)
print(df)
print(df.query('second=="one"'))



你可能感兴趣的:(pandas)