pandas学习笔记(3)

pandas学习笔记(3)

追加(Append)

import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.rand(3,3), columns=['A', 'B', 'C'])#生成3*3的0~1随机数dataframe对象
print(df)

在这里插入图片描述

#给dataframe追加一行
s =df.ix[0]
print(s)
a=df.append(s, ignore_index=True)
print(a)

pandas学习笔记(3)_第1张图片

简单的计算

df = pd.DataFrame(np.random.randint(0,7,(3,3)), columns=['A', 'B', 'C'])#生成3*3的0~7随机数dataframe对象
print(df)

pandas学习笔记(3)_第2张图片

# 列和
print(df.sum())

pandas学习笔记(3)_第3张图片

# 行和
print(df.sum(axis=1))

在这里插入图片描述

# 最大值与最小值
print(df.max())
print()
print(df.min())

pandas学习笔记(3)_第4张图片

排序

#排序
df = pd.DataFrame(np.random.randint(0,7,(7,3)), columns=['A', 'B', 'C'])#生成7*3的0~7随机数dataframe对象
print(df)

pandas学习笔记(3)_第5张图片

print(df.sort_values('A',ascending=False))#按照A列进行降序排序,ascending默认值为True,即进行升序排序

pandas学习笔记(3)_第6张图片

print(df.sort_values(by=0,axis=1))#按照0行进行排序

pandas学习笔记(3)_第7张图片

Apply函数

#apply函数可以对DataFrame对象进行操作,既可以作用于一行或者一列的元素,也可以作用于单个元素。
df = pd.DataFrame(np.random.randint(0,7,(3,3)), columns=['A', 'B', 'C'])#生成3*3的0~7随机数dataframe对象
print(df)

pandas学习笔记(3)_第8张图片

def f(x):
    return x.min()
print(df.apply(f,axis=0))#列
print()
print(df.apply(f,axis=1))#行

pandas学习笔记(3)_第9张图片

分组(Grouping)

#分组(Grouping)
#分割:根据一些标准将数据分解成组
#应用:将函数独立地应用于每个组
#组合:将结果组合成数据结构
c=pd.DataFrame({
     
    'call':4,
    'age':[5,4,3,2,1],
    'sex':['M','F','M','F','M'],
    'num':[12,39,45,67,45]
})
print(c)

pandas学习笔记(3)_第10张图片

#分组,然后将sum() 函数应用于分组结果:
print(c.groupby('sex').sum())

堆叠(Stack)

#stack:将数据的列索引旋转为行索引
#unstack:将数据的行索引旋转为列索引
new_stsck=c.stack()
print(new_stsck)

pandas学习笔记(3)_第11张图片

print(new_stsck.unstack())

pandas学习笔记(3)_第12张图片

#通过level参数指定旋转轴的层次(默认level=-1)
print(new_stsck.unstack(level=0))

pandas学习笔记(3)_第13张图片

数据透视表(PivotTables)

#数据透视表(PivotTables)
df = pd.DataFrame({
     '购买者': ['小米', '小华', '小魅', '小V'] * 3,
                   '水果种类': ['苹果', '葡萄', '柚子'] * 4,
                   '信息': ['价格','数量' ] * 6,
                   '2019': np.random.randint(12,size=12),
                   '2018': np.random.randint(12,size=12)})
print(df)

pandas学习笔记(3)_第14张图片

#将购买者、水果种类作为行索引,将信息作为列索引,将2019作为值
c=pd.pivot_table(df, values='2019', index=['购买者', '水果种类'], columns=['信息'])
print(c)

pandas学习笔记(3)_第15张图片

你可能感兴趣的:(pandas,学习笔记)