2021-08-04

第七节 pandas函数应用

1. 直接使用numpy函数

  • 求绝对值


    image.png
  • 求最大值,默认axis=0为列


    image.png

2. apply和applymap

2.1 apply将函数应用到行或者列,默认axis=0方向为列

  • 求各行列最大值(匿名函数)


    image.png

2.2 匿名函数一行解决不了时,可以选择自定义函数

  • 求各行列最大值(自定义函数)


    image.png

2.3 在一个数组中沿轴应用一个函数

  • 求各行列最大值(应用自定义函数)


    image.png

2.4 applymap将函数应用到每个数据

  • 保留两位小数


    image.png

3. 排序

3.1 按索引排序s1.sort_index() # ascending=True 默认升序

  • s1.sort_index(axis=0, level=None, ascending=True, inplace=False, kind='quicksort', na_position='last', sort_remaining=True)


    image.png

    image.png

3.2 按轴排序

image.png

3.3 按值排序

  • s1.sort_values(axis=0, ascending=True, inplace=False, kind='quicksort', na_position='last')


    image.png
  • 注意相同值的优先级
  • pd1.sort_values(by, axis=0, ascending=True, inplace=False, kind='quicksort', na_position='last')
  • by行或列的排序优先级


    image.png

    image.png

4. 唯一值和成员属性

image.png

5.数据个数统计

image.png

image.png

image.png

6. 处理缺失值

6.1 检测缺失值 df3.isnull()

image.png

6.2 检测非缺失值 df3.notnull()

image.png

6.3 删除,默认删除缺失值所在的行 df3.dropna()

image.png
  • df3.dropna(axis=0, how='any', thresh=None, subset=None, inplace=False)
  • “how='any':如果存在任何NA值,请删除该行或列。
  • “how='all':如果所有值均为NA,则删除该行或列。


    image.png

6.4 填充缺失值 df3.fillna(1)

  • 用平均值填充缺失值


    image.png
  • 上下填充
  • df3.fillna(value=None, method=None, axis=None, inplace=False, limit=None, downcast=None, **kwargs)
  • method='pad'或'ffill'将上一个有效数据往下填充
  • method='backfill'或'bfill'将下一个有效数据往上填充


    image.png

你可能感兴趣的:(2021-08-04)