pandas使用技巧【12】如何处理缺失数据

简介: 本文主要介绍在pandas中如何处理缺失数据。

主要方法有:

  1. isnull()
  2. notnull()
  3. dropna()
  4. fillna()
  • 判断数据是否缺失

使用isnull()函数,返回bool类型数据

dataframe.isnull()

使用notnull()函数,同样返回bool类型数据

dataframe.notnull()

使用sum()函数,统计缺失数据

dataframe.isnull().sum()
  • 过滤缺失数据
dataframe[dataframe.colname.isnull()]
dataframe[dataframe.colname.notnull()]
  • 丢弃缺失数据

how按行row判断

dataframe.dropna(how='any')
dataframe.dropna(how='any', inplace=True)
dataframe.dropna(how='all')
dataframe.dropna(how='all', inplace=True)

对特定列操作

dataframe.dropna(subset=["col1",  "col2"], how='any')
dataframe.dropna(subset=["col1",  "col2"], how='all')
  • 填充缺失数据

fillna()函数


附上小哥哥的视频链接Data analysis in Python with pandas
Youtube
哔哩哔哩

所有文章列表
pandas使用技巧总览

你可能感兴趣的:(pandas使用技巧【12】如何处理缺失数据)