pandas数据分析教程-数据清洗-缺失值处理

pandas-02-数据清洗&预处理

    • A.缺失值处理
      • 1. Pandas缺失值判断
      • 2. 缺失值过滤
        • 2.1 Series.dropna()
        • 2.2 DataFrame.dropna()
      • 3. 缺失值填充
      • 3.1 值填充
      • 3.2 向前/向后填充

文中用S代指Series,用Df代指DataFrame
数据清洗是处理大型复杂情况数据必不可少的步骤,这里总结一些数据清洗的常用方法:包括缺失值、重复值、异常值处理,数据类型统计,分箱,随机采样,向量化编码等方法。每种方法都给出了代码和实例,并用表格进行总结。

A.缺失值处理

pandas数据分析教程-数据清洗-缺失值处理_第1张图片

1. Pandas缺失值判断

  • np.nan 会自动识别为NaN (not a number),认定为空值
  • python中内置

你可能感兴趣的:(pandas,pandas,数据清洗)