Python pandas 空值缺失值(NaN)处理填充替换判断删除含缺失空值数据行

缺失值处理

  • 判断

data
     ts_code  symbol  name area industry  list_date
0  000001.SZ     1.0  平安银行   深圳       银行   19910403
1  000002.SZ     NaN   万科A   深圳     全国地产   19910129
2  000004.SZ     4.0  ST国华  NaN     软件服务   19910114
3  000005.SZ     5.0  ST星源   深圳     环境保护   19901210
data.isna()
   ts_code  symbol   name   area  industry  list_date
0    False   False  False  False     False      False
1    False    True  False  False     False      False
2    False   False  False   True     False      False
3    False   False  False  False     False      False
data.isna()["area"]
0    False
1    False
2     True
3    False
Name: area, dtype: bool
data["area"].isna()
0    False
1    False
2     True
3    False
Name: area, dtype: bool

  • 填充(替换)

data.fillna("-999")
     ts_code symbol  name  area industry  list_date
0  000001.SZ    1.0  平安银行    深圳       银行   19910403
1  000002.SZ   -999   万科A    深圳     全国地产   19910129
2  000004.SZ    4.0  ST国华  -999     软件服务   19910114
3  000005.SZ    5.0  ST星源    深圳     环境保护   19901210
data["area"].fillna("-999")
0      深圳
1      深圳
2    -999
3      深圳
Name: area, dtype: object
data["area"] = data["area"].fillna("-999")
data
     ts_code  symbol  name  area industry  list_date
0  000001.SZ     1.0  平安银行    深圳       银行   19910403
1  000002.SZ     NaN   万科A    深圳     全国地产   19910129
2  000004.SZ     4.0  ST国华  -999     软件服务   19910114
3  000005.SZ     5.0  ST星源    深圳     环境保护   19901210

  • 删除

data.dropna()
     ts_code  symbol  name area industry  list_date
0  000001.SZ     1.0  平安银行   深圳       银行   19910403
3  000005.SZ     5.0  ST星源   深圳     环境保护   19901210
data["area"].isna()
0    False
1    False
2     True
3    False
Name: area, dtype: bool
data[~data["area"].isna()]
     ts_code  symbol  name area industry  list_date
0  000001.SZ     1.0  平安银行   深圳       银行   19910403
1  000002.SZ     NaN   万科A   深圳     全国地产   19910129
3  000005.SZ     5.0  ST星源   深圳     环境保护   19901210

你可能感兴趣的:(python,1024程序员节,python,pandas)