python,pandas缺失值数据处理

缺失值数据处理方式:
1.数据补齐 2.删除对应数据行 3.不处理

data.csv文件内容:
python,pandas缺失值数据处理_第1张图片

import pandas as pd
'''
uft-8编码:包含全世界所有国家需要用到的字符,英文网站用的较多
gbk编码:包含全部的中文字符
unicode编码:把所有语言统一到一套编码
'''

df=pd.read_csv(r"C:\data\data.csv",encoding='gbk') #pandas默认的编码方式是utf8
#如果python中所要处理的字符串中包含中文,那么最好要搞懂所用字符的编码,是gbk,还是utf-8,否则容易出现乱码,以及语法错误。
#此处如果不写encoding='gbk',会报错((UnicodeDecodeError: 'utf-8' codec can't decode byte 0xd5 in position 0: invalid continuation byte)

python,pandas缺失值数据处理_第2张图片

1.判定空值所在位置

na=df.isnull()
print(na)

python,pandas缺失值数据处理_第3张图片

'''
判断每一行是否有空值
'''
print(na.any(axis=1))#any(iterable) 函数用于判断给定的可迭代参数 iterable 是否全部为False,若是则返回 False,如果有一个为 True,则返回 True。

python,pandas缺失值数据处理_第4张图片

'''
针对某列数据具体判断是否是空值
'''
print(na[['gender']].any(axis=1))

python,pandas缺失值数据处理_第5张图片

2.提取缺失值所在的行

print(df[na[['gender']].any(axis=1)]) #df[逻辑值]

在这里插入图片描述

3.填充缺失值

df1=df.fillna('1')#所有的空值都填1 。df中的内容没有变。na代表空值

python,pandas缺失值数据处理_第6张图片
python,pandas缺失值数据处理_第7张图片

3.删除缺失值

'''
删除整行数据
'''
df2=df.dropna() #删除空值数据。df中的内容没有改变。

python,pandas缺失值数据处理_第8张图片
python,pandas缺失值数据处理_第9张图片

你可能感兴趣的:(pandas,python)