pandas删除nan数据,筛选出nan的数据,筛选出非nan的数据,替换nan值

在处理缺失值的时候,总会遇到各种问题

目录

1.删除全部为nan的行

 2.删除含有nan的行

 3.删除全部为nan的列

4. 删除包含nan的列

5.删除指定某一列有nan,这样即可定位到所在行的index,然后对该index进行drop操作即可df[np.isnan(df[‘open’])].index #定位某一列是否有nan

直接drop对应indx即可删除该行df.drop(df[np.isnan(df[‘open’])].index, inplace=True)

 6. df1 = df.dropna(axis=0, how=‘all’, subset=[‘d’, ‘c’]) #删除指定的两列都是空的行

7.筛选出nan的数据

8.筛选出非nan的数据

9.替换nan值


import pandas as pd

data = pd.read_excel(r'测试数据.xlsx')
print(data)

先看看如下数据

pandas删除nan数据,筛选出nan的数据,筛选出非nan的数据,替换nan值_第1张图片

1.删除全部为nan的行

import pandas as pd

data = pd.read_excel(r'测试数据.xlsx')
print(data)
# 删除表中全部为NaN的行
data = data.dropna(axis=0, how='all')
print(data)

输出:

pandas删除nan数据,筛选出nan的数据,筛选出非nan的数据,替换nan值_第2张图片

 2.删除含有nan的行

import pandas as pd

data = pd.read_excel(r'测试数据.xlsx')
print(data)
# 删除表中含有NaN的行
data = data.dropna(axis=0, how='any')
print(data)

输出:

pandas删除nan数据,筛选出nan的数据,筛选出非nan的数据,替换nan值_第3张图片

 3.删除全部为nan的列

# 删除全部为nan的列
data = data.dropna(axis=1, how='all')

数据如下: 

pandas删除nan数据,筛选出nan的数据,筛选出非nan的数据,替换nan值_第4张图片

输出: 

pandas删除nan数据,筛选出nan的数据,筛选出非nan的数据,替换nan值_第5张图片

4. 删除包含nan的列

# 删除包含nan的列
data = data.dropna(axis=1, how='any')

数据如下 

pandas删除nan数据,筛选出nan的数据,筛选出非nan的数据,替换nan值_第6张图片

输出: 

pandas删除nan数据,筛选出nan的数据,筛选出非nan的数据,替换nan值_第7张图片

5.删除指定某一列有nan,这样即可定位到所在行的index,然后对该index进行drop操作即可
df[np.isnan(df[‘open’])].index #定位某一列是否有nan

直接drop对应indx即可删除该行
df.drop(df[np.isnan(df[‘open’])].index, inplace=True)

数据如下:

pandas删除nan数据,筛选出nan的数据,筛选出非nan的数据,替换nan值_第8张图片

输出:
pandas删除nan数据,筛选出nan的数据,筛选出非nan的数据,替换nan值_第9张图片

 6. df1 = df.dropna(axis=0, how=‘all’, subset=[‘d’, ‘c’]) #删除指定的两列都是空的行

7.筛选出nan的数据

df_nan = df[df['往来单位编号'].isna()]

8.筛选出非nan的数据

df_notnan = df[~df['往来单位编号'].isna()]

9.替换nan值

df.fillna('', inplace=True)  # 将nan替换为'',否则无法保存到MySQL

10.有时候是空字符串的情况 

nan_df = df[(df['xxx'].str.len() <= 5) | (df['xxx'].isna())]

你可能感兴趣的:(Pandas数据分析,python,开发语言)