Python判断DataFrame或者其中某一项的值是否为空,提取某列唯一值

目录

DataFrame某一项的值是否为空

判断dataframe是否为空

提取唯一值:

DataFrame某一项的值是否为空

判断DataFrame中某一项的值是否为空的方法有两种:
1.通过pd.isnull()来判断,语法格式:

import pandas as pd
 
pd.isnull(data.loc[i,'column_name'])

#或者下面这条

pd.isnull(data.loc[i,'column_name'])==True

转化为:判断某项值不为空的方法,不为空则继续执行的if语句

import pandas as pd
 
pd.isnull(data.loc[i,'column_name'])==False
 
if pd.isnull(data.loc[i,'column_name'])==False :


2.通过np.nan 来比较判断,语法格式:

df['column_name'][i] is not np.nan

3.剔除掉Dataframe类型数据某列中为空的数据,为空的列剔除掉其整行数据

#剔除掉为空的行

data=data[pd.isnull(data['column_name'])==False]

#只保留日期列中为 2021-01,2021-02 的行数据

data=data[data['日期'].apply(lambda x:True if x in ['2021-01','2021-02'] else False )]

————————————————
原文链接:https://blog.csdn.net/May_Beee/article/details/120845804

判断dataframe是否为空

python if条件判断dataframe是否为空
在使用python for循环做数据处理时,会遇到某些文件为空,导致程序报错,可以使用dataframe.empty加if条件判断进行解决

例如:

1 data = pd.read_csv(file, skiprows=1, header=None, error_bad_lines=False)
2 if data.empty:
3     pass
4 else:
5     do

或者

1 data = pd.read_csv(file, skiprows=1, header=None, error_bad_lines=False)
2 if not data.empty:
3     do

timestamp转字符串,直接str(tmp)转换即可

statistics_date_list_tmp = result['report_time'].tolist()
statistics_date_list = [str(tmp).split()[0] for tmp in statistics_date_list_tmp]


原文链接:https://blog.csdn.net/qq_15821487/article/details/124451405

提取唯一值:

核心语句

df['column'].unique()
df['column'].value_counts()

示例与解释
a = list(dataSetRaw['vin'].unique())   # 列出该列的唯一值
len(a) # 统计该列有多少个不一样的值
 
b = pd.DataFrame(dataSetRaw['vin'].value_counts()) # 统计每个唯一值出现了多少次

原文链接:https://blog.csdn.net/Orange_Spotty_Cat/article/details/94576683

你可能感兴趣的:(python,pandas,开发语言)