目录
DataFrame某一项的值是否为空
判断dataframe是否为空
提取唯一值:
判断DataFrame中某一项的值是否为空的方法有两种:
1.通过pd.isnull()来判断,语法格式:
import pandas as pd
pd.isnull(data.loc[i,'column_name'])
#或者下面这条
pd.isnull(data.loc[i,'column_name'])==True
转化为:判断某项值不为空的方法,不为空则继续执行的if语句
import pandas as pd
pd.isnull(data.loc[i,'column_name'])==False
if pd.isnull(data.loc[i,'column_name'])==False :
2.通过np.nan 来比较判断,语法格式:
df['column_name'][i] is not np.nan
3.剔除掉Dataframe类型数据某列中为空的数据,为空的列剔除掉其整行数据
#剔除掉为空的行
data=data[pd.isnull(data['column_name'])==False]
#只保留日期列中为 2021-01,2021-02 的行数据
data=data[data['日期'].apply(lambda x:True if x in ['2021-01','2021-02'] else False )]
————————————————
原文链接:https://blog.csdn.net/May_Beee/article/details/120845804
python if条件判断dataframe是否为空
在使用python for循环做数据处理时,会遇到某些文件为空,导致程序报错,可以使用dataframe.empty加if条件判断进行解决
例如:
1 data = pd.read_csv(file, skiprows=1, header=None, error_bad_lines=False)
2 if data.empty:
3 pass
4 else:
5 do
或者
1 data = pd.read_csv(file, skiprows=1, header=None, error_bad_lines=False)
2 if not data.empty:
3 do
timestamp转字符串,直接str(tmp)转换即可
statistics_date_list_tmp = result['report_time'].tolist()
statistics_date_list = [str(tmp).split()[0] for tmp in statistics_date_list_tmp]
原文链接:https://blog.csdn.net/qq_15821487/article/details/124451405
核心语句
df['column'].unique()
df['column'].value_counts()
示例与解释
a = list(dataSetRaw['vin'].unique()) # 列出该列的唯一值
len(a) # 统计该列有多少个不一样的值
b = pd.DataFrame(dataSetRaw['vin'].value_counts()) # 统计每个唯一值出现了多少次
原文链接:https://blog.csdn.net/Orange_Spotty_Cat/article/details/94576683