python8——pandas大范围赋值和增加特定数据,处理丢失数据(nan)

文章目录

  • 前言
  • pandas大范围赋值
  • 增加空数据
  • 处理丢失数据(nan)
    • isnull:查看哪个数据是nan
    • dropna:直接丢掉
    • fillna:赋值为0

前言

根据 莫烦Python的教程 总结写成,以便自己复习和使用,这里我就不哟林地挂原创了。

pandas大范围赋值

dates = pd.date_range('20200209',periods=6) #以日期的格式形成的数据
df = pd.DataFrame(np.arange(24).reshape(6,4),index=dates,columns=['a','b','c','d']) # index 行;column 列
df.a[df.a>4] = 0 # 只将a那一列大于4的值赋值为0
df[df.a>4] = 0 # 将a那一列所有大于4的行都赋值为0

增加空数据

df['e'] = np.nan # 加上空的列
df['e'] = pd.Series([1,2,3,4,5,6],index=pd.date_range('20200210',periods=6)) # 加上排列的好的数据列

处理丢失数据(nan)

isnull:查看哪个数据是nan

df.iloc[0,1] = np.nan # 设定丢失的数据
df.iloc[1,2] = np.nan
print(df.isnull())
print(np.any(df.isnull()) == True) #只检查是否有缺失

dropna:直接丢掉

print(df.dropna(axis=0,how='any' )) # 0:丢掉行,1: 丢掉列;how=any:只要有一个nan就操作,how=all:只有全部是nan才操作

fillna:赋值为0

print(df.fillna(value=0)) # 将nan填入0

你可能感兴趣的:(机器学习,python,numpy)