pandas日常使用笔记:iterrows()、mode()需要注意的东西

  • 1.iterrows()、iteritems():此方法用于对DataFrame进行行或者列的迭代获取

经过此方法所得到的DataFrame行或者列,你永远都不要去对它进行改动因为迭代所得只是这个数据对象的复制本,你对它进行何种改动都无济于事

  • 2.mode():此方法用于获得该列“众数”,即本特征下取值最多的那个特征值(因而可能不止一个结果)

如果你想用mode()函数的计算结果填充DataFrame的缺失值,请使用这个方法:df.fillna(df.mode().iloc[0])。原因在于,每列的mode()结果不止一个,所以我们得到的是一个DataFrame。我们用其第一行进行缺失值填充。

DataFrame.mode(axis=0numeric_only=False)

此外,根据mode()的参数,我们可以传入axis = 0或1,用于对列或者对行求众数;

还可以对numeric_only进行设置:选择numeric_only=True,即只对数值型的列进行

你可能感兴趣的:(tricks,机器学习,pandas,特征工程,数据处理)