python——数据分析函数

1、pandas.notnull():去掉空值行

pandas.isnull():只要空值行

2、数据集.列.unique():只显示不重复的指标值

3、数据集.列.value_count():统计某列各个指标的个数 并按降序排列

4、数据集.groupby(‘列’):以某列为key对其他列进行相应计算(类似于以某列分组)

5、numpy.linspace(x,y,n):产生以x为起始,以y为终止,n个元素个数

6、get_dummies(数据集['列'],prefix='列名'):one-hot编码(若离散特征的取值大小无意义,比如颜色、位置等等)把某一列具有n个属性转换成n列指标,且每个数据在n个指标中只有一个值,新列的名称以prefix为前缀再加上自身的名称

你可能感兴趣的:(Python,数据分析,数据挖掘,数据预处理)