Python机器学习:range()对索引重新排列

在特征工程中,需要对数据拆分或者合并。而对数据操作后索引不会自动更新,需要重新排列一下。

比如这是刚合并完的数据集,索引是不对的。

Python机器学习:range()对索引重新排列_第1张图片

 这个时候一行代码可以搞定:

data.index = range(len(data))

代码讲解:

index代表行索引,是Python内置的对象,语法写“数据集.index”就可以调用了;

len()可以返回长度或者个数,用在这里可以返回数据集data实际上有多少行;

range()可以返回一个数组,嵌套在里面的len()函数给了它既定的范围,比如放在这里的意思就是生成范围从0-1000以内的数组。

运行完就正确啦:

Python机器学习:range()对索引重新排列_第2张图片

如果觉得以上方法太麻烦了,还有一个函数可以直接处理:

data.reset_index()

运行结果:

Python机器学习:range()对索引重新排列_第3张图片

 加上inplace=True就对原数据进行修改了,如果写inplace=False则原数据不变。

data.reset_index(inplace=True)

你可能感兴趣的:(Python机器学习,python,开发语言)