在特征工程中,需要对数据拆分或者合并。而对数据操作后索引不会自动更新,需要重新排列一下。
比如这是刚合并完的数据集,索引是不对的。
这个时候一行代码可以搞定:
data.index = range(len(data))
代码讲解:
index代表行索引,是Python内置的对象,语法写“数据集.index”就可以调用了;
len()可以返回长度或者个数,用在这里可以返回数据集data实际上有多少行;
range()可以返回一个数组,嵌套在里面的len()函数给了它既定的范围,比如放在这里的意思就是生成范围从0-1000以内的数组。
运行完就正确啦:
如果觉得以上方法太麻烦了,还有一个函数可以直接处理:
data.reset_index()
运行结果:
加上inplace=True就对原数据进行修改了,如果写inplace=False则原数据不变。
data.reset_index(inplace=True)