很多时候在处理数据时,样本数据与标签值是放在两个数据结构中存储的。当样本数据顺序发生变化时,我们需要保证其对应的标签顺序也同时发生变化。
思想很简单,由于样本数据的变化是未知的,想要标签数据随着样本数据的变化而变化,最简单的方法就是将标签和样本融合在一起。
例如,在python中,我们可以这样做:
import numpy as np
data = [[1,2,3,1],[2,1,2,3],[1,4,6,7],[6,7,3,2]]
labels = [1, 1, 0, 1]
completeData = np.c_[data, np.array(labels).T]
print(completeData)
np.random.shuffle(completeData)
print(completeData)
把label放在data的最后一位,即可满足问题的需求。