python shuffle整个数据集

转自:https://blog.csdn.net/tina_ttl/article/details/51034824

给定数据集data,数据集对应的标签label

[python]  view plain  copy
  1. index = [i for i in range(len(data))]    
  2. random.shuffle(index)   
  3. data = data[index]  
  4. label = label[index]  

(1)首先,获得数据集的所有index,其实就是0,1,2,....,num-1(这里的num是数据集中含有的examples的个数,注意,python的索引是从0开始的,所以,第一个元素索引为0,最后一个元素索引为num-1)

【数据集中函数的样本个数num=sampNum = len(data)】

[python]  view plain  copy
  1. index = [i for i in range(len(data))]    

  python shuffle整个数据集_第1张图片  

(2)将索引随机打乱顺序

[python]  view plain  copy
  1. random.shuffle(index)  

 python shuffle整个数据集_第2张图片 

(3)按照新的乱序索引得到新的乱序后的data和label

[python]  view plain  copy
  1. data = data[index]  
  2. label = label[index]  

你可能感兴趣的:(python shuffle整个数据集)