当一个类中定义了__getitem__方法,那么它的实例对象便拥有了通过下标来索引的能力。
class A():
def __getitem__(self, index):
return index * 2
a = A()
a[2] #output: 4
如果切片访问呢,return 返回切片列表
class A():
def __getitem__(self, index):
import numpy as np
tmp = np.random.randn(9,2)
return tmp[index]
a = A()
a[1:3] #output:
array([[ 0.7020495 , -0.70795646],
[ 1.56645361, -1.24962575]])
这种技巧常用来封装训练数据集
import torch
from torch.utils.data import Dataset
class TIMITDataset(Dataset):
def __init__(self, X, y=None):
self.data = torch.from_numpy(X).float()
if y is not None:
y = y.astype(np.int)
self.label = torch.LongTensor(y)
else:
self.label = None
def __getitem__(self, idx):
if self.label is not None:
return self.data[idx], self.label[idx]
else:
return self.data[idx]
def __len__(self):
return len(self.data)
训练集样本特征: train.shape #(1229932, 429)
训练集标签: train_label.shape #(1229932,)
实例化定义数据集并访问
data = TIMITDataset(train, train_label)
data[1:3] #访问第二个和第三个样本
data[1] #访问第二个样本
这样就能愉快的把样本特征与标签封装在一起,欢迎关注公众号,更多精彩等着您