python类方法__getitem__的使用

当一个类中定义了__getitem__方法,那么它的实例对象便拥有了通过下标来索引的能力。

class A():
    def __getitem__(self, index):
        return index * 2
a = A()
  • 索引访问
a[2] #output: 4

如果切片访问呢,return 返回切片列表

class A():
    def __getitem__(self, index):
        import numpy as np
        tmp = np.random.randn(9,2)
        return tmp[index]
a = A()
  • 切片访问
a[1:3]   #output:
array([[ 0.7020495 , -0.70795646],
       [ 1.56645361, -1.24962575]])

这种技巧常用来封装训练数据集

import torch
from torch.utils.data import Dataset

class TIMITDataset(Dataset):
    def __init__(self, X, y=None):
        self.data = torch.from_numpy(X).float()
        if y is not None:
            y = y.astype(np.int)
            self.label = torch.LongTensor(y)
        else:
            self.label = None

    def __getitem__(self, idx):
        if self.label is not None:
            return self.data[idx], self.label[idx]
        else:
            return self.data[idx]

    def __len__(self):
        return len(self.data)
  • 如何封装数据集

训练集样本特征: train.shape #(1229932, 429)
训练集标签: train_label.shape #(1229932,)

实例化定义数据集并访问

data = TIMITDataset(train, train_label)
data[1:3] #访问第二个和第三个样本
data[1] #访问第二个样本

这样就能愉快的把样本特征与标签封装在一起,欢迎关注公众号,更多精彩等着您

你可能感兴趣的:(python)