cs231n_深度之眼第二次作业

  1. 图像分类数据和label分别是什么 ?图像分类存在的问题与挑战?
    图像分类数据包括训练集测试集的数据,在有监督的问题中对于训练集数据来说是有label的,而测试集是等待我们去识别它的类别,不具有label。
    label就是分类标签,比如cifar10这个数据集,待分类的这10类数据我们可以写成1-10,或者0-9这就叫做label。
    图像分类存在的问题与挑战:光照,角度,形变,遮挡。
  2. 使用python加载一张彩色图片,观察像素值
    from PIL import Image
    import numpy as np
    import matplotlib.pyplot as plt
    img=np.array(Image.open('/path/.png')) #打开图像并转化为数字矩阵
    plt.imshow(img)
    plt.axis('off')
    plt.show()

如果是RGB图片,那么转换为array之后,就变成了一个rowscolschannels的三维矩阵,因此,我们可以使用img[i,j,k]来访问像素值。

print(img[1000,100,2])

  1. L1范数,L2范数数学表达式 ?这两种度量分别适用于什么情况?


  2. 描述近邻算法KNN NN算法复的杂度 为什么很少使用在图像中以及它存在的问题
    Train O(1), predict O(N)
    测试时速度慢,距离函数用在比较像素上不合适

  3. 了解cifar10数据集
    CIFAR-10数据集由10个类的60000个32x32彩色图像组成,每个类有6000个图像。有50000个训练图像和10000个测试图像。
    数据集分为五个训练批次和一个测试批次,每个批次有10000个图像。测试批次包含来自每个类别的恰好1000个随机选择的图像。训练批次以随机顺序包含剩余图像,但一些训练批次可能包含来自一个类别的图像比另一个更多。总体来说,五个训练集之和包含来自每个类的正好5000张图像。

  4. 超参数怎么选择合适(即数据集如何划分)
    数据集划分为训练集、验证集、测试集。使用交叉验证的方法找到合适的超参数。

你可能感兴趣的:(cs231n_深度之眼第二次作业)