动手学深度学习Pytorch版本学习笔记 Task 09

1.目标检测基础

目标检测基础主要注意关于输入输出数据问题:
两个术语:
(1)真实边界框(ground-truth bounding box):通俗讲,ground-truth bounding box也就是人工对数据集标注的边界框,也就是y_labels
(2)锚框(anchor box) :anchor box是要计算的边框数值,也就是y_predict(最后计算和y_labels的loss)
有以下几个主要参数: 输入图像高h, 宽W, 大小为s(0~1), 宽高比为r>0。再利用r计算anchor box的宽高  MultiBoxPrior作用是生成输入的batch的数据集的anchor box,形状为(1, num_anchors, 4),这里形成anchor box数量为hw(n+m-1), 这里的n为图像的大小size,m为图像的宽高比r。 这里的4维是(左上x,左上y,右下x,右下y)

2.图像风格迁移

方法

用一个例子来阐述基于卷积神经网络的样式迁移方法。首先,我们初始化合成图像,例如将其初始化成内容图像。该合成图像是样式迁移过程中唯一需要更新的变量,即样式迁移所需迭代的模型参数。然后,我们选择一个预训练的卷积神经网络来抽取图像的特征,其中的模型参数在训练中无须更新。深度卷积神经网络凭借多个层逐级抽取图像的特征。我们可以选择其中某些层的输出作为内容特征或样式特征。以图9.13为例,这里选取的预训练的神经网络含有3个卷积层,其中第二层输出图像的内容特征,而第一层和第三层的输出被作为图像的样式特征。接下来,我们通过正向传播(实线箭头方向)计算样式迁移的损失函数,并通过反向传播(虚线箭头方向)迭代模型参数,即不断更新合成图像。样式迁移常用的损失函数由3部分组成:内容损失(content loss)使合成图像与内容图像在内容特征上接近,样式损失(style loss)令合成图像与样式图像在样式特征上接近,而总变差损失(total variation loss)则有助于减少合成图像中的噪点。最后,当模型训练结束时,我们输出样式迁移的模型参数,即得到最终的合成图像。

Image Name

你可能感兴趣的:(神经网络,深度学习,人工智能)