[论文笔记]Visual Discovery at Pinterest

导读
准确来说,这篇Paper严格上算不上论文,没有什么贡献点。通篇说的就是Pinterest这APP的pipeline,如何利用各种特征进行图像检索。所以今天不打算详细的讲解,仅仅列举一些有趣的发现。

中低层特征效果更好。

如下图,文中做了大批量的实验,然后发现用中低层的特征表征图像时,效果更好。当取原始的raw特征时,ResNet-152的Pool5效果最好。并且当取二值化时,VGG16的FC-6层表现最好。然后作者发现一个有趣的现象,二值化时,ResNet-152的Pool5层效果大大下降。作者推测其原因是,Pool5层是对上一层的ReLu输出进行平均池化,而ReLu的输出是大于等于0的,对ReLu的激活值进行池化,会得到大于0的特征,而对这些特征进行二值化的时候,每个点都会变成1。


[论文笔记]Visual Discovery at Pinterest_第1张图片
特征层选取
二值化提高AlexNet和VGG16在检索中的表现。

作者发现,对AlexNet和VGG16的特征进行二值化时,发现检索的效果提升了。


[论文笔记]Visual Discovery at Pinterest_第2张图片
VGG16二值化

然后作者还发现,二值化更利于干净的分离噪声图像和真实图像,而raw特征却把他们聚类在一起。


[论文笔记]Visual Discovery at Pinterest_第3张图片
二值化

最后贴一个Pipeline


[论文笔记]Visual Discovery at Pinterest_第4张图片
image.png

你可能感兴趣的:([论文笔记]Visual Discovery at Pinterest)