笔记:Deep multi patch aggregation network for image style, aesthetics and quality estimation
在Imagestyle,aestheticsandqualityestimation三类任务中往往需要依靠更多的高像素(highresolution)图片中的细纹理(fine-grained)信息。通常CNN网络的输入是256*256*3的尺寸,通常的做法是,通常的做法是将一个高像素(比如1024*768)图片随机裁剪为一个patch,用这个patch表示整幅图像,这样会丢失掉其余部分的细纹理信息