2016.3.29 近些年的研究进展以及相关小问题。

近些年的研究进展以及还有的一些小问题。

 

1998年,MNIST诞生了,于是大家都在刷MNIST,直到ImageNet,一千六百万张图片,两万类别,其中的一个子集ILSVRC包含一百二十万张图片和1000类别,validation有五万张图片,test有十五万张图片。

 

2012lrmd出现了,15.7%的准确率已经比去年提升了九个百分点。这是2012年。

 

同年,KSH这篇论文提出的方法到达了top1 63.3%的准确率,top5达到了847%的准确率。因为在一幅图片中,可能有多个物品,不能说识别了一个其他的就错了,所以采用最高的五种可能的分类进行判断,这样能够更加准确。

KSH采用了多种方法。比如说crop,一个尺寸不规则的图片来说,将图片缩放成短边的长度为256,然后截取中间部分,成为256 x 256,随即crop224 x 224的结果;再有比如说l2 regulationdropoutmomentum

 

2013年,记录有被刷新了,GoogLeNet达到了93.33%的准确率。非常牛逼的结果啊。不过人呢?

 

经过科学家们的研究发现,一个训练后的专家错误率大约是5.1%,当然还有很多不同的相关研究。

 

随着数值的刷新,越来越高的准确率带来了我们新的思考,比如说adversarial images这个问题,随机打乱一些点点,或者加入一些白噪声,网络马上就开始跪了。但是我们理解不能。所以尽管数值上我们越刷越高,但是确实我们对于网络的理解相当不够。还需要继续的深入研究。

 

也许大部分人的研究都是没有什么效果的,甚至都不会有人引用,但是确实有一些真正有意义的东西值得我们去关注。

你可能感兴趣的:(2016.3.29 近些年的研究进展以及相关小问题。)