计算机视觉任务

基于深度学习的目标识别

http://www.sohu.com/a/196999210_390227

图像分类

https://www.cnblogs.com/nowornever-L/p/6392577.html
腾讯QQ空间超分辨率技术TSR:为用户节省3/4流量,处理效果和速度超谷歌RAISR

项目细节:
1)googlenet和inceptionv3的区别;
在GoogLeNet出来之前,主流的网络结构突破大致是网络更深(即层数增加),网络更宽(即神经元数目增多),但这样做存在一些缺点:

当训练集有限时,参数过多,模型会出现过拟合;
网络越大,计算复杂度越大,设计起来越困难;
当层数增多时,梯度越往后越容易消失;

v3一个最重要的改进是分解(Factorization),将7x7分解成两个一维的卷积(1x7,7x1),3x3也是一样(1x3,3x1),这样的好处,既可以加速计算(多余的计算能力可以用来加深网络),又可以将1个conv拆成2个conv,使得网络深度进一步增加,增加了网络的非线性,还有值得注意的地方是网络输入从224x224变为了299x299,更加精细设计了35x35/17x17/8x8的模块。
2)RNN如何处理文本;
3)数据清洗和文本聚类
4)交叉熵推导
5)xgboost

你可能感兴趣的:(计算机视觉任务)