旷视科技(Face++)面经

一面:

 

介绍一下项目(你参与度最高的)


:Pooling知道吧?我们在做cv的时候,图像经常是不同size的,我们在训练的时候经常通过crop图片取得同size的输入数据。但是训练的时候,输入是整张图,【这样会造成什么后果呢?】用没有什么办法可以解决这个问题呢?即测试的时候如何有效利用整张图的信息?

 

答:测试的时候也crop,每个croped图片有一个预测结果,通过投票的形式得到最后结果。

 

问:因为crop是overlapping的,这种方式会造成在部分图片区域上的重复卷积,增加计算复杂度,有没有办法解决这个问题?

 

答:在卷积输出层,也就是fc层前进行crop(但是网络结构不能改变)

问:怎么做呢?举个例子,原来是8x8x128的卷积输出层,换成全图之后,是10x12x128的卷积层,怎么连接到fc1层(假设是20维的)?

 

答:(在提示下)用20x8x8x128(n,c,h,w)的卷积核对10x12x128的map进行(s=1,p=0)的卷积,其实就相当于crop,得到fc1为20x3x5c,h,w的输出

 

问:但是此时fc1层改变了(从20编程20x3x5, fc2层与之的连接也就失效了, 怎么解决?

 

答:(在各种提示下,提醒:搞DeepLearning的,卷积计算一定要熟练啊)用5x20x1x1的卷积核再操作,得到5x3x5的(这里卡住了)输出结果

要得到一个五维的输出向量,对3x5区域做一个平均就可以了(每个channel是3x5=15个结果,即对卷积层输出卷积操作得到3x5个不同feature预测的结果,就是15个crop对应的结果)

 

问:为什么选InceptionV3

答:实现方便,top1正确率和其他比较新的模型差不多

 

问:有看过他们的输入么?inception用的是299x299 resnet用的是224x224,大size的一般都要比较好,所以Inception好是正常的,但是输入不一样,不能直接比

 

这个东西叫FCN测试,可以看看

 

 

编程题:

一维pooling(先avg后max), 考虑时间复杂度和算法复杂度

暴力循环,时间复杂度nk

用前一次循环的结果,时间复杂度 n

 

 

二面

 

问:介绍一下研究背景?

答:研究背景?

问:都做过哪些研究?

答:哦哦 从大四毕设讲起

问:你这个双目匹配讲一下,你做了啥?

答:。。。。恩恩,我现在在做这个视差,用patchmatch

问:深度和视差的关系是什么?推导一下

答:卡住了。。。 是通过相似三角形的关系,

问:相似三角形在哪里?

答:画半天。。。。)提示下做出==太久没做了,忘了

 

问:那其他项目,风险预测这个项目,特征是几维的,

讲一下SVM,SVM的原理?

答:最大间隔

问:最大间隔是什么,SVM的损失函数具体形式?SVM的参数和超参数?

 

编程:

递归输出下列长度为2^n的矩阵(每个矩阵由四部分组成),矩阵满足以下条件:

右下角部分全为0,其他部分等于上一阶段的矩阵

N=0,            1

N=1,            1 1

                    1  0

N=2,            1 1 1  1

                    1 0  1  0

                    1 1  0  0

                    1 0  0  0

 

三面:

说一个你自以为最突出的点(假设现在有10个候选人,我为什么选你)

说一个你没有写在简历里的优点

(xx项目,做到了72%的准确率)这个问题的极限解有多高?评估你最好能把这个问题做到什么程度?

就是让你说一下可以改进的点,改进的投入是多少?reward有多少?

 

把reward量化出来(可以提升几个百分点的accuracy?)

(其实就是想问你的改进方案,以及改进之后带来的提升,结果自己一直纠结在如何量化提升的百分点上==

 

【有的时候我们可以估计,有的时候我们还是得估计,从解决问题的开始阶段就要评估,看看我们究竟能做到什么程度】

 

问题:

a,b ~i.i.d~ U(0, 1)

求E(maxa, b)

用几何思想求解

 

 

 

你可能感兴趣的:(旷视科技(Face++)面经)