面试字节跳动计算机视觉算法实习岗位

项目场景:

收到了字节跳动计算机视觉算法实习生-抖音职位的面试。
面试字节跳动计算机视觉算法实习岗位_第1张图片


面试问题:

1.首先HR让自我介绍;

2.然后让介绍自己做过的项目;
答:我做过细胞检测还有口罩检测还有一个导师的国项,这里不方便说明。
3.根据自己描述做过的项目,HR问一些项目细节,我做的项目是目标检测和缺损检测之类的。
问:YOLO和Faste-rcnn之间的区别,并且问两种算法的工作原理,
答:YOLO是one-stage检测算法,能够同时预测边框和预测类别。而Faster-rcnn是two-stage检测算法,它是分开进行着两个预测步骤。YOLO的优点是检测速度快,但是对小目标的检测效果不明显。而Faster-rcnn的检测效果比较好但是其训练和检测的时间成本过于昂贵。
问:两种目标的检测精度和训练检测速度之间的对比,并且让解释两种算法为什么同样的模型深度会产生不同的效果。
答:对于大的检测目标来说,二者的检测效果相差无几,但是对于小目标的检测来说YOLO的检测效果远远小于Faster-rcnn,YOLO比较坑的地方在于倒数第二层为全连接,后面的7*7格子不能扩张太大,不然前面的全连接要爆。格子大了,同一个格子可能会包括多个小物体,检测就不好搞了,所以导致其检测小目标效果不如Faster-rcnn。
问:YOLOV3和YOLOV5之间的区别,
答:YOLOv5在开始使用Focus替代了V3的卷积层,Focus有效的减少了训练的时间,而且V5s将其网络的深度和宽度都进行了相应的缩减,比如V5s它的算法深度是原算法的0.33,宽度为0.5。然后在损失函数的选用上也有区别。
问:SSD算法的一些基础问题,
答:SSD算法为YOLO和Faster-rcnn的结合体,分别汲取了两种算法的优点,融合了YOLO回归和Faster-rcnn的Anchor机制,相较于YOLO提升了对小目标的检测精度。
问:YOLOv3的损失函数以及它的作用,
答:有五种损失函数,包括有目标置信度误差、无目标置信度误差、检测目标中心坐标误差、检测目标宽高的误差、分类误差。
问:同样的模型深度为什么YOLO的检测效果没有Faster-rcnn的检测效果好?
答:YOLO同时检测预测框和预测类别,而Faster-rcnn是同时进行的。

算法题:

# 假设有一张黑白图像,只有01两种元素,里面有2个连通区域,一个是圆形,一个是正多边形
# 找出这两个区域并判断区域形状

思路:我想着是对图像进行遍历,然后找到前景的目标,遇到一个数字为1,对找到的目标进行坐标标注,若遇到一个数字为1,根据四联通先看下面的是不是1,然后再看上面的,左面的,右面的,递归操作。


你可能感兴趣的:(计算机视觉,面试,算法)