百度2019校招计算机视觉方向

1.关于K-means聚类算法,请回答以下问题:

  1. K-means是有监督聚类还是无监督聚类?(2分)

  2. 写出将N个样本(X=(x1,…,xN))聚成K类的K-means聚类算法的优化目标函数。(6分)

  3. 请用伪代码写出聚类过程。(8分)

  4. 假设样本特征维度为D,请描述Kmeans算法时间复杂度。(4分)

答案

1, 无监督

2, 优化目标函数:F(X,K) =i=1Kj=1Ni(xj-μi)2

3, 聚类过程:

    初始化:从N个样本中随机选择K个作为初始聚类中心;

    For t=1:T(此处,T为最大迭代次数)

    将N个样本按距离最近原则分配给K个聚类中心;

    迭代更新聚类中心;

    如果达到终止条件,如全部样本归类无变化,或者样本点到聚类中心的平均距离变化率较低,则退出

4, 时间复杂度:TNKD 其中T为迭代次数、N为样本个数,K为聚类中心数目,D为样本维度

2.相机模型有哪些参数,写出三维空间点到图像坐标投影公式。镜头畸变系数有哪几种,对应畸变矫正的公式表达?

答案

相机模型的内参数重要有:主点,焦距,畸变系数。(3分)

三维空间点到二维图像的投影公式:(10分)
Alt
镜头畸变:径向畸变和切向畸变。(2分)

径向畸变矫正公式表达:(3分)
Alt
切向畸变矫正公式表达:(2分)
Alt

3.系统设计题(20分)

在自动驾驶领域,障碍物的空间位置是很重要的信息。在不具备雷达等有测距能力传感器的情况下,如何仅通过单目相机计算出地面上目标的距离

答案

采用IPM(Inverse Perspective Mapping)方法来实现,IPM投影如下图所示:

原始图像
百度2019校招计算机视觉方向_第1张图片

IPM转换后的图像
百度2019校招计算机视觉方向_第2张图片

主要有两种方式来生成IPM图像

方案一:假设地面是平的,采用直接计算单应矩阵H投影的方式。手动或自动选取图像和三维空间点对应的4组标记点,计算出原始图像到IPM变换图像的单应矩阵H。因此图像坐标系中地平面上的任一点,乘以H矩阵后都可以计算出真实三维空间下的坐标。

方案二:同样需要地面是平的假设,通过标定出相机的内参数和外参数,投影换算出图像地平面和三维空间的关系。能够给出公式推导加分。

4.目前通过卷积神经网络进行检测的方法主要分为one-stage和two-stage,分别写出了解的对应的算法。在共性上两类检测算法有哪些差异?

答案

One-stage:yolov1、yolov2、yolov3、SSD、RetinaNet(2分)

Two-stage:Fast R-CNN、Faster R-CNN(2分)

Two-stage检测算法的共性,以faster r-cnn为例,使用了复杂的网络用于每个候选区域的分类和回归;ROI pooling后的feature channels数目较大,导致内存消耗和计算量都比较大。

One-stage检测算法的共性,从网络结构上看只是多分类的rpn网络,相当于faster rcnn的第一阶段,因此one-stage主要的优势是速度快。其预测结果是从feature map回归出目标的位置及分类,有的也采用了anchor的概念。而two-stage对上述结果进行roi pooling后会进一步细化,因此two-stage算法检测精度一般相对较高。还有一种观点是,two-stage的rpn部分相当于做了正负样本均衡,这也是two-stage检测效果相对较好的一个原因。one-stage算法对小目标检测效果较差,如果所有的anchor都没有覆盖到这个目标,那么这个目标就会漏检。如果一个比较大的anchor覆盖了这个目标,那么较大的感受野会弱化目标的真实特征,得分也不会高。two-stage算法中的roi pooling会对目标做resize, 小目标的特征被放大,其特征轮廓也更为清晰,因此检测也更为准确。

上述标红,回答出一点给4分,如果回答合理,不在上述答案中也加分。

你可能感兴趣的:(总结)