视觉面试题

  • 训练决策树的参数是什么

  • 在决策树的节点处分割的标准是什么

  • 基尼系数的公式是什么

  • 熵的公式是什么

  • 决策树如何决定在哪个特征处分割

  • 你如何用数学计算收集来的信息?你确定吗?

  • 随机森林的优点有哪些

  • 介绍下boosting算法

  • gradient boosting如何工作

  • 关于adaboost算法,你了解多少,它如何工作

  • SVM中用到了哪些核?SVM中的优化技术有哪些

  • 介绍下无监督学习,算法有哪些

  • 在k-means聚类算法中,如何定义k

  • 告诉我至少3种定义k的方法

  • SVM

    • 线性SVM
      • 最优化问题:
      • 对偶优化问题:

        由以上求得对偶优化问题的解为
      • 合页损失函数:
      • 原问题的解:
    • 非线性SVM:
      • 非线性支持向量机是在对偶优化问题的基础上引进核函数得到的,表达式如下:

        由以上求得对偶优化问题的解为
      • 计算得
      • 决策函数:
      • 常见的核函数:
        1、多项式核函数:
        2、高斯核函数:
        3、字符串核函数:$$
    • 序列最小最优化算法
  • L1范数和L2范数的区别
    以线性回归为例,损失函数加入L1称为lasso回归,损失函数加入L2的称为ridge回归。
    L1正则化是指权值向量中各个元素的绝对值之和,L2正则化是指权值向量中各个元素平方和再开方
    L1正则化可以产生稀疏解,用于特征选择(某种程度上也能防止过拟合),L2正则化可以防止过拟合(使模型参数变小,提高模型的抗干扰能力)

  • Mask R-CNN

    • Mask R-CNN扩展自 Faster R-CNN,Faster为流行的目标检测框架,Mask将其扩展为实例分割框架。
    • Mask是一个两个阶段的框架,第一个阶段扫描图像并生成提议(proposals),第二阶段分类提议生成边界框和掩码。
    • Mask通常以ResNet50或ResNet101+特征金字塔网络(FPN)作为主干网络。FPN引入了额外的复杂度:在FPN中第二个金字塔拥有一个包含每一级特征的特征图,而不是标准主干网络中的单个主干特征图(第一个金字塔中的最高层)。选用哪级特征是由目标的尺寸动态决定的。
    • RPN:一个轻量级的神经网络,它用滑动窗口来扫描图像(主干网络的特征图),并寻找存在目标的区域,RPN有两个输出,分别为:1)anchor类别:前景或背景;2)边框精调:通过评估delta输出(x, y, 宽, 高的变化百分数)以精调anchor box来更好地拟合目标。这样我们可以选出最好的包含目标的anchor,并对其位置和尺度进行微调。
    • ROI分类器和边界框回归器
      这个步骤是在RPN提出的ROI上运行的。该步骤同样有两个输出:1)类别:ROI中目标的类别;2)边框精调:和RPN类似。
    • ROI池化:
      由于RPN生成的ROI可以有不同的尺寸,但是分类器只能处理固定尺寸的输入,为了解决这个问题,Mask R-CNN的作者提出了ROIAlign,采用双线性插值进行裁剪。
    • 分割掩码:
      前面的步骤正是用于目标检测的Faster R-CNN。而分割掩码网络正是Mask R-CNN的论文引入的附加网络
      掩码分支是一个卷积网络,以ROI分类器选择的正区域为输入,训练过程中将真实的掩码缩小,产生低分辨率掩码(28*28),但是这个掩码是由浮点数表示(软掩码)相对于二进制掩码有更多的细节。预测过程中将掩码放大为ROI边框尺寸,以给出最终的掩码。
  • FCN

    • 不含fc层的全卷积网络,可接受任意大小的初入
    • 增大特征图尺寸的反卷积,能够输出精细的结果
    • 结合不同的深度层结果的跳级结构,同时确保鲁棒性和精确性。
      特征点匹配错误的解决方案
      回环检测
      OpenCV边缘检测算法
      相机位姿的计算
      点云
      特征操作子(SIFT)
      KMP算法
      最小二乘法和随机梯度下降

你可能感兴趣的:(视觉面试题)