计算机视觉——期末复习(简答题)

1、计算机视觉与机器视觉的区别

计算机视觉是利用计算机实现人的视觉功能,即对客观世界中三维场景的感知、加工、解释,侧重于场景分析和图像解释的理论和方法,而机器视觉更关注通过视觉传感器获取环境的图像,构建具有视觉感知功能的系统,以及实现检测和辨识物体的算法。

2、欧氏距离、城区距离、棋盘距离区别

欧氏距离给出的结果最准确,但计算时需平方和开方运算,计算量较大。城区距离和棋盘距离为非欧氏距离,不需平方和开方运算,计算量较小,但结果有一定误差。距离的计算只考虑图像中两个像素的位置,不考虑两个像素的灰度值。
3、USAN判断方法原理

将模板中各个像素都与模板中心的核像 素的灰度进行比较。当圆形模板在亮区域(目标区域)和暗区域(背景区域),USAN最大。当圆形模板1/4在暗区域,USAN最小。当圆形模板1/2在暗区域,为边缘点USAN为最大值一半。USAN面积超过一半时,核像素处于图像中的灰度一致区域

4、Hough变换的基本原理

利用点与线的对偶性,将原始图像空间的给定的曲线通过曲线表达形式变为参数空间的一个点.把原始图像中给定曲线的检测问题转化为寻找参数空间中的峰值问题;即把检测整体特性转化为检测局部特性.如直线,椭圆,圆,弧线等

5、直线检测原理

一条直线由两个点A和B确定(笛卡尔坐标);y=kx+q写成关于(k,q)函数表达式q=-kx+y;变换后的空间为Hough空间,即笛卡尔坐标系中一条直线对应 Hough空间的一个点;反过来同样成立。步骤:(1)对参数空间中参数p和q的可能取值范围进行量化,根据量化结果构造一个累加数组A(pmin : pmax , qmin : qmax),初始化为零;(2)对每个XY空间中的给定点让p取遍所有可能值,用q==px+y计算出q,根据p和q的值累加A,即A(p, q) = A(p, q) + 1 (3) 根据累加后A中最大值所对应的p和q,由y=px+q确定出XY中的一条直线

6、位置直方图检测原理 (横向直方图

位置直方图:将图像向多个轴投影,并对像素灰度求和而得到的直方图。假设图像中有多个分开的目标,将每个目标分别向水平方向和垂直方向,进行投影叠加,可分别获得一个水平直方图和一个垂直直方图。从这两个直方图向目标区域进行反投影,就可确定出各个目标的位置。实际中,根据两个直方图分布情况可检测出图像中的目标。

  1. 最稳定区域的三个因素

最稳定区域:从目标种子出发,用区域生长策略产生一系列(嵌套的)周围区域。区间差距大+区内接近+有一定尺寸。因素(1) 这个区域与其外部周边区域之间是否有很高的对比度 (2) 这个区域内部是否只有很低的对比度(即很平滑)(3) 这个区域的面积不能太小,否则噪声影响过大

8、目标分割的目的语义分割与实例分割的区别

目标分割:指将感兴趣的目标区域从图像中分离并提取出来,即图像分割;计算机视觉领域,图像分割指将数字图像细分为多个图像子区域(像素的集合)的过程。简化或改变图像的表示形式,使图像更易理解和分析。图像分割常用于定位图像中的物体和边界(线、曲线等)。图像分割是对图像中的每个像素加标签的一个过程,这个过程使得具有相同标签的像素具有某种共同视觉特性。

  1. 主动轮廓模型的步骤原理

一种基于边缘信息的目标分割方法。主要原理:通过构造能量泛函,在能量函数最小值驱动下,轮廓曲线逐渐向待检测物体的边缘逼近,最终分割出目标。先在图像创建一条初始曲线,形状不拘,但需将目标 物体轮廓线包在内测;建立“能量方程式” ,包括规范曲线形状为目的之“内部能量” ,及规范曲线与目标物体轮廓线接近程度之“外部能量” ;在运算过程中,最小化内部能量可令曲线持续向内部紧缩并保持平滑;最小化外部能量则可令曲线持续贴近目标物体轮廓线而到达一致位置

11、均移确定聚类中心

首先随机选择一个初始的感兴趣区域(初始点)并确定其重心,接下来,搜索该区域周围点密度更大的感兴趣区域并确定其重心,然后将窗移动到新重心确定的位置,这里原重心和新重心间的位移矢量对应均移,重复上面的过程不断将均值移动直到收敛。这里最后的重心位置确定了局部密度的极大值,即局部概率密度函数的最频值。

13、目标表达与描述的区别

目标的表达和描述:实现对图像分割得到的区域中的感兴趣的目标的几何性质进行定性或定量的表示和描述。目标的表达侧重数据结构;目标的描述侧重目标的区域特性和不同区域之间的联系与差别。

14、LBP含义、检测过程、核心思想

思想:以中心像素的灰度值作为阈值,与他的邻域相比较,得到相应二进制码来表示局部纹理特征

过程:根据相邻像素点与中间相邻点相比的大小确定值为1或0(相邻像素值>=中间像素值,为1;<为0);对每个像素点邻域信息进行整合,变为邻域各位的数的编码;然后对一个块中所有像素编码进行直方图统计,得到LBP特征。

15、模式分类原理

对一个未知模式x来说,如果将它代入所有决策函数算得d i (x)值最大,则x属于第i类。如果对x的值,有d i (x) = d j (x),则得到将类i与类j分开的决策边界:dij(x)=di(x)-dj(x)=0。d ij (x) > 0,则模式属于类s i ,反之,属于类s j 。通过构造一个分类函数或分类模型将数据集映射到某一给定类别中,即对具有给定特征的样本通过分类器进行分类

获取信息-->预处理-->特征提取-->构建分类器-->决策输出

利用图像差的运动检测:序列图像中,通过逐像素比较直接求取前后两帧图像之间的差别;假设照明条件在多帧图像间基本不变化,那么图像之间的差别就有可能是运动的结果。

  1. 帧差法

基本思路:通过对视频序列中两帧(或多帧)图像进行差分运算来提取运动目标的轮廓。

原理:(1)求两帧图像中每个对应像素差的绝对值(像素灰度值差),得到帧差图像

(2)帧差图像进行二值化处理:两帧图像中的某像素灰度值差大于设定阈值将该像素点判定为前景(运动目标)的部分,即前后时刻的两图发生变化的地方;其像素灰度值差小于设定的阈值,将该像素点判定为背景部分,即未发生变化;判定为运动目标部分的像素点全体,组成当前观测图像帧上较为完整的目标形状及其大小和位置信息。

关键帧提取

原理:将两帧图像进行差分,得到图像的平均像素强度可以用来衡量两帧图像的变化大小。基于帧间差分的平均强度,每当视频中的某一帧于前一帧画面内容产生了大的变化,便认为是关键帧,将其提取出来。

流程:取视频,依次计算每两帧之间的帧间差分,得到平均帧间差分强度;提取关键帧(使用差分强度的顺序,使用差分强度阈值,使用局部最大值)

  1. 背景差分法(静止场景进行运动分割的通用方法

将当前获取的图像帧与背景图像做差分运算,得到目标运动区域的灰度图,对灰度图进行阈值化提取运动区域,

为避免环境光照变化影响,背景图像根据当前获取图像帧进行更新。受场景环境变化、光照、天气和外来因素的干扰,需定期、实时、或按某种规则对背景模型进行更新,所以背景模型的更新策略也是背景减法的关键环节之一。

原理:(1)建立视频序列的背景模型图像;(2)求当前帧图像与背景模型图像对应像素的像素灰度值差(3)对当前帧差图像进行二值化处理(若两帧图像中对应位置的像素灰度值差大于设定的阈值,将该像素点判定为前景(运动目标)的部分;若其像素灰度值差小于设定的阈值,将该像素点判定为背景的部分。所判定为前景目标的所有像素点,组成了当前帧(观测)图像上较为完整的目标形状和位置信息。(4)按照某种规则对背景模型进行更新。

背景建模

1)单帧抽取法

直接抽取视频序列中某一帧图像作为背景模型图像(,)的方法。通常用于能够确定在某段时间内该帧作为背景参考图像时,能够检测出临时出现的运动目标,多用于背景连续一段时间不会变化的场景。

2)多帧统计平均法

统计平均法是指从视频流中取连续的多帧图像,并通过对多帧图像中各像素点的灰度值求平均值,来获得一幅新图像作为背景模型图像(,)的方法。统计平均法假设:尽管背景部分的某些点有时会被前景目标遮挡,但在大部分时间里,可认为背景部分的图像都是不变或是缓变的。

3)中值法

指从视频流中取连续的多帧图像,并通过对多帧图像中同位置像素点的灰度值进行排序,然后分别取其中值作为背景图像中相应位置的像素灰度值,也即背景图像的各像素灰度值由序列图像对应像素点的灰度值的中值来确定。

4)基于模型的方法

基于模型的方法分为单模态高斯背景模型法和多模态(混合)高斯背景模型法

你可能感兴趣的:(复习,计算机视觉,人工智能,python)