主要介绍用于实现感知自主层的理论。
感知是在观测的基础上理解环境的过程,也通常是一个模型构建的过程。
虽然定位技术使机器人的移动成为可能,但是环境感知能够使系统对外界激励产生智能响应——即使环境与所有预设情况都不同。
通常,只有通过感知,机器人才能自然地表现出足够智能的行为。
在本书中出现的计算机视觉算法分为以下三类:
主要处理摄像头数据或图像测距传感器数据,部分重要算法包括:
在最基本的图像处理之上,做进一步的处理。部分重要算法包括:
在基本的图像处理和计算机视觉几何之外,再进行一些额外的处理。往往包括先验知识,复杂的概率模型或搜索过程,或两者兼有。部分重要算法包括:
像素分类:将每个像素分配到场景中的不同地物类型中,对路径跟踪时的道路选择,避障时的障碍物识别非常有用。
高通滤波算子能增强信息中的高频信号,并抑制低频信号。当高频信号是我们关注的主要信息时,就要用到高通滤波。如果噪声中也包含高频信息时,那么噪声也会被高通滤波算子放大。
使用中心差分方法可以从激光雷达的城市道路点云数据中探测出各边缘。
对二维图,一个著名的中心差分算子是索贝尔算子,索贝尔算子是一个3×3模板,它生成一个向量值输出。更复杂的边缘检测算法会搜索梯度方向上一阶导数的局部最大值。
对信号进行低通滤波算子是为了增强低频信息,同时抑制高频信息。当对信号中的低频信息感兴趣时,就会用到低通滤波算子。当信号中存在高频噪声干扰,低通滤波算子会倾向于抑制高频信息。
在信号处理中,求导运算可以增强高频信息,反之,积分运算则会增强低频信息,因此低通算子更接近于积分运算。
最简单的高频滤波方法就是围绕该点的邻域均值代替其实际值。
如果希望利用变尺度掩膜对一幅图像进行多次滤波,那么通常可以定义一个递归图像金字塔。
为对接近邻域中心的信号值赋予更高的权重,因此选择使用类似高斯分布的掩膜。
信号匹配时图像处理中的另一个基本运算,其具有广泛用途:
在计算机视觉领域中,数字图像是一个二维的离散信号,对数字图像做卷积操作起始就是利用卷积核(卷积模板)在图像上滑动,将图像点上的像素灰度值与对应的卷积核上的数值相乘,然后将所有相乘后的值相加作为卷积核中间像素对应的图像上像素的灰度值,并最终滑动完成所有图像的过程。
图像处理中,平滑 模糊 去噪 锐化 边缘提取等等工作,起始都可以通过卷积操作来完成。
不同的卷积核作用于图像,可以更清晰的获取图像的某种特征,如轮廓,颜色等。
在卷积神经网络中,卷积核对输入的图像数据分区域进行卷积运算,通过运算的结果判定图像区域是否符合某种预设特征(如判断人脸,鼻子,眼睛,嘴巴)
将卷积核作用于图片,直接进行卷积运算,就会发现对于识别的特征计算出来的值非常大,对于不能识别的特征,计算的值非常小。
提取图片特征的关键是合理的卷积核。卷积神经网络训练的过程,就是提供合理的样本,让程序通过样本自动为各种卷积核给出阈值的过程。
利用模板相关计算,通过找到插头模板图像在现实拍摄图像中的位置,机器人可以定位插头的位置,以便将插头插入插座中进行充电。
与待寻精确信号进行相关计算被称作匹配滤波,广泛应用于立体视觉,特征跟踪,表面配准,甚至GPS信号处理等领域。
基于相关计算的信号匹配是使匹配标准最大化,也使误差最小化。
可以证明,最小化SSD(误差平方和)等价于相关最大化。
该运算可以看最两幅图像之间的残差平方,或者是两个面之间体积平方,也可以看做两个向量信号之间或矩阵图像之间的欧氏距离。
特征也被称为“兴趣点”,指的是图像中有区分度且具有某种特定功能的点,曲线,或者区域,主要包括:
边缘检测与(点)特征检测问题密切相关,都希望在图像中找到信号不连续性位置。
当特征被用于几何推理时,主要关心他们在图像中位置;当特征被用于分类和识别时,特征属性,如长度 纹理 曲率等则更加重要。
对应运动推理而言,主要聚集于评估图像中纹理丰富的位置的强度快速变化。
哈里斯(Harris)角点检测器通过在像素邻域内对梯度向量的加权协方差矩阵进行特征值计算(在两个特征值中,如果只有一个比较大,那么表示该区域是一条边缘;如果过两个特征值都比较大,那么该区域就是一个“角点”),可以识别出沿两个方向都有较大梯度的特征。这些特征在图像之间通常较为稳定,特别适合用于匹配和跟踪。
激光雷达在室内场景中的扫描数据包含很多直角,利用这些直角特征可用于计算机器人自身的运动或基于地图的导航。
8.1.6 区域处理
具有相对一致性的特性。特征具有位置属性,并且可能具有方向属性,而区域具有几何形状属性。常用的区域处理算法如下:
某些物体或区域会给机器人带来碰撞风险,因此需要探测机器人移动范围内是否存在障碍物并确定其位置。
与期望值的偏差:对环境特性进行强假设,那么相对于假设的微小测量偏差就可以可靠的指示障碍物,如假设环境地面时平面的;
占有率/存在概率:
颜色/组成:颜色和纹理在很多情况下是进行识别障碍物的好途径。例如,高大的绿色物体可能比高大的棕褐色物体更容易识别为树木;
密度:对应激光雷达这一类传感器,能沿着激光束的精确指向穿透叶簇,或被遮挡。在三维栅格中,通过统计阻挡激光束与被激光束穿透的栅格单元的相对比例,可以估计区域密度。当穿过与遮挡比较高时,则栅格单元中很可能是稀疏植被。但是需要高了季节变化的因素。
PCA特征值:求解散布矩阵的特征值,如果只有一个大的特征值,则表示数据可能代表场景中的一根线状物体,如果其中只有两个明显特征值,则说明数据可能代表一个二维平面。
形状:确定哪些形状是不利于车轮与之碰撞的
类:如果知道物体属于某一类,就足以断定它是否是一个障碍物
2.性能
可靠性:障碍物找全与障碍物找准的平衡;
车辆速度:在实现实时障碍物探测及实时反应的前提下对应的车辆速度上限;
意外障碍物:在某些视角存在障碍物被遮挡的情况,传感器无法探测到这些危险。有时一个非常小的突起物,就可能遮挡住位于测距阴影范围内的车轮大小的孔洞。