<2012 11 30> 导航的图像技术 一、引言

一、引言

       1.1  移动机器人与AGV

移动机器人的移动最终目标是实现人类式的完全自主化导航,这不仅牵涉复杂的外部环境感知和处理,也牵涉人工智能(AI)的过程,从该领域技术的近几十年发展和现状来看,这个目标依然很遥远。Durrant等(1991)提出自主移动机器人的三个基本问题:“Where am IWhere to goAnd How?”,并且提出了著名的SLAMSimultaneous Localization and Mapping)模型,该模型需要同时解决定位和地图构建的问题。完全自主的移动机器人在未知环境中(事先并没有环境的地图信息),一方面需要建立环境地图(表示环境的信息),一方面需要在这个环境中定位自己。而一般来说,机器人如果需要精确的确定自己的位姿则它需要表示周围环境的精确地图,如果需要建立精确的环境地图则它需要事先知道自己精确的位姿。这个问题又被称作CMLConcurrent mapping and localization)问题。在最近的重要文献(Dissanayake2001Durrant 2006Abrate2007)中,提出了解决这个问题的可能途径“holy grail”

实践中,AGVAutomatic Guide Vehicle)的导航技术有很多种,根据不同的分类标准将它们进行分类,有助于对不同技术的宏观理解。据导航的自主化程度,即对外部特定标识的依赖性程度来看,可以分为自主式的地图匹配导航、半自主式的信标定位导航、和非自主的标线跟踪导航。他们都需要依赖外部提供的先验环境信息,不属于完全自主的SLAM/CML模型,但是也一定程度上解决了移动机器人的导航问题。

其中,地图匹配导航需要建立一种环境模型,典型的模型有几何特征地图、栅格地图、拓扑地图。几何特征基于对环境的点、线、面等元素的描述与抽取,并根据这些特征在机器人的数据库中进行匹配。这种问题在数字图像处理中又被成为“特征检测与跟踪”,研究人员提出了很多种特征描述与抽取方法,其中基于尺度不变特征(SIFT)(Lowe 2004)及其变体的方法很受重视,该方法描述和抽取的特征能够在图像尺度(Scale)变化的情况下保持不变性。在实际应用中,由于地图匹配的导航方法需要大规模的数据和计算支持,难以应对实时和动态挑战,在计算机存储和计算技术都不足的当前条件下,更增加了实用难度。

        半自主的信标定位方法利用机器人的传感器测量相对于环境中坐标已知的信标的距离或者角度,根据几何方法确定机器人本身在环境中的当前位姿和需要到达的目标位姿,再根据路径规划方法获取一条到达目标的运动路线,等于自主解决了”How to go”的问题。这种方法常用的有激光导航、超声波导航、GPS导航等。实践中,这种方法已经趋于成熟,例如许多欧美公司的高性能AGV都使用激光导航。

        非自主的标线跟踪导航需要完整的外部导航标识,路径信息不仅给出了当前机器人的坐标信息,并且给出了达到目的地的先验规划路径。机器人只需要跟踪路径和获取路径上的坐标信息便可以实现完整的导航过程。这是在具体的移动机器人应用如AGV上最早实现、也是最成熟的方法。具体的路径和坐标信息可以由不同的媒介承载,由设置在AGV上的传感器识别和处理,比如电磁路径(按路径铺设的导线上的电流产生的磁场)、光电反射路径、磁珠路径。

        图像处理跟踪路径是一种研究较多的方法,其相对于其他的路径跟踪方式,优势在于灵活、路径修改方便、扩展性好。像电磁、磁珠之类的路径铺设往往需要埋设在地面以下,更改比较困难,图像处理所跟踪的路径只需要在地面上涂颜色线条或者贴颜色纸,由图像传感器(如CCD、CMOS)获取、采样量化为数字图像后,由计算机进行存储和处理。图像处理技术是更高级别导航技术的基础,识别路径之外,可以处理和识别更高层的信息。图像技术的灵活性、多样性带来的很多的挑战,主要有算法、干扰和噪声、巨大的数据量和计算量等。

 

        1.2 数字图像处理技术介绍

        数字图像处理技术的发展有悠久的历史,在计算机诞生的早期就有这方面的研究和实验。但直到最近的几十年,计算机的存储和运算能力大幅度提高以后,这种技术才逐渐受到了人们的重视和实践。

        根据Gonzalez等人的观点,数字图像处理技术包含的内容相当广泛。首先是作为“图像”的本身的概念,传统的图像指的是电磁波中能够被人眼识别的“可见光”区段形成的视觉对象,该对象是一个f(x,y)的平面场,而广义的图像技术这包含从红外线到伽马射线的宽泛的电磁波频段、以及超声波、电子显微镜(德布罗意效应)、计算机产生的图像。能够表示成平面场的外界信息都可以运用图像处理技术。

       其次,是图像处理的技术层次,Gonzalez将其分为低级、中级、高级三个层次,这是由于作为“计算机视觉”这一“视觉”与“人工智能”交叉的领域。视觉作为人类最重要的感知方式,往往提供了许多智能的模型。“低级处理包括原始操作,如降低噪声的图像预处理、对比度增强、图像锐化和艺术处理等。低级处理的特点是其输入和输出都是图像。图像的中级处理涉及诸如分割这样的任务,即把图像分为区域或对象(特征),然后对对象进行描述,以便把它们简化为适合计算机处理的形式,并对对象进行分类、识别。中级处理的特点是,输入通常是图像,但是输出的则是从这些图像中提取的属性(如边缘、轮廓、区域以及单个对象的特性)。最后,高级处理通过执行通常与人类视觉相关的感知函数(如AI领域的一些模型、函数),来对识别的对象进行综合处理与确认。”

        可以看出,AGV图像导航需要识别标志线的信息,比如路径直线或曲线或者其他标识信息,并从中提取导航数据,这属于中级处理的层次。

 

参考:Gonzalez 《Digital Image Processing Technology》、《Digital Image Processing Using MATLAB》 2005

        Henri Maitre 《Le traitement des images》 2006

        Teddy Yap, Jr.  Mobile robot navigation with low-cost sensors. 2009

        视觉导航的轮式移动机器人运动控制技术研究 2011

 

 

 

 

你可能感兴趣的:(2012)