关于机器人状态估计(7)-感知真的需要那么重吗?

今天这篇是近期工作的一个思考,有待完善。

同时非常偏商业,技术干得再好不也还是得考虑吃饭问题撒。。。总体不是太务虚

首先从个人立场来说,我并不是一个L4自动驾驶的拥护者,但是对无人驾驶(尤其是特定行业的)我很认同。

现在总体机器人状态估计领域,具备以下的一些基本情况:

1.复杂场景感知端极重,一般都以一个或多个线扫雷达,结合强算力平台与一大堆的视觉传感器完成。先不讨论成本,这一系列基础设计使SLAM在复杂场景落地的时候,全局和本地处理都极其复杂,尤其是地面场景。(空中略好又受限于非常麻烦的低空许可与安全性)

2.SLAM学界开始变得越来越卷,向着越来越复杂的领域一去不回头,语义地图语义分割,GAN和LSTM的导入,更多复杂的线/面特征处理,集群控制与协同。慢慢已经到了越来越阳春白雪,越来越多人听完想死的阶段,和AI领域大量交叉。

3.未来有很大的可能性,UAV会卷掉大量场景,不能说危言耸听吧,举个很简单的场景巡检就是一个几乎能被完全干掉的场景(在电网电力已经开始了)。

4.学术与工业界的GAP并没有变得越来越小,而是越来越大。

我的一些想法:

1.机器人应该是循序渐进的,DJI再炫酷的无人机本质上也是人类的一个玩具,人类并不应该一步跨越作为一个被取代的对象。发展应遵循辅助-->半自动-->部分全自动的路径。

2.这里举一个很弱智的例子(清结工具),扫把与拖把从一开始就是人类的辅助工具,我们已经用了上千年;全自动扫地机器人经过过去9年的发展,因为场景的极其简单,已经完整的完成了自动化。但是在这种情况下,为何蒸汽拖把这个奇奇怪怪的半自动的东西,每年还有如此之高的销量呢?价格还不便宜(900-2800元)。其实原因非常简单(1)再自动还是有些地方弄不干净引起洁癖类主妇不满(2)蒸汽拖把好玩,像我这种懒汉也愿意用

3.这里就带出一个很有意思的思路了,DJI的UAV再炫酷再多高科技,其本质无外乎给人类提供了难以想象的顶上视图可玩性。那在机器人整体发展路径中,我们应该思考的到底是什么呢?首先乐森机器人这样非常特别的例子先排除。。。我觉得(1)让我们更懒(2)更好玩,让乏味的事变有趣(3)替代掉危险和我们完全不愿意做的事。

基于以上3点,只有场景(3)适合全自动,而场景(1)和(2)大有可为啊!前途无量啊!兄弟姐妹们!

SOLUTION:

场景(3)问题讲过了,无法展开探讨,展开能写5万字。

聊一下场景(1)(2),稍微涉及一点技术,看不懂的我觉得也没资格做这行:

场景(1)(2)部分的规划与控制相对(3)来说简单太多,如果从比如工具/助手类业务的机器人,或纯辅助的角度看,感知层几乎只需要一个摄像头加一个32位SOC就能搞定了,业务形态非常丰富。但是这样的东西未来门槛太低,很容易陷入红海竞争,可玩性也一般般,通常就是个遥控玩具,能做点趣味小动作,再来个跟随啥的。

这里重点提一下半自动的远控机器人,这里有一个非常标准的例子,DJI,尤其是近期的阿瓦塔,近乎极致的设计(这玩意包含的技术积累太多,勿效仿,绝大部分单位没这个本事)。这一类机器人能够极好的满足场景(1)偷懒(2)高可玩性,这一类机器人,往往不需要使用激光雷达,因为有这个强大的操作载体,用有强大能力的VIO/VDIO或者更低端一点的VSLAM组件结合不错的64位算力平台即可实现全能力,传感最多也就是涉及全局快门/卷帘快门相机,深度相机和IMU,或轮速计/rtk这一类耦合即可解决。同时这类设备与设计作为的能力的衍申,完全不需要过多的考虑全局地图,以及全局地图与本地建图的深度耦合,完美避开了SLAM真正内卷的部分。

这类机器人必须要深度的考虑传输问题,要比较懂通信(如近场Mesh/Wisun这些),如果涉及跨互联网的管理和操作还需要考虑云端延时等问题,但是相对恐怖和深度内卷中的SLAM,这些知识并不是商业落地的障碍。

当然这类机器人我并没有太多具体的想法(其实有一堆并涉及一堆行业,但是涉及伙伴们的商业秘密自然是不能提),但是这个方向一定是光明,广袤与充满前景的。

你可能感兴趣的:(VIO与多传感器融合融态,机器人,人工智能,计算机视觉,图像处理)