一些与VIO/SLAM有关又无关的杂谈

        最近比较忙,太细的技术文档没什么时间整理,后面有几篇大活,现在也都还在进行中就不支离破碎的弄了。今天主要有些想法,于是写个杂谈,方方面面吧,包括VIO和SLAM,也包括一些市场方面的事情。

        出于一些工作上的原因,往年每年会帮机构和大佬们看几百个创业的案子,今年到现在100个都没到,应该主要问题还是大环境太差;另外一方面只能说大家更加求稳,勇气和实力并存的团队越来越少了。这个月居然看到了3家用AI和机器视觉分析COVID病毒命中率的,还号称100%准确率,看了1分钟就想骂人。。。我国真的是一个sha子太多骗子不够用,最有效的创业路径可能就是这些坑蒙拐了,但是离铁窗也近,以前还能往外跑现在也不太现实了,这帮人目前高度集中在BJ,SPORE,HK和北美,离我们的生活即远也近,目标也很远大,并不仅止国内韭菜同样包括国际韭菜,祝他们旗开得胜~。 在硅谷谈WEB3.0和元宇宙很酷,同样的语境换到我们的圈子,呵呵,按不下表。

       那创业的路径是不是只有有技术就行呢?那肯定是太扯了,想法(创意)/设计/技术门槛/销售与渠道这4样,哪怕对一个初创团队来说都是必不可少的,有短板就得补全,否则在2022年开始向后的市场里会被无情的搅碎。走了一段时间如果还没挂就得强化管理供应链

      现在很强调硬科技,那什么算是硬科技呢?难道只有芯片,AI,自动驾驶?这也太扯了。。。很多东西都是硬科技,且不要说真正优秀的控制技术,软件,算法或数据结构,有时候哪怕只是一个关键的工艺,它也是硬科技。反而很多硬科技不“硬”,只是看着高大上比较容易忽悠LD或者VC罢了,随着2022年向后,这些事也会越来越多人看透,逐渐变成一些扯淡的事情。

      回到VIO/SLAM上来,从技术和市场两个角度看看:

1.先讲讲激光雷达SLAM,成本太高了,接下来几年128线的车规级应该能到小几千,但也没用。因为市场还是相对单一,同时再稠密的激光也得配视觉,无外乎哪个主,哪个辅了。

2.回到VIO,这里面最值得比较的应该是多目VSLAM,重点讲讲这2个

(1) 首先VIO并不是一个多么完美的方案,之前我也提到过多次了,尤其是在一些极端场景上,同时某些时刻也需要依赖更多的其他传感器,紧耦合本身也是个死穴。尤其是世界观,很多时候远不如激光雷达,要真正建立世界观对算力又很依赖,还有大量的事情要做。先排除掉深度学习向上的这一块,向下的部分也有太多的事情要优化。向下的这些工作我们天天都默默在做。。。目前只能说谨慎乐观吧,优化问题,有时候比解决问题都还要麻烦的多。

我本身虽然有很多正在做全自动SLAM的朋友,但是其实我觉得这个事情还是为时过早,有时候换换思路,先不考虑半自动的各种7788的机器人SLAM落地与操作面,也别考虑XR这么高大上的东西(这2者都是明确的市场方向)。如果开销/鲁棒/精度这3相性和世界观都能控制到非常好的程度,那是不是能出现一些非常小型化的装置和方案真正落进市场呢?就算是个玩具不是也挺好的吗~~~ 目前从未来超低成本的方向来看,VIO是比较有机会实现的路径,很多高大上的领域反而不合适。

(2)多目SLAM,比如双鱼眼,4鱼眼,6鱼眼这些方案的纯VSLAM。这是一个很棒的方向,从逻辑上很多同学能整明白,也非常充分的补充了无纹理场景。因为视场角(FOV)足够的大,使其三相性具备极强的可行性。尤其是针对机器狗这一类其实VIO很难搞的场景。

但是这类系统,问题也尤为明显,今天这块作为一个科普来谈,首先标定和生产一致性就非常麻烦,这是显性的问题。另外我做机器视觉很多年了,多路(其实双路还可以,但是190x120的鱼眼像素太散了),就意味着成倍或者数倍的吞吐,这时需要的视觉ISP,多路编码/解码的能力都是成倍或数倍提升的,尤其如果要建立世界观,对应的ICP点云不管你用啥数据结构也都是数倍提升。这样要有匹配的算力+流处理平台,成本是很难控制的,于是还是形成了一个死穴,更别说相机成本也随数量提升了。所以这个目前看从长线是不如VIO商业前景深的。真要做这种,还不如直接做多目VIO,反正开销都那么高了。。。再提升2倍也无所谓的嘛,哈哈~

3.最后讲讲UAV,其实VIO的深应用,无人机还是我们比较看好的一块,毕竟提供的视野是无可比拟的,尤其是室内巡检类,侦察类,沉浸体验类,集群类。但是目前感觉国内还没有真正像样的组织在这块发力,期待有组织能真正做起来~~~

你可能感兴趣的:(VIO与多传感器融合融态,计算机视觉,深度学习,机器人,自动驾驶,视觉检测)