驭势科技CEO吴甘沙:探索中国式的自动驾驶之路

本文根据吴甘沙在ADAS与自动驾驶趋势论坛上的发言修正。

大家好!我演讲的题目叫做“探索中国式的自动驾驶之路”。非常荣幸能够来到这么一个论坛,其实这也是我作为一个传统的IT人第一次参加汽车产业这块的论坛。我们这家公司确实是比较新,叫驭势科技。
我们是视觉感知,自动驾驶规划和控制,以及做复杂系统方面非常好的三支团队整合起来的一家新的公司。为什么在这个时候进入到自动驾驶这个领域?我们既然叫驭势,我们要判断这个势是怎么形成的,我们觉得现在是三个潮流汇一的时间点。一个是从互联网到物联网、再到大数据一路发展起来的信息流,信息自由的流动,产生实时的洞察。第二个就是能量流,现在新能源汽车势已经起来了,分布式能源互联网正在呼之欲出,能量流变革一触即发。最后就是交通流,从新能源车到汽车共享的新商业模式,到驾驶智能化,最后网联化,尤其是以LTE-V以及5G为代表发展起来的V2X,所有这些技术的累积效应预示我们自动驾驶成熟期即将来临。

当然,我们认为它不是一蹴而就的,前途是光明的道路也是曲折的,我们必须得探索一条独特的发展之路。我们认为两个时间段有不同的价值主张。第一个时间段以五年为限,它的价值主张是服务好驾驶员,给驾驶员带来额外的安全和舒适。它是一个什么样的形态呢?一开始是主动安全,慢慢加入半自动驾驶,多种功能融合的形态,在通向第四级全自动驾驶的过程当中慢慢逼近高度自动驾驶。高度自动驾驶中人完全放手,所以对机器建立信任需要时间。因此,我们认为在半自动驾驶和高度自动驾驶中间可以引入一个新的形态叫“增强驾驶”,它是一种人机共驾,人在开机器也在开,机器不断学习人的行为,改进自己的算法,并且给驾驶员能够带来更多的安全和舒适。这是五年内以驾驶员为主张的一个主要的发展之路。
但是我们认为同时无人驾驶也在发展,刚才老余说“无人驾驶”这个词虚无缥渺,所以我们要给它加上限制,五年内限定场景的无人驾驶会大有发展潜力。什么是限定场景?可能在一个私有的园区里,在专用的道路上,固定的路线,中低速行驶,还可以有环境增强,在路上可以刷一些特殊的标志,可以针对这个区域加一个专门的差分基站,可以在红绿灯上面装一些射频装置,跟我们的车进行联系。这种方向实际上跟前面的辅助驾驶方向它是可以融合的。比如说现在我们做分时租赁,分时租赁的车主体是辅助驾驶,但它的一个痛点是取车和还车要花很多的时间,如果车在停车场的范围内能够实现无人驾驶,就能够很好的去解决这样一个问题,所以这些东西都会在五年发生。

5-10年的时间之内我们的技术会慢慢的从以驾驶员为中心演进到以出行者为中心。这个时候价值主张变成如何给出行者提供更便捷、更廉价的工具和服务,能够使得他们把出行时间转化为生产力。这时候我们认为无人驾驶会得到更大的发展,尤其是在城区,urban area,也就是谷歌现在做的这样一个无人驾驶,我们认为在五年的时间段可能会实现。当然它的实现也将通过一定的过程,比如最早是在最后五公里实现无人驾驶,你的家跟地铁站之间,现在可能是你靠自行车的分时租赁或者是靠摩的或者是靠小区和地铁站的班车来完成,所有这些可能被无人驾驶的班车和小型出租车取代。
城区的无人驾驶实现以后下一步就要去实现全天候全区域的无人驾驶,这个我认为确实可能需要很长的时间。但是我想跟大家说明一点,未来的车跟现在的车不一样,未来很多车的形态并不是为全天候全区域设计的,城市区域的出租车完全不需要达到这样一个目标。这也使得我们无人驾驶的实现之路能够更快。当然一旦针对人的无人驾驶实现了,那么一整个跟人和物交通相关的产业链都会被重新定义,包括物流,包括停车,包括保险业甚至是服务业,我们认为这样一种城区的无人驾驶车是在家和办公室之间的第三空间,它是一个移动的商业地产,会重新定义服务业,这是我们能够看到这么一个自动驾驶发展之路。

我今天想要说五个观点。
第一个观点国外的技术发展路线和功能选择跟国内的未必是一致。大家知道现在谷歌或者是百度他们基本上都是高举高打,三大件,激光雷达可能是70万人民币,一个GPS-RTK加一个高精度的激光陀螺或者是光纤陀螺也需要好几十万,这三个加起来确实能够给你带来更好的感知能力,但是它适不适合中国?也许更适合美国。这种车一辆20-30万美金,在美国一个出租车司机的收入可能是7万美金,意味着几年能够回本。但是在中国一辆车200万人民币,一个出租车司机的人力成本可能6、7万,这样一种方式就并不适合,这样一条技术路线并不适合咱们中国。
当然另外一条路线可能是视觉为主,雷达的这样一种技术路线,这条路线确实是更适合中国,但是也得考虑功能选择上两个地方得有差异,其实我个人在特斯拉车主当中做了一些调研,在美国他们对于像高速的ACC、车道保持这样的功能他们是非常愿意使用的,虽然谷歌无人驾驶车的创始人Sebastian Thrun尝试了特斯拉的ACC+车道保持的功能,抱怨说it almost killed me for ten times。在中国什么样的功能好用?比如在北京这种地方经常就是开开停停,traffic jam assist这样一种功能可能对中国人非常有用。刚才说的停车场的无人驾驶功能也是非常好的,你去新光天地下到停车场花十分钟的时间找停车位,你可以让它自己去找地方停,走的时候一键召回。刚才也讲到中国交通特别复杂的问题,我倒是觉得防碰撞这件事情,也就是行人检测这件事情倒并不是特别困难,因为你并不只依赖于视频,还有雷达这样一些工具,但是问题是,在中国如果说你的自动驾驶策略调的不够好的话是不行的,太过保守的话可能总是被人加塞,无法获得路权。谷歌也试图在调整他的驾驶策略,从以安全为第一目的,到慢慢的加入人的一些竞争的因素进去,结果就撞上大巴了,所以这需要一个发展的过程。在中国尤其要多考虑我们的自动驾驶策略,既能够保证安全,又可以获得路权。我们的路线和功能选择很重要。

2,低成本路线必须做加法,而不是做减法。其实谷歌也要降低成本,这也是为什么从去年下半年开始自己招人去做激光雷达,但是他的这种做法是做减法。本来高,慢慢的往下降,我们中国人有句老话叫做由奢入简难,我们的方法不一样,我们从最低成本的传感器开始,慢慢的做加法,以视觉、雷达和商业化的GPS、惯导为主要手段。我们的自动驾驶策略就必须有一个简单的假设,就是我每一个传感器都是不可靠的,都是不够精确的。GPS是10米误差,惯导有它的误差,双目测深度和视觉算法有误差,几个融合起来能不能做到稳定可靠的横向10厘米、纵向10厘米定位,这是我们需要考虑的。我们做加法,基础就是低成本的感知+高性能的计算,低成本感知我们希望能够做到500美金,然后用高性能的计算来解决感知不够完美的问题。如果谷歌认为有2.0的视力才能做无人驾驶,我们现在考虑用1.0的视力,做好多数情况下的自动驾驶。我们人有1.0的视力就能够开车,意味着这条路我们也能走得通,但是要比人多得多的计算。要是真有老余讲的200块钱人民币的计算,我做梦都要笑了,现在还不可能。现在我们要一两千美金的计算成本,因为你不只是考虑到能不能算的问题,你也要考虑它的稳定可靠性,要有足够的冗余。不但是同构的冗余,还要异构的冗余,你有GPU和FPGA,甚至有一些嵌入式的视觉芯片,你有深度学习和非深度学习,这样才能保证足够的可靠。最近两年我认为一两千美金是一个合理的价格区间,但是我相信计算发展的速度和成本下降的速度是非常快的。
大家可以看到在我们这个信息世界里有三条曲线,一条是半导体、电子成本的曲线。摩尔定律大家知道,每两年成本下降一半,所以把你的宝押在计算上应该问题不是特别大。机械部件和激光部件成本下降比较慢,像谷歌用的Velodyne 64线激光雷达既是机械又是激光的,所以不能期望它在未来几年明显降低成本。当然现在新的激光雷达可能是基于相控阵,或MEMS振镜,可能成本能够更快下来。在2018年、2019年的时间段,当它们降到500美金以下,我们的加法思维也能够把这样的东西加进去。
是我们的实验样车,有双目摄像头,有商用GPS、惯导和雷达。我说一下双目,双目在智能驾驶的场景里面用的并不多,只有斯巴鲁的一款车用了日立的双目,双目做起来不容易,首先结构设计要保证它在风吹日晒之下是不是能够保证形变最小,有了些微形变后能不能做自我的校准,这些都是很大的难点,我们基本上都解决了。其次是双目的算法能不能做到低误差和实时性,我们的双目摄像头最远看到160米,在10米左右误差能够达到几厘米,高清,30帧每秒。
双目有很多好处,这是一个路面的场景,我们这里机器学习只用了路面可行驶区域的检测,没有用到深度学习,但是路面的各种车辆和障碍物我们都通过双目形成深度信息。这里的一团高速移动的点云可以比较容易的判断是车,而那边不动的密集点云是路边的障碍物。请大家注意到一点,我们即使是用深度学习,在有些车辆只露出一点点的情况下还是检测不出来,我们自己的深度学习要求露出30%的时候能够检测出来,但是在旁边车道很近的车只露出一点点的时候是最危险的时候,这个用不要深度学习的双目摄像头就可以做到。因此,基于这个双目可以形成非常廉价的视觉防碰撞方案。
这个是我们用纯视觉形成的一个车机解决方案,这里面除了传统的车道线检测、道路目标的检测之外,我们展示了非常精确的深度判断。虽然说很多单目方案号称可以用Structure from Motion的算法实现立体视觉,但可能只适用于像AEB紧急刹车、FCW防碰撞,对于高精度的视觉定位准确度是达不到的。
这边的弧线是视觉里程计。它能显示车辆行驶的轨迹,跟基于轮式里程计或MEMS的IMU可以互补,这样一种基于双目的视觉里程计能够达到的精度要比单目的视觉里程计的算法要高很多。
我们不是只固执于视觉算法,加法的理念是,当DGPS/RTK比较便宜以后,或者在特定的环境里面做无人驾驶DGPS/RTK的成本可以接受,我们就把它加进去。同样,激光雷达足够便宜和成熟的时候,也加进去,我们现在在做激光这块的布局。另外一个就是地图,现在基于视觉已经有了一个很好的地图建构和视觉定位的解决方案,未来我们是希望通过众包的方式,能够把更广区域的地图建立起来。

3,ADAS技术路线演进很难满足自动驾驶需求。这里面一个根本原因就是ADAS它是人驾驶为主机器辅助,而自动驾驶它是机器驾驶为主人辅助。这对于技术来说有不同的要求,传统ADAS人驾驶为主,所以它是做出一些离散的警示,车道线偏离了给你一个警告,这个检测算法到底是70%还是80%,其实问题并不大,因为真正的复杂决策和控制是人来做的。而自动驾驶要求算法连续准确可靠地输出,而且常常是以机器驾驶为主,一旦出错是不得了的事情。传统的ADAS最烦的一个就是误报,有时候你算法要做一个折中,为了减少误报可能会同时损失精度,而在自动驾驶的时候不能牺牲精度。
传统的ADAS成本非常重要,可能要做到100美金以下,而辅助驾驶或者是自动驾驶它对于成本不是那么敏感,而性能、准确性是最重要的。这样意味着我们在一些DEMO视频里面显示出来的准确性就不够,需要在真实交通当中的工作能力。在北京大家开的时候,发现光照不好的时候,地面上的车道线人都很难去分辨,这个自动驾驶怎么解决?
我们一直说希望达到99.999%,这是一个很难的目标,我们现在基于统计的机器学习,包括深度学习,无法穷尽样本空间,意味着无法保证100%,只能通过更多的数据去驱动,甚至需要在线的学习,这是逼近99.999%的一条途径。第二不能从一个视觉传感器的角度出发点,必须多传感器融合,传统的ADAS解决了防撞、车道线的功能,但是真正的自动驾驶需要多种传感器进行融合,包括雷达,GPS,IMU,甚至未来激光雷达和V2X。
除此之外还要解决地图建构和定位的问题。刚才老余也讲了需要高精地图,常常基于激光雷达、高精度GPS和IMU,现在谷歌在做,HERE、TomTom也在做,四维图新也在做,究竟什么样的地图是自动驾驶需要的,还是个没有定论的问题。目前来说,高精地图实际上是一种束缚,因为你并没有很多区域的高精地图,那是不是就不能开了?我们采取了一种非常实用的方式,能够解决自动驾驶定位和地图构建的问题。
做完定位和地图还不够,还要解决规划和控制的问题,控制是必须得是实时的,几十毫秒级的,决策可能是秒级的,规划可能是10秒级的,这些规划和控制怎么能够做到足够的准确?我们做自动驾驶的时候要有一个基本的假设,就是第一我们是必须得假设各个传感器进来的数据是不一定可靠的,第二必须得考虑当所有传感器都失效的时候车应该怎么办,这里面需要很多经验的部分也需要机器学习的部分。刚才两位讲到应用深度学习、应用增强学习解决规划问题,这个是现在非常热的一个问题,深度学习可能是包括了像卷积神经网络,也保证了递归神经网络。目前来说,在控制中增强学习是更现实的,AlphaGo正是使用这个来实现自我对弈、形成估值网络的过程。

4,自动驾驶是一个超级复杂的系统工程。我们刚才说的感知、规划和控制,是浮在表面上的事情,还要解决驾驶员行为、偏好的分析,现在有个夫妻吵架的重要原因,比如我太太开车,我坐在副驾驶座上感到特别别扭,我们不希望自动驾驶让我们乘客坐得不舒服。还有人机接口非常重要,人机接口不只是光、声,不只是显示,还有方向盘的振动,方向盘的助力等,这些都是人机接口。状态监控非常重要,要在车里面放入一个像飞机黑匣子这样的东西,这样未来自动驾驶出问题的时候要能够发现问题在哪里,厘清是谁的责任。
实时高可靠高安全的系统软件架构非常重要。实时肯定是很重要的,100公里每小时开时,相当于1秒28米,常常处理要达到30帧每秒。
怎么做到高可靠?软件必须按照流程,模块级别要有压力测试,也要有方案的集成测试,大量地去路测。
怎么做到高安全?只要用的是开放的操作系统,只要联网就可能有car hacking,所以你需要一套新的安全设计的方法论。第一怎么能够保证你的规范是正确的,do the right system,第二要保证你的实现是准确的,do the system right,第三你在运行的时候怎么保证系统是足够安全的,黑客不能侵入。第四,一旦出问题以后有没有一种最好的方式马上能够取得控制。
最后就是要做到小型化、高性能、高可靠的硬件架构,为了实现这个东西不能去牺牲成本,必须得引入足够的计算力,保证算法最优化运行,也要采用符合车规的部件,引入足够的冗余,保证高温度范围、防尘防震。这方面我们从英特尔出来的工程师很有经验。

5,无人驾驶的关键是复杂状况的处理能力,而辅助驾驶很重要的一点就是人的舒适性,驾乘感受。怎么能够做到这一点?给大家看一个视频,这是我们的合伙人之一姜岩做的一个工作,大家可以看到他在车上路之前,在车顶上面放了打火机、硬币,接着绕三环48公里开了一圈,这里面实现了各种各样的功能,包括紧急刹车、自适应巡航、车道保持、换道,唯一在这里面没有展示的就是自动泊车。一圈开下来大家可以看到硬币、打火机在车顶上还是稳稳的放着,这反映了以舒适性为主要设计元素的自动驾驶规划和控制技术。

总结,第一,我们要走不同的发展之路。第二,从ADAS到自动驾驶不是渐进的演化,而是变革式的飞跃。第三,协同创新是突破的必要途径。我们是做技术的一家新公司,我们一家不可能把自动驾驶的事业包揽下来,这里需要协作和分工。我们希望协同创新,与上下游,比如上游的英伟达,下游的一级供应商和车厂,一起把自动驾驶这个事业做大,真正深刻地改变这个世界。谢谢大家!

你可能感兴趣的:(无人驾驶,人工智能)