李德毅:各位领导、各位专家,特别是交通产业界的朋友们,今天很高兴参加交通峰会。
我们迎来一个智能时代,在见证历史的同时,也在创造历史,我是一个人工智能工作者,今天想讲一讲新一代人工智能产业发展应该怎么做,等到人工智能诞生100年的时候,也就是到2056年,人工智能尤其是对交通会产生什么样的影响。
首先,什么叫新一代人工智能。
如果大家看一看中国战略白皮书就能了解到,中国是在全球第一个率先宣布要做新一代人工智能的国家,新一代人工智能的技术特征是什么?传统人工智能应该怎么叫?我们应对这些问题有所思考。
其次,人工智能比我们想象要难,尽管大家已经体验到人工智能带来的益处,但硬核到底是什么,需要一番认真思考。有这么几个词来冷静描述当前我国人工智能状态:基础研究弱,人工智能拿图灵奖的只有姚期智院士,他还是美国培养的。辐射市场大,这个大家都理解,叶茂枝不壮,树大根不深,叫好难叫座。
回想一下1956年诞生了人工智能,传统的人工智能是什么?新一代人工智能是什么?中间分界点在哪里?一个明显的分界点就是机器碾压人类围棋高手,发生在2016年,围棋人机大战中,人类完败,这件事情挑战了人类的认知。从技术上来看源于2006年深度学习,甚至20世纪机器学习演变过来的深度学习,传统人工智能叫什么呢?我为其起了一个名字叫计算机智能,我与李科杰院士有一段邮件的通信,他是计算机协会的理事长,我是人工智能学会理事长,李院士在邮件中说,你那个智能不是在计算机上完成的,你们不是我一个应用而已吗?我觉得他说的有道理,所以我把传统人工智能叫做计算机智能。我们国家要求我们做类脑智能,人类最后一个科学的堡垒也许就是解码人脑的工作机理,能不能借鉴脑科学来研发人工智能呢?这是一个很好的想法,有没有困难?有困难。
现在人工智能高峰点就是预编程人工智能,我们手下的人工智能实际上是算法功能的智能编成的代码,在机器上一而再再而三的执行,严格讲机器在执行,智能是算法工程师的,凡是大数据预编程我们叫做传统人工智能。
新一代人工智能起了两个定义,一个叫会学习,自编程,不要算法工程师编程,这才叫新一代。
没有类鸟,人类发明了飞机,反过来用空气动力学解释了鸟的滑翔,其实鸟在空中的动作很多地方科学解释不了,滑翔翅膀是不动的,所以飞机翅膀不动。没有类脑,人类发明了计算机,反过来用计算智能解释了人脑部分智能,像围棋计算能力特别超强,我想表达的是类脑类人智能之路还很长很长,以科学发展的角度来看,若用200年、300年甚至500年把人脑搞清楚也是了不起的。
类脑发展千万众,从何入手?我们说的类脑智能,确切的说并非是在微观上跟人脑组织结构一样的生物智能,我们要做一个脑科学,或者认知科学启发的人工智能。
英文叫Brain inspired intelligence,脑科学涉及到生命科学和神经科学,特别是认知神经生物学,认知科学涉及到社会科学、行为科学,我们国家的认知科学不发达,其实认知心理学100多年历史了,特别是讲人是怎么学习的,学习的科学。所以我们要做的是不纠结细节,而不是在微观上去研究类似脑的组织,智能行为上要类人,要剥离意识,不是做人工生命,这次新冠病毒全国蔓延给我们的教训,确切的说它还不是一个生命,因为它还许多宿主,但是把人类搞的很不轻松了,我们千万不要轻易搞一个人类的异己跟我们对抗,我主张在物理装置上外显人类智能,50多年来,我们团队跟天津港一起提出一个概念叫驾驶脑,就是一个物理装置而已,它没有意识,它听话,它不闹情绪,脑科学、认知科学启发新一代人工智能的架构,研发的是智能机器,交通最大的问题是事故,事故最大的问题是生命,因为它思想不集中,他疲劳,他开小车要看路边的美女,我们机器不干这个活,这才是我们需要的。
人工智能70年的发展,有三条主流的学科;
行为主义,机器人从感知到行为,因为所有智能都是通过行为表现。想做什么呢?像人一样行动,像(蒋新松)院士去世了,他的研究所就是机器人所。
符号主义,做什么呢?希望机器像人一样思维,我本人在83天做博士学位的时候就做了这个方面的文章,我的博士论文就是讲一个(诉说)问题,怎么变成一个未知延伸的证明问题,证明它的对等性,所以确切地说,从符号主义这个学派诞生成长起来的。要研究的是计算,怎么样优化,怎么样预测,怎么样可解释。
连接主义,希望机器脑像人一样连接,模拟神经网络的结构,这里面最有名就是深度学习,就是现在最火的东西,能不能从机器人行为智能里面,想一想人进化当中最基本的能力就是模仿,模仿当中有两样东西很重要,一个是抽象,一个是类比,要把行为主义智能进一步发扬光大,我提出两个智能,感知智能和行为智能,计算智能仍然发扬这是我们宝贵财富。
但是我们知道开车这件事情,确切地说,开车你问一下驾驶员主要靠记忆,因为我提出来要拓展记忆智能,在人工智能里面两个重要的,一个是计算,一个是记忆,这就形成了我们的新一代人工智能核心思想。
举例来说,假如这是一个交通枢纽,大家看到有一个盲人,带了一个机器导盲犬,机器导盲犬到交通枢纽里面,这个摄像头要看,看到那个中间哪个出口,看到一个B,这个摄像头怎么知道这是一个B呢?它盯着这个摄像头看,看不出来是一个B,因为它又瞄了C口,它就知道这叫B,所以它就按照它的规划就走了,如果贴这么一个标签,是14,那么它就知道那个B不是B,那是13。我这个例子告诉你什么呢?这个B是不确定的,在不同情境下有不同的含义,离开了情境,离开了语境谈算法和语义意义不大。
所以我提出来要从4个方面研究语境、语用、语义、语法,计算智能太多靠语境和语法,或者语境和语义。刚才讲三个学派各司其职,智智与共,于是我们开始有我们的思想了,计算机诞生于符号处理,类似人的高阶认知,我们被困在计算机太久了,总是在想智能就是计算,哦,计算快一些,快一些,再快一些,于是我们听到声音,算力、算法、数据是人工智能的核心,对不对?对,但是不够全面,它是计算智能的核心,不是新一代人工智能的核心,如果那样把技术科学做好就行了,何必把人工智能开一个学院搞成一个学科呢,人类智能在环境交互中进化,先有感知和行为,自身产生感知智能和行为智能,先低阶后高阶,高阶认知产生记忆智能和计算智能。勇闯无人区就是要另辟蹊径实现更大更快的突破,新一代人工智能,既然叫新一代,必须有一个质的跃升,经常有外国学者问为什么叫新一代,我们只知道起起伏伏,我觉得质的跃升从计算智能扩展到记忆智能,从人机交互扩展到交互认知,从深度学习扩展到机器自学习,各司其职,智智与共,才是新一代人工智能研究方向。
人类正在进入智能时代,现在是一个未来已来,过去未去的时代,人工智能用了动能机器渗透,各式各样的智能代理或者智能机器正在成为人类智能的体外延伸,替代或者服务人类无处不在,无时不在。
我就用几分钟讲一讲新一代,不是计算机智能,有人说做无人驾驶就是四个轮子加一个计算机,不那么简单,你看(VM)做了这么久呢?怎么还有问题呢?下面讲一讲新一代人工智能硬核是什么?我觉得会学习,会学习这个词用英文翻译出来叫Learning to learn,智能植根于教育,文明是智能的生态,为什么把我们生命和思想放在学校里,就是要培养学习能力,是高阶的学习,不仅仅是一种知识。
人在与环境交互中,形成物理空间未知感,通过跨模态感知,一般讲多模态,跨模态蛮重要的,多当然好,甚至双模态已经不得了,双模态也行,把物理空间解决的现实问题转化为认知空间,在认知空间不同记忆区留下带时间印记的抽象,可以从长期记忆区直接提取问题解决方案,这叫快搜索,也可以在工作记忆区进行计算思考和推理新的解决方案,这叫慢搜索,通过智能行为作用到物理空间,能感知认知行为环,交互中的空间智能,以及现实空间或虚拟空间不停的映射,是人类智能基本能力。计算机放在这个房间,放在那个房间不知道在哪里,一辆汽车可不行,你知道这辆汽车此时此刻在哪个路口,这叫作空间位置感知能力,想象的认知和客观世界。
因为学习,所以与时俱进,我们不再是只能解决预设同类问题的能力,阿尔法GO围棋能力好不好,很智能,把冠军击败了,但是假如说一个围棋手,我们下一盘棋,这个棋盘不是19×19,19×9的,那么就完了,围棋手都能下,你那个智能,你说专用不够专用的,我们不搞一个矩形,搞一个六边形棋盘下下,围棋手还会下,具不具备通用的智能,体现在能不能随时针对一个跨领域现实问题,生成新的记忆边界完成推理。经常有一句话发生事故了叫做哪壶不开提哪壶,智能驾驶测试层你做多少个案例,跟发生事故的案例偏偏不在测试库里面就是这个道理。所以智能驾驶比我们想象要难。
驾照的问题,为什么要车厂承担,为什么要传感器秤杆,传感器代替不了驾照,驾龄的问题不是驾照代替不了,路熟悉不熟悉是驾龄代替不了的,错误的学习是正确学习很难代替的,刚才中午吃饭的时候说北京市西客站五一节的时候有一些混乱,没有这样的负学习哪来高效地管理呢?驾驶文化也不是驾驶脑替代的,这就是无人驾驶难处,要比人脸识别难得多。
研发有感知,有认知、有行为、可交互、会学习、自成长的新一代人工智能就是我们的目标,我们希望到2056年,我们的00后享受这样的东西,传统人工智能有什么硬核的话,算力、数据和算法,新一代人工智能是交互、记忆和学习。
人工智能的产业既是自成产业,更是赋能产业,如果自身没有硬核难以形成规模经济。做车的知道,全世界这么多车,一辆车20万块,20万亿经济产值,比人脸识别要厉害得多。
下面讲讲中国怎么做智能时代的中国方案?对于智能驾驶长远作用认识不足,对于产业化难度认识不足,对于经济效果希望过高,这些问题值得我们共同探讨。
未来汽车,要做这样机器人有这样一个路线图,我把这个路线图先冷静换算到全球坐标来看一看,全球人工智能驾驶,假如从科研探索期,0到1的阶段,我们参加那么多次比赛,基本上在探索,从2020年到2030年我们认为是10年市场创新期,产品孵化器,我们此时此刻就在这关键十年,规模发展期量产了,从2030年到2055年,那是人工智能一百年。全球现在有多少辆车呢?4.4亿辆,如果到2035年能够把它变成无人驾驶这已经是不得了,全球现在总共保有量10万亿辆车,到2056年都无人驾驶比10万亿辆少一点,在这样情况下应该怎么做呢?介绍两条曲线,任何一个新技术叫社会接受度曲线,一个叫作社会关注度曲线,无人驾驶社会关注度很高,但是量产的前景还在后头,他们做产业化分类的时候分四个阶段,第一个阶段炫耀阶段,第二豪华品牌高端市场。第三阶段低成本经济型拉动市场。第四阶段大众普及,这时候才是高回报的时候,这是特斯拉产业化方针。
中国应该怎么发展呢?2035年远景目标各个政府都在制定,中国“十四五”规划已经绘就,这是机遇,对于我国来说这十年智能制造乃至人工智能占领全球高地举足轻重。我们处在孵化期前五年(2020-2025),我们能不能这样想?自动驾驶车辆不会是市场主流,要通过有趣的技术,谨慎选择落地场景,先用于特种车或者商用车,你看Robotaxi那么困难,你家那个小车子要无人驾驶我才不会买,你让我装50个传感器,传感器坏了怎么办,要这么多钱。吸引创新者和早期采用者,大家稍微冷一点不要太早期了。
真正吸引市场不完全是技术,更重要是痛点和刚需,因为归根到底叫座而不是叫好。选择了十个场景,这十个场景共同点是恶劣的环境、无趣的岗位、白天黑夜重复劳动,对人没有解放。例如说卡车司机或环卫工人,他们是什么情况呢?75%的人对自己的工作岗位不满意,95%的人不愿意看到自己的孩子再干这一行,我们应该在这方面找场景来迭代我们的产品。
所以我们提了十个场景四大赛道,港口与干线物流就是当前两个重要方向。乘用车先把自动泊车做好,一般女性开车泊车挺难的,再一个就是把Robotaxi做好,把公交做好,再一个就是农业中农机自动驾驶做好等,这十个赛道。
卡车赛道我们提出了港口运输带动卡车无人驾驶落地。
农机车道把无人拖拉机作为智慧农业起跑线。
低速电动车赛道,率先实现无人配送规模化应用。
孵化期后五年,2025年到2030年,我们希望产业链配套星辰,可规模化扩展,提供精准化管理或市场化服务,产品开始快速迭代升级,十大赛道全面铺开,从示范走向普及,智能网联汽车生产超过一千万辆。同志们到现在还没有哪一家生产一千辆产智能车,我们要一千万辆,大部分城市BRT公交实现自动驾驶,公交车是弱势群体喜欢的车辆,让他们有获得感,普遍推广特种车和商用车,迅速向私家车和小轿车普及。
到2030年到2035年是大规模发展期的前五年,智能驾驶车具备学习能力,包括试错学习向事故学习,不再是软件定义汽车,不仅有计算智能,还有交互智能和记忆智能,可以自学习自成长。
这是大规模发展十年,智能制造辉煌时期,到那个时候智能驾驶车突破地理栅栏,天气栅栏和人文地俗栅栏,车群具有灵活编队模式,型成新的交通文化和社会生态,人工驾驶的门槛大幅度提升。
中国智能网联生态要领先全球,国内罕见人工驾驶,到2056年做的,我们希望就像今天看到马车一样感到稀缺,可交互会学习自成长的轮式机器人机器编队可实现国内交通全覆盖。
这是我今天在交通峰会分享的一些观点,希望智能驾驶成为我国继高铁之后又一张新名片,具体体现在以下几个点:
第一,智能车载平台有望提升我国整个智能制造业,因为智能制造才能有规模,有规模才能有万亿规模级GDP。
第二,北斗+4G/5G成为中国网联中国特色生态。
第三,农机智能驾驶成为我国智慧农业起跑线。
第四,公交智能驾驶使老百姓有实实在在获得感。中国所有城市BRT均数字化并实现自动驾驶,人们出行的舒适度和便利性会得到大大提升。我们与车企如陕西一汽和济南中汽等的合作事项就是要搞这个(数字化无人驾驶公交)。
第五,以港口枢纽和高速干线物流为代表新一代智能运输系统能够形成。
第六,交互学习和记忆成为新一代人工智能的硬核,辐射所有方方面面,这就是我的希冀所在。
欢迎加入智能交通技术群!
加群请加微信号18515441838,注明“加群”。