2020-04-28 22:13:05
4月26日,清华109年校庆,计算机系举办AI Open 云论坛,张钹院士,李向阳校友(中科大人工智能学院院长)及唐杰、刘知远、王小川(搜狗CEO)、唐文斌(旷视联合创始人)就AI技术开源展开深入讨论。
作者 | 蒋宝尚
编辑 | 贾伟
开源,曾经是最早一批互联网创建者们所追求的自由与开放的价值观,也是所有软件工程师们的终极梦想。
2008年无疑是这份梦想革命性的爆发:GitHub开源社区诞生,作为一个开源的分布式版本控制系统,能够让全球数百万开发者参与开源项目,为协作写代码贡献自己的力量。
从某种意义上,GitHub改变了人们对编程的认知,今天几乎所有的程序员都离不开它。
但是,在经济出现逆全球化苗头的同时,技术开源也受到了波及,如2019年7月份,曾有外媒披露“GitHub 开始限制被美国贸易制裁国家的开发者”。
其实,在2018年Github被美国微软公司收购之后,便引发了对开源生态的担忧,开源社区变成了公司资产,用户上传代码,将会受美国的管理条例约束。
在贸易战的背景下,中国可能成为被禁国家之一。
开源生态虽然是国际大势所趋,但似乎也难逃“卡脖子”危机,Github存在被禁风险,我们如何发展自己的开源社区?在贸易战中,我们如何平衡独立自主与开源共享?
在 AI Open 云活动中,张钹院士表示:面对一系列的不确定性,中国必须进一步开放;王小川表示:疫情能够加速合作的步伐;李向阳教授表示:我们要自力更生,但自力更生并不是要闭关锁国。唐文斌说道:开放不管是从利己还是利他的角度,都有好处。
1 科学研究从来都是开放促进步
不只是中国,整个人工智能领域近几年发展如此火热,得益于开放的研究环境,以及核心技术的无私奉献。在清华大学建校109周年—计算机系云活动·论道AI Open,张钹院士提到:“科学技术发展的历史表明,科学研究必须在开放的国际环境下面才能够得到健康的发展,并造福于全人类”。
大家普遍认为人工智能诞生于美国,美国现在仍然处于全世界引领地位,但是这中间起主要作用的是全球科研机构的合力推动。
以谷歌的 Alpha Go 为例,它产生的过程中间,主要贡献不只有美国。Alpha Go前身就是DeepMind,其中创始的三个人都不是美国人。
里面用的各项技术,例如神经网络,或者说是卷积神经网络也有各个国家研究人员的身影。神经网络是1943年美国两个人提出的,第一代神经网络是日本人提出来的,第二代神经网络是1998年法国人提出来的。
里面用的主要算法,梯度下降最早是 Cauchy 1847年提出,现代加速版是俄国数学家 Yurii 1983年提出来的,反向传播算法是1970年当时一个芬兰硕士生提出来的。
蒙特卡洛树搜索是2006年法国人提出来的。强化学习Alpha Go里主要用的算法叫Q算法,Q算法是英国人提出来的。
整个围棋程序是中国台湾一个团队编制。另外,深度学习的三个图灵奖获得者都不是美国人。
综上 Alpha Go 的贡献者有九个到十个国家,有美国、英国、法国、新西兰、中国、俄国、日本、加拿大、芬兰。这说明任何一个科学成就,都是全世界科技工作者共同努力的结果,特别是前人大量基础研究的积累。
美国所有在人工智能领域长期处于引领的地位,在于他利用了开放的国际环境,使原来一些不是出生在美国的科技工作者,通过去美国学习和交流,最后定居美国为美国服务。
2 面对封锁,中国应该进一步开放
既然美国是最大的收益者,为什么美国要反对AI进行开放和国际合作?答案无疑是美国想阻止中国的科技崛起。
面对孤立我们的对策必须是进一步开放,深化中国参与国际交流合作的环境,正如张钹院士在论坛中提到的那样:“我们只有很好的利用开放条件,来发展我们中国人工智能科学和技术,只有把中国人工智能科学技术搞上去了,美国这种脱钩政策才不可能得逞。”
但是,国际环境如此复杂的情况下,我们又不得不面临是独立自主还是开源共享的问题。最好的答案自然是两者融合,既能保持自主性,也能贡献开源社区。
但是两者融合的“度”在哪里,需要不断的探寻摸索。从发展的眼光看开放全球一体化,越开放发展的速度越快。保持开放和自力更生是我们国家要努力做的功课,但是很多功课在这个之外。
正如搜狗王小川所说:“我们如何对外表达出我们的一种非进攻性,让世界觉得中国的成功对世界是安全”。
保持开放的精神,自力更生的实力不仅要体现在技术领域,经济文化方面上,都要表达出一种足够的开放性、包容性,这样才能促进良好的技术和经济环境。
所以,“非威胁声明”是保持进一步开放的外部条件。
另外,对于这个问题,疫情也能给我们一些思考。“兄弟阋于墙,外御其侮”,面对疫情这个敌人,全世界都应该团结,这是全人类共同的战役,只有保持开放共享才能打赢这场战斗。这个时候如何谈独立、自主、控制显然会带来意想不到的伤害。
开放,不管是从利己还是利他的角度,都是有一定的好处。旷视唐文斌表示:开放和自主研发是两个轴,不是一个选择题。
当前,我们需要有更多的人才思考技术难题,某种程度上讲开放的东西在哪里,人才就会在哪里。
从中国的角度看,需要做的是建设好一种开放的生态,把真正优秀的人留在国内的同时,把更多优秀的人吸引到中国。
3 开源越多,创业机会越少?
开源的技术越多,创业机会越少其实是一个误区。首先要区分核心技术和应用技术,当前的很多深度学习算法,其实并不是核心的技术,更多是偏应用性的算法研究。
真正AI创业机会其实不在于核心环节,而在于它与产业的结合,即便是一个简单的人脸识别,在手机场景下、摄像头场景下以及门禁系统场景下都不是相同的技术。因为需要考虑的环境、光照不一样,有很多问题需要解决,如果一旦深入到一个场景,问题就会变的完全不一样。
把深度学习、强化学习等技术运用到一个具体的行业中去,如果没有这个行业的知识,光是纯技术,那么所做出的产品就是一个伪命题。
所以,人工智能要想在某个领域应用起来,必须跟那个领域的知识相结合,不能单纯靠数据,张钹院士提到的第三代人工智能最重要的方向就是把数据跟知识结合起来,例如想用AI弄清楚新冠病毒的源头,那么不能就数据论数据,必须跟理论知识结合,没有任何数据知识找到准确的结果可能性很小。
张钹院士曾经提到的关于第三代人工智能的理论框架体系核心思想:
建立可解释、鲁棒性的人工智能理论和方法。
发展安全、可靠、可信及可扩展的人工智能技术。
推动人工智能创新应用。
及具体实施的路线图:
与脑科学融合,发展脑启发的人工智能理论。
数据与知识融合的人工智能理论与方法。
搜狗王小川谈到:“只有领域的需求和领域的知识跟AI的结合,才是创业公司把AI作为解决方案需要掌握的能力,这时候光有AI技术是不够的。”
“对于搜狗来说,原本想把语音的AI技术和语言的AI技术合在一块,后来发现特别难,两个架构不一样,当做单独做语音图象的时候,发现能够独立实现它的目标,比如语音可以用到输入法、录音笔里面,甚至可以作为一个平台能够输出一个服务;但是到了语言级别之后就很难独立输出服务,语言需要深度理解业务场景,需要考虑用在什么地方,是单纯的问答?还是想做一个对话系统?最后发现组织架构需要跟业务深度整合,没有特别多对核心上的研究需求,更多是在应用上贴的非常紧,因为领域知识要求更多。”
正是如此,当前的趋势是计算机和人工智能方向与生物、医学、化学深度交叉,才能助力相关的研发。AI如果跟相关领域知识结合,可以助力疫情的监控、预测、溯源。
开源越多,并不意味着创业机会越来越少,核心技术的不断开源,才能够助力各行各业的创业者找到适合自己的落地项目,从而实现多方共赢。
注:计算机系云活动·论道AI Open 是由AI TIME主办,其是清华大学计算机系一群关注人工智能发展,并有思想情怀的青年人创办的圈子。AI TIME旨在发扬科学思辨精神,邀请各界人士对人工智能理论、算法、场景、应用的本质问题进行探索,加强思想碰撞,打造成为北京乃至全国知识分享的聚集地