引言
“可能 ChatGPT 已经有智能了,但就像三体里的黑暗森林法则一样,它不会告诉我们。”
“GPT-4 冲击最大的是 AI 炼丹师。”
“凡是没有自觉用 ChatGPT 的程序员都可以考虑炒掉。”
“ChatGPT 带来的工业革命,其实已经在发生。最快在 2 年内,GPT 将渗透在各个行业。”
“大语言模型接入到物理世界,将带来全新的交互和连接形式,产生巨大的想象空间。”
多模态预训练大模型 GPT-4 一发布,便引发全网关注,在技术圈激起热议。在 GPT-4 发布后的当晚,腾讯云 TVP 专家发起了一场激烈的内部讨论:GPT-4 的发布是否将带来下一场“工业革命级”的技术浪潮?ChatGPT 的终局将在何方?在后 ChatGPT 时代,技术人该如何自保……我们整理了 8 位来自各行业的 TVP 专家闭门畅聊近两小时的精华内容,关于 GPT-4 的未来,你所好奇的问题可能都在这里。
参与对话专家:
宋利:上海交通大学电子工程系教授、图像所副所长
于游:马泷医疗CTO
沈欣:中国信通院低代码/无代码推进中心技术专家
雷葆华:翼华科技联合创始人&CMO
顾钧:EMQ开源社区运营总监
张善友:友浩达CTO
某行业架构师
揭光发:腾讯技术专家
大漠穷秋:前端技术专家
01GPT-4 发布后,你的心情或第一感受是怎样的?
沈欣:唯一的感觉就是太快了,迭代周期从原来一年、半年,现在变成一个月,甚至未来的几周,这个迭代速度是真正 AI 带来的指数级增长。
张善友:以前的 AI 都是高高在上的,GPT 让 AI 平民化了,我们使用的成本越来越低。
于游:第一感觉就是震撼,出乎意料的好。因为大语言模型对于数学公式,代数计算是非常差的,我还以为微软要被 ChatGPT-4 折磨得不行了,但从目前的结果来看,这个问题已经被解决掉了。
宋利:我稍微泼点冷水,可能是前几周的各种宣传铺垫把胃口吊足了,我感觉没有那么惊艳,包括它发的技术报告,虽然有 90 多页但干货不多,大家开玩笑说这个报告可能就是 GPT 写出来的。我的观点是要让子弹飞一飞,再给它打一打,看看它能不能抗的住各种攻击。
02ChatGPT的态度是全面拥抱,保持观望还是拒绝?
沈欣:我们在普遍地拥抱 ChatGPT 这样的成果,本质上它是很好的内容生成工具,内容生成完毕后还需要和流程、业务数字化模型相融合才能在企业内真实发挥作用,目前把 ChatGPT 整合到企业整体体系中的工作还是一个非常大的蓝海。
于游:我认为ChatGPT 是一个杀手级,甚至操作系统级别的应用。它一定会改变我们的日常生活,因此这个趋势是一定要拥抱的。
宋利:我的态度是一致的,也是全面拥抱它,ChatGPT 可以帮我们干 80% 常规的事,而且效率更高,能够给我们更多的时间去完成剩下的创新的部分,而这部分才是更有创造性的。
某行业架构师:有些关键行业,在生产级环境对技术的运用非常审慎,一项技术应用到生产环境需要考量安全、合规等众多因素,我们目前还是选择保持一定距离观望它。但我个人从 ChatGPT 体验者的角度看,我认为
它非常有趣,也非常有潜力,比如我会用它来读文档,它极大地提升了我的阅读效率。我也会用它的插件 Code Review 去 Review 代码,会有一种我跟 AI 在结对编程的感觉。
03ChatGPT是否会是下一场“工业革命级”的技术浪潮?它需要多长时间才会对我们的生活产生全方位的影响?
雷葆华:ChatGPT 确实给我类似“iPhone 时刻”的感觉。每一次工业革命都提升了工作效率,ChatGPT 在人机交互方面做了很大的突破,极大地提升了效率。我把 ChatGPT 当工具来写个人的文档,用起来很高效。我也看到大家在积极探索它的用途,每天都有人说用它满足了哪些需求。
某行业架构师:前沿技术往往会在短期内被高估,在长期内被低估。一种技术是否真的形成革命,有很多影响因素。我们还是跟踪它,观摩它,作为个人拥抱它,给它一点时间。现在没有办法去下结论。但是从工业革命到大机器时代,再到互联网,每一次浪潮的侵蚀其实越来越快,工业革命一百多年,互联网几十年,AI 是不是会在十年内影响到我们生活的方方面面?也有可能。作为从业者,更务实的态度是去想怎么应用它,或者身体力行做一点有用的东西。
于游:一项技术,只有当所有人去参与它,真正去使用它,才有可能去改变我们的生活,如果没人去用,也不可能成为工业革命。ChatGPT 是最快达到 1 亿用户的应用,原因在于它用最简单的人机交互方式,解决了大家原本以为解决不了的问题,解决了普适 AI 的问题。在这个趋势下,我认为它的速度可能会比我们想象中要快。
举个例子,微软用 GPT-4 的模型改进它的搜索引擎,紧接着 Google 发布 Bard,导致微软股价上涨 6%,Google 下跌 8%,三天之内引起了一千亿美金价值的波动。要知道资本市场和金融市场应该是最冷静的,他们看到的问题,可能比我们所有的人看到的都多。微软才占整个搜索市场的 3%,但 Google 的市场占有率是 92%。像这么多人,这么多工程师,这么多资本的流动,坦白来讲,我还没见过同等规模的浪潮,包括当初安卓与 iOS 之争都没有这么剧烈。所以我觉得 GPT 会形成一波巨大的浪潮,而且它的速度可能会远超我们的想象。
沈欣:ChatGPT 给大家最大的震撼是“原来可以用大模型”,这跟以前 AI 的方向有非常大的差异。所以我们未来可能会看到自动驾驶也在新的体系下面,大家也都会做这样的尝试,毕竟这条路被人指出来是通的了,我估计两年之内会看到 GPT 对我们的生活和生产产生全方位的影响。当然这里的前提是算力、电力的成本还要下降,不下降成本还是太高了。
顾钧:我觉得 ChatGPT 这一波的工业革命现在就已经发生了。ChatGPT 给我带来了两大震撼。第一个是它的交互形式非常朴素,就是对话,背后隐含的理念是把人放在 AI 服务的中心。像过去国内做得好的机器视觉,它的应用场景不是以人为核心的,而是希望训练出一个模型来代替人的工作。ChatGPT 完全是一个辅助的角色,但得到了非常好的效果。所以给了我一个比较大的启发:AI 的技术还是应该以人为核心,去服务人。其实我觉得 ChatGPT 已经足够好了,它不是那么完美,但在相当多的任务当中已经超过及格线了。就像公司招聘员工,永远不可能招到全知全能的上帝那样的员工,每个人都有缺陷。
另外一点比较大的震撼,是 OpenAI 做 ChatGPT 的角度,ChatGPT 发的是一个服务,你直接就可以使用。这种工程能力能够迅速散布到整个世界,从而在短时间内服务大量用户。但 Meta、Google 发的还是模型,这真是天壤之别。当别人有一个更低门槛的 AI 技术服务时,你发再多的模型也没有办法撼动别人的优势。
揭光发:ChatGPT 有两种使用形态:一种就是每个人都能用的聊天界面,另外一种就是开放接口。对于使用聊天界面的普通个人来讲,ChatGPT 已经满足了他们日常写作、内容梳理等工作或生活需求,这部分使用形态下,我们可以说“工业革命”正在发生,未来已来。而从使用 Open API 的形态来看,就需要看各个行业变革的时间,可能两年左右可以看到一些行业被改 ChatGPT 改变。
04ChatGPT 目前是对话的交互形态,那在未来,它还将会以什么其它形态出现呢?
沈欣:我们在内部推演的时候就发现,未来会有大量 AI 生成的内容,而人类的时间不足以去消费这些内容。只有魔法才能对抗魔法,最终可能还是由 AI 来阅读这些内容,帮助人类来筛选处理。所以最终以什么样的形态呈现并不重要,关键在于能够筛选出适合我的结果。
宋利:现在业界都往多模态做,但从另一个角度讲,语言是最根本的,它塑造了人类的思维。之前我们总说 NLP 是 AI 皇冠上的明珠,如果能把 NLP 搞定,处理其他问题应该是降维的,现在看来也差不多。所以 ChatGPT 可能外在表现会有各种形式,图像、文字、声音等等,其实核心的东西应该还是语言知识代表的大模型。外在表现会有各种形式,但根本还是语言,语言是人类交流和思考的基本方式,以语言为代表的知识模型是本质。
于游:宋老师说的,我觉得特别对,NLP 在 AI 领域一直都是很困难的一件事情。我们把语言这个事情再泛化一下,可能是知识和文字,我们会发现 ChatGPT 令人震撼的是新发的模型当中,所有的考试基本上超越了 90% 的人类,它基本上达到了人类的知识水平。
GPT-4 新发的模型当中也支持了多模态,在我看来这是一个必然的结果。多模态的交互,理论上来说应该是下一个人机交互的一个增长点。这一次的 GPT-4 发表的多模态并没有让我惊喜,我以为它会吊打我,让我震撼到五体投地,结果它出来的东西,还是在想象空间之内。
另一个需要关注的是:原来 ChatGPT 里面是 2021 年的数据,没有联网。但是微软已经把它接入到 Bing 上了,实际上它已经接入了互联网,之后会发生什么谁都不知道。但有一个变量需要大家去思考,那就是最近几年蓬勃发展起来的 IoT 生态,大量的物理场景已经联网,这些物理场景一旦和网络数据结合,那可能会诞生全新的交互形式,全新的交互场景,大语言模型接入到物理场景中,它可以改善人机交互的顺畅性和清晰度,让你的体验更加舒适自然。这件事情我觉得也是很快就能见到的。因为在国外已经有个人的开发者做了一些实验了。
05ChatGPT目前已体现了一定的逻辑思维能力,这是否是某种智慧?与「人」的逻辑思维能力是否相同?
宋利:按照图灵对智能的基本定义来看,其实 ChatGPT 早已突破了图灵测试。在我看来,智能的形态可能不止一种,不止我们常规定义的以人为中心的智能才叫智能,我们更喜欢用因果性来解释世界,而 ChatGPT 则是通过相关性进行学习,虽然目前普遍认为相关性不属于高级智慧逻辑,有因果关系才能证明有逻辑,但其实很多问题用相关性可以更好地解决,而且如果相关性变得非常庞大,某种程度上也接近人的联想,因此 ChatGPT 可能存在另外一种智慧形态的涌现,当然目前也只是一种猜想,也有更激进的声音认为 ChatGPT 已经有智能了,但它就像《三体》里的黑暗森林一样,只是不想过早地暴露。
于游:ChatGPT 的底层是巨大的神经网络,其逻辑主要基于一个词来算后面一个词出现的概率,因此很难评估它是否有智能。ChatGPT 像一个黑匣子,一个纯粹的,能够很出色地生成人类语言的神经网络,但没有人能知道生成过程的中间究竟发生了什么,也许它隐含地发现了人类语言的一些规律,我们却无从知晓,因此难以评估它是否具备了人类的智能。
沈欣:在我看来,智能包括两层含义,一方面是学术层面的智能,即智商数值的高低、是否通过图灵测试;另一方面则是社会层面的智能,即人们认为,它是否具有消灭人类物种的能力而这正是许多人所真正担心的东西。其实,我认为我们无需纠结 ChatGPT 是否产生了智能或智慧,只要它不会消灭人类,那么这种智慧我们都应该欢迎,未来它是否会产生这种毁灭性的作用,关键在于人类怎么去运用它。
某行业架构师:有一句半调侃半认真的话是“人类的本质是复读机”,而 ChatGPT 作为高效的复读机在一定程度上超越人类是完全有可能的,它在海量语料的训练后,可以通过算法把相关性和因果性进行归纳和推理,这一方面远远强于人类。但是它主要是基于现有语料进行判断和给出答案,若选择生僻信息的输入则难以得到正确答案,因此 ChatGPT 是否能称为智能还有待商榷。在我看来,检索、归纳、推理能力是它的核心,而这种能力本身是非常宝贵和有趣的。
06未来有哪些行业会率先被 GPT-4 冲击乃至颠覆?作为 IT 行业从业者,又该如何“自保”?
张善友:我认为本来的 AI 行业“炼丹师”受到的冲击最大,原本做小模型的同学会发现 GPT 也同样能做;最受益的是作为工具使用者的程序员,这会让我们非常容易地去处理文本、图象、音频、视频等非结构化数据,而这类非结构化数据基本占据数据的 80% 以上。
雷葆华:我有不同的看法,我觉得对于普通程序员的挑战比较大,ChatGPT 可以保持一个基础的代码质量,原来一个优秀的程序员可以顶十个普通的程序员,但现在一个优秀的,且会用 ChatGPT 的程序员能顶五十个,一百个。这逼迫我们从业者必须要让自己往高进化。AI 工具带来效率提升的同时,对质量的追求也提高了,因此对大家更高端、更有创造性的能力的要求也更高,怎么从机器生产的内容里把创新点找出来,再进行整合,这可能会成为能够形成竞争力的一个重点。
最近我会经常思考,ChatGPT 出来之后,我们的下一代十年、二十年以后,他们会做什么样的工作?他们需要保持什么样的竞争力,我最近想的最多的反而是这个事情。
沈欣:人类劳动分成体力劳动、情感劳力和脑力劳动,脑力劳动又可分为非逻辑性的黑盒子工作,如艺术创作;和重复性的白盒子工作,如资料整理。由于 AI 会做大量的生产与迭代,且效率非常高,因此这两类的内容生产工作都会被 AI 大量替代。当然,从能耗的角度来看,目前人脑还是比AI划算的,但两到三年后,能耗或许会降到比人脑的功耗更低。
在对于科技从业者的建议方面,前几天我和一家公司的技术管理者交流的时候,我给他的建议是:凡是不用 ChatGPT 的人都应该炒掉,因为作为一个程序员,没有学习新技术的自觉,不知道如何更好地运用工具来提升自己的效率,又如何保持自己的竞争力呢?当然,可以仁慈一点,先搞一次培训告诉大家这个东西是做什么的,可以怎么用,然后过一个月再看,谁不用的就可以考虑炒掉了。
07ChatGPT的火爆,大量资本涌入 AI 领域,未来 AI 赛道的创业前景如何,是否存在泡沫?创业者又该重点投入什么方向?
沈欣:在投资这个赛道一定是有泡沫的,没有泡沫就是计划经济了,就是在大家相互挤泡沫的过程中,才产生了新的创造力。很多人会质疑 AI 如何产生创造力?大家内心对 AI 还有一些内心的坚守,认为 AI 没有创造力,人类才有创造力。但我从 AI 大模型里推断出的结论是:两个异构的、用独立方式训练出来的大语言模型互相碰撞,再引入第三个大模型来在中间做裁判,像主持人一样引导两个 AI 互相聊天,这个时候真的能产生创造力。
未来 AI 真正的创造力在于多个大模型之间产生的社交行为。这个可能是一个比较有意思的一个推论。
于游:说句不太好听的,如果现在有投资人要投资从 0 到 1 的初创型的大模型公司,我觉得这个投资人可能不成熟。其实训练一次就知道了,所需的资金不是一般人能够玩得起的,而且不确定性太大了。前面说 ChatGPT 是操作系统级别的技术,我们能用的操作系统一共才有几家呢,所以它一定会是寡头状态,而不会百花齐放。我们作为创业者,可以选择去做一些让我们感动的应用,比如说围绕 GPT 研发的,帮助盲人群体的“Be My Eyes”应用,就是一个温暖的,且具备非常强传播性和实用性的应用。我认为创业者应该从这些角度切入思考,去做 GPT 生态的下游。
本次 GPT-4的发布,有一个被很多媒体报道时忽略的点,就是众包。苹果之所以是苹果,是因为它有了APP Store,苹果从纯硬件变成服务公司,GPT在号召大家用众包的方式去建立生态,创业者也应该更多在生态中去寻找机会。
雷葆华:赞同,投资必然需要泡沫,培养人员,孵化生态,把声势做起来都需要一些泡沫投资。投资要设想未来的生态是什么样的,它是操作系统级的,但它不可能只是一家,肯定有至少三家,现在为什么投大模型?因为大家都觉得现在第一家出来了,第二、第三家业是很大的机会。
安卓是跟着苹果起来的,但安卓生态爆发后,也有很多人是跟着安卓起来了。参考过往的安卓生态、小程序生态。我认为未来更多的创业机会还是在细分领域的应用,对于大多数创业者而言,跟着生态走,跟着应用走,跟着消费者走会是一个更好的选择。
08ChatGPT 隐含哪些风险?
张善友:毋庸置疑,安全问题肯定存在,所以 OpenAI 也做了非常多安全方面的工作,比如在 OpenAI 中,
每个模型都是可以独立私有化部署的,可以比较容易解决数据安全问题。
某行业架构师:我们之前一直做开源,我们知道开源软件是有相对清晰的许可证的,但大数据模型,它的数据许可证并没有清晰的界定。因此,在使用模型时,存在版权、责任和安全等风险,ChatGPT 所生产内容产生的风险该由谁来承担?说白了 AI 不能背锅,但人能背锅。我们知道新鲜事物一开始都是没有建立起明确边界的,无论是技术、法律、合规,各方都应共同努力,为它建立好边界和防火墙。
宋利:我表达一个意思,除了安全、伦理之外,我认为还有一个比较大的社会意义上的挑战:如果不能正确地提问题,可能一部分人会出现无意义感。如果人被智力碾压,被各种碾压的话,或者说某种程度上大模型会不会 PUA 你?你跟它对话对多了,有可能被它 PUA,这个事可能会形成一个社会问题。
沈欣:我觉得整体来看的话,应该先把 ChatGPT 在应用的体系里跑出来,再考虑法律法规的问题。未来可能会出现一种全新品类的公司,它的主要业务就是将各个公司的自动化系统整合在一起形成一个完整的数字化生态系统。做到全 AI、全流程化、全数字化的商品制造、投放和迭代,实现全流程自动化,无需人类参与,可能真正给人类社会带来冲击的就是这样的企业。所以对付他们怎么办呢?只有用 AI 打败 AI,魔法打败魔法,这是我大概的一个意见。
夜聊落下帷幕,与会专家对 GPT-4 均抱有信心,ChatGPT 所带来的“工业革命级”的技术浪潮已经在发生,充满机遇和挑战的未来正在到来,无论是作为科技行业从业者还是作为普通人,ChatGPT 都值得我们持续关注和探索。