1950年,英国科学家图灵在一篇论文中预言,人类有可能创造出具有真正智能的机器。
著名的「图灵测试」就此诞生:如果一台机器能够与人类展开对话,而不被辨别出其机器身份,那么称这台机器具有智能。
也是从那时开始,人类世界开始了对人工智能长达半个多世纪的探索,但至少在2000年以前,困难总比惊喜多,人工智能还经历了两次发展寒冬:
一次是在1974-1980年,受限于计算器计算能力,AI技术研究遇冷,研究资助被大规模缩减甚至取消;另一次是在1987-1993年,期间人工智能计算机DARPA的失败为AI泼了一盆冷水。
失败也不全是坏事。跌跌撞撞盛衰起伏的过程中,AI的发展在2006年以后迈进了新的阶段——由机器学习迈入了深度学习阶段,离真正的人工智能更近。
自此之后,人类对AI的探索之旅明显加快,一些重要的里程碑时刻相继出现了。比如2014年,第一台通过图灵测试的计算机诞生,它让人类相信它是一个13岁的男孩;比如2016年,ALphaGo战胜围棋世界冠军李世石。
再到2022年底,ChatGPT一夜爆火。
不过,纵观AI的曲折进程,技术与实验成功之间隔着一道墙,实验成功与大规模应用之间又隔着一道墙,应用落地与最终的商业化之间,也隔着一道墙。
这导致,我们依然无法对AI的进程抱有太高的期待,包括当下火热的ChatGPT。
2022年下半年,科技界最受瞩目的大事件,莫过于美国的人工智能研究公司OpenAI发布了ChatGPT。
ChatGPT是一个智能对话系统,用户在注册后,能够对这个系统发出各种各样的提问,系统自动生成答案。
最开始,没有人会想到,这样一个只是提供人机交谈的系统,却成了2022年全球最后一个爆款产品。
OpenAI 11月30日发布了它,短短一周后,全球范围内已经至少有100万人在使用它。
OpenAI的公司估值也水涨船高。根据媒体1月10日的相关报道,微软计划向OpenAI投资100亿美元(合人民币677.51亿元)以收购其49%的股权,目前双方正在谈判,预计OpenAI投后估值将达到290亿美元。
再到1月12日凌晨,OpenAI在社交平台上表示,其开始考虑对ChatGPT进行收费,以实现商业化,可能包括ChatGPT Professional(专业版)、每月订阅付费等方式。
短短半个月的时间,ChatGPT实现了一定程度的规模化、赢得了高估值、还将商业化提上日程,它的成长速度足以令人咂舌。
ChatGPT能短时间内爆火的原因,数智界认为有两点:
第一,从表层来看,ChatGPT表现得更聪明了。
ChatGPT不只能回答简单的知识性问题,还能够回答开放式问题,并且能与用户进行多轮对话。比如用户此前在社交媒体上分享的问题中,就包括了让ChatGPT写代码、与ChatGPT聊人生哲学、让ChatGPT写诗等等。
在很多问题场景下,ChatGPT都给出了出乎意料的回答。比如下面这段,ChatGPT用鲁迅的文笔描述网友的心情:
“在疫情的蔓延中,我困了门里,困了心里。屋外一片荒凉,想起一顿火锅的香味,瞬间让我心慌。这时候我才知道,疫情来临,它让人生无聊而悲凉,也让我们看到自己的无助与弱点。然而我们又岂能放弃对美好的追求,岂能把欲望压抑到不想吃火锅的地步?”
第二,ChatGPT的走红背后,AI大模型正在成为行业趋势。
人工智能中,NLP(自然语言理解)是一个核心概念,被称作是人工智能皇冠上的明珠。
在NLP中,之前往往需要对单个小任务进行训。比如要让AI掌握对话的能力,需要一个小模型、要让AI学会协作,需要另一个小模型、要让AI能阅读能理解,又需要另一个小模型。
但是人工智能从机器学习阶段迈入到深度学习阶段之后,现在单个大模型就可以完成各种类型的任务训练,也就是对不同问题在同一个模型上进行预训练。
深度学习里有个Double Descent现象:随着模型参数变多,测试错误率会先下降、再上升,然后第二次下降。原则上,在成本可接受的情况下,模型越大,准确率越好。
具体到ChatGPT的发展来看:
2018年第一代GPT面世时,OpenAI还只是用它来做语言理解方面的任务;
2019年GPT-2,得益于更高的数据质量和更大数据规模,其生成的故事在流畅度和逻辑性上更加完善;
2020年的GPT-3,更加完善成了一个大型语言预测和生成模型,能够生成长序列的原始文本,语言处理更强大、更快,甚至无需任何特殊的调优;
再到当前的GPT-3.5,则是一个多模态大模型,比起之前的版本更加成熟、准确率越高。
仅当前来看,ChatGPT的表现已经带给了人类惊喜,但必须要知道,它现在依然面临着一些缺陷。
比如在回答某些问题时,它可能给出看似合理、实则是错误乃至荒谬的回答;比如你反复问同一个问题,但是用不同的话术,很可能会得到前后不一的答案;比如它的很多回复过于冗长;比如它现在还无法完全拒绝一些不合理、不道德的请求;
但这些问题的存在并不会完全阻断ChatGPT的商业化路径,OpenAI考虑通过专业版和每月订阅付费开始商业化,就说明了这一点。
国海证券在一份研报中指出,随着ChatGPT的不断调优,其有望在医疗、客服机器人、虚拟人、翻译、营销、游戏、社交、教育、家庭陪护等多个领域被应用,潜在的商业模式存在以下几种:
云服务——客户使用ChatGPT的云服务来支持他们的聊天机器人应用程序;
内容营销——ChatGPT根据用户的兴趣和喜好向用户推送广告;
数据盈利——ChatGPT生成的大量数据,包括会话日志和客户反馈,这些数据可以通过出售给第三方或用于改进ChatGPT的功能来变现;
咨询服务——ChatGPT可以分析客户对话并提供见解和建议,以改善客户体验;
版权授权——ChatGPT可以授权给希望在自己的聊天机器人应用程序中使用其功能的客户。
当然,以上这些潜在的商业模式,实际上是整个对话式AI都面临的巨大空间。ChatGPT只是作为其中最具代表性的AIGC文字内容生产工具之一,优势更明显。
我们也看到,基于ChatGPT的商业潜力,很多科技巨头都在加快布局。反应最快也最激烈的,是微软。
早在2019年,微软就向OpenAI投资了10亿美元,前段时间ChatGPT爆火后,微软又传出欲以100亿美元收购OpenAI的消息——如若交易达成,这将成为微软迄今为止最大的一笔投资。
最新的消息是,微软CEO纳德拉表示,微软计划将ChatGPT等OpenAI的人工智能工具整合进公司所有产品,并将其作为平台供其他企业使用。
一个有趣的细节是,此前微软尽管多年来连续投资OpenAI,但比尔·盖茨并不喜欢这项投资,他对OpenAI的技术持怀疑态度,认为其部分侧重于计算机掌握人类语言含义的能力。
但是在1月12日的一次活动中,当被问及如何看待ChatGPT时,他表示,“这让我能一窥未来,整个平台的方法和创新速度都令我印象深刻。”态度已然转变。
ChatGPT爆红之后,其在编程、文本生成等NLP领域强大的能力已经引发了部分行业的担忧。
比如由于ChatGPT拥有基于对话形式接收输入指令并输出结果的能力,与传统的搜索引擎功能具有一定的重合。
我们也看到,最近搜索引擎巨头谷歌动作频频,显然感受到了ChatGPT带来的压力。
据媒体报道,谷歌CEO Sundar Pichai参与了一系列探讨谷歌AI战略的会议,同时公司的研究、信任与安全等部门和团队,将被组织重整,旨在帮助开发和发布新的AI原型和产品。
谷歌还要求员工开发能够创建艺术品和其他图像的AI产品,对标的正是OpenAI的另一项产品DALL-E,一个可以根据书面文字生成图像的人工智能系统,目前已经吸引到超过300万用户。
报道还指出,谷歌管理层已经发布了“红色代码”警报。在硅谷,这就意味着拉响了“火警”。
谷歌摆出积极防御姿态的同时,关于ChatGPT会不会取代搜索引擎的讨论,也一再升温。
去年12月,摩根士丹利投行的首席分析师Brian Nowak在一份研报中提到,语言模型可能会占据市场份额,并破坏谷歌作为互联网用户入口的地位。
专栏作家Parmy Olson也撰文指出,相比谷歌搜索抓取十亿个网页内容编制索引,然后按照最相关的答案对其进行排名,包含链接列表来让你点击,ChatGPT可以直接基于它自己的搜索和信息综合的单一答案,回复流程更加简便。
不过就目前阶段而言,说ChatGPT可以直接取代搜索引擎,恐怕还为时尚早。
参考中国银河证券的观点,其认为有两点原因不能忽略:
第一,ChatGPT与传统搜索引擎的功能和优势并不相同。
搜索引擎是帮助人们做信息检索的,人们的检索行为会返回多条查询结果、准确率也较高,并且搜索引擎不会对信息做出判断,完全呈现结果供用户进一步筛选;
ChatGPT则是一个自然语言处理模型,用户输入单一指令,只能得到单一结果,以此来确保与用户对话过程的流畅性。
第二,二者的应用领域不同。
搜索引擎的信息库抓取信息快、信息库更新频率高、存量大,主要用于帮助用户快速查找匹配信息、找到感兴趣的信息,尝尝应用在文献检索、互联网搜索等领域;
而ChatGPT的语料库来源于离线数据,输出的文本存在虚假信息的可能,且吸纳新的知识需要对模型进行再训练和微调,这会导致训练成本和甄别成本上升,因此主要应用在人机对话、智能客服、智能问答等强逻辑性的自然语言交互领域。
除了这两点原因之外,ChatGPT还面临着信息老旧的问题。它并不会在网络上抓取实时信息,知识仅限于2021年之前学到的东西。
基于以上几点,短期之内,ChatGPT无法取代搜索引擎,但它可以作为当前搜索引擎服务的一种补充,也会对现有的搜索引擎公司产生一定的冲击,促进巨头间竞争。