国内互联网大厂已经很久没有这样的盛况了!
在各自领域成长为头部的互联网大厂们,近年来正在向“自留地”的纵深发展,正面交锋的机会并不多。直到大洋彼岸传来GPT的声音后,一下子抓住了大厂们的G点,他们仿佛听到了新一轮战争的号角,迅速奔赴AI大模型的战场。
2月份Chat GPT-4问世后,市场再次感知到了大模型的威力,相比于去年末发布的Chat GPT-3.5,新一代GPT算力和逻辑能力更强,商业价值也随之凸显。业内人士认为,这将是开启下一个时代的技术竞争高地,如同千禧年的互联网一般。
可以“change the world”的机会,国内互联网大厂们自然不能错过,短短两个月的时间,先后宣布进军大模型的公司不少于30家,这其中不仅包含百度、阿里、京东等超级大厂;也有商汤科技、科大讯飞等AI科技公司;阔别台前许久的互联网知名人物王惠文、王小川等也步履不停,大张旗鼓地成立新公司。
具备先发能力的互联网大厂们,更是在当下迎来密集的发布阶段。
3月16日,百度抢先发布大语言模型“文心一言”;4月9日,三六零官方正式宣布,基于360GPT 大模型开发的“360智脑”落地搜索场景;4月10日,商汤科技发布“ 日日新SenseNova ”大模型体系;同一天,昆仑万维宣布即将推出“天工”大模型;4月11日,阿里巴巴大语言模型“通义千问”正式亮相……
然而,迫不及待的发布大模型之后的前景又如何呢?
Chat GPT走俏,最大的受益者莫过于微软。当年微软解散炙手可热的元宇宙团队,先后三次投资900亿砸向Chat GPT,如今Chat GPT的能力已经集成在微软的搜索引擎必应和微软办公软件中。微软的必应能够提供更精准的生成式回答,Microsoft 365 服务已全面接入 AI 驱动工具 Copilot。
在可预见的未来内,这或许才是大模型商业逻辑的最优解,拥有技术能力仅仅只是敲门砖,基于大模型的能力敲开未来的商业大门才是真正的市场竞争逻辑。对此,国内的大厂们准备好了吗?王慧文们找到答案了吗?
从商业的角度来讲,技术没有商业使用场景那便是空中楼阁;从技术本身的角度出发,商业使用场景能沉淀更多的数字资产,助力技术迅速迭代。这条逻辑同样适用于大模型技术,人工智能这个雪球,在商业的雪地上滚动起来,才能带动产业指数级的增长。
作为Chat GPT的“金主”,微软第一时间享受到了大模型带来的技术红利。
多年来,微软虽位列全球互联网大厂第一梯队,但其主要业务之一的搜索引擎,一直困在谷歌的阴影之下。根据2022年的数据显示,谷歌的搜索引擎在全球 PC 端搜索市场份额高达 84%。第二名才是微软的必应,占比不到 9%,其差距显而易见。
不仅如此,早期谷歌在AI领域的研究更是领先微软半个身位。2013年,谷歌聊天机器人研发起步,三年后谷歌推出的人工智能AlphaGo 打败围棋冠军李世石。随后,取得阶段性突破的谷歌,将机器学习等 AI 技术整合到谷歌全家桶中。
彼时,微软才刚推出聊天机器人“Tay”,但仅仅几小时后,因为机器人的不恰当言论引发争议,微软紧急撤下。
2017年,谷歌再次取得重大的技术突破,研发了神经网络系统Transformer,这也是ChatGPT的底层技术之一。
可以说,直到2017年微软一直没能在AI领域超越谷歌。
木秀于林,风必摧之。正是在人工智能领域的卓越,使得谷歌那几年备受舆论争议,专家和学者开始抵抗人工智能技术的发展,并向谷歌施压,要求其承诺不会将技术用作非法途径。2018年,谷歌宣布不会将AI技术应用于军事武器制造方面,随后的几年,谷歌在AI领域的进程并不顺利,频频爆出AI伦理问题,核心人员陆续离开谷歌。
在此阶段,非营利性组织Open AI成立,其GPT模型在谷歌云上运行。2019年,微软投资Open AI,拿到GPT的独家授权,OpenAI 从谷歌云转向微软云。据了解,微软和 OpenAI 合作的主要目标就是增强搜索能力,并在 Microsoft Office 中提供语言翻译。
2022年末,Chat GPT3.5向公众开放,几乎是在瞬间引爆了市场,仅仅两个月月活破十亿,看到商业曙光的微软又追投100 亿美元,并且微软云服务是 ChatGPT 的独家云提供商。
此时谷歌预感到重大威胁,内部拉响了红色警报,一位 AI 领域的风险投资家表示:“谷歌在搜索界当了太久的垄断王者,这次必须会为市场份额而战。因为一夜之间,有很多不用 Windows 电脑的朋友都想试试必应了。”
去年末谷歌开始奋起直追微软,谷歌和微软的竞争态势和几年前换了个位置。今年初,Chat GPT4发布,更强的语义理解再次颠覆市场对人工智能的认知,谷歌也推出了聊天机器人Bard,发布当天就因答案准确性存疑受到市场吐槽。而且Bard在技术层面被GPT4碾压,Bard并不能支持多语言,仅会英文,而且不会编程。
时至今日,微软已将GPT的能力集成在必应和其他业务中。有了GPT撑腰,微软找到了再战谷歌的技术底气。
这或许就是国内大厂紧锣密鼓筹备上线大模型的原因之一,对未来的恐慌可能大过业务端对大模型的需求。但仅推出大模型拥有技术傍身并不够,和自身产业协同,才是面对未来的底气。
在Chat GPT走俏之前,国内大厂其实早有大模型技术储备,但并未被推到聚光灯下,直到这次浪潮,大厂们才纷纷拿出压箱底的大模型。如若按照商业模式来看,大厂们的大模型技术,主要分为两种:为自家“嫡系”应用层赋能、向企业合作伙伴输出技术能力。
从最早迎战的百度来看,2019年百度发布文心大模型,经过迭代后目前主要有通用大模型、行业大模型、任务大模型。通用大模型具备通用知识能力;行业大模型则是针对特定行业,具备对行业 know-how 的了解,应用在行业特定场景中;任务大模型主要面向特定任务,如NLP领域的信息抽取、对话、搜索等,以及视觉领域的商品图文搜索,文档图像理解等。通过百度的飞浆平台,三种大模型一直在不断进化。
在应用层上,百度去年向公众开放了AI作画平台“文心一格”和产业级搜索系统“文心百中”。3月,百度又推出对标Chat GPT的应用文心一言,发布之际李彦宏表示“文心一言和ChatGPT水平就差两三月”。
文心一言具备文学创作、商业文案的创作、数理逻辑的推算、中文的理解、多模态生成等能力,算是百度ALL IN AI以来第一个集成多方面能力的应用层代表。
从百度业务的基本盘来看,百度或许是最有可能复制微软商业逻辑的国内互联网大厂。何况在国内搜索引擎领域中,尚未有能和百度形成竞争的公司,大模型的应用,即能加强百度智能搜索的技术能力,亦能让百度的长板更长。
值得注意的是,在百度生态中,不乏百度贴吧、百度文库等承载大量内容数据的应用。这些数据资产同样可以反哺给文心一言,形成良性发展的循环。
此外,文心一言的能力也可以应用在其他百度系的应用中。百度地图已经全面融合文心一言,并发布交通大模型,百度地图升级为具备自学习、自进化能力的 AI 导航,为百度在地图领域的竞争增添士气。
除了自家应用可以借助文心一言的能力升级外,百度亦可以开放给企业级客户,李彦宏提到超八万家企业在排队谈合作。
阿里的“通义千问”商业逻辑和文心一言相差不多。
阿里大模型的商业化也在此前展现了潜力,2019年阿里推出基于预训练语言模型的通用对话框架,2021年11月,阿里达摩院宣布了M6大模型,一个基于10万亿参数的多模态大模型。
根据阿里公开的内容,M6大模型在淘宝、支付宝、天猫等阿里旗下产业中应用落地并取得了一定成绩。不过M6模型仅局限在阿里系内部使用,并未面向公众开放。
“通义千问”的诞生,阿里的AI能力才开始向外延伸。“通义千问”基于语言大模型,可以处理问题,执行任务写文章、写脚本等。
在商业化层面,阿里分内外两条路线。内部来看,钉钉、天猫精灵将率先接入测试,在评估认证后正式发布新功能;外部来看,阿里开放“通义千问”的能力,企业基于“通义千问”打造具备自己行业能力的专属大模型。
从阿里自身的生态来看,“通义千问”的能力可以使得To B领域的钉钉更加智能化,To C业务的淘宝、支付宝、天猫精灵等,可以借助大模型能力更懂用户需求,提升用户体验。
京东和腾讯的大模型目前还未解开面纱,但可以预见的是,京东大模型会更偏向零售业产业级的应用,2019年京东基于自研领域模型K-PLUG,具备对商品的sku自动生成长度不等的商品文案的能力,包括商品标题、商品卖点文案和商品直播文案三类,目前商品文案写作能力已覆盖2000多个京东的品类。
腾讯的混元大模型,会更加偏向腾讯自身产业生态,据了解腾讯混元助手项目组的目标是通过性能稳定的强化学习算法训练,完善腾讯智能助手工具,打造腾讯智能大助手,成为国内的业界标杆。
从大厂的角度来看,其实各家都已具备大模型能力,只是GPT的浪潮让大厂们提速了大模型的商业化进程。对于大厂而言,推出大模型的作用,还是偏向于技术储备,做到“人有我有”,更像是拿到一张通往新时代的船票。
商业化角度,大厂们首先从自身应用层切入,一方面可以夯实自身应用在行业内的地位,另一方面也便于大模型的训练。至于技术能力外溢,赋能其他合作伙伴,或许才是未来大厂大模型商业竞争的关键点。
相比于大厂应用范围辐射面积较广,AI领域的企业更专注于自身技术,鲜少直接出现在落地应用层面运营。所以对于AI企业而言,大模型更重要的是向各自专注的领域纵向延伸,提供下游客户更智能化的解决方案,为自己夯实在业内的竞争力。
从AI四小龙商汤来看,去年商汤科技推出了书生2.5多模态大模型,前不久又推出日日新大模型,包括自然语言生成、文生图、感知模型标注以及模型研发功能。同时,商汤推出了自研中文语言大模型应用平台“商量 SenseChat”。可实现多轮对话、逻辑推理、语言纠错、内容创作、情感分析等。
商汤在发布会现场展示了语言大模型支持的几项创新应用,编程助手可帮助开发者更高效地编写和调试代码;健康咨询助手,为用户提供个性化的医疗建议;PDF文件阅读助手,可以从复杂文档中提取和概括信息。
从商业角度来看,日日新为政企客户提供了多种灵活的API接口和服务,可根据实际应用需求,调用日日新大模型的各项AI技术能力,低门槛、低成本、高效率地实现各类AI应用。
此前商汤科技通过大模型技术,在智慧生活、智慧城市、智能汽车等多业态实现落地应用。日日新对于商汤自身而言,可以说是在原有的解决方案基础上,再进一程。例如,在智能驾驶领域,基于视觉大模型商汤实现了可识别3000类物体的BEV环视通用感知算法的实车量产。
同在AI领域的科大讯飞,进程稍微落后于商汤科技。
科大讯飞在2022年12月份启动生成式预训练大模型“1+N”任务,其中“1”是通用认知智能大模型算法研发及高效训练底座平台,“N”是应用于教育、医疗、人机交互、办公、翻译、工业等多个行业领域的专用大模型版本。
据官方透露,大模型的发布时间预计为5月份。虽然同属AI赛道,但科大讯飞会直接参与面向C端消费者的产品,推出科大讯飞学习机、智能办公本、录音笔等。科大讯飞的大模型不仅可以提升对于B端的解决方案,更能直接在C端产品中应用,为产品增加较强的竞争力。
实际上,相比于大厂而言,专注于AI赛道的企业才是真正的面临白热化的竞争。一方面要加强自身的技术能力,和行业内其他玩家抗衡,另一方面又要抵抗大厂的冲击,在大厂的辐射范围内差异化抢夺市场份额。
更何况,GPT的浪潮让许多本来称不上是竞争对手的企业也加入赛道,例如360等其他领域的企业,还有市面上即将涌现的一批以王惠文、王小川为首的新兴大模型创业公司。假以时日,他们或许也会掀起足够大的水花,对原有的AI竞争格局造成冲击。
从商业角度出发,或许AI企业会在商业进程中取得领先,毕竟深耕AI多年的商汤科技、科大讯飞等,更专注于AI能力的进化,在产业内多年也积累了一定体量的用户规模。
新技术的出现,带来的是无限的想象空间,今时今日的大模型混战,仿佛让我们穿越到了互联网的开端。Chat GPT如同“鲶鱼”,刺激了国内科技企业向新技术领域的突破。
但当我们畅想大模型未来的星辰大海时,不能忘了技术与商业的结合,缺少任何一环,都是完美设想中的海市蜃楼。
目前,我们经历的国内大模型爆发期,也仅仅只是一个开始,虽然各家能力各有所长,也有明显的不足,但从市场进程来看,尚未达到可以给各家大模型排名次的时候。而未来谁率先在商业上取得成功,才会与技术形成互为促进的关系,才能持续取得成功。