导读:乘着深度学习的“东风”,AI再一次迎来了新一轮的发展机遇。然而近期,AI投资下降,商业化进程受阻的消息频出。这是否意味着,已经历经两次低谷期的AI,将会再一次遇冷?
近日,智源研究院战略研究中心对本轮人工智能的发展历程进行了分析研究,并做主题报告。报告认为,当前AI商业化受阻的主要原因在于企业选择的应用场景较为集中,以及回款速度慢,投资大环境遇冷等。报告同时分析了大模型、AI for Science等值得关注的新兴热点,并分析了未来AI技术的商业化趋势。本文对报告内容进行了整理,以飨读者。
作者:倪贤豪、殷靖东、靳虹博
整理:戴一鸣
01
背景:AI商业化再次受阻,重蹈旧日覆辙,还是迎来新曙光?
由于技术和商业化因素,人工智能的发展经历了三次上升和两次低谷期。本轮AI的大发展从2012年AlexNet在ImageNet上击败所有视觉传统方法开始,至今已有十年的时间。
以国内的AI公司为例,主要头部AI公司已经进入上市或启动上市的进程之中,AI赛道的融资额也在2021年达到了巅峰。但步入2022年,二级市场AI公司的市值,以及一级市场AI公司的融资额下降明显。
AI公司商业化受阻已是不争的事实,受挫原因主要在于:场景过于同质化造成天花板较低。很多AI公司的业务方向集中于安防、交通、金融等方向。这些方向的共同特点是,政府及其相关单位是其中多数项目的主要甲方。近年来,通过参与雪亮工程、平安城市等项目建设,厂商已经将前述赛道基础场景下的资金基本消化。随着行业数字化智能化步入深水区,进一步的需求对于乙方的工程交付、产品能力要求不断加深。这决定了参与其中的AI公司的营收增速趋于放缓。加之始终高企的研发投入和长回款周期,以及传统硬件头部厂商如“海大宇”在AI侧的持续升级,头部AI公司盈利不佳,进而在资本市场遇冷也是意料之中。
02
新的突破点:可能成为拐点的新技术新应用
有哪些机会将成为AI行业可能的发展拐点?在这里我们尝试举出几个案例。
1. 新技术:大模型
当前环境下,大模型有机会成为拐点技术。从两方面我们可以看到迹象。在科研方面,小模型模式下,AI的性能提升已接近瓶颈。但大模型为这一问题带来解决方案。如下图,在数据集不断增大的情况下,若同时将模型规模放大,带来的精度提升可以达到10.5个百分点。相应地,单方面对于模型规模或数据集的扩容并没有这样好的效果。
而在工业界,大模型也有望带来研发模式的转变。以APP工厂模式为例,很多互联网公司采用的是这样的开发模式:频繁推出APP的方式,做出满足需求的最小可行品(MVP),再投入到不同的赛道去做测试。
在之前的APP工厂模式下,如果涉及到AI算法,通常采用的是小模型的方式。假如有n个模型的需求,就需要做n次的数据处理、模型设计、参数调优,其他部分则采用中台模式,接入工程库池,加上少量的定制开发,最后输出APP。而在大模型的研发模式下,如能够采用较好的数据集进行预训练,再以目标赛道的小数据微调,可以达到人力和开发成本的降低。
优劣势对比而论,小模型APP工厂,其研发的产品复用性较低,场景和模型之间的具有强绑定关系。而在大模型APP模式下,场景与模型的互动性较高,模型+微调这样的流水线模式可以得到较好的复用。当然,APP工厂模式的大模型升级思路只是大模型应用的一个方向,也仍需行业实践验证我们的构想。在C端赛道增速不再的当下,我们还需要找到更多通用或是刚需垂直的应用场景。
在学术界和工业界,目前已经可以看到大模型快速发展的趋势。据统计,2021年有关大模型的相关论文达到了巅峰。在工业界,也有很多AI公司尝试做大模型商业化。比如,在文生图等领域的初步商业化探索,尤其是插画领域的相关尝试,已经使得不少风格固定的插画作家开始担心被AI代替的可能性。未来相信我们有望看到更多诸如此类的商业应用。
在数据、算力、算法等AI三要素相对成熟的当下,我们看到,仅在融资规模达到巅峰的2021年之后一年时间里,大模型的商业化探索便已得到业界相当的关注。无论是GPT-3的350+应用,抑或是阿里M6模型的200+应用,抑或是百度Eernie等大模型的“文生图”商业化,或许我们可以期待此次AI行业的商业化受阻只是暂时的,所谓的“三落”还言之尚早。
2.新应用:Alphafold2
大模型之外,其他技术也具有质变的发展潜力。值得一提的是AlphaFold2,是AI4S方向的应用。当然,从市场角度来看,商业变现能力没有大模型那样优秀,仍有待根据业界的实际使用反馈考虑下一步的应用。
3.AGI仍旧可期
尽管目前业界对AGI的走向争论不断。引用智源研究院院长黄铁军对三个主流AI技术的判断——基于深度学习、强化学习和类脑智能的技术都将有发展的机会。深度学习的成熟度是最高的。其次则是强化学习和类脑智能,目前仍处于技术发展的阶段,如强化学习Xland、Gato,智源研究院的天宝1.0等,但距离支撑起整个赛道商业化前景的角度还比较遥远。具体而言,AGI仍有无限可能。
03
趋势前瞻:哪些行业应用具有变现价值?
上文我们重点阐述了技术侧的突破。以下我们更多地从行业应用和AI系统层做判断,同时会兼顾商业变现规模和落地时间。
1.行业应用
在应用方面,目前具有商业变现价值的主要是AI4S、元宇宙、虚拟数字人、Web3、自动驾驶、机器人等赛道。
首先是AI for Science,根据鄂维南院士的划分标准,当前已经从计算模拟辅助实验走向了算法指导实验的阶段,即AI4S 2.0。
在这个节点上,目前已经有一些关键成功案例,例如AlphaFold2在生命健康领域已经成为了领域通用的工具,以数据库的形式提供服务。同时还有在微观物理层面的DeePMD,指导核聚变研究的突破等,但还没有做到如Alphafold2这样规模应用的程度。除此之外,我们还可以看到AI在大气科学、神经科学领域也逐渐开启应用探索。
第二个值得注意的赛道是元宇宙。目前元宇宙处于过热期,刚刚过了媒体炒作的巅峰。在元宇宙赛道,最可能跑出来的厂商类型有以下几类:由互联网公司发展而来的综合性平台厂商、游戏厂商、AR/VR软硬件的开发商,以及社交类应用的厂商。
未来几年,元宇宙的落地时间,可以从载具(HMD)的售卖量和场景的覆盖率来判断。国内外有很多企业在这个方向上有机会进行发展。整体上来看,在2025~2026年期间,我们有望看到一款以上的元宇宙爆款单品出现。
虚拟人,作为与元宇宙紧密相关的赛道,去年以来受到了多方关注。AI在其中也能起到很好的作用。具体而言,AI作用主要体现在降本增效环节,通过替代传统的图形学方法,加上多样化、拟人化技术,形成整体的虚拟人,同时还会加上智能语音、NLP等技术,赋予虚拟人独立的身份特征和性格,是较快看到落地效果的领域。
Web3,现阶段更多地是Web2加上区块链的模式,也就是狭义的Web3。广义的Web3和元宇宙的概念更为接近。综合来看,在2026到2028年之间,随着关键技术的日趋成熟,我们有望看到杀手级的Web3应用的出现。
自动驾驶方面,目前的主要模式是RoboTaxi,在国内已经开始测试。商用车方面,在港口、矿区等封闭场景,规模化应用已经开始。2021年被称为是自动驾驶元年。随着新能源汽车(智能网联汽车)的推进,数据将得到更好的积累。与此同时,路侧车联网的建设,叠加政策引导,我们会看到自动驾驶商业化的速度超出当前预期。
机器人领域,始终是AI技术的核心应用方向。当前,我们也能看到视觉或NLP大模型等新一类AI技术的应用可能。比如,工业机器人的工业视觉或者服务机器人的感知技术智能交互,以及特种机器人采用的感知技术,都能够采用视觉或NLP大模型去做赋能升级。
服务机器人是目前C端消费者感知最好的机器人品类,但特定领域的成熟度还是相对弱一点。在工业机器人(非人形的机器人)的应用已经比较好。
最后是AI医疗,其市场规模保持着逆势增长的状态。如上图,在技术商业化产品上,AI的应用成熟度比较高。但探索研发类的产品,如辅助机器人等,AI的应用成熟度相对较低。
2.AI系统层
AI系统层包括芯片、计算框架、模型等。我们认为,打磨好以GPGPU为代表的芯片,并辅之以异构并行计算平台(CUDA)实现算力的高效利用。在此基础上, 通过成熟高效训练框架构建大模型,完善模型压缩,迁移,再学习等技术,叠加具体垂直赛道的小数据微调,或许我们能看到真正的AI时代到来。
在训练框架方面,目前呈现TensorFlow和PyTorch双寡头竞争的格局,后来者想要有所突破挑战巨大。
我们试着从模型的可获得性、部署能力、易用性,应用规模等维度,对PyTorch和TensorFlow做竞品分析。可以看到,目前PyTorch在第三方模型的支持上领先很多,以Hugging Face为例,PyTorch支持的模型数量占比达到85%。
部署能力方面,目前TensorFlow依然更高,因为其在工业领域的应用和移动部署方面相比PyTorch更为便捷。
易用性方面,PyTorch优势明显,具体而言,TF混乱的API设计和Debug难度高为Pytorch的超车提供了机会。
也正是易用性上的优势,使得学术界使用PyTorch的比例很高。但在工业界方面,TensorFlow还是领先。但考虑到未来学术界的科研人员不断转往工业界,不排除将使用PyTorch的习惯带去,拓展其在工业领域的应用范围。这对TF构成挑战。
当然,计算框架仍在不断发展,包括API体系的优化,动静态图的切换优化,和芯片的标准化适配等,需要持续进行调整。PaddlePaddle等国内框架也都还有机会。
关于异构并行计算平台,主要分为硬件(芯片)和软件栈。所谓软件栈主要由硬件驱动、API及Libraries构成。硬件则是芯片本身设计的相应优化。通常我们指称的CUDA为软件栈,硬件层则更多属于芯片范畴。有了异构计算平台,可以实现算力放大的作用,支持上游的应用开发,对模型的便利开发和支持。
在这个方面,英伟达推出的CUDA是目前最成熟的,包括针对机器学习、深度学习,以及高性能计算推出的CUDA-X Libraries。围绕CUDA业已形成150+库、SDK、调试工具等全套生态系统组件及600+行业应用。
“GPGPU+CUDA”模式加持下,为Nvidia带来了宽广的护城河。对于国内厂商而言,无论是异构并行计算平台,还是芯片,赶超难度都很大。
而对于英特尔和AMD两家巨头来说,仅在芯片发力,缺少像CUDA这样的软件栈则同样制约着它们的进一步发展。因此近年来,我们能看到这两家在这方面持续投入。
关于芯片,当前以GPU为主的云端训练模式很难替代,基于GPU的云端训练芯片的市场份额达到90%,这依然是英伟达擅长的方向。
那么,其他厂商如何超车呢?从目前格局来看,芯片侧厂商们多通过自研框架、芯片或自研工具链+芯片的方式进行超车。
如英伟达市占率有所下降,比如10%,填补份额的芯片厂商都将凭借10%背后代表的大规模出货量获得主流框架的高度适配。“框架/异构并行计算平台+芯片”的模式,或将因此为其他厂商所复刻。近日美国宣布禁止英伟达对华销售A100和H100芯片,其市值就跌了很多,这对国内厂商而言是一个利好。
大模型方面,大模型的商业化应用仍处于早期阶段,但从其高昂的研发成本来看,这个赛道最终会形成少数厂商寡头竞争局面。至于国内的大模型,我们的悟道系列大模型有不小的机会。
至于大模型的未来商业化方向,目前来看更多是生态的发展。以GPT-3为例,目前的应用数量达到350个左右,涵盖医疗、营销、客服、教育、法律、元宇宙、文娱等。而整个GPT-3项目营收规模已达到5680万美元,对OpenAI而言比较可观,毕竟其员工仅有200多人。
04
投融资分析:大环境导致的规模大减
在投融资方面,从整体行情判断,全球范围内2022Q1的AI融资环比下降12%。但与之相应地,所有赛道的融资额总计环比下降了23%,AI赛道反而具备一定抗压性。
在全球AI融资的区域分布上,依旧是美中欧格局。美国绝对领先,占全球的AI融资比60%。中国和欧盟等量齐观的,分别在10%左右。
国内方面的投融资行情更差一些。今年第一季度,整个AI领域的融资额下降45%,整体AI融资数据回到了20年Q2/Q3水平。但同期国内整体的融资额下降53%。另一方面,我们对比20年Q2/Q3的AI赛道和整体融资数据,能发现AI赛道融资数据和整体融资数据依然处于正常区间,从2020年到2022年间,并没有出现明显的恶化。大环境的影响仍是主要因素。
具体到AI赛道的投融资分析,在投融资轮次的分布方面,早期的AI企业投资比例趋于下降。过去厂商会拿下一到两个头部种子客户,做出产品就可拿到高额融资的模式,很难持续。
此外,直接输出标准化产品在C端变现,或是可以在除安防、金融、交通之外的B端客户获客变现的企业,当前往往更具备进一步发展壮大的可能性。而通常具有这样比较通用和泛化商业能力的厂商,其所在的投资轮次已经较为靠后。因此,无论是赛道本身格局变化带来的洗牌,还是出于投资收益率的考量,早期的AI投资比例在下降,投资人关注中后期投资的情况会越来越明显。
产业链投资环节分布来看,获得投资的应用层企业占比一半以上,但基础层企业获投的上升趋势比较明显。这与整个行业进入深水期有关。早期应用层商业发展提供解决方案,但如果要从解决方案发展为产品和工具,就离不开在基础层、技术层方面进行投入。
报告对可进入的AI细分赛道也进行了分析。围绕规模增速、竞争强度、竞争力构建、产品化程度、融资规模、数据基础、潜在收益、风险可控等八个指标搭建赛道筛选模型。
细分赛道来看,交通和机器人、智慧医疗是目前应用层可进入价值相对较高的三个赛道。值得一提的是,智慧交通在产品化程度低的同时,要求强工程交付、强政府关系,这对创业公司带来较大挑战。
在基础层和技术层方面,机器学习和计算机视觉是主流的发展领域,而知识图谱的商业化程度在加速,但仍存在同质化的问题。
04
总结
从以上研究结论来看,当前AI第三次浪潮确实遭遇挫折。但危中有机,我们能在大模型等新领域实现通用场景下的商业化突破,在AI4S、元宇宙、Web3、虚拟人等赛道找到更好的刚需赋能场景。与此同时,在异构并行计算平台(CUDA/类CUDA)和芯片方面夯实基础,高效兑现芯片能力,有力支撑AI在行业侧的商业化应用。
这样一来,AI行业发展或将迎来全新拐点,迈入新一阶段的快速发展期。