今天分享的AI系列深度研究报告:《2024年度AI投资策略报告:AI三要素共振,AIGC云到端加速推进》。
(报告出品方:中国银河证券研究院)
报告共计:103页
(一)行业行情回顾及 202303 业绩总结
1、受A借化行业上半年涨势如虹,6 月下旬后震薪回调
回顾 2023 年,受 ChatGT 引发的新一轮人工智能大模型浪潮影响,行业整体表现活跃。
2、行业前三季度营收增速同比下降,归母净利润同比改善
2023 年由于受地方财政承压等因素影响,前三季度行业业绩表现不达预期,2023 前三季度, 行业营收同比增长 5.00%,但增速有所下降(去年 Q3 增速 10.36%),归母净利润同比增长 12.99% (去年 Q3 增速-59.39%),前三季度经营活动产生的现金流量净额依然为负,行业整体 ROE(摊薄) 1.79%,行业内公司平均毛利率 39.95%(同比+1.8pct),净利率-4.86%(同比+11.32pct)。
3、过去五年行业营收及净利润整体表现不佳,但企业研发投入持续提升
受地方财政支出压力等多重因素影响,自 2020 年起计算机行业营收及净利润水平均表现不佳。 企业研发费用率稳增,2023 年三季度费用率显著增至 19.22%。
(二)海外科技股行情回顾
1、年初至今美股科技股整体跑赢美股大盘,港股、中概股走势低迷
从 2023 年初截至美东时间 12 月 4 日,纳斯达克指数和费城半导体指数表现优于标普 500 指数。 2023 年初至 4 月上旬,TAMAMA 科技指数跑赢标普 500 指数和纳斯达克指数;4 月上旬后,TAMAMA 科技指数跑赢标普 500 指数、纳斯达克指数和费城半导体指数。
2、2023 年美债收益率持续走高,科技股估值阶段性承压
2023 年美联储分别于 2 月 1 日、3 月 22 日、5 月 4 日和 7 月 26 日单次加息 25 个基点,联邦基 金利率由年初的 4.50%升至 5.50%。由于美联储一系列加息,债券收益率于 2022 年初开始走高;2023 年 10 月初,基准 10 年期美国国债收益率达到 4.81%峰值,为 16 年以来的最高水平。美联储此举 致使科技股阶段性承压,加息节点走势低迷。伴随美联储加息停止,明年上半年有望进入降息通道, 科技股估值压力预期将有所缓解。
(三)投资建议:建议把握六大投资主线
展望 2024 年,伴随 AIGC 多场景落地,上游算力需求依旧景气度高企,数据要素价值释放带来数 据产业量及质量双重提升,海外巨量参数大模型开源,国内垂类大模型行业渗透率快速提升,我们认 为计算机行业明年有望迎来戴维斯双击。分子端(业绩端):区别于 2023 年的估值驱动,2024 年计 算机行业有望迎来“三要素”(算力+数据+算法)共振,积极财政政策预期带来下游需求预期改善, 以及数据要素入表,分子端业绩有望触底反弹。就分母端(估值端)而言,美联储 2024 年降息预期下, 若明年国内货币政策预期宽松将利好科技成长,流动性改善,有助于估值进一步拔升。
具体而言,2024 年建议把握六大投资主线:
主线一,算力侧:海外大厂支出指引 AIcapex 占比继续提升,国内受政策驱动及大模型参数对标游外升级,全球智能算力预计维持高景气。有别于市场的观点,市场担心未来算力需求短期见顶明年低于预期,我们认为,从长周期来看,新一代人工智能已经引发第六轮康波开启,AIGC 大模型正在成为引发的生产力变革才刚刚开始,英伟达最新财报显示数据中心营收同比增幅达 297%,预付款项指引2025 年景气度依然高企。未来 5 年中国智能算力规模年复合增长率预计将达到 52.3%,通用算力规模年复合增长率为 18.5%。细分子领域重点关注 1)算力国产化( 重点关注华为链 ;2)高带宽存储( HBM产业链); 3) AI 服务器龙头: 4) 液冷产业链: 5)算力租赁。
主线二,数据侧:数据要素三次价值释放元年,会计入表推动数据价值“显性化”。"数据人表"将于 2024 年初实行,标志着数据完成了从自然资源到经济资产的跨越,数据资产化时代正式开启。有别于市场的规点,市场主流判断数据要素市场规模预计 10 万亿市场空间,我们估算 225 年数据资本存量市场规模有望达到 35.49 万亿。数据要素完全有望成为改善政企资产负债表的重要支撑,进而推动国内经济升级转型,促进地方政府从“土地财政”全面转换升级为“数字财政”。建议重点关注:1)数据资产化的确权、定价等政策落地时点;2)国资云厂商;3)拥有数据资产或数据运营权的企业;4)数据治理、数据安全、数据复制与灾备等服务提供商。
主线三,算法侧:大模型从云到端持续推进,云端继续升级,终端大模型呼之欲出。OpenAI 明年上半年预计发布 GPT-5,Meta 预计已在开发比 GPT4 更强大的开源大模型 Llama3。谷歌发布大模型PaLM2 实现轻量级移动端落地,并即将发布多模态大语言模型 Gemini; 高通发布搭最新晓龙 8Gen3芯片模型 StableDiffusion 及其核心插件 ControlNet,均可在终端运行。云服务产品市场持续扩容,催化大模型向边缘设备落地,包括智能手机、笔记本电脑、XR、机器人,耳机,智能汽车、智能物联网终端( AIT) 等。建议重点关注侧操作系统层软件服务公司。
主线四,终墙侧:1) GPT4 加持的无屏葬可穿戴设备"AIPin"横空出世,重塑人机交互形式,2024年开始产生销量,有望开启全新终端大模型“轻量级”硬件新时代:2) 特斯拉人型机器人 202401 有望开始爬产,具身智能时代到来: 3)国内智能座舱渗透率预计值超全球水平,自动驾驶 12 逐年稳增,智能汽车销量高增长,带动智能汽车软件需求,中国智能座舱 2023 年海透率预计可达 66%,全球自动驾驶 2024 年 L2/L3 海透率预计可达 37%/1.5%,从明年开始伴随 13 政策预期突破,L3 海透率有望迎来拐头向上快速提升,4)5G 智能手机市场将在 2024 年恢复增长,华为手机成长动能预期最强劲。重点关注不同类型终端产业链零部件及软件提供商投资机会。
主线五,生态侧;华为突围带动信创生态变革,鸿蒙产业链生态持续走向繁荣,华为领衔信创产业生态变革,“妮鹏+界腾”打造双引警计算战略,"鸿蒙+欧拉”共筑国产操作系统产业发展的重要底座,鸿蒙是面向万物互联世界的操作系统,搭载华为鸿蒙系统的生态设备数已经突破 7 亿,Harmony0s开发者数量超过 220 万人,API 日调用 590 亿次,鸿蒙已经成为全球第三大操作系统。2024 年伴随国立上游产能支持力提升,华为生态将持续选代扩容。建议关注华为产业链上下游合作伙伴。
主线大,场景侧:AI+教育、金融、办公、法律、医疗有望率先落地,1) AI+教育:人工智能技术在教育领域的应用场景广阔,是人工智能落地的最优场景之一: 2) AI+金融:垂类小模型在特定领域具备较高的可行性,国内金融大模型抢滩布局:3) AI+办公: 人工智能使办公软件 ARPU 值与付费率双升: 4) A+法律,生成式 A1 可替代 44%法律工作,为法律行业多钟应用场景赋能;5) AI+医疗助力智慧医疗转型升级。建议关注各细分子领域龙头公司。
(一)算力侧:技术革新及政策双轮驱动,AI算力景气度高企
1、从供给侧看算力不断升级,未来将圣现“云-边-端”体局
从算力供给而言,可以分为通用算力、智能算力和超算算力。算力实现的核心是 CPU、GPU、 FPGA、ASIC 等各类计算芯片,并由计算机、服务器、高性能计算集群和各类智能终端等承载,海 量数据处理和各种数字化应用都离不开算力的加工和计算,算力数值越大代表综合计算能力越强, 常用的计量单位是 FLOPS(每秒执行的浮点数运算次数)。
算力是设备根据内部状态的改变,每秒可处理的信息数据量。算力的载体发展经历了以算盘和 机械计算器为代表的时代到基于架设互联网基础平台的服务器的历程。在过去 20 年,随着算力载 体的丰富程度得到了极大提升,呈现多样化发展趋势。
算力架构可以拆解为芯片、设备、软件,呈现“云-边-端”一体格局。未来将形成云端侧负 责大体量复杂计算、边缘侧负责简单计算执行、终端侧负责感知交互的泛在算力部署形式。
2、大模型驱动智能算力需求指数级增长
大模型需要强大算力来支持训练过程和推理过程。根据 OpenAI 数据,训练 GPT-3175B 的模型, 需要的算力高达 3640PF-days(假如每秒做一千万亿次浮点运算,需要计算 3640 天)。2018 年以来, 大模型的参数量级已达到数千亿参数的量级规模。而 CPU 的物理工艺、核心数已接近极限。在 AI 时代下,仅靠 CPU 已经不能满足需求,通过 GPU、FPGA、ASIC 等加速芯片异构而成的智能算力 的演化成为趋势,并最终成为生成式人工智能时代下算力的主角。
AI 时代的摩尔定律,算力平均每 3.43 个月翻一倍。自 2012 年后,驱动 AI 的底层机器学习技 术计算量呈指数级增长,根据 OpenAI 论文,深度学习前期,算力翻倍时间为 21.3 个月,深度学习 时期,算力翻倍时间为 5.7 个月,大模型时期,AI 训练任务所用的算力每 3.43 个月就会翻倍,远超摩尔定律(晶体管每 18 个月翻一倍)带来的算力提升速度。
大模型对算力的需求主要体现在以下三个场景:
(1)预训练算力需求:模型预训练过程是消耗算力的最主要场景。ChatGPT 采用预训练语言 模型,GPT-3 具有大约 1750 亿参数,GPT-4 的规模是 GPT-3 的 10 倍以上,它具有大约 1.8 兆参数, 分布在 120 个层,13 万亿 token,OpenAI 训练 GPT-4 的 FLOPS 约为 2.15*10^25,单张英伟达 A100 的算力为 19.5TFlops(浮点运算每秒 19.5 万亿次),如果不考虑利用率用 25000 张 A100 训练需要 52 天,实际情况在大约 25000 个 A100 上训练了 90 到 100 天,MFU(平均功能利用率)在 32%到 36%之间。如果按照 OpenAI 云计算的成本是差不多 1 美元/每 A100 小时的话,不考虑括所有的实验、失败的训练和其他成本,比如数据收集、RLHF(以强化学习方式依据人类反馈优化语言模型)、 人力成本等,这次训练的成本大约是 6300 万美元。
(2)日常运营算力需求:预计 ChatGPT 单月运营需要算力约 4874.4PFlops-days,对应成本约 1800 万美元。在完成模型预训练之后,ChatGPT 对于底层算力的需求并未结束,日常运营过程中, 用户交互带来数据处理需求。根据 OpenAI 官网 9 月数据,ChatGPT 目前拥有超过 1 亿用户,每月 产生 18 亿次访问量。据 Fortune 杂志,每次用户与 ChatGPT 互动,产生的算力云服务成本约 0.01 美元。基于此,我们估算 OpenAI 为 ChatGPT 每月支付的运营算力成本为 1800 万美元。
(3)模型调优算力需求:从模型迭代的角度来看,ChatGPT 模型并不是静态的,而是需要不断进行 Finetune 模型调优,以确保模型处于最佳应用状态。调优过程中,一方面是需要开发者对模型参数进行调整,确保输出内容不是有害和失真的;另一方面,需要基于用户反馈和 PPO(近端策 略优化),对模型进行大规模或小规模的迭代训练。因此,模型调优同样会为 OpenAI 带来算力成本,具体算力需求和成本金额取决于模型的迭代速度。
3、海外:全球算力规模进入加速期,科技巨头不断加大 AI 资本开支
伴随全球人工智能浪潮,全球算力规模爆发式增长。2022 年全球算力总规模达到 906EFlops, 增速达到 47%,其中基础算力规模(FP32)为 440EFlops,智能算力规模(换算为 FP32)为 451EFlops, 超算算力规模(换算为 FP32)为 16EFlops。根据中国移动预测,未来五年全球算力规模将以超过 50%的速度增长,到 2025 年全球计算设备算力总规模将超过 3ZFlops,至 2030 年将超过 20ZFlops。
以 AIGC 为首的应用表现强劲,推动了智能计算的快速和持续增长。IDC 预测,全球人工智能 计算市场规模将从 2022 年的 195 亿美元增长到 2026 年的 346.6 亿美元。其中,生成式人工智能计 算市场规模将从 2022 年的 8.2 亿美元增长到 2026 年的 109.9 亿美元,占整体人工智能计算市场的比重将从 4.2%增长到 31.7%。生成式人工智能将推动互联网、制造、金融、教育、医疗等行业创新发展。
从海外云巨头三季报看,人工智能投资推动收入和资本支出。年初至今,生成式 AI 技术浪潮 的快速崛起带来对 AI 算力需求的大幅提升,海外云厂商巨头谷歌、微软、Meta(这里暂时不考虑亚马逊,亚马逊由于三季度收缩用于仓储物流的资本开支,影响权重较大)3Q 资本开支 212.05 亿 美元,合计资本开支环比增长 9.43%,主要系 AI 基础设施投入加大,各家在业绩会上均表示 2024 将继续加码 AI 领域。
4、国内:智能算力需求持续增长,芯片禁令导致高端算力供需错配
算力对于促进 GDP 与数字经济增长效果显著。相关数据显示,十五个样本国家的计算力指数 平均每提高 1 点,国家的数字经济和 GDP 将分别增长 3.6‰和 1.7‰,预计该趋势在 2023 至 2026 年将继续保持。
中国计算力指数排名第二,处于领跑者地位。根据《2022-2023 全球计算力指数评估报告》中, 第一梯队包括中国和美国;第二梯队国家包括日本、德国、英国、法国、加拿大、韩国和澳大利亚; 第三梯队国家包括印度、意大利、巴西、俄罗斯、南非和马来西亚。2022 年中国计算力指数同比 增长 1.4%,达到了 71 分,2022 年受到疫情反复冲击,全年 GDP 增长低于预期,在这样的大环境下,中国算力指数仍保持增长。
中国算力核心产业规模高增,成为国内 GDP 增长重要抓手。据工业和信息化部数据,截至 2022 年年底,我国算力核心产业规模达到 1.8 万亿元,算力总规模达到 180EFLOPS,年增长率近 30%; 存力总规模超过 1000EB;国家枢纽节点间的网络单向时延降低到 20 毫秒以内。预计 2023 中国算 力核心产业规模。算力每投入 1 元,将带动 3~4 元的 GDP 经济增长。
2023 是企业数字化转型拐点,2024 资本开支有望继续高增。从 2022 年开始,全球企业在数字 化转型的浪潮下开始加速数字化进程,2023 年是企业数字化转型的拐点,企业从数字化转型时代 进入到数字化业务时代,开始逐渐步入数字化新阶段。根据 IDC 的研究,到 2023 年底,全球数字 化转型支出在总体企业 ICT 支出中的占比将达到 52%,全球 52%的软件应用支出也将是 SaaS 模式。 预计 2023 年全球数字化转型技术的支出增长率为 16.9%。数字化转型在降本增效、提高创新能力、 商业模式转型升级等方面已初显成效,已成为企业核心发展战略。
国内算力产业总体规模未来三年有望维持 30%左右 CAGR,智能算力渗透率及占比快速提升。 近几年,我国不断加大对计算、网络和存储等基础设施的投入,高度重视数据中心、智算中心、超算中心以及边缘数据中心等算力基础设施的高质量发展,近 5 年,我国算力产业规模年平均增速超 过 30%。
智能算力渗透率逐渐提升。智能算力增长迅速,新增算力中智能算力成为增长新引擎,截至 2022 年底,我国算力总规模达到 180EFLOPS,其中智能算力规模与去年相比增加 41.4%,超过全球 整体智能算力增速(25.7%),其中通用算力规模 137EFLOPS,占比约 76.7%,智能算力规模 41EFLOPS, 占比约 22.8%。根据《2022-2023 中国人工智能计算力发展评估报告》,未来 5 年中国智能算力规 模年复合增长率将达到 52.3%,通用算力规模年复合增长率为 18.5%。预计到 2026 年中国智能算力 将达到 145EFLOPS,占比将达到 36.7%。随着 AI 大模型的快速发展,智能算力需求正呈现爆发性 增长态势,渗透率将显著提升。
(二)算力侧投资主线:国产化、高带宽存储、AI 服务器、液冷、算力租赁
1、出口禁令倒逼国产化加速,华为昇腾 VS 英伟达参数对比
出口禁令影响海外供应,倒逼国产替代不断加速。2023 年 10 月 17 日,美国商务部工业和安全局(BIS)发布了针对芯片的出口禁令新规,更加严格的限制了中国购买重要的高端芯片。一方 面,从 ChatGPT 面世以来,国内各企业和研究院在短短半年多的时间内先后推出了超过 130 款大模 型,其中领跑玩家已经开始着手于将大模型应用于特定场景,打造爆款应用。另一方面,为了构筑 算力底座,各地政府纷纷上马智算中心建设,铺设大数据时代的信息高速,推动产业创新升级,降 低企业调用以大模型为代表的科技成果的成本。
2、“内存墙”制约算力释放,HBM 高带宽存储量价齐升
目前 AI 芯片中 GPU 在训练和推理中占绝对优势。AI 芯片又称 AI 加速器或计算卡,是专门用 于处理人工智能应用中大量计算任务的模块,AI 芯片是 AI 服务器的核心部件,在 AI 服务器中价 值量占比接近 70%。目前主流的 AI 算力芯片主要包括 CPU、GPU、FPGA、ASIC 等。其中,GPU 是较为成熟的通用型人工智能芯片,FPGA 和 ASIC 则是针对人工智能需求特征的半定制和全定制 芯片,GPU、FPGA、ASIC 作为加速芯片协助 CPU 进行大规模计算。
(一)数据人表:2024 年初实行,数据资产化时代正式开启
作为无形资产的数据不排他,作为存货的数据具备排他性。在绝大部分场景与企业中,企业对数据资源进行反复使用,使用的场景包括不限于自用数据产 生产品销售以产生经济价值、通过数据共享给客户以产生经济价值等,数据资源为多方所使用,不具 备使用权的排他性,应为无形资产。存货的场景主要有数据采集与加工厂商,产生数据资源的目的单 纯是为了销售,进行数据所有权的转让,出售之后数据不再属于原有企业,具备排他性。
(二)数据要素政策仍有细化空间,政策催化效应预期凸显
数据二十条中的制度制定贯穿数据产业链的全生命周期,提出核心的四项数据基础制度,包括数 据产权制度、数据要素流通和交易制度、数据要素收益分配制度、数据要素治理制度。在这四项制度 中,数据产权制度是基础,流通和交易制度是核心,收益分配制度是动力,治理制度是保障。这四项 基础制度是我国数据经济可持续发展的“四梁八柱”,是数据要素发展的基石。
(三)数据要素迎三次价值释放,数据资本空间预计可达 30 万亿
三次价值释放循序渐进,后一次以前一次为基础。目前,我国前两次数据价值释放环境已渐趋成 熟。我们认为,第三次价值释放不同以往,侧重于数据从企业内部向外部的流通,使得数据从供应方 更好地流转到需求方,使得数据作为生产要素的生产效率与价值最大化。此外,三次价值释放将衍生 出全新数据相关技术,产业链进一步丰富与完善。
(四)细分投资机会解析:贯穿全产业链的价值“显性化”
数据治理离不开高质量的数据采集与标注。从 AI 的数据治理产业链图谱来看,上游主要为数据的 提供方,下游主要为数据的最终应用方。应用于 AI 模型的训练与推理的数据主要由中游基础数据服务 商进行采集与标注,数据治理平台进行数据的优化治理。
目前,在产业端已经有相应的探索与落地。人民网旗下人民数据按照“数据二十条”中提到的三 权分置发放数据要素“三证”—“数据资源持有权证书”“数据加工使用权证书”“数据产品经营权 证书”。“三证”基于人民链 Baas 服务平台(2.0 版本),进行确权、上链、存证、交易服务工作。“三证”主要旨在统一和连接各级党政机关和大数据交易所之间相对分散的数据,形成全国性的数据交易服务平台,同时解决数据权利不明晰的问题。
报告共计:103页