点击报名 8 月 3 日(周四)融云直播课~
2022 年底,以 ChatGPT 为代表的“生成式 AI”正式开启了 AI 行业爆点不断的热闹时刻。关注【融云全球互联网通信云】了解更多
傅盛和朱啸虎关于大模型是否还有机会的隔空激辩余热未散,Meta 就宣布开源商用模型,企图通过做大模型时代的开源标准来应对 OpenAI 构建的技术围墙。
行业火热异常,格局瞬息万变,而行至此路口的前序努力已经用时数十年。
1956 年,麦卡锡、明斯基、罗彻斯特、香农等人工智能的开山祖师举办“人工智能达特茅斯夏令营”,准备一起工作一个夏天,在可编程计算机、编程语言、神经网络、机器学习等问题上取得重大进展。
达特茅斯夏令营参与者,来源:DT 财经
那是一个群星闪耀的灿烂年岁,夏令营参与者中的每一位,都在后来成为了 AI 分类学科的宗师级人物,并启蒙了一代代年轻人加入。
此后,行业在新研究发表带来的狂热和成果匮乏引发的寒冬中反复震荡,也演变出了连接主义、符号主义、行动主义三条技术路径各自去寻找出路。
连接主义学派认为,人类大脑依靠神经元组成的神经网络来实现复杂的计算和记忆。因此,将神经元作为最小信息处理单元,把神经元的工作过程简化为一个运算模型,就可以让机器模拟人脑的运行。
符号主义学派则认为,让计算机推演人脑的思维模式需要靠逻辑推理法则。如果能把所有描述人类活动的知识都灌给计算机,它便可以实现对人类思维的模仿和预言。
行动主义学派则偏向于让机器模仿人类行为,并通过反馈来实现自我进化。
三大学派在互相较量甚至打压中起起伏伏,而每一次人工智能领域的风吹草动,也都会引起社会各界的积极响应。
智力游戏在早期被公认为是智能的一种具体表现,所以让计算机下棋战胜人类一直是人工智能领域的重要课题之一。1957 年,科学家们预言“十年内计算机下棋会击败人”,直到 1997 年 IBM 的“深蓝”才得以实现。
“深蓝”作为符号主义路线的代表成果,向我们展示了计算机的穷尽计算能力,以及其无法突破的边界。
而近十年来,领跑人工智能的是连接主义的神经网络学派。
上一轮人工智能热发生于 2016 年,DeepMind 的 AlphaGo 击败了世界围棋冠军李世石。2018 年,在上海举办的“世界人工智能大会(WAIC 2018)”上,人工智能在工业、农业、医疗等领域的应用成为主角。
此后几年,闪烁着各种动态数据和监控视频的巨型屏幕成为人工智能类展会的标配,安防等“智慧城市”项目也成为人工智能企业商业化落地的重要场景。
WAIC 2020,来源:WAIC 官网
纵观整个 AI 发展史,行业在最初的 30 年都处于相对混沌的阶段,才华横溢的人才辈出、天马行空的想法逐渐落地、奠基地位的理论研究屡有突破;80 年代末,计算机视觉、自然语言处理、认知科学、机器学习、机器人学等关键学科开始分化发展;近十年来,各学科又呈现出了融合之势。
来源:甲子光年《2023 中国 AIGC 市场研究报告》
移步【融云全球互联网通信云】后台回复【AIGC】看完整报告~
而随着 GPT-4 的发布,竞争直接升级为多模态通用大模型、行业垂直大模型及其之上的各类应用。
仅仅用时两个月,ChatGPT 的用户数量就突破了 1 亿。
行业对 AIGC 这个“互联网后期唯一真命题”的认知收敛迅速完成,大厂吹响军备竞赛号角,创投界难得地兴奋了起来。
目前,大厂派、创业派、学院派等选手都纷纷坐上了牌桌。
新一轮的话语权争夺开始了,但这并不是一个能够快速分出胜负的领域。
前不久在奇绩创坛活动上,陆奇提出,以 OpenAI 的 ChatGPT 为标志,我们正迎来一个新拐点。“模型”知识将无处不在,“在未来,或许唯一有价值的是人类自己的见解”。
与之相对应的上一个拐点,是 PC 普及带来的信息无处不在。这意味着,一个结构化机会的入口正在打开。
来源:陆奇《新范式 新时代 新机会》
陆奇演讲中还包含对新时代、新机会的更多分享,移步【融云全球互联网通信云】后台回复【AIGC】获取 PPT 一起学习吧~
随着行业的沸腾,以及 OpenAI 等对大模型产品化的尝试,加速的商业化进程让入局者更加急切。
整体而言,这一波机会包含了算力、平台、算法三大部分,而其中的算法层还分化出了基础层、中间层和应用层,每个方向上都有颠覆性机会。
来源:甲子光年《2023 中国 AIGC 市场研究报告》
其中,算法层集中了八成以上的竞争力量。
百度、阿里、腾讯等都已纷纷公布了自己的大模型,今年 7 月在上海举办的世界人工智能大会(WAIC 2023)上,已经有 30 多个模型进行了展示,而更多公司的模型还在研发中。
不过,大模型的机会空间也是业内争论颇多的一个话题。目前,最初那些“通用大模型即将吞噬一切”,“OpenAI 要统治全世界”的恐慌已经消散。
首先,参数动辄千亿、耗费大量资源的通用大模型,一般基于公开文献与网络信息训练,缺乏专业知识与行业数据积累,在特定场景效果不好。
其次,随着越来越多开源模型支持商用,模型在某一个阶段里取得的任何成绩都无法成为护城河。
此前有公司用公开数据集训练大模型,把支持商用当做付费点。随着开源模型的商用,这部分生意基本消失了,自研模型的意义更小了。
大语言模型布局时间线,标黄为开源
来源:《A Survey of Large Language Models》
移步【融云全球互联网通信云】后台回复【AIGC】看完整论文~
而针对特定场景的行业大模型,聚焦特定领域的工作流程,依赖于专有数据集进行针对性训练,体现出更大的现实意义。
有价值的 Know-How 很可能不在互联网上,这是积累了行业资源的创业者的机会所在。
根据今年 6 月的奇绩创坛数据:创业营最终录取的 60 个项目中,大模型项目 39 个,占比高达 65%,几乎都围绕垂直大模型应用开发展开。
另外,从目前各大厂发布的产品来看,做底层模型同时发布 C 端产品也是这一轮不同于移动互联网时代的产品特性,基础技术不一定要与上层应用创新分离。
直面 C 端,大模型可以更好地利用数据飞轮形成正向循环。比如,Midjourney 把用户反馈纳入核心流程,通过用户生成和筛选作品形成迭代机制,让产品不断螺旋上升。
市场浩瀚机会不明,我们究竟身处 AI 创业的哪个发展阶段?以移动互联网时代作为一个完整周期来整体回溯,最为黄金的移动互联网十年在 2010-2020 年,而其前中半段是巨头诞生的密集期。
对照到 AI 行业来看,新一轮的新旧交接已经开始,但也只是刚刚开始。
接下来的文章中,我们将对 AIGC 在不同细分行业和场景中的赋能探索进行场景拆解和案例分享,敬请 关注【融云全球互联网通信云】了解更多~