点击上方“视学算法”,选择加"星标"或“置顶”
生成式AI要取代搜索引擎的声音,出现在ChatGPT发布的第一天。
后来越传越邪乎,有人设想以后大家找资料都不说google一下了,而是geept一下。
还有人说,搜索引擎给的一页10个蓝蓝的链接,以后就像老式拨号电话的转盘一样成为历史。
谷歌刚开始还满不在乎,随着ChatGPT爆火出圈也感受到威胁,内部拉响红色警报,调整AI产品策略。
微软则把这视作弯道超车的机会,计划在必应搜索中继承ChatGPT的能力。
……
不过,持不同观点的也大有人在。
随着大家使用加深,ChatGPT会用权威的语气输出错误信息,无法获取最新知识等弱点暴露出来。
OpenAI的CEO也表示,现阶段ChatGPT容易给人带来一种假象,依赖它来做重要事情是不靠谱的。
Keras之父则认为,搜索与生成根本就是两个问题,原理上就决定了两者无法相互取代。
有意思的是,另一搜索巨头百度的观点也站在这一边。
近日,百度刚刚举办Create AI开发者大会,大会前夕,百度搜索宣布将基于百度自研的生成式模型,升级“生成式搜索”能力,并指出,生成式AI和搜索引擎是互补关系而不是替代,还说搜索底层技术和AI底层技术是相通的。
百度这番话不是说说而已,而是从2021年就开始尝试把AIGC与搜索两者结合起来了。
十年前点击“百度一下”的按钮时,搜索引擎背后的工作原理相对简单,就是通过关键词索引,经过算法筛选排序,生成结果页。
而现在,结果页有时候已经不是单纯呈现链接排列。
比如,买了新款iPhone的你,把手机翻了个底朝天,也没找到录音功能藏在哪。
无奈求助于百度,在搜索框输入“苹果怎么录音?”,生成页面最顶端出现的不是链接,而是一个小卡片。
AI选出最能帮到你的答案并做摘要,显示在最上方,无需再从搜索结果翻找。
点进去看,还是图文并茂,步骤清晰的那种。
(世界未解之谜:苹果的录音机到底为什么要叫语音备忘录???)
又或者网络冲浪时看到一帧截图,想要知道出自哪部剧,描述一下,搜索引擎可基于深度语义理解问题并匹配结果,也能搜出答案来。
不信可以一起口语化描述下面这张剧照,“韩国有部电影野兽轮船在空中飘着叫什么名字”,然后在评论区告诉我们答案。
再比如,想了解“北京GDP和上海GDP谁高”,百度可以基于权威数据自动生成多年两地GDP走势图。
高低对比直接呈现,不用自己分别另行搜索和自行计算。
这些功能背后都是AI技术在支撑,也是AIGC和搜索技术的结合,只是用起来过于顺滑,大家习以为常了,就像手机上的指纹识别一样。
搜索引擎虽然有20多年历史,但对大多数网民来说仍然是难以替代的高频刚需,并且需求也一直在变化。
从简单的关键词命中搜索,到自然语言搜索,再到语音(特别是方言)搜索,人们使用搜索引擎的方式越来越靠近本能和直觉。
从基础的把网页当成文档去搜索,到搜索知识、服务,人们越来越期待搜索提供更大的价值。
由此带来的复杂需求与庞大计算量,使搜索依然是技术壁垒非常高的产品。
据了解,自百度发力AI十年来累计研发投入超过1000亿元,每年研发占比都超过15%,2021年更是达到23%。
与此同时,搜索则是百度20年来的核心业务,也是离大众最近的“窗口”之一,每天处理海量的请求。
百度领先的AI技术都会最先落地在搜索上,让搜索不断跟上需求的发展,同时也是AI技术最好的试炼场。
提起百度的AI技术,最被人熟知的是文心大模型,产业级、知识增强是其特色。
背后还有飞桨深度学习平台,提供一系列基础设施和工具。以及更底层的自研昆仑芯片,兼具超强算力与高性价比的成本优势。
那么这些技术怎么用于搜索引擎呢?
这就要说到在百度Create大会上亮相的两大“杀手锏”技术,跨模态大模型“知一”,新一代索引技术“千流”。
先看跨模态大模型知一,是AI技术在搜索场景落地的代表。
简单来说,知一大模型可以从全网形态各异的资源中持续学习,无论是文本、图片、视频还是结构化信息都可以融会贯通。
打破了资源形态的界限,就更容易理解用户的搜索需求。
从技术层面讲,知一使用了百度文心大模型技术。大规模预训练技术提升模型性能,蒸馏压缩率高达99%的模型小型化技术以降低成本,得以在搜索场景全面应用。
据了解,目前知一在百度搜索的各场景中每天要进行上万亿次的推理。如此巨大的使用规模又带来新的问题,如何把满足需求的结果高效呈现给用户。
这就要提到新一代索引技术千流,负责把不同维度的信息进行智能有序的组织。
千流与之前的索引技术相比,主打多领域、多维度表达的立体栅格化索引。
如何理解栅格化?
在过去,搜索引擎为提高效率会把内容按质量横向切开,做分层处理。先从高质量内容开始检索,满足需求就可以及时返回结果,还未满足再进入下一层。
在千流中,进一步把质量最高的一批内容按领域垂直分层。质量分层+内容命中结合,一横一纵把内容切分成栅格按需检索,大大减少每次检索的计算量。
这是对搜索引擎后端架构的彻底改造,做到成本降低一半、速度快两倍。
但这又不光是节省成本的问题。
百度工程师透露,节省下的计算量还可以投入到对内容的精耕细作中,如综合利用多种算法提升索引质量,或者加入最新的生成式AI技术。
此外,在不同的栅格间也可以使用个性化算法,就好比“一鱼多吃”,不同的部分使用不同的烹饪方法。
知一和千流两者配合起来,一方面对用户搜索意图的理解更精确,一方面提高内容的质量和信息检索效率,为搜索打开了更多可能性。
用户的高频需求,驱动着AI技术变革。新技术又能激发新用户需求表达,两者构成“双轮驱动”,持续推动搜索进化。
在这样不断反馈迭代之下,下一个质变即将到来。
搜索即创作
回到最初的话题:生成式AI会取代搜索引擎吗?
作为国内最大的搜索引擎,百度的答案已经明了:
AIGC和搜索引擎是互补而非取代关系。
百度搜索杰出架构师辜斯缪解释了百度如此判断的思维路径:
当前的AIGC对话系统,哪怕是最火最出圈的ChatGPT,尚有自身能力的明显瓶颈, (比如有时胡说八道,以及不能及时获取最新消息) ,且不能保证未来技术一定能够解决这些问题。
因为从工业应用和落地可能性角度看,现有模型规模并不能支撑一个模型能记录所有知识。
尤其是用户需求量巨大的强时效性内容。
解决办法,就是换个角度,利用AIGC为用户开放式的搜索提问或定制化的信息需求“创作答案”。
从单边的搜索或生成,融合为检索+生成,会达到更好的效果。
这也是从2021年,百度就已经着手研发生成式搜索的重要原因。
检索和生成的结合模式,注定了百度搜索升级后的产品形式会有变化。
据了解,最终产品会与ChatGPT有很大不同,即虽是多轮交互,但并非单纯的多轮对话。
简而言之,用户可以更高效地向搜索引擎提出需求,生成式搜索则在满足需求的同时,迭代和调整这个需求。
不会PS的人,可以利用生成式搜索搜出一张图片,再用语言描述想要怎么修改这张图片,搜索引擎就能根据要求,通过百度的NLP技术对图片进行修改,给予反馈。
升级后,生成式搜索会实现三个方面的体验提升。
信息智能整合组织。在保证权威性和准确性的前提下,梳理检索结果,提供整合后的结构化答案。
内容创作。基于文心·NLP大模型,发挥自然语言处理能力,可以满足诸如“写文章”“写公告”“智能聊天对话”等创作型搜索需求。
个性化内容体验。基于不同用户画像和阅读偏好,同一内容也有差异化、个性化的具体表达。
据介绍,百度即将在近期升级全网首个生成式搜索。
提纲挈领地梳理下来,不论是AIGC,ChatGPT,还是生成式搜索,都是技术、尤其是AI技术发展到一定地步产生出来的新的机会。
如2022年底,百度CEO李彦宏在全员大会上的发言所说:
把AIGC这么酷的技术变成人人需要的产品,这一步才是最难的。
百度生成式搜索会是下一个人人需要的“酷”产品吗?
拭目以待。
— 完 —
点个在看 paper不断!