作者 | 百度文库APP
导读
百度创始人、董事长兼首席执行官李彦宏早在今年年初所预测的:大模型时代最大的机会在于应用层,会出现“杀手级”应用。
全文4448字,预计阅读时间12分钟。
前言
“我们要让AI走下技术的“神坛”,深入应用的“土壤”。
在揭秘AI原生应用之前,我们首先需要培养下AI原生思维。它是指在设计和开发应用时,以人工智能技术为出发点,将人工智能作为核心驱动力,重新设计和构建应用。
从人工智能技术的发展趋势来看,AI时代的原住民至少应该具备以下思维:
1、数据驱动思维:AI时代的原住民需要具备数据驱动思维,能够通过数据分析和挖掘来发现问题、解决问题;
2、跨学科思维:AI时代的原住民需要具备跨学科思维,能够将不同领域的知识进行整合和应用;
3、创新思维:AI时代的原住民需要具备创新思维,能够不断地创新和改进技术、产品和服务;
4、合作共赢思维:AI时代的原住民需要具备合作共赢思维,能够与AI本身、AI专业人士、乃至相关企业和组织进行合作,并实现互利共赢;
5、风险意识和责任感:AI时代的原住民需要具备风险意识和责任感,能够在开发和应用人工智能技术时考虑到可能带来的风险,并承担相应责任。
举个例子来理解‘AI原生’的概念,可以类比‘电原生’和‘云原生’。‘电原生’是指基于电力基础设施而产生的各种产品形态,如电灯、电报和电力网络。‘云原生’是因云计算技术的发展而诞生的软件、硬件和架构,包括云原生数据库、云原生操作系统、云原生芯片等,它们正在重塑整个信息通信技术的架构体系。同样地,‘AI原生’是指基于AI技术而产生的各种产品和服务。随着AI技术的发展,我们应该会像使用‘电原生’和‘云原生’产品一样,自然而然地使用AI原生产品。
AI原生(AI Native)是一种基于AI构建和运行应用程序的方法,是一套技术体系和方法论。
在AI原生应用中,它以AI为核心,包括数据收集和处理、模型训练和优化、模型部署和管理等方面,将AI的能力贯穿于整个应用架构中。AI原生应用中的AI是产品的核心部分,如果没有AI,产品的功能形态的核心流程就不存在。
第一波涌现的AI原生应用中,值得一提的是百度文库。文库已然升级为“一站式智能文档平台”,大模型正全面赋能文档创作,持续引领智能办公领域革新。
当下百度文库每周实现2-3个新功能的迭代,近一个月就陆续上线文档生成PPT、文生图表及分析洞察、PPT图表生成、文档智能总结及问答等“杀手级功能”,内容准确度、内容丰富度及文档生成速度均处于行业领先,且文档直接可用。
例如,“文档生成PPT”功能对文章重点要点、行文逻辑、内容风格的理解和解构更为复杂,彰显了百度文库的技术实力;“文生图表”功能适用于企业研究或财务数据分析,可以高效完成从文字到图表的转化并形成数据洞察等;万字长文可进行一键总结,帮助用户高效阅读,并基于文章进行个性化问答,充分理解和学习文章内容。
AI大模型的发展阶段已经进入下半场,如何赋能应用、如何推动行业数字化转型,将决定AI大模型的真正竞争力。
将LLM(大模型)的强大理解、生成、逻辑和记忆能力与NLP、语音识别/合成、Prompt工程、SFT微调、爬虫等关键技术进行整合,可以在各个细分市场挖掘出更多的使用场景。通过将这些技术结合运用,可以开发出更智能、更高效的解决方案,帮助人们更快速、更准确地完成各种任务。LLM可以广泛应用于以下领域:
1、影视的剧本生成、角色场景、后期制作;
2、传媒的选题策划、信息采编、内容制作、播报传递;
3、电商的产品展示、人机交互、广告营销、虚拟带货;
4、C端娱乐的图片、文字、音视频内容趣味生成、虚拟数字人;
5、游戏的NPC设定、环境剧情、关卡逻辑、对战训练。
此外,LLM还可以应用于金融、计算机科技、教育、工业、医疗等多个领域。
通俗的说,我们想要像有云原生,电原生思维一样,构思一个AI原生的创意,一般是首先对LLM的特征和能力有所了解,对自身所处的行业有很深入的了解,知道有哪些细分场景,通过利用LLM整合配套技术(Iot、ocr、语音、爬虫…),我们能够更好地解决实际问题,提高效率和便利性。
例如,在医疗领域,可以使用NLP和语音识别技术来自动分析病例和病历,从而帮助医生更快速地诊断和治疗疾病。在金融领域,可以使用LLM技术来自动分析复杂的金融数据和新闻,从而帮助投资者更准确地做出投资决策。此外,在客户服务领域,可以使用语音合成技术来自动生成语音响应,从而为客户提供更高效、更便捷的服务。
在上个月开展的以“拥抱大模型时代”为主题的第27季 Hackathon Coding Party & Coding Show,笔者作为选手参加全流程的赛事。活动现场涌现了很多充满想象力与科技力的AI原生创意,有可以一站式为你包揽恋爱安排的AI“恋爱军师”,帮你完成新家装修和老房改造的AI设计师,还有可以专属定制的AI剧本杀!
在hackathon集市上,笔者最感兴趣的是其中一个没有评选上黑马奖前三名的创意,名字叫"如诉"。这是一个为普通用户和法律工作者量身打造的智能化法律对话工具,旨在让用户能高效率、高质量地提出诉求,主张权利。如诉可以衍生一些功能,比如:法律知识问答、AI律师咨询、智能创作普法音视频。
笔者认为这个创意比较好的原因如下:
一方面,在“引经据典”以及匹配繁多的法律条例、历史案件等方面,因为AI的数据库规模庞大,相较于人类更有优势。
另一方面,在不同国家不同法规的情况下,如诉具备本土化的先天条件,在大模型成本高的前提下做商业化,国外公司参与进来的风险会大很多,因此在法律支持这方面的市场,出现来自国外公司竞争的情况会少很多。
最后,人们在遇到民事刑事案件时,个人贫瘠的法律知识和迫切需要专业的法律顾问之间的矛盾,形成了巨大的需求。这种需求推动了法律服务的市场发展。
通过整合这些技术,可以创造出更多的机会和可能性,并在各个领域带来更多的创新和进步。与大模型相比,AI原生应用更加注重技术的实际应用和商业化。大模型的研发需要大量的计算资源和时间来训练,难以直接实际应用到生产环境中。相比之下,AI原生应用更加注重技术的可行性和商业化前景。在当前中国需要加快经济发展和产业升级的背景下,AI原生应用更为实用和迅速,能够更好地推动中国的创新和发展。
今年9月,李彦宏在2023百度云智大会、百度“文心杯”创业大赛颁奖致辞中更是进一步明确指出了“AI原生应用”需要满足的三个条件:
1、能用自然语言交互,这是最根本的变化;
2、能充分利用理解、生成、逻辑、记忆等等,这些过去技术上不具备的能力;
3、第三每个应用的交互都不超过两级菜单。
此外,我们在实际改造产品时,接入AI能力,肯定需要增加一个入口,页面会更复杂一些。所以,在设计布局时尽量遵循"加一减二"的原则,在增加新功能或入口的同时,尽量减少其他不必要的元素或步骤。这一原则的目的是使产品更加简洁易用,提高用户体验。
再者,大模型仍处于快速迭代、能力跃迁的加速期,我们应该注重产品的可扩展性和可持续性,以便在未来进一步的扩展升级,贯彻长期主义。
百度智能云千帆大模型平台是面向企业开发者的一站式大模型开发及服务运行平台。千帆不仅提供了包括文心一言底层模型(ERNIE-Bot)和第三方开源大模型,还提供了各种AI开发工具和整套开发环境,支持数据管理、自动化模型SFT以及推理服务云端部署的一站式大模型定制服务,助力各行业的生成式AI应用需求落地。
入门参考什么是百度智能云千帆大模型平台,使用参考平台使用快速开始。方便的一站式服务和超多可选的大模型,可以助力使用者快速搭建适合自身业务场景的AI原生应用。
制作一款AI原生应用,我们来看看有哪些必不可少的基础服务。比如:
1、根据大模型服务计费较贵的特性,需要对应的频控服务,来保证预算使用可控;
2、根据大模型生成内容不可控的特性,需要对应的黄反敏感词检测服务,过滤用户quey和AI生成内容;
3、根据大模型生成内容耗时较长的特性,需要对应的实时推送数据的SSE通信机制,实现更高效和实时的数据推送,前端页面渲染出打字机的输出效果,降低等待时间;
4、根据用户需求表达不明确会导致生成质量低的情况,需要对应的意图识别、多轮对话、隐式Prompt工程等服务,提升生成内容的质量。
大模型的发展日新月异,每次迭代都带来大幅度能力升级,让我们感到雀跃。大模型会是通向更高级的AGI的一种路径,所以它不会像一阵风一样短暂。
新的工具、技术和产品不断涌现,推动人类社会的科技进步和创新发展。相对比近年比较火的技术点,在笔者眼中,大模型明显区别于区块链的是,它的应用范围更加广泛,接入到已有产品中相对更容易,用户体验上的提升也有明显感知。
再者,大模型不同于元宇宙的概念,元宇宙是在网络通信、虚拟现实技术(VR/AR/MR/XR)、人工智能、游戏、区块链等众多先进技术聚合下,形成的新型数字生态。元宇宙是有广阔前景的一个构思,但目前没有出现类似iphone时刻的产品,最根本的原因是仍缺失足够先进的技术。大模型并不是突然出现的概念,它是数十年基于人工智能的技术发展,量变引起质变的产物,chatGPT如此火爆,也说明大模型是实实在在地用产品说话。
在发展机遇上,笔者认为大模型类似于网络通信技术(2G->3G->4G->5G…)。一方面,两者都具备作为各行各业的技术底座的特性;另一方面,随着技术迭代,数据处理量增加、可控性、多模态等能力提升,应用场景不断扩大,会带动全社会多领域的产业升级。他俩是在实际的生活生产中能带来巨大价值的技术。
基于大模型的AI原生应用逐渐成为了业界的热门话题。然而,由于大模型的制作和使用门槛较高,目前在这个领域还处于摸索阶段。我们有必要足够认知大模型,多学多思、躬身入局、大胆实践、自我刷新。
本文通过分享笔者对AI原生应用的理解,探讨其未来的发展趋势,希望阅读本文能帮助您厘清概念,拓宽思路,为业务创造价值!
——END——
推荐阅读
代码理解技术应用实践介绍
百度交易中台之内容分润结算系统架构浅析
小程序编译器性能优化之路
百度APP iOS端包体积50M优化实践(六)无用方法清理
基于异常上线场景的实时拦截与问题分发策略