11月30日-12月1日,「2023甲子引力年终盛典·致追风赶月的你」在北京成功举办。作为中国科技产业智库「甲子光年」一年一度最重磅的高质量大会,汇聚上百位行业大咖、专家学者、产业高管、投资大咖、科技企业创始人等顶尖人物和重量嘉宾分享产业干货,为科技与产业加速融合提供新的方向和思路,吸引了3000+人次到场参会,246万+人次线上观看。
实在智能创始人&CEO孙林君受邀出席甲子引力年终盛典「奇点已来」“AI与元宇宙”专场,以“AI Agent是大模型之后的下一个机会吗?”为主题,与主持人和其他嘉宾一起,就AI Agent的最新思考与可能性、在技术与商业方面的落地实践、推进过程中遇到的机遇与挑战等焦点问题深入交流,共同探讨AI Agent发展趋势和未来方向。
2023年国内AI产业拉满了加速度。上半年,整个行业热衷于做大模型拼参数、拼算力,随着首批大模型产品完成备案、陆续向用户开放,下半年出现显著变化,开始比拼应用,除了总量的增多,赛点也在不断迭代,AI Agent成为大模型之后AI圈最火的话题,它是一种能够感知环境、进行决策和执行动作的智能实体。
「奇点已来」“AI与元宇宙”专场 圆桌现场
在圆桌对话开场时,孙林君说“实在智能成立5年多,是一家通过自研AGI大模型+超自动化技术,领跑人机协同时代的人工智能科技公司。创立之初是做TOB企业的数字员工,用RPA自动化技术代替人去做一些重复的、琐碎的工作,升级形态是将RPA和AI结合起来的IPA模式,驱动各种软件进行“点选用”操作,随着大模型飞速的发展,逐渐进入AI Agent新的时代,会发现用数字员工的手和脚去定义智能体已经不合适。
在今年8月16日发布了自研垂直的“TARS(塔斯)大语言模型”,同时推出首款产品级别的实在RPA Agent智能体,它是将计算机视觉、大模型与RPA深度融合的落地产品TARS-RPA-Agent。我们一直在积极的落地Agent智能体应用场景,比如,客服场景,通过简单的话术就可以让Agent帮助完成基础的工作;财务场景,用对话模式让Agent帮助流水对账、资金审核等等,很多类似人使用工具的能力都可以通过Agent智能体去实现个人PC数字助理。
实在RPA Agent智能体之所以是产品级别,是因为需要解决很多环节的问题,比如考虑容错、打断、重试、人机协同等情况,另外大模型本身不是一个产品、不是框架;RPA和Agent智能体有着很强的关系,是因为接口的设计原则是高内聚、低耦合,实际上有很多软件上很难都有接口,这时候RPA的作用就尤为重要,如何让RPA作为“手和脚”完美结合Agent“大脑”实现真正的智能自动化,正是需要我们不断探索和创新的实践之路。”
实在智能创始人&CEO孙林君
Part.1 智能体在大模型应用上跑出加速度
对于大模型时代智能体的新范式和发展机遇,孙林君认为:
“人比较擅长使用工具,而智能体和人很像的一个属性就是使用工具的能力,它可以借助大模型的能力去操作各种工具完成特定的任务,这也是智能化成熟的表现。比尔盖茨已经提了Agent是一种全新的交互方式,从DOS到Windows再到用智能体,代替我们去跟操作系统交互的方式已经成为一个必然的趋势。
明年可能是智能体的元年,大模型达到很强的能力情况下,对拥有个性化数据、个性化场景的企业来讲,可以结合大模型、再结合智能体,例如,一个企业的调度员,智能体能把原先低效的工作变得很高效;财务人员用更少的精力投在事务性的工作,喝个水的时间Agent智能体就能把活干完了。有了智能体,人机协同在分工上会有新的形式,我们非常看好智能体在大模型应用爆发的里程碑上快速发展的态势。”
Part.2 打磨产品级别的实在RPA Agent智能体
Agent智能体很多方面还需继续打磨,面对商业落地实践与挑战,孙林君说:
“今年8月实在智能推出RPA Agent智能体产品,确实是有很多未知的东西等待我们去破解。举例子说,大模型在面对同一个任务的时候具有多样性,哪怕是同样的问题、在不同的时间点下给出的答案也会略有差异;遇到没有见过的软件操作、不懂的知识内容,需要外挂知识库,外部知识组织形式是什么样、什么层次关系、用什么样训练的方式给到大模型;任务的步骤执行可能会遇到错误,重试机制是什么样、发生问题人怎么介入、怎样修正它的意图、陷入死循环出不来想要的结果等,都是产品级别需要考虑、解决的问题,但是比较好的情况是我们在非常多的场景下已经取得不错的效果,关注我们实在视频号会发现经常有放出场景跑下来很顺畅的例子。
Agent智能体可以接收我们的指令去拆解任务,比如银行流水的资金对账,单个银行的对账报4~5个人天,原来是靠人、RPA和低代码实施去做,现在对智能体来说,要100家银行的资金流水对账,通过对话模式说一句话给到指令这件事就可以完成了,能看到巨大的效率提升;用户商业模式也在发生深刻的转变,以前是企业面对高频的、重复的、ROI很高的情况下才会花钱去做特定的事,有了智能体新的方式下,用户变成买智能体产品,每个人配一个智能体的助手。
实在智能经过这几年的发展已经积累了2000多家客户、数万个自动化流程,这些流程都是客户为之付费的刚需场景,可以挖掘大量的Agent智能体适用空间,因此我们会坚定不移的在这个赛道上一直走下去。”
Part.3 听得懂,想明白,看得见,动起来
在技术方面,有哪些前沿探索?孙林君展示了实在智能的“秘密武器”。
“从技术路线上来看,第一个是多模态,它在对齐上是非常困难的,尤其是实现智能体的情况下,这个我们已经有了自研的“智能屏幕语义理解技术(ISSUT)”,解决“数字员工像人一样理解要操作的对象”的问题,看得到画面并且知道下一步怎么做,现如今把计算机视觉能力结合大模型推理能力、结合RPA使用工具能力,实现了智能体“你说PC做,所说即所得”,从目前效果来看远比一个纯粹的大模型的模态要强,在多模态技术上演进是一个必要趋势。
第二个是强化学习,智能体错了以后可以重试、修正自己的意图,从失败到成功找到一个实现的路径。大模型行业上的KNOW-HOW非常重要,正因大模型知识密度很高也有能力涌现,对任务的理解和拆解以及很多地方都能表现的很好,对企业方面来讲,不太可能自己做或买一个GPT4,但在真正生产环境中,客户对于任务完成质量、效率等要求又非常高,垂直的大模型就很有必要,我们提供一个“成本可控、效果可用、定制化训练、私有化部署”精准的中枢模型,让智能体不断地提升自己能力去做企业本身模型的再次优化,需要我们做更多的探索。”
甲子引力年终盛典为我们呈现了一场不可多得的思想盛宴,人工智能领域最值得被所有人关注的话题之一AI Agent,表明科技与产业正在前所未有的方式实现深度融合,也给我们展现了一个未来的生态规则:人人都能使用自然语言开发软件、拥有多个私人助理工作,它着手建立着AI时代全新的生态位,引领着我们的生产力,也重新设计了生产关系。
根据甲子光年智库调研,AI已逐渐融入我们的工作,在办公场景的使用率达到了26%,内容生产工作者对AI的使用率更是高达32%以上。办公过程中主要从以下三个维度进行赋能:一是AIGC,帮我们生成内容;二是通过对话式交流,帮我们输出决策洞察;第三帮我们将非/半结构化数据形成结构化数据。
如果说之前的AI像需要手把手教导的实习生,现在的AI Agent就像一个能自己解决困难的成熟员工,人来设定目标,拥有理解、推理、分析等高阶认知能力的Agent智能体就能独立思考并做出行动,拆解出每步计划,依靠外界的反馈和自主思考,自己给自己创建 Prompt来实现目标。
以AI为主语的人机协作时代已经到来,正作为一种全新的生命形态和人类站在一起,将重塑我们的工作模式,脑机交互将从简单的单向脑机接口走向人机交互、并逐步达到人机共融的状态,如何与AI Agent交互将是每一位工作者的必修课,我们在不远的未来将迎来全民AI的人类世界。