在前面几个章节,我们在熟悉了大模型的一些概念,学习了大模型的提示工程,体验了Chat的使用。
今天这个章节是为了接下来我们使用大模型做应用开发做准备。
大家陆续在很多文章中可能已经看到过了很多概念,比如plugins、GPTs、Agent,这里面自ChatGPT3.5爆火以来,有众多的AI创业公司从不同的切入点在做,OpenAI公司也在不断推进自家产品的核心能力和生态的迭代更新,比如去年最引人瞩目的GPT-4 turbo的发布。
接下来我们就以OpenAI的产品来介绍下这些概念,以及在GPT-4 turbo中出现的GPTs等的解读和应用。
ChatGPT的"Actions"与"Plugins"是OpenAI在GPT模型中引入的两种不同的功能扩展机制。这两种机制的目的是增强模型的功能,使其能够处理更多样化的任务和请求。
2023年(北京时间)3月24凌晨,OpenAI宣布,ChatGPT中初步实现对插件的支持。 (Plugins are tools designed specifically for language models with safety as a core principle, and help ChatGPT access up-to-date information, run computations, or use third-party services.)
推出以来,开发者们已经构建了数千个ChatGPT插件,包括来自Expedia、Instacart和Kayak等公司的插件。
简单点说,插件能够使ChatGPT参与开发者定义的API互动,增强ChatGPT的能力。有点类似于苹果的appstore。
引入插件Plugin标志ChatGPT走在创建生态系统的伟大道路上,统一平台+插件的模式有望构建与苹果+App Store相似的繁荣生态。
同时,Plugin的推出给了广大的开发者更多的参与大模型的机会。
自2024年3月19日起,将不再允许创建带插件的新对话,这一变化意味着,用户和开发者将无法安装新插件或利用现有插件创建新的对话。
为什么要结束插件测试版?
官方的回答是:
“With the launch of GPTs and the GPT store, we were able to make many improvements that plugin users had asked for. GPTs now have full feature parity (in addition to many new features) with plugins.”
即“随着 GPTs 和 GPT 商店的推出,我们能够根据插件用户的要求进行许多改进。GPTs 现在具有与插件相同的完整功能(除了许多新功能之外)。”
GPTs的推出,使得普通人也能在GPT的辅助下自己创建智能体(尽管因每个人的能力不同,创建的智能体的能力强弱也各有差异)。
如果你在微博上搜索 ChatGPT Plugins,热门内容还是一年前的那场发布会演示和评论,所有人都在感叹向第三方开放 ChatGPT 的能力有多逆天,结果 OpenAI 自己就用 GPTs 把 ChatGPT Plugins 给干掉了。
具体为什么OpenAI会在一年以后关闭Plugins,网上有很多推论,可能和OpenAI的布局有关,也可能和目前的安全有关。但是这都不妨碍原本的很多插件也都开发了GPTs,很多GPTs已经可以替代绝大部分插件的功能了。GPT商店已经拥有数十万个GPTs,涵盖写作、生产力、编程、教育等类别。
GPTs的推出使得非开发者的普通人,也可以投入到大模型的浪潮。
ChatGPT Plugins 是需要本地开发的,API 权限卡得特别严格,但大多数 GPTs 却都是直接基于 Web 端创建的,甚至不需要编程。
定义与用途:Plugins(插件)是一种用于扩展ChatGPT功能的机制,允许模型与外部系统交互。例如,可以与数据库、API或其他软件服务进行交互。
工作方式:当ChatGPT需要获取外部信息或执行某些不仅仅依赖文本生成的任务时,会通过这些插件与外部系统通信。
应用实例:例如,ChatGPT可以通过一个天气插件来获取实时天气信息,或者通过搜索引擎插件来提供最新的搜索结果。
定义与用途:Actions(动作)是ChatGPT的一种新功能,旨在允许模型在对话中直接执行特定的动作,这些动作可能涉及模型的内部功能或特定的任务执行。
新特性: 直接交互:Actions可以让模型在对话中直接触发和执行特定任务,如生成图像、执行代码等,无需外部插件介入。 任务多样性:支持多种不同的任务类型,如文本生成、图像处理、数据分析等。
更流畅的用户体验:通过Actions,用户体验更加直接和流畅,不需要离开对话界面即可完成多种任务。
自定义动作:支持创建自定义动作,以适应特定的用例或需求。
集成内部工具:与内置的工具和功能(如Python环境、DALL-E图像生成等)紧密集成。
Plugins:侧重于与外部系统的交互和集成。 Actions:侧重于在对话中直接执行特定任务,提供了更多样化的内部功能。
提到GPTs就不得不提GPT4.0 turbo,它的出现,是使得众多AI创业者一夜无眠的版本。
借用一个图来说明下它的强大:
目前,业界一般认为基于大模型的应用集中在两个方向上:RAG 和 Agent,无论哪一种应用,设计、实现和优化能够充分利用大模型(LLM)潜力的应用都需要大量的努力和专业知识。
这里的Agent 指的是智能体,可以追溯到明斯基的《society of mind》一书。在那本书中,明斯基对Agent的定义有点抽象——“社会中某个个体经过协商后可求得问题的解,这个个体就是agent”。在计算机领域,agent是一种通过传感器感知其环境,并通过执行器作用于该环境的实体,因此,可以把实体定义为一种从感知序列到实体动作的映射。一般认为,Agent是指驻留在某一环境下,能持续自主地发挥作用,具备自主性、反应性、社会性、主动性等特征的计算实体。
智能,是Agent 与环境相互作用的涌现属性。
在大模型领域,大模型替代了传统agent 中的规则引擎以及知识库,Agent提供了并寻求推理、观察、批评和验证的对话通道。特别是当配置了正确的提示和推理设置时,单个LLM就可以显示出广泛的功能 ,不同配置的Agent之间的对话可以帮助以模块化并以互补的方式将这些广泛的LLM功能结合起来。
开发人员可以轻松、快速地创建具有不同角色的Agent,例如,使用Agent来编写代码、执行代码、连接人工反馈、验证输出等。通过选择和配置内置功能的子集,Agent的后端也可以很容易地进行扩展,以允许更多的自定义行为。
开头我们讲了,Agent是一个目前大模型领域重要的应用方向,接下来我们也会再细分专题分别进行讨论。不在这里过多展开。
Assistant全名Assistant API, 所以它本身不是一个APP,而是API工具箱,可以嵌入到APP中那种,所以Assistant API的应用层级应该是介于Fine-tuned Models和LLM-based APP之间,它看起来不是一个完全体应用,但也不需要像模型finetune一样需要掌握原理、数据集、方法等。
这里后面我们也单独开个专题来分享对于Assistants API的使用。
所谓RAG,检索增强生成(Retrieval Augmented Generation),简称 RAG,已经成为当前最火热的LLM应用方案。
通俗点说;就是通过自有垂域数据库检索相关信息,然后合并成为提示模板,给大模型生成漂亮的回答。
RAG的出现,是因为在大模型的广泛应用中,伴随着出现的一些问题,比如:
而RAG是解决上述问题的一套有效方案。
RAG = 检索技术 + LLM 提示。例如,我们向 LLM 提问一个问题,RAG 从各种数据源检索相关的信息,并将检索到的信息和问题注入到 LLM 提示中,LLM 最后给出答案。
许多产品基于 RAG 构建,从基于 web 搜索引擎和 LLM 的问答服务到使用私有数据的chat应用程序。
本文章讲了很多在大模型应用层的很多概念,有ChatGPT的功能:plugins、GPTs、Assistant API;也有大模型的应用:agent,RAG,提示词工程的应用,finetune,训练垂直领域大模型,自己造轮子等等。
在真正聚焦于我们找到自己感兴趣和合适的深入方向之前,我们要了解现在基于大模型的应用都有些什么,才能知道我们在什么场景下,能做些什么。
求大家的点赞和收藏,我花2万买的大模型学习资料免费共享给你们,来看看有哪些东西。
第一阶段: 从大模型系统设计入手,讲解大模型的主要方法;
第二阶段: 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用;
第三阶段: 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统;
第四阶段: 大模型知识库应用开发以LangChain框架为例,构建物流行业咨询智能问答系统;
第五阶段: 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;
第六阶段: 以SD多模态大模型为主,搭建了文生图小程序案例;
第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。
网上虽然也有很多的学习资源,但基本上都残缺不全的,这是我自己整理的大模型视频教程,上面路线图的每一个知识点,我都有配套的视频讲解。
(都打包成一块的了,不能一一展开,总共300多集)
因篇幅有限,仅展示部分资料,需要点击下方图片前往获取
这里主要整理了大模型相关PDF书籍、行业报告、文档,有几百本,都是目前行业最新的。
这里主要整理了行业目前最新的大模型面试题和各种大厂offer面经合集。
学会后的收获:
• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;
• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;
• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;
• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。
1.AI大模型学习路线图
2.100套AI大模型商业化落地方案
3.100集大模型视频教程
4.200本大模型PDF书籍
5.LLM面试题合集
6.AI产品经理资源合集
获取方式:
有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】