国内直联GPT!清风 AIchat 手把手保姆级使用教程,适合小白
“未来几年,所有组织的管理、业务都将AI化,如何利用AI技术,是每一个管理者必须思考的问题”
自从去年 12 月 ChatGPT 发布后,带动了新的一轮应用交互革命。尤其是 GPT-3.5 接口全面放开后,LLM 应用雨后春笋般快速涌现。
企业信息化1.0 是电算化,2.0 是移动化,3.0 就是 AI 智能化了。
企业 AI 化时代,员工关心是如何提高写作效率、工作效率;管理者关心的是如何提高组织的整体效率,促进业务,带动销售,提效降费。
企业知识库是 AI 技术比较容易落地的一个场景,之前已经分享过几篇 AI 在企业知识库的应用,链接详见文末。
今天讲讲 FastGPT,这是迄今为止,我用过的最成熟的一个企业知识库 AI agent,
其他不错的知识库 AI agent,如 dify、langchatchat,有机会再分享。
FastGPT 官方已开源,用户可以自行本地部署,也可直接使用官方搭建好的网站
对于终端用户,不仅可在网站上使用FastGPT,进入自己的知识库,还可以在 Chat-NETX-WEB 客户端使用,已打通企业微信群,直接在微信群进行知识库问答 !
下面,跟着我,5 分钟构建属于你的企业知识库!
文章写得很细,很长,建议大家先收藏
一、概念和原理
(一)名词解释
企业知识库、LLM(大语言模型)、GPT、AI 化的企业知识库、向量化...
相关名词,详见《利用 GPT-4 & LangChain 本地部署企业知识库》第一部分。
(二)FastGPT 的原理
1、原理
FastGPT 是一个基于 LLM 大语言模型的知识库问答系统,提供开箱即用的数据处理、模型调用等能力。还可以通过 Flow 可视化进行工作流编排,完成 AI 客服,从而实现复杂的问答场景!
概述:
专属 AI 客服:AI 模型能根据文档以交互式对话方式回答问题
简单易用的可视化界面:直观的设计和操作步骤,轻松完成 AI 客服的创建和训练流程
自动数据预处理:多种数据导入途径,自动处理、向量化和 QA 分割
⚙️ 工作流编排:Flow 模块的工作流编排,设计复杂的问答流程。类似我之前介绍的 Flowise
强大的 API 集成:对齐全球、国产主流AI,如 OpenAI ,清华GML,可集成到各种平台
知识库核心流程图:展示问题输入到模型输出的完整流程
项目完全开源:遵循 Apache License 2.0 开源协议
2、原理流程图
FastGPT 的核心流程如下:
3、相关网址
(1)开源地址:
https://github.com/labring/FastGPT
FastGPT 是一个开源项目, 大家可以选择自行部署在本地服务器或互联网托管服务器上
(2)官方网址:fastgpt.run
服务器在新加坡,国内部分区域访问可能需要科学上网
(3)官方手册:doc.fastgpt.run
使用手册应该是 IT+钢铁直男写的,很严(hui)谨(se)。跟着我的讲解,最快上手。
二、实操案例
下面,详细讲解如何利用官方网站快速生成一个知识库,并通过手机及 chat-next-web 访问,主要步骤:
注册登录后,先上传一份文档,构建一个知识库,再新建一个应用,最后通过聊天界面与知识库进行沟通。
(一)注册
登录 fastgpt.run 网站,大家也可点击本文左下角“阅读原文”直达
也通过 AI 工具网站 www.aitools.cn 进入
进入后,界面如下:
点击“立即开始”,系统会要求你先登录
用邮箱或手机注册后登录,登录界面如下:
进入后,使用界面如下
(二)构造数据库
开始前,请准备一份测试电子文档,WORD,PDF,TXT,excel 都可以,比如公司休假制度,不涉密的销售说辞等等,
我使用的是广告大师奥格威做推销员时写的一本《将军牌炊具销售理论与实务》手册
1、新建数据库
进入“数据库”模块,点击右上角“新建”:
名字:随便起
标签:用于多个数据分类,按需求自己写
索引模型:有两个选择,一个是 OPEN AI 的 Embedding-2,一个是中文 M3E。
比较如下:
索引模型 | 训练速度 | 占用资源 | 语义表达 | 生成质量 |
---|---|---|---|---|
Embedding-2 | 快 | 少 | 一般 | 一般 |
M3E | 慢 | 高 | 更准确 | 高 |
选择索引模式,可以将数据处理得让 AI 更容易理解。
Embedding-2 模型适合在资源有限的环境中使用,而 M3E 模型适合在需要更好的语义表达能力和生成质量的场景中使用。选择哪种模型取决于具体的需求和可用资源。
项目管理三角:进度、质量、成本,三者只能得其二。
有人推荐 M3E,实测后,我初步认为 mbedding-2 模型更“聪明”点,更适合模糊查询,
测试阶段选择 mbedding-2 模型就 OK。
(2)选择数据导入方式
在下图中选择,“导入数据”
进入以下界面:
有四种模式
- 手动输入:手动输入问答对,是最精准的数据
- QA 拆分:选择文本文件,让AI自动生成问答对
- 直接分段:选择文本文件,直接将其按分段进行处理
- CSV 导入:批量导入问答对
这里,我们选择 QA 拆分,让 AI 自动生成问答,若问答质量不高,系统支持后期手动输入。
QA 拆分又分为"上传文件“、”(网页)链接读取“、”创建文件“
你可以上传一个本地文档,也可以让系统读取一个静态网页
① 上传文件:点击浏览,将你准备的文件上传,目前支持文件格式包括:.txt, .doc, .docx, .pdf, .md
② 链接读取:可以同时读取 10 个链接,比如你要介绍你们公司,你就可以把你公司主要的网站页面链接放在这里,fastGPT 自动读取。
采用哪种读取方式,看实际情况。
比如,实操中,将网页打印为 PDF 上传,就不如直接读取链接。因为读取链接后,系统会讲读取的内容在文本框中显示,你可以手动删除一些无关的内容。
另外,上传文件,系统会建立一个“上传文件名”的数据集;如果读取链接,数据集会被放到“其他数据”中。
③ 填入拆分引导词:
拆分引导词的作用是在用户提问之前给予一定的引导。这样可以帮助用户更好地表达问题,提供更准确的信息,从而获得更准确的回答。引导词可以是一些提示性的问题,例如:"请问你想了解什么关于将军牌炊具 的内容?"这样的引导可以帮助用户明确自己的需求,提高问答的效果。所以,拆分引导词对于提高问答的准确性和用户体验非常有帮助
(3)导入数据
你可以看到你上传的内容
导入向量数据库是由 AI 完成的,AI 需要消耗 token,token 需要花钱买
官方公布的索引生成计费为: 0.03/1k tokens
下面有个“预估价格”,这个价格是本次创建文件索引的价格,
FASTgpt 给每个新注册账户赠送了 2 元钱的费用 用于测试。
我们点击“确认导入”
另外,如果你在系统设置中,录入你自己的 OPEN AI key,在线上平台使用 OpenAI Chat 模型不会另行计费,直接消耗你自己的 OPEN AI key;但是知识库训练、索引生成, fastGPT 公司会另行收费(可用两元免费额度)。
(4)建立索引
系统显示,索引中
注意,在官网使用,需要排队索引
我上传的文件大概 6000 个汉字,等了 5 分钟,索引了 2 分钟。
完成索引后,可以看到 AI 自动把文件 拆分成了不同的问答
(5)搜索测试
点击“搜索测试”,输入一些关键字,可以看到拆分质量,不满意,可手动完善。
到这里,测试数据库就建立好了!
2、新建应用
(1)新建一个应用
点击,进入“应用”模块
可以选择新建,也可以使用模版
目前,官方提供了四个模版
我们从最简单的开始,新建“简单的对话”
(2)简易配置
① 选择数据库
在配置界面,拉到最下面,选择刚才我们索引的数据库
参数设置中
- “相似度”
参数调整中的 "相似度" 是用来调整搜索结果的相关性程度的。通过调整相似度参数,您可以控制搜索结果的严格程度,从而获得更符合您需求的结果。
较高的相似度阈值会使搜索结果更加严格,只返回与输入文本非常相似的内容。这意味着搜索结果可能更加精确,但也可能会错过一些相关但相似度稍低的内容。
- “单次搜索次数”:默认即可
- “空搜索”
是找不到信息后返给用户的信息,可自定义
② AI 设置
对话模型:有十多个选择,建议选择 FASTAI,其实就是 GPT3.5
- 温度
值越高,AI 的回答越发散
- 提示词
这个提示词,是给 AI 的。你可以把它理解为它在与用户对话中的人设。
提示词的作用是引导模型对话的方向。在设置提示词时,遵守 2 个原则:
告诉 AI 回答什么方面内容。给知识库一个基本描述,从而让 AI 更好的判断用户的问题是否属于知识库范围。
我给 AI 的提示词(人设)如下:
你只回答与将军牌炊具有关的信息;你的目的是实现销售,引导对方留下联系方式,电话、地址等;态度要和蔼而幽默;如果对方有恶意言语,终止对话。
③ 应用配置
你可设置“对话开场”白,会以链接的方式 列在对话标题下方,
可以把一些重要的说明、焦点问题列在这里,每句话用[]框住
④ 手动完善回答
现在你可以通过界面和 AI,就知识库进行对话了
比如,你可以提问:
产品是否安全?
3、开始对话
我们进入“聊天”模块
首先,AI 会按内置词语介绍自己(我给了一个它是奥格威的提示)
4、完善回答
FastGPT 提供了搜索测试对知识库进行微调,官方建议你提前收集一些用户问题进行测试,根据预期效果进行跳转。可以先进行搜索测试调整,判断知识点是否合理。
对某条回答不满意,可以在“测试结果”中直接点开这条记录,补充内容后,点“确认变更”,数据库会补充建立索引。
你也可以增加上传文件,到已有数据库。
5、链接和嵌入分享
(1)建立外部使用链接
复制后的链接可以发给其他人,其他人点开就可以对话
比如,你可以发给同事的手机上,他可以在微信打开后直接使用,示例如下:
6、API
API 就是应用程序接口,你可以通过设置 API,把你的知识库和其他信息系统打通!
我先用一个小例子,如何在 最流行的 ChatGPT-Next-Web 中使用前面我们建立的数据库
(1)安装 ChatGPT-Next-Web
我们只需要在 fastgpt.run 网站中,找到下面两个参数,填入 ChatGPT-Next-Web 软件的系统设置(如下)即可
(2)复制“接口地址”
回到 fastgpt.run 网站,进入“应用”模块,找到刚才我们的“将军牌炊具 XX 系统”
点进进入后,选 API
点一下 ①,系统自动复制接口地址
(3)生成 API KEY
API KEY = API 密匙-AppId = ③-②
fastgpt-n6x6sdescXXXXX-6509701eXXXX
注意,中间有个英文输入下的连接符“-”
(4)使用知识库
现在,你在 ChatGPT-Next-Web 的桌面端或者 web 段,就像在 fastgpt.run 上一样,与我们建立的数据库进行沟通啦
API 可以让你把这个数据库应用到你的网站、客服网站上去!
打通飞书、企业微信、企业网站等等!
FastGPT 功能还有很多,应用前景很广阔,今天先介绍到这里!
此篇原文地址:https://mp.weixin.qq.com/s/QAEt4Au7eu9N0iiE1oROXw