随着大模型的发布迭代,大模型变得越来越智能,但在使用大模型的能力,尤其是在和数据库交互的过程中,私密数据以及环境是否能掌握自己的手里,完全自主可控?数据与隐私的安全性问题也成为了不得不关注的风险。基于此,我们发起了DB-GPT项目,为所有以数据库为基础的场景,构建一套完整的私有大模型解决方案。此方案因为支持本地部署,所以不仅仅可以应用于独立私有环境,而且还可以根据业务模块独立部署隔离,让大模型的能力绝对私有、安全、可控。
DB-GPT 是一个开源的以数据库为基础的GPT实验项目,使用本地化的GPT大模型与您的数据和环境进行交互,无数据泄露风险,100% 私密。我们的愿景是让围绕数据库构建大模型应用更简单,更方便。
目前该开源项目已经发布了多种关键的特性,这里一一列举展示一下当前发布的能力:
ChatData
o SQL 生成
o SQL 诊断
ChatDB
o 多种数据库类型支持(用户可以连接 MySQL, SQLite, ClickHouse, DuckDB, MSSQL 等数据源)
Chat2Dashboard
ChatExcel
私域问答与数据处理
o 知识库管理 (目前支持 txt, pdf, md, html, doc, ppt, and url)
o 数据库知识问答
o 数据处理
插件模型
o 支持自定义插件执行任务,原生支持 Auto-GPT 插件。如:
o SQL 自动执行,获取查询结果
o 自动爬取学习知识
知识库统一向量存储 / 索引
o 非结构化数据支持包括 PDF、MarkDown、CSV、WebURL
多模型支持
o 支持多种大语言模型,当前已支持如下模型:
o Vicuna-v1.5(7b,13b)
o llama-2(7b,13b,70b)
o WizardLM-v1.2(13b)
o Vicuna (7b,13b)
o ChatGLM-6b (int4,int8)
o ChatGLM2-6b (int4,int8)
o guanaco(7b,13b,33b)
o Gorilla(7b,13b)
o baichuan(7b,13b)
ChatData&ChatDB 自然语言生成SQL,与数据对话,在编辑器模式下你可以编辑对应的SQL
ChatExcel 自然语言分析Excel内容
私域问答与数据处理
DB-GPT基于 FastChat 构建大模型运行环境,提供 vicuna 作为基础的大语言模型,通过LangChain提供私域知识库问答能力。此外,我们支持插件模式, 在设计上原生支持Auto-GPT插件。
核心能力主要有以下几个部分。
知识库能力:支持私域知识库问答能力
大模型管理能力:基于FastChat提供一个大模型的运营环境。
统一的数据向量化存储与索引:提供一种统一的方式来存储和索引各种数据类型。
连接模块:用于连接不同的模块和数据源,实现数据的流转和交互。
Agent与插件:提供Agent和插件机制,使得用户可以自定义并增强系统的行为。
Prompt自动生成与优化:自动化生成高质量的Prompt,并进行优化,提高系统的响应效率。
多端产品界面:支持多种不同的客户端产品,例如Web、移动应用和桌面应用等。
DB-GPT-Hub 使用 LLM 进行文本到 SQL 解析
DB-GPT-Plugins DB-GPT 插件仓库, 兼容Auto-GPT
DB-GPT-Web 多端交互前端界面
开源项目地址:eosphoros
开源项目作者:https://github.com/eosphoros-ai/DB-GPT