DB-GPT,数据库的下一代交互方式

DB-GPT结合数据库与大语言模型, 通过构建私域知识库、多模型管理、多源数据连接、Multi-agents等一系列技术, 提供了最完整的架构、产品解决方案, 同时除了结合数据库能力之外, 最近支持了ChatExcel的能力,让数据库的使用、数据分析变得异常便捷。我们期望围绕数据库与大模型构建最完整的解决方案, 从而彻底改变数据库的交互方式。 今天借此机会和大家一起介绍一下项目以及后续的规划。

什么是DB-GPT?  

随着大模型的发布迭代,大模型变得越来越智能,但在使用大模型的能力,尤其是在和数据库交互的过程中,私密数据以及环境是否能掌握自己的手里,完全自主可控?数据与隐私的安全性问题也成为了不得不关注的风险。基于此,我们发起了DB-GPT项目,为所有以数据库为基础的场景,构建一套完整的私有大模型解决方案。此方案因为支持本地部署,所以不仅仅可以应用于独立私有环境,而且还可以根据业务模块独立部署隔离,让大模型的能力绝对私有、安全、可控。

DB-GPT 是一个开源的以数据库为基础的GPT实验项目,使用本地化的GPT大模型与您的数据和环境进行交互,无数据泄露风险,100% 私密。我们的愿景是让围绕数据库构建大模型应用更简单,更方便。

特性一览  

目前该开源项目已经发布了多种关键的特性,这里一一列举展示一下当前发布的能力:

  • ChatData

o SQL 生成

o SQL 诊断

  • ChatDB

o 多种数据库类型支持(用户可以连接 MySQL, SQLite, ClickHouse, DuckDB, MSSQL 等数据源)

  • Chat2Dashboard

  • ChatExcel

  • 私域问答与数据处理

o 知识库管理 (目前支持 txt, pdf, md, html, doc, ppt, and url)

o 数据库知识问答

o 数据处理

  • 插件模型

o 支持自定义插件执行任务,原生支持 Auto-GPT 插件。如:

o SQL 自动执行,获取查询结果

o 自动爬取学习知识

  • 知识库统一向量存储 / 索引

o 非结构化数据支持包括 PDF、MarkDown、CSV、WebURL

  • 多模型支持

o 支持多种大语言模型,当前已支持如下模型:

o  Vicuna-v1.5(7b,13b)

o  llama-2(7b,13b,70b)

o WizardLM-v1.2(13b)

o Vicuna (7b,13b)

o ChatGLM-6b (int4,int8)

o ChatGLM2-6b (int4,int8)

o guanaco(7b,13b,33b)

o Gorilla(7b,13b)

o baichuan(7b,13b)

  • ChatData&ChatDB 自然语言生成SQL,与数据对话,在编辑器模式下你可以编辑对应的SQL 

  • ChatExcel 自然语言分析Excel内容  

  • 私域问答与数据处理

架构方案  

DB-GPT基于 FastChat 构建大模型运行环境,提供 vicuna 作为基础的大语言模型,通过LangChain提供私域知识库问答能力。此外,我们支持插件模式, 在设计上原生支持Auto-GPT插件。

核心能力主要有以下几个部分。

  • 知识库能力:支持私域知识库问答能力

  • 大模型管理能力:基于FastChat提供一个大模型的运营环境。

  • 统一的数据向量化存储与索引:提供一种统一的方式来存储和索引各种数据类型。

  • 连接模块:用于连接不同的模块和数据源,实现数据的流转和交互。

  • Agent与插件:提供Agent和插件机制,使得用户可以自定义并增强系统的行为。

  • Prompt自动生成与优化:自动化生成高质量的Prompt,并进行优化,提高系统的响应效率。

  • 多端产品界面:支持多种不同的客户端产品,例如Web、移动应用和桌面应用等。

子模块  

  • DB-GPT-Hub  使用 LLM 进行文本到 SQL 解析

  • DB-GPT-Plugins DB-GPT 插件仓库, 兼容Auto-GPT

  • DB-GPT-Web 多端交互前端界面

开源项目地址:eosphoros

开源项目作者:https://github.com/eosphoros-ai/DB-GPT

你可能感兴趣的:(网络)