DB-GPT安装部署使用初体验_dbgpt-程序员宅基地

技术标签: gpt  大模型  数据库  DB-GPT  

DB-GPT是什么?引自官网:

DB-GPT是一个开源的AI原生数据应用开发框架(AI Native Data App Development framework with AWEL(Agentic Workflow Expression Language) and Agents)。
目的是构建大模型领域的基础设施,通过开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单,更方便。
数据3.0 时代,基于模型、数据库,企业/开发者可以用更少的代码搭建自己的专属应用。

总而言之:基于大模型的数据集大成者的应用。

官网文档地址

功能

  • 私域问答&数据处理&RAG(Retrieval-Augmented Generation)
    支持内置、多文件格式上传、插件自抓取等方式自定义构建知识库,对海量结构化,非结构化数据做统一向量存储与检索
  • 多数据源&GBI(Generative Business Intelligence)
    支持自然语言与Excel、数据库、数仓等多种数据源交互,并支持分析报告。
  • 多模型管理
    海量模型支持,包括开源、API代理等几十种大语言模型。如LLaMA/LLaMA2、Baichuan、ChatGLM、文心、通义、智谱、星火等。
  • 自动化微调
    围绕大语言模型、Text2SQL数据集、LoRA/QLoRA/Pturning等微调方法构建的自动化微调轻量框架, 让TextSQL微调像流水线一样方便。
  • Data-Driven Multi-Agents&Plugins
    支持自定义插件执行任务,原生支持Auto-GPT插件模型,Agents协议采用Agent Protocol标准
  • 隐私安全
    通过私有化大模型、代理脱敏等多种技术保障数据的隐私安全

其他介绍详见官方文档

安装部署

参考源码部署

:如本地部署大模型,可离线下载后放置DB-GPT/models目录下。
考虑大家资源有限,此处介绍代理模式安装。
代理模式即各大大模型厂商提供的API接口,有免费的、限免的、付费的,大家酌情选择。
免费/限免的有:

  • 阿里系: https://dashscope.console.aliyun.com/billing
  • 科大讯飞:星火大模型,官网领取额度
    结论:通义千问qwen-turbo模型效果稍好点。
    有条件的可以上chat-gpt和智谱AI,效果更好。

参数配置

以通义千问为例。

  • 拷贝.env.template.env
  • 设置
LLM_MODEL=tongyi_proxyllm
# PROXYLLM_BACKEND = qwen-1.8b-chat (可选模型, 免费)
PROXYLLM_BACKEND = qwen-turbo
EMBEDDING_MODEL=text2vec
#通义千问
PROXY_SERVER_URL=https://dashscope.aliyuncs.com/api/v1/services/aigc/text-generation/generation
# Aliyun tongyi
TONGYI_PROXY_API_KEY=={自己申请的key}

启动

python ./dbgpt/app/dbgpt_server.py

启动成功:

INFO:     Uvicorn running on http://0.0.0.0:5000 (Press CTRL+C to quit)
2024-03-25 19:51:06 bogon dbgpt.model.adapter.proxy_adapter[1457] INFO Load model from params: 

=========================== ProxyModelParameters ===========================

model_name: tongyi_proxyllm
model_path: tongyi_proxyllm
proxy_server_url: https://dashscope.aliyuncs.com/api/v1/services/aigc/text-generation/generation
proxy_api_key: ********
proxy_api_base: None
proxy_api_app_id: None
proxy_api_secret: None
proxy_api_type: None
proxy_api_version: None
http_proxy: None
proxyllm_backend: qwen-turbo
model_type: proxy
device: cpu
prompt_template: None
max_context_size: 4096
llm_client_class: None

======================================================================

功能演练

地址:http://127.0.0.1:5000/
在这里插入图片描述

数据库配置

在这里插入图片描述
支持各大主流传统数据库、大数据库、KV数据库等。

功能清单

在这里插入图片描述
支持数据对话、数据库对话、Excel对话、知识库对话、报表分析、代理对话等。

数据对话

在这里插入图片描述
在这里插入图片描述

效果还行,单表查询不错。

数据库对话

在这里插入图片描述
效果一般,无法进行数据库连接操作。

Excel对话

在这里插入图片描述
上传Excel后,会进行初步的总结。

在这里插入图片描述
在这里插入图片描述
整体还行。

知识库对话

略。
常规操作。

报表分析

在这里插入图片描述
无法达到预期效果,应该和模型有关。
官方的一段话:数据对话对模型能力的要求相对较高,ChatGPT/GPT-4有较高的成功率。其他开源模型可以尝试Vicuna-13B。

其他功能

  • 模型管理
  • 应用开发
  • 插件开发
  • 智能体编排语言(AWEL) 这个看上去很6的样子

持续跟进。。。

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/pilihaotian/article/details/137023350

智能推荐

【华为OD机试 2023 B卷 | 200分】We Are A Team(C++ Java JavaScript Python)_华为od we are a team-程序员宅基地

文章浏览阅读9.6k次。总共有 n 个人在机房,每个人有一个标号(1_华为od we are a team

常见文件格式的文件头数值-程序员宅基地

文章浏览阅读390次。常见文件格式的文件头数值JPEG (jpg),文件头:FFD8FFPNG (png),文件头:89504E47GIF (gif),文件头:47494638TIFF (tif),文件头:49492A00Windows Bitmap (bmp),文件头:424DCAD (dwg),文件头:41433130Adobe Photoshop (psd),文件头:38425053..._常见文件格式的文件头数值

安装leach-234,./configure出现‘Installation of tcl seems incomplete or can't be found automaticall'怎么办_configure: error: installation of tcl seems incomp-程序员宅基地

文章浏览阅读1.5k次。# ./configurechecking for gcc... gccchecking whether the C compiler works... yeschecking for C compiler default output file name... a.outchecking for suffix of executables... checking whether we are c..._configure: error: installation of tcl seems incomplete or can't be found aut

解决Could not resolve com.github.tbruyelle:rxpermissions:0.10.2.-程序员宅基地

文章浏览阅读3.5k次。android studio 运行项目报 Could not resolve com.github.tbruyelle:rxpermissions:0.10.2.如图:提示说是没有这个版本库的缓存可以用于离线模式,搞了半天,最后发现原来是gradle设置那里把离线模式打开了,在Android Studio ---Tool Windows ---Gradle,打开如图,设置Gradle:Toggle Offline Mode, 点击这个按钮为非选中状态,即非离线状态,然后再运行项._could not resolve com.github.tbruyelle:rxpermissions:0.10.2.

利用libwebsockets写ws、wss服务端和客户端_libwsclient_send-程序员宅基地

文章浏览阅读3.2k次。服务端:server.c#include "libwebsockets.h"#include <signal.h>#include <string.h>static volatile int exit_sig = 0;#define MAX_PAYLOAD_SIZE 10 * 1024void sighdl( int sig ) { lwsl_notice( "%d traped", sig ); exit_sig = 1;}/** _libwsclient_send

Linux系统安装与配置_装linux系统配置-程序员宅基地

文章浏览阅读856次,点赞18次,收藏30次。Linux系统的安装过程需要进行准备工作,并按照一定的步骤进行。用户需要选择适合自己的发行版、下载ISO镜像文件、制作启动盘或启动U盘、备份重要数据和检查硬件要求。安装步骤包括选择启动设备、进入安装程序、分区、安装基本系统、设置用户账户、安装引导程序和完成安装。在安装过程中,用户可能会遇到各种问题,例如无法启动计算机、无法识别硬盘、安装程序卡住、安装程序出现错误等。用户可以根据问题的具体情况,采取相应的解决方法。_装linux系统配置

随便推点

unity热更新框架Xlua--自定义Loader方式_xlua 使用两次自定义loader-程序员宅基地

文章浏览阅读1.8w次。本博客根据51CTOscholl刘国柱老师网课编写,小白笔记,侵权必删创建C#脚本:using System.Collections;using System.Collections.Generic;using UnityEngine;using XLua;using System.IO;public class RunluaBySelfDefloader : MonoBeha..._xlua 使用两次自定义loader

grasshopper for rhino 6下载_Grasshopper做分形图案-程序员宅基地

文章浏览阅读280次。【长文多图预警】大家对于“分形”这个词并不陌生。一般来说,拥有“自相似”性质的图形属于分形。简而言之,如果你把一个图形放大,看到和它本身一模一样的形状,那么可以认为这个图形是“分形”的。它们还拥有无限多的细节,堪称最美丽的几何图形。虽然分形最初是用来测量和表述自然界中有粗糙边界的物体(比如海岸线),而且有严谨的定义,但本文不讨论这些,仅讨论使用迭代方法绘制分形。在Grasshopper中,绘制分形..._grasshopper for rhino 6

Java定时任务-ScheduledExecutorService_scheduledexecutortask-程序员宅基地

文章浏览阅读1.1k次。1.ScheduledExecutorService的接口介绍package java.util.concurrent;public interface ScheduledExecutorService extends ExecutorService { //单次执行,在指定延时delay后运行command任务 public ScheduledFuture<?> schedule(Runnable command,long delay, TimeUnit unit);_scheduledexecutortask

处理Oracle中杀不掉的锁-程序员宅基地

文章浏览阅读147次。一些ORACLE中的进程被杀掉后,状态被置为"killed",但是锁定的资源很长时间不释放,有时实在没办法,只好重启数据库。现在提供一种方法解决这种问题,那1.就是在ORACLE中杀不掉的,2.在OS一级再杀。 1.下面的语句用来查询哪些对象被锁: select a.object_name,a.object_type,s.osuser,s.username,s.status,machine,s.s..._locked mode 为6杀不掉

基于用户乘车行为大数据的客流分析及预测模型_轨道交通大数据分析模型有哪些-程序员宅基地

文章浏览阅读1.1k次。目录 一.项目说明 1项目背景 1问题说明 1任务要求 1二.包含技术 2本项目用到的技术 2三.数据格式 2客流数据 2天气数据 2构建数据 2四.设计过程 3环境配置 3 1.相应库的导入 3 2.数据的读取 4 3.数据探索 4 4.数据合并 5 5.数据预处理 5 5.1查看数据分布 5 5.2异常数据处理 5 5.3构造特征值 7 6.特征相关性分析 7 7.目标相关性分析 8 8.LSTM模型搭建 8 9.预测及结果可视化 9五.个人总结 10_轨道交通大数据分析模型有哪些

java转双层pdf文件_双层ofd转pdf时报错,带图片带坐标的那种格式-程序员宅基地

文章浏览阅读1.9k次。双层ofd转pdf时报错,带图片带坐标的那种格式org.ofdrw.reader.BadOFDException: OFD解析失败,原因:无法在目录: C:\Users\ADMINI~1\AppData\Local\Temp\ofd-tmp-3503787938540531089\Doc_0中找到,文件 [ Annotations.xml ]at org.ofdrw.reader.OFDReade..._无法在目录: /ofd-tmp-72300205115873

推荐文章

热门文章

相关标签