javastart

oobabooga-text-generation-webui可能是最好的语言模型启动器（包含手把手安装教程）

原文：oobabooga-text-generation-webui可能是最好的语言模型启动器（包含手把手安装教程） - 哔哩哔哩

引言：

问：oobabooga是什么？

oobabooga-text-generation-webui是一个用于运行类似Chatglm、RWKV-Raven、Vicuna、MOSS、LLaMA、llama.cpp、GPT-J、Pythia、OPT和GALACTICA等大型语言模型的Gradio Web用户界面。它的目标是成为文本生成的AUTOMATIC1111/stable-diffusion-webui。

这里是它的github链接：https://github.com/oobabooga/text-generation-webui

简单来说它就是个语言模型的启动器。

你可以加载几乎所有的主流模型，并在本地运行他们。语言模型能做什么，你就可以体验到什么，处理文本，个人管家，知识顾问，私人教学，这就是一个不联网的弱化版本的chatgpt，但不同于chatgpt的收费与对话审查限制，客制化的本地模型几乎提供了无限可能。(是的你完全可以训练出属于你自己的猫娘，或者体验各种奇怪内容，咳咳咳)，同时你可以轻松的在huggingface找到十几种以上的模型，活跃的环境让小模型的发展迅速，几乎每周都有几个新模型出现，总有一个符合你的要求。

问：oobabooga-text-generation-webui的主要功能有哪些？

webui支持的功能非常多，大部分重点我已经用加粗标注了。
类似stable-diffusion的，用户友好型交互界面。
较为友善的一键安装模式。
模型兼容性极佳，主流模型都可以加载。
一键式模型切换能力，快速在多个语言模型之间切换。
自带人设管理，一键加载
类似于OpenAI的记事本模式交流界面。
用于对话和角色扮演的聊天模式
与Alpaca、Vicuna、Open Assistant、Dolly、Koala、ChatGLM、MOSS、RWKV-Raven、Galactica、StableLM、WizardLM、Baize、Ziya、Chinese-Vicuna、MPT、INCITE、Wizard Mega、KoAlpaca、Vigogne、Bactrian、h2o和OpenBuddy等各种格式兼容的指令模式
包括LLaVA和MiniGPT-4在内的多模态流程
用于GALACTICA的Markdown输出，包括LaTeX渲染
用于GPT-4chan的漂亮HTML输出
高级聊天功能（发送图片，获取带有TTS的音频响应）
非常高效的文本流处理
参数预设丰富
LLaMA模型支持
4-bitGPTQ模型支持
LoRA（加载和训练）
llama.cpp模型支持
RWKV模型支持
8-bit模式
模型层分布GPU、CPU和磁盘
CPU模式
FlexGen
DeepSpeed ZeRO-3
带流式传输和无流式传输的API

有关我制作的koishi插件的介绍，如果不知道koishi是什么的可以去这里查看：

https://koishi.chat/zh-CN/

简单介绍一下oobabooga-testbot插件：

oobabooga-testbot插件是一个基于oobabooga-text-generation-webui语言模型启动器的qq机器人插件，实现了一些基本的指令，让你可以在qq机器人上实现与语言模型的对话，不需要扛着电脑，有手机就ok。支持人设加载，vits语音回复，支持AI补充tag调用插件绘图等功能。

（毕竟谁不想要一个在线猫娘随时陪伴呢）

插件教程贴：https://forum.koishi.xyz/t/topic/2391

实际上本教程之前是在koishi论坛上发布的，考虑到大伙都不太了解oobabooga所以在这里重新制作一个教程贴，帮助大家安装。

目录：

第一部分oobabooga-text-generation-webui

1.oobabooga-text-generation-webui交互页面展示。

2.如何本地搭建（github一键安装，全程没遇到报错的情况）

3.如何本地搭建（github一键安装，依赖安装出现报错的情况）

4.如何本地搭建（github手动分步安装）

5.模型下载

6.oobabooga交互页面大致导览

7.为什么我推荐大家使用oobabooga-text-generation-webui。

第二部分oobabooga-testbot插件使用以及人设文档创建

1.插件安装

2.启用oobabooga的api调用

3.插件使用教程

4.建立自己的人设文档

第一部分oobabooga-text-generation-webui

1.oobabooga-text-generation-webui交互页面展示。

文本交流页面：

文本交流页面

人设创建页面：

人设创建页面

模型加载与选择界面：

模型加载与选择界面

2.如何本地搭建（全程没遇到报错的情况）

github上提供了两种搭建方式：

一键安装包。

分步手动安装。

其他途径搭建：

b站大佬 coyude 提供了一个一键解压安装的懒人包，但我并没有尝试过是否兼容插件。

[AI对话]懒人包v1发布图形化启动界面(oobabooga/text-generation-webui)可用chatglm/rwkv/vicuna_哔哩哔哩_bilibili

专栏地址：

[懒人包]AI对话懒人包发布解压即用(text-generation-webui)可加载chatglm/rwkv/vicu - 哔哩哔哩

b站大佬 AI斯基摩人提供了一个详细的视频教程。

https://www.bilibili.com/video/BV1fP41127ra/?

本专栏将着重用细致的文字描述来帮助各位使用github上的一键安装包安装与分步手动搭建。

github一键安装流程

1.首先前往github主页。（需要科学上网，以下内容都是在科学上网的前提下进行的）

地址：https://github.com/oobabooga/text-generation-webui

2.找到如下选项：

可以看到现在一键安装是支持Windows，Linux和MacOS的。

我们以Windows系统为例：

（注：接下来的全程都是在Windows10系统下的）

选择链接下载：

下载的应该是一个压缩包：

解压缩
这里是解压缩后的文件：

注意！请务必将文件放置在全英文路径下，并且不要包涵空格或者其他特殊符号

这里是一个例子：D:\oobabooga\oobabooga_windows

oobabooga本体大约会占用10g左右的磁盘空间，单个语言模型大小在10g左右，也有特别大的14b模型可以到29g以上，所以请确保你的磁盘空间至少有50g左右。加载模型的时候会将数据导入到运存中，所以你的磁盘读取速度越快越好，个人建议放在SSD中，可以显著加快加载速度。

特别注意：

接下来的步骤需要全程科学上网，才能正确安装，如果不会的话请百度，这里不多做赘述。

然后我们双击运行start_windows.bat

它会自动下载miniconda并且安装在当前目录下。

miniconda安装完成：

这里会让你选择你的GPU类型

A：NVIDIA ，N卡选A

B：AMD ，A卡选B

C：Apple M Series，苹果选C

D：没显卡，或者显卡太弱，用CPU跑模型的用户选D（会导致回复非常慢）

我这里本地是RTX3090显卡，所以我选A，输入A，然后回车继续。

然后它就会开始自动下载一堆东西，不需要进行操作。

这一步需要等待较长时间，取决于你的网速，请你耐心等待。

我这里等待了15分钟左右完成。

出现这个表示下载完成，开始解压安装。请继续等待。

出现这个说明开始安装依赖了。请继续等待。

这一步报错的概率非常大，如果出现红色报错，说明你依赖安装出现了问题。绝大部分安装问题都出在这里。详见下方的第二种方式。

出现以下提示：

恭喜你，你已经成功安装了oobabooga了。

现在的目录结构应该是这样的：

我们运行start_windows.bat，来测试启动oobabooga。

由于我们只安装了oobabooga，并没有下载任何模型，所以启动的时候会提示你选择模型下载。

你可以选择一个下载，但速度会比较慢，个人建议还是用idm直接去huggingface找到对应模型下载比较好。

接下来请跳转到下载模型部分

3.如何本地搭建（依赖安装出现报错的情况）

看起来你很不幸的遇到了报错，报错可能长得很不一样，但是解决方法都大同小异。

现在将以这种安装报错为例：

这代表依赖未完全下载，出现的原因一般是因为你的网络环境不稳定，可以的话请更换节点后再次运行安装程序，如果不行的话就请按照以下内容进行。

再次安装依然失败的情况：

如果依然失败请先关闭当前控制台，然后随便进入一个外国网址确定你的梯子没有问题后，再进行以下步骤。

进入根目录：

依赖安装错误这个问题一般发生在安装完成miniconda，并且成功git clone了github项目之后，这时你的miniconda一般是没有问题的，你的更目录应该和图片一样，存在一个叫做text-generation-webui的文件夹。

如果没有请你不要继续并前往私信或评论区提问。

确定文件存在后你可以继续操作了：

为了解决这个问题我们需要首先进入miniconda。

双击运行cmd_windows.bat文件

这时会弹出一个黑色的窗口:

输入：cd text-generation-webui

回车

输入: pip install -r requirements.txt

回车

这时程序应该开始安装了：

安装完成后oobabooga应该就可以正常运行了。

如果更加不幸的事情发生到你身上了，在安装过程中依然报错，类似这样：

请你继续以下步骤：

现在请你到更目录，进入text-generation-webui，找到requirements文件：

打开后，删除z这三行，并保存退出：

然后回到根目录，找到cmd_windows.bat，双击运行重新创建一个新的控制台：

依次输入并回车

pip install peft

pip install transformers

pip install accelerate

cd text-generation-webui

pip install -r requirements.txt

然后等待安装完成。

完成后，请回到根目录。

运行update_windows.bat来检查一遍所有依赖

如果正常完成：

那么你的oobabooga应该就可以正常工作了。

接下来请跳转到下载模型部分

如果还未解决问题，那么就请你私信up或者在评论区留言

4.如何本地搭建（github手动分步安装）

接下来我将会讲解github上分步手动搭建流程。

手动安装需要一些进阶的知识，所以我是假设你已经具备了这些知识的，所以教程会比较简单。

首先你需要安装Conda或者WSL

这里的话我就不具体讲解如何安装了，b站教程很多，大家自己学习一下就行。

以下我将会以windows系统，安装了conda虚拟环境的方式继续

进入你想要的安装oobabooga的目录

鼠标选择后编辑：

回车，你应该打开了一个cmd窗口：

首先创建虚拟环境：

conda create -n textgen python=3.10.9

激活conda：

conda activate textgen

然后根据你的系统，安装Pytorch

windows环境就是第一句:

pip install torch torchvision torchaudio

然后安装oobabooga

git clone https://github.com/oobabooga/text-generation-webui

cd进入文件夹

cd text-generation-webui

安装依赖

pip install -r requirements.txt

等待依赖跑完就算安装完成了。

更多细节请前往github页面：https://github.com/oobabooga/text-generation-webui

接下来请跳转到模型下载部分

如果出现报错

请尝试使用上一个方法中的出现报错的处理方式进行处理

如果依然不行可以选择在评论区提问，或者私信up。

5.模型下载

接下来我将简单介绍一下如何下载模型并在oobabooga内启动

我们先前往huggingface官网：https://huggingface.co/

我将以Chatglm模型作为例子。

搜索模型：

选择第一个：https://huggingface.co/THUDM/chatglm-6b

然后我们会来到这个界面：

接下来有两个选择，你可以使用oobabooga自带的下载器，下载模型，或者自己选择文件下载。

使用oobabooga内置下载器

优点：简单，不容易出错，模型文件格式肯定正确。

缺点：速度慢。

方法：我们首先点击这里：

然后我们回到这个界面：

选择L选项 Manually specify a Hugging Face model

然后我们把刚刚复制的内容粘贴进去

回车，它就会开始自动下载了。

下载目录为：\oobabooga_windows\text-generation-webui\models

文件夹里面就是下载的模型了。

这种方式只会出现在你没有任何模型的时候

如果你已经有模型了，然后仍然希望用oobabooga进行模型下载，那么可以转跳到交互页面大致导览的model选项卡介绍。

自己下载模型文件：

优点：速度快

缺点：得手动

方法：我们首先进入model存储目录

\oobabooga_windows\text-generation-webui\models

创建一个新的文件夹，比方说：

然后我们去到Chatglm的huggingface页面：

https://huggingface.co/THUDM/chatglm-6b

选择files：

把这里所有的文件都下载到刚刚创建的文件里面：

完成后的模型文件夹内部应该类似这样：

注意！

不同类型的模型有不同的模型格式，一般来说只要把huggingface里所有的文件都下载下来就行了。如果还有问题请加群询问。

接下来我们继续oobabooga的模型加载

你应该已经下载好了模型。

如果model文件夹下只有一个模型，那oobabooga会自动加载，如果有多个模型，像我这样，它就会跳出模型选择的页面：

现在我们以Vicuna-13b作为案例，来启动模型。

（为何不用Chatglm做例子是因为Chatglm需要额外安装一下icetk，稍后我会详细讲的）

（注意！请关闭clash，oobabooga与clash会冲突，导致页面可以启动但是无法与模型对话）

弹出

Running on local URL: http://127.0.0.1:7860

To create a public link, set share=True in launch().

就说明启动成功，然后和stable-diffusion一样，我们访问127.0.0.1:7860

就可以看到webui界面了：

接上面的oobabooga中使用Chatglm模型

我们再加载Chatglm模型的时候，会遇到缺少依赖的报错，一般来说是icetk：

（暂时没找到对应的图片）

为了解决这个问题，我们需要安装icetk。

首先我们来到oobabooga文件夹：

选择cmd_windows.bat运行

输入pip install icetk

回车运行

等待安装完成（如果报错可能是你没开科学上网）

然后返回oobabooga文件夹，找到webui.py文件：

右键用记事本打开：

向下翻到140-180行左右，找到“def run_model()”

在python sever.py后面

添加--trust-remote-code

保存并退出

然后重开oobabooga，你就应该可以加载Chatglm模型了。

如果遇到更多问题，请在评论区提问，或者私信up。

6.oobabooga交互页面大致导览

我会简单介绍一下oobabooga的界面选项，以及如何与模型对话和切换模型。

在页面顶端，我们可以看到这几个选项卡。

第一个是我们与模型对话的主要界面

第二个是人设/角色加载和设定界面

第三个是模型详细参数调节

第四个是模型切换，加载与下载界面

第五个是lora训练界面

第六个是webui的选项卡

我主要来介绍第一个与模型对话的主要界面和第四个模型切换，加载与下载界面

详细设定我就不讲了，大伙自己用翻译看一下就行。

Text generation界面

我们在input输入我们想要与模型对话的内容，然后使用黄色的generate按钮，就可以与模型对话了。下面的几个按钮，就是一些正常的聊天用的按钮，自己摸索一下就都明白了。

然后是这部分，这你有三个模式，基本上就是切换不同的对话框模式，这里展示的chat模式，选择了人设后会出现相对应的头像，更增加代入感：

然后是下面的chat style

这里个选项取决于你的模型支持什么样的chat style，一般来说oobabooga会自动帮你选择最佳的。

最下面是gallery

这个是用来加载角色的。oobabooga自带了一个example角色：

选中角色卡就可以加载。

与模型对话的主要界面介绍就到这里。

接下来是第四个模型切换，加载与下载界面

model界面

我们选择选项卡来到model：

我将会分区来进行详细说明：

左上角是模型选择界面，我们可以直接选择模型进行加载，右边是lora界面，同样可以选择加载，下面是Transformers模型的选项，可以选择限制模型占用的内存大小，右侧可以选择使用的模式：

这里是GPTQ模型使用的选项，一般来说oobabooga会自动选择合适的，但使用较新的模型的时候，你可能得自己选择对应的模式：

这部分是是否自动加载模型，就是你上面的选项选择模型后是否会自动加载。
下面是模型自动下载，和之前提到的oobabooga自带的下载器使用方式一样

只需要在下面的框中输入huggingface上的名称，然后点击download就可以自动下载模型：

这里是llama模型的选项卡：

这里是应用lora，加载模型，重载模型，保存模型设定的按钮：

对于oobabooga界面的介绍就到此为止了

除了我介绍的部分之外，oobabooga还提供非常多的各种类型的功能，同时和stable-diffusion一样，也支持插件安装，大家可以自行探索。

也可以在评论区留言或私信up讨论。

7.为什么我推荐大家使用oobabooga-text-generation-webui

这部分主要是我的主观想法，大伙就当做安利就行了。

我个人对于语言模型非常感兴趣，（主要是因为想要一个个人助理），从openai发布chatgpt开始我就开始广泛的关注小模型。然而初期各种模型对于我这种不太会编程的人而言门槛太高了，很多模型我都跑不起来。

而在大量关注小模型的时候，我注意到国外的小模型发展速度非常快，从RWKV，alpaca，Vicuna，到wizard，stableVicuna，小模型的迭代速度非常的快，几乎每隔几天就有一个新的模型出现，我很希望更多人能够参与到这场变革中来，oobabooga-text-generation-webui就是一个非常好的抓手。

oobabooga-text-generation-webui作为语言模型启动器，对于模型的支持范围可以说是最广的，同时高效的模型加载方式，很大程度上满足了我对于大量模型测试的需求。同时，自带的人设加载功能，也很好满足了我对于个性化的需求。

如果你也和我一样，对于小模型有很浓厚的兴趣，而且希望在模型发布的时候就能第一时间玩到，那我强烈推荐你使用。

第二部分插件使用以及人设文档创建

1.插件安装

在koishi的插件市场搜索oobabooga

点击添加就可以安装了

在插件配置页面进行配置即可正常使用：

2.oobabooga启用api服务

接下来我将讲解如何打开oobabooga的api选项，让插件可以调用本地的oobabooga。

我们来到oobabooga文件夹下，选中webui.py

向下找到140-180行

找到“def run_model()”

在python sever.py后面

添加--api

然后保存并关闭，正常启动webui

你可以在Interface mode选项卡中看到：

这样api服务就正常启动了，你的插件应该可以通过默认的url地址调用oobabooga了。

2.插件使用教程

截止到5月24日，插件版本号是1.2.0

插件提供了多样化的指令：

我们先来看看配置页面：

apiURL是用来填写你的oobabooga的api地址的。想要开启oobabooga的api，请看楼上。

用户使用逻辑如下：

首先我们先试用oob.list指令查看当前的人设

然后我们使用oob.load指令，加载我们想要使用的人设

在插件文件夹内，将会创建一个新的历史记录

然后我们才可以使用oob与模型进行对话

oob指令是基础指令，通过使用oob指令可以直接与模型对话

历史记录将会实时保存在对应文件内，同时historylimit将会限制上下文长度，具体取决于你的设置。

使用oob.undo指令，可以撤回刚刚的一个提问

使用oob.reset指令，可以重置当前会话的历史记录

使用oob.del指令，可以删除当前的会话，来加载新的人设。

oob.tag指令可以，让Ai帮助补充tag，进行绘图。

oob.check指令是一个检查指令，它会检查是是否已经存在会话了

现在的插件已经支持昵称与@唤醒

4.建立自己的人设文档

请注意，人设文档完全在本地读取和保存，每次插件更新都会导致其清空，请注意自己留存备份。

首先我们来到

koishi-plugin-oobabooga-testbot\lib\characters

文件夹下

使用记事本打开任意一个人设文件，你会发现人设文件的格式都是类似的。

人设文件由两部分组成：

基础人设+示例对话

人设文件实际上是以数组的形式存放的，这里是一个比较好理解的例子：

[“Hello”,“Hello”]

这样就组成了一组对话。

但我们的人设文件还要再稍微复杂一些，你可以看到，我们首先给出了一段人设：

“你是人工智能语言模型，你将会用中文回复，你将作为助手，给出有帮助且友善的回复。你只需要作为助手回复。”

然后在标准的对话例子中增加了开头结尾，这里是一个例子：

[“You: ||Hello||”,“Assistant: ||Hello||”]

这是为了让模型更好的认识到哪些是人设，哪些是示例对话。同时规范模型的返回格式，以方便我们后续的处理。

请注意你的人设文件名称：

这是Aqua人设的内部，你可以看到这里的会话格式变成了：

[“You: ||Hello||”,“Aqua: ||Hello||”]

这是因为插件会自动识别人设文件的名称，让模型扮演角色，这样可以让模型的回复更加符合人设。

现在你已经大致了解了人设文件的格式了，你可以尝试性的创建一个自己的人设了。

进一步讨论请私信up或者在评论区讨论

一些想说的话

各位看官如果能坚持看到这里，那真是太了不起了，能忍受我这么长的没有一点乐趣的教程。好累，一边写论文，一边写插件，一边还在写教程，感觉身体被掏空。但各位看官如果能从我的教程中学到点什么，或者哪怕是获得一点启发，我都已经非常高兴了。希望大家能够愉快的使用oobabooga-text-generation-webui，在语言模型快速发展的现在，大家能够更得上时代的步伐，一起体验到小模型给我们带来的便利。

——smzh敬上

你可能感兴趣的:(大模型,人工智能,chatgpt,语言模型)

系统学习Python——并发模型和异步编程：进程、线程和GIL
分类目录：《系统学习Python》总目录在文章《并发模型和异步编程：基础知识》我们简单介绍了Python中的进程、线程和协程。本文就着重介绍Python中的进程、线程和GIL的关系。Python解释器的每个实例都是一个进程。使用multiprocessing或concurrent.futures库可以启动额外的Python进程。Python的subprocess库用于启动运行外部程序（不管使用何种
驱动程序为什么要做 WHQL 认证? GDCA SSL证书网络协议网络
驱动程序进行WHQL（WindowsHardwareQualityLabs）认证的核心价值在于解决兼容性、安全性和市场准入三大关键问题，具体必要性如下：️‌一、规避系统拦截，保障驱动可用性‌消除安装警告‌未认证的驱动在安装时会触发Windows的‌红色安全警告‌（如“无法验证发布者”），甚至被系统强制拦截。通过WHQL认证的驱动获得微软数字签名，用户可无阻安装‌。满足系统强制要求‌Windows1
C++ 11 Lambda表达式和min_element()与max_element()的使用_c++ lamda函数 min_element(
网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化的资料的朋友，可以添加戳这里获取一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！intmain(){vectormyvec{3,
冒泡、选择、插入排序：三大基础排序算法深度解析（C语言实现） xienda 算法排序算法数据结构
在算法学习道路上，排序算法是每位程序员必须掌握的基石。本文将深入解析冒泡排序、选择排序和插入排序这三种基础排序算法，通过C语言代码实现和对比分析，帮助读者彻底理解它们的差异与应用场景。算法原理与代码实现1.冒泡排序（BubbleSort）工作原理：通过重复比较相邻元素，将较大元素逐步"冒泡"到数组末尾。voidbubbleSort(intarr[],intn){ for(inti=0;iarr[
深入剖析OpenJDK 18 GA源码：Java平台最新发展想法臃肿
本文还有配套的精品资源，点击获取简介：OpenJDK18GA作为Java开发的关键里程碑，提供了诸多新特性和改进。本文章深入探讨了OpenJDK18GA源码，揭示其内部机制，帮助开发者更好地理解和利用这个版本。文章还涵盖了PatternMatching、SealedClasses、Records、JEP395、JEP406和JEP407等特性，以及HotSpot虚拟机、编译器、垃圾收集器、内存模型
PyTorch & TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）阿牛的药铺算法移植部署 pytorch tensorflow fpga开发
PyTorch&TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）引言：为什么算法移植工程师必须掌握框架基础？针对光学类产品算法FPGA移植岗位需求（如可见光/红外图像处理），深度学习框架是算法落地的"桥梁"——既要用PyTorch/TensorFlow验证算法可行性，又要将训练好的模型（如CNN、目标检测）转换为FPGA可部署的格式（ONNX、TFLite）。本文采用"
算法学习笔记：17.蒙特卡洛算法 ——从原理到实战，涵盖 LeetCode 与考研 408 例题
在计算机科学和数学领域，蒙特卡洛算法（MonteCarloAlgorithm）以其独特的随机抽样思想，成为解决复杂问题的有力工具。从圆周率的计算到金融风险评估，从物理模拟到人工智能，蒙特卡洛算法都发挥着不可替代的作用。本文将深入剖析蒙特卡洛算法的思想、解题思路，结合实际应用场景与Java代码实现，并融入考研408的相关考点，穿插图片辅助理解，帮助你全面掌握这一重要算法。蒙特卡洛算法的基本概念蒙特卡
分布式学习笔记_04_复制模型 NzuCRAS 分布式学习笔记架构后端
常见复制模型使用复制的目的在分布式系统中，数据通常需要被分布在多台机器上，主要为了达到：拓展性：数据量因读写负载巨大，一台机器无法承载，数据分散在多台机器上仍然可以有效地进行负载均衡，达到灵活的横向拓展高容错&高可用：在分布式系统中单机故障是常态，在单机故障的情况下希望整体系统仍然能够正常工作，这时候就需要数据在多台机器上做冗余，在遇到单机故障时能够让其他机器接管统一的用户体验：如果系统客户端分布
霍夫变换（Hough Transform）算法原来详解和纯C++代码实现以及OpenCV中的使用示例点云SLAM 算法图形图像处理算法 opencv 图像处理与计算机视觉算法直线提取检测目标检测霍夫变换算法
霍夫变换（HoughTransform）是一种经典的图像处理与计算机视觉算法，广泛用于检测图像中的几何形状，例如直线、圆、椭圆等。其核心思想是将图像空间中的“点”映射到参数空间中的“曲线”，从而将形状检测问题转化为参数空间中的峰值检测问题。一、霍夫变换基本思想输入：边缘图像（如经过Canny边缘检测）输出：一组满足几何模型的形状（如直线、圆）关键思想：图像空间中的一个点→参数空间中的一个曲线参数空
npm proxy setting kjndppl [Node.js JavaScript npm https proxy password
清理npmconfigdeletehttp-proxynpmconfigdeletehttps-proxy具体设置步骤如下：1.执行npmconfig后，将看到下一行提示信息npmconfigls-ltoshowalldefaults.2.执行npmconfigls-l后，在一大长串的settign中找出userconfig项(大概位于倒数第4项)[b]userconfig[/b]="C:\\Us
计算机网络技术 CZZDg 计算机网络
目录一.网络概述1.网络的概念2.网络发展是3.网络的四要素4.网络功能5.网络类型6.网络协议与标准7.网络中常见的概念8.网络拓补结构二.网络模型1.分层思想2.OSI七层模型3.TCP/IP五层模型4.数据的封装与解封装过程三.IP地址1.进制转换2.IP地址定义3.IP地址组成成分4.IP地址分类5.地址划分6、相关概念一.网络概述1.网络的概念两个主机通过传输介质和通信协议实现通信和资源
ThinkSound V2版 - 一键给无声视频配音，为AI视频生成匹配音效支持50系显卡一键整合包下载昨日之日2006 ai语音音视频人工智能
ThinkSound是阿里通义实验室开源的首个音频生成模型，它能够让AI像专业“音效师”一样，根据视频内容生成高度逼真、与视觉内容完美契合的音频。ThinkSound可直接应用于影视后期制作，为AI生成的视频自动匹配精准的环境噪音与爆炸声效；服务于游戏开发领域，实时生成雨势变化等动态场景的自适应音效；同时可以无障碍视频生产，为视障用户同步生成画面描述与环境音效。今天分享的ThinkSoundV2版
OpenWebUI(12)源码学习-后端constants.py常量定义文件青苔猿猿 AI大模型 openwebui constants常量定义
目录文件名：`constants.py`功能概述：主要功能点详解1.**MESSAGES枚举类**2.**WEBHOOK_MESSAGES枚举类**3.**ERROR_MESSAGES枚举类**✅默认错误模板✅认证与用户相关错误✅资源冲突与重复错误✅验证失败类错误✅权限限制类错误✅文件上传与格式错误✅模型与API错误✅请求频率与安全限制✅数据库与配置错误4.**TASKS枚举类**✅总结实际应用场
RocketMQ 核心特性实战详解愤怒的代码 RocketMQ实战 rocketmq
RocketMQ核心特性实战详解本文基于RocketMQ4.x+rocketmq-spring-boot-starter2.3.1，从零搭建，逐步讲解RocketMQ11大核心特性，每一段代码都能直接跑。0.项目环境准备依赖引入在pom.xml文件添加：org.apache.rocketmqrocketmq-spring-boot-starter2.3.1配置文件application.ymlse
Kimi Chat 1.5 与 2.0 架构升级对比 charles666666 人工智能 transformer 深度学习产品经理 chatgpt
1.5版的MoE架构优化KimiChat1.5采用了优化后的MoE架构，其核心在于“专家网络动态路由”。这一机制类似于快递系统智能选择最优路径，能够根据输入数据的特性动态分配计算资源。这种优化显著提升了模型的计算效率，同时降低了硬件资源的浪费。在实际应用中，这意味着开发者可以在相同的硬件配置下处理更复杂的任务，或者在有限的资源下实现更高的性能。2.0的混合专家系统创新点与1.5版相比，KimiCh
数字孪生技术为UI前端注入新活力：实现产品设计的沉浸式体验 ui设计前端开发老司机 ui
hello宝子们...我们是艾斯视觉擅长ui设计、前端开发、数字孪生、大数据、三维建模、三维动画10年+经验!希望我的分享能帮助到您!如需帮助可以评论关注私信我们一起探讨!致敬感谢感恩!一、引言：从“平面交互”到“沉浸体验”的UI革命当用户在电商APP中翻看3D家具模型却无法感知其与自家客厅的匹配度，当设计师在2D屏幕上绘制汽车内饰却难以预判实际乘坐体验——传统UI设计的“平面化、静态化、割裂感”
Java三年经验程序员技术栈全景指南：从前端到架构，对标阿里美团全栈要求可曾去过倒悬山 java 前端架构
Java三年经验程序员技术栈全景指南：从前端到架构，对标阿里美团全栈要求三年经验是Java程序员的分水岭，技术栈深度决定你成为“业务码农”还是“架构师候选人”。本文整合阿里、美团、滴滴等大厂招聘要求，为你绘制可落地的进阶路线。一、Java核心：从语法糖到JVM底层三年经验与初级的核心差异在于系统级理解，大厂面试常考以下能力：JVM与性能调优内存模型（堆外内存、元空间）、GC算法（G1/ZGC适用场
传统检测响应慢？陌讯多模态引擎提速90+FPS实战 2501_92473147 算法计算机视觉目标检测
开篇痛点：实时目标检测在安防监控中的核心挑战在安防监控领域，实时目标检测是保障公共安全的关键技术。然而，传统算法如YOLOv5或开源框架MMDetection常面临两大痛点：误报率高（复杂光照或遮挡场景下检测不稳定）和响应延迟（高分辨率视频流处理FPS低于30）。实测数据显示，城市交通监控系统误报率达15%，导致安保资源浪费；客户反馈表明，延迟超100ms时，目标跟踪可能失效。这些问题源于算法泛化
反光衣识别漏检率 30%？陌讯多尺度模型实测优化
在建筑工地、交通指挥等场景中，反光衣是保障作业人员安全的重要装备，对其进行精准识别是智能监控系统的核心功能之一。但传统视觉算法在实际应用中却屡屡碰壁：强光下反光衣易与背景混淆、远距离小目标漏检率高达30%、复杂场景下模型泛化能力不足[实测数据来源：某智慧工地项目2024年Q1日志]。这些问题直接导致安全监控系统预警滞后，给安全生产埋下隐患。一、技术解析：反光衣识别的核心难点与陌讯算法创新反光衣识别
AI音乐模拟器：AIGC时代的智能音乐创作革命 lauo 人工智能 AIGC 开源前端机器人
AI音乐模拟器：AIGC时代的智能音乐创作革命引言：AIGC浪潮下的音乐创作新范式在数字化转型的浪潮中，人工智能生成内容（AIGC）正在重塑各个创意领域。音乐产业作为创意经济的重要组成部分，正经历着前所未有的变革。据最新市场研究数据显示，全球AI音乐市场规模预计将从2023年的5.8亿美元增长到2030年的26.8亿美元，年复合增长率高达24.3%。这一快速增长的市场背后，是AI音乐技术正在打破传
【AI大模型学习路线】第三阶段之RAG与LangChain——第十六章（Advanced RAG[1]）基于历史对话重新生成Query？ 985小水博一枚呀 AI大模型学习路线人工智能学习 langchain RAG
【AI大模型学习路线】第三阶段之RAG与LangChain——第十六章（AdvancedRAG[1]）基于历史对话重新生成Query？【AI大模型学习路线】第三阶段之RAG与LangChain——第十六章（AdvancedRAG[1]）基于历史对话重新生成Query？文章目录【AI大模型学习路线】第三阶段之RAG与LangChain——第十六章（AdvancedRAG[1]）基于历史对话重新生成Q
【AI大模型学习路线】第三阶段之RAG与LangChain——第十六章（Advanced RAG[1]）其他Query优化相关策略？ 985小水博一枚呀 AI大模型学习路线人工智能学习 langchain
【AI大模型学习路线】第三阶段之RAG与LangChain——第十六章（AdvancedRAG[1]）其他Query优化相关策略？【AI大模型学习路线】第三阶段之RAG与LangChain——第十六章（AdvancedRAG[1]）其他Query优化相关策略？文章目录【AI大模型学习路线】第三阶段之RAG与LangChain——第十六章（AdvancedRAG[1]）其他Query优化相关策略？一
盲超分的核心概念小冷爱读书数学建模盲超分超分重建
一、盲超分的本质与数学建模1.退化过程的数学表达低分辨率图像（LR）可看作高分辨率图像（HR）经过退化模型后的结果：：观测到的低分辨率图像：待恢复的高分辨率图像：模糊核（BlurKernel）⊗：卷积操作↓：下采样（步长为）：加性噪声（如高斯噪声、泊松噪声等）盲超分的核心问题：在未知、、的情况下，从估计。2.为什么传统超分方法会失效？传统方法（如SRCNN、EDSR）假设退化是固定的（如双三次下采
LangChain中的向量数据库接口－Weaviate 洪城叮当 langchain 数据库经验分享笔记交互人工智能知识图谱
文章目录前言一、原型定义二、代码解析1、add_texts方法1.1、应用样例2、from_texts方法2.1、应用样例3、similarity_search方法3.1、应用样例三、项目应用1、安装依赖2、引入依赖3、创建对象4、添加数据5、查询数据总结前言 Weaviate是一个开源的向量数据库，支持存储来自各类机器学习模型的数据对象和向量嵌入，并能无缝扩展至数十亿数据对象。它提供存储文档嵌
LLM中最后一个词语的表征（隐藏状态）通常会融合前面所有词语的信息吗？ ZhangJiQun&MXP 教学 2024大模型以及算力 2021 AI python 机器学习算法深度学习人工智能
LLM中最后一个词语的表征（隐藏状态）通常会融合前面所有词语的信息吗？在大语言模型（LLM）中，最后一个词语的表征（隐藏状态）通常会融合前面所有词语的信息，这是由LLM的核心架构（以Transformer为基础）决定的，具体可以从以下角度理解：1.核心机制：自注意力（Self-Attention）的作用现代LLM（如GPT系列、Qwen等）均基于Transformer架构，其核心是自注意力机制。在
深度学习模型表征提取全解析 ZhangJiQun&MXP 教学 2024大模型以及算力 2021 AI python 深度学习人工智能 python embedding 语言模型
模型内部进行表征提取的方法在自然语言处理（NLP）中，“表征（Representation）”指将文本（词、短语、句子、文档等）转化为计算机可理解的数值形式（如向量、矩阵），核心目标是捕捉语言的语义、语法、上下文依赖等信息。自然语言表征技术可按“静态/动态”“有无上下文”“是否融入知识”等维度划分一、传统静态表征（无上下文，词级为主）这类方法为每个词分配固定向量，不考虑其在具体语境中的含义（无法解
AI Agent开发学习系列 - langchain之Chains的使用(7)：用四种处理文档的预制链轻松实现文档对话 alex100 AI Agent 学习人工智能 langchain prompt 语言模型 python
在LangChain中，四种文档处理预制链（stuff、refine、mapreduce、mapre-rank）是实现文档问答、摘要等任务的常用高阶工具。它们的核心作用是：将长文档切分为块，分步处理，再整合结果，极大提升大模型处理长文档的能力。stuff直接拼接所有文档内容到prompt，一次性交给大模型处理。适合文档较短、token不超限的场景。refine递进式摘要。先对第一块文档生成初步答案
LLM的表征做减法的是什么，自然语言是一个矩阵，怎么进行减法的 ZhangJiQun&MXP 教学 2024大模型以及算力 2021 AI python 计算机视觉人工智能机器学习算法深度学习
LLM的表征做减法的是什么，自然语言是一个矩阵，怎么进行减法的有个假设：就是最后一个词语融合了前面词语的信息减法操作主要用于提取模型内部表征中的"诚实性"概念向量。具体来说，这是通过对比诚实和不诚实场景下的模型隐藏状态实现的。importtorchfromtransformersimportAutoModelForCausalLM,AutoTokenizer,AutoConfigimportnum
什么是RFM模型走过冬季学习笔记大数据数据分析
RFM模型是客户价值分析中一种经典且实用的量化模型，它通过三个关键维度评估用户价值，帮助企业识别最有价值的客户群体。名称RFM由三个核心指标的英文首字母组成：R（Recency）-最近一次消费时间定义：用户上一次发生交易行为距今的时间长度（如多少天前）。意义：衡量用户的活跃度和流失风险。R值越小（最近有消费），说明用户越活跃，流失风险越低；R值越大（很久没消费），用户流失风险越高。母婴场景示例：一
视频分析：让AI看懂动态画面随机森林404 计算机视觉音视频人工智能 microsoft
引言：动态视觉理解的革命在数字信息爆炸的时代，视频已成为最主要的媒介形式。据统计，每分钟有超过500小时的视频内容被上传到YouTube平台，而全球互联网流量的82%来自视频数据传输。面对如此海量的视频内容，传统的人工处理方式已无法满足需求，这正是人工智能视频分析技术大显身手的舞台。视频分析技术赋予机器"看懂"动态画面的能力，使其能够自动理解、解释甚至预测视频中的内容，这一突破正在彻底改变我们与视
JVM StackMapTable 属性的作用及理解 lijingyao8206 jvm 字节码 Class文件 StackMapTable
在Java 6版本之后JVM引入了栈图(Stack Map Table)概念。为了提高验证过程的效率，在字节码规范中添加了Stack Map Table属性，以下简称栈图，其方法的code属性中存储了局部变量和操作数的类型验证以及字节码的偏移量。也就是一个method需要且仅对应一个Stack Map Table。在Java 7版
回调函数调用方法百合不是茶 java
最近在看大神写的代码时,.发现其中使用了很多的回调 ,以前只是在学习的时候经常用到 ,现在写个笔记记录一下代码很简单: MainDemo :调用方法得到方法的返回结果
[时间机器]制造时间机器需要一些材料 comsci 制造
根据我的计算和推测,要完全实现制造一台时间机器,需要某些我们这个世界不存在的物质和材料... 甚至可以这样说,这种材料和物质,我们在反应堆中也无法获得......
开口埋怨不如闭口做事邓集海邓集海做人做事工作
“开口埋怨，不如闭口做事。”不是名人名言，而是一个普通父亲对儿子的训导。但是，因为这句训导，这位普通父亲却造就了一个名人儿子。这位普通父亲造就的名人儿子，叫张明正。　　　　张明正出身贫寒，读书时成绩差，常挨老师批评。高中毕业，张明正连普通大学的分数线都没上。高考成绩出来后，平时开口怨这怨那的张明正，不从自身找原因，而是不停地埋怨自己家庭条件不好、埋怨父母没有给他创造良好的学习环境。　　　　
jQuery插件开发全解析，类级别与对象级别开发 IT独行者 jquery 开发插件　函数
jQuery插件的开发包括两种：一种是类级别的插件开发，即给 jQuery添加新的全局函数，相当于给 jQuery类本身添加方法。 jQuery的全局函数就是属于 jQuery命名空间的函数，另一种是对象级别的插件开发，即给 jQuery对象添加方法。下面就两种函数的开发做详细的说明。 1 、类级别的插件开发类级别的插件开发最直接的理解就是给jQuer
Rome解析Rss 413277409 Rome解析Rss
import java.net.URL; import java.util.List; import org.junit.Test; import com.sun.syndication.feed.synd.SyndCategory; import com.sun.syndication.feed.synd.S
RSA加密解密无量加密解密 rsa
RSA加密解密代码代码有待整理 package com.tongbanjie.commons.util; import java.security.Key; import java.security.KeyFactory; import java.security.KeyPair; import java.security.KeyPairGenerat
linux 软件安装遇到的问题 aichenglong linux 遇到的问题 ftp
1 ftp配置中遇到的问题 500 OOPS: cannot change directory 出现该问题的原因:是SELinux安装机制的问题.只要disable SELinux就可以了修改方法:1 修改/etc/selinux/config 中SELINUX=disabled 2 source /etc
面试心得 alafqq 面试
最近面试了好几家公司。记录下；支付宝，面试我的人胖胖的，看着人挺好的；博彦外包的职位，面试失败；阿里金融，面试官人也挺和善，只不过我让他吐血了。。。由于印象比较深，记录下； 1，自我介绍 2，说下八种基本类型；（算上string。楼主才答了3种，哈哈，string其实不是基本类型，是引用类型） 3，什么是包装类，包装类的优点； 4，平时看过什么书？NND，什么书都没看过。。照样
java的多态性探讨百合不是茶 java
java的多态性是指main方法在调用属性的时候类可以对这一属性做出反应的情况 //package 1; class A{ public void test(){ System.out.println("A"); } } class D extends A{ public void test(){ S
网络编程基础篇之JavaScript-学习笔记 bijian1013 JavaScript
1.documentWrite <html> <head> <script language="JavaScript"> document.write("这是电脑网络学校"); document.close(); </script> </h
探索JUnit4扩展：深入Rule bijian1013 JUnit Rule 单元测试
本文将进一步探究Rule的应用，展示如何使用Rule来替代@BeforeClass，@AfterClass，@Before和@After的功能。在上一篇中提到，可以使用Rule替代现有的大部分Runner扩展，而且也不提倡对Runner中的withBefores()，withAfte
[CSS]CSS浮动十五条规则 bit1129 css
这些浮动规则，主要是参考CSS权威指南关于浮动规则的总结，然后添加一些简单的例子以验证和理解这些规则。 1. 所有的页面元素都可以浮动 2. 一个元素浮动后，会成为块级元素，比如<span>,a, strong等都会变成块级元素 3.一个元素左浮动，会向最近的块级父元素的左上角移动，直到浮动元素的左外边界碰到块级父元素的左内边界；如果这个块级父元素已经有浮动元素停靠了
【Kafka六】Kafka Producer和Consumer多Broker、多Partition场景 bit1129 partition
0.Kafka服务器配置 3个broker 1个topic，6个partition，副本因子是2 2个consumer，每个consumer三个线程并发读取 1. Producer package kafka.examples.multibrokers.producers; import java.util.Properties; import java.util.
zabbix_agentd.conf配置文件详解 ronin47 zabbix 配置文件
Aliaskey的别名，例如 Alias=ttlsa.userid:vfs.file.regexp[/etc/passwd,^ttlsa:.:([0-9]+),,,,\1]，或者ttlsa的用户ID。你可以使用key：vfs.file.regexp[/etc/passwd,^ttlsa:.: ([0-9]+),,,,\1]，也可以使用ttlsa.userid。备注: 别名不能重复，但是可以有多个
java--19.用矩阵求Fibonacci数列的第N项 bylijinnan fibonacci
参考了网上的思路，写了个Java版的： public class Fibonacci { final static int[] A={1,1,1,0}; public static void main(String[] args) { int n=7; for(int i=0;i<=n;i++){ int f=fibonac
Netty源码学习-LengthFieldBasedFrameDecoder bylijinnan java netty
先看看LengthFieldBasedFrameDecoder的官方API http://docs.jboss.org/netty/3.1/api/org/jboss/netty/handler/codec/frame/LengthFieldBasedFrameDecoder.html API举例说明了LengthFieldBasedFrameDecoder的解析机制，如下：实
AES加密解密 chicony 加密解密
AES加解密算法，使用Base64做转码以及辅助加密： package com.wintv.common; import javax.crypto.Cipher; import javax.crypto.spec.IvParameterSpec; import javax.crypto.spec.SecretKeySpec; import sun.misc.BASE64Decod
文件编码格式转换 ctrain 编码格式
package com.test; import java.io.File; import java.io.FileInputStream; import java.io.FileOutputStream; import java.io.IOException; import java.io.InputStream; import java.io.OutputStream;
mysql 在linux客户端插入数据中文乱码 daizj mysql 中文乱码
1、查看系统客户端，数据库，连接层的编码查看方法： http://daizj.iteye.com/blog/2174993 进入mysql，通过如下命令查看数据库编码方式： mysql> show variables like 'character_set_%'; +--------------------------+------
好代码是廉价的代码 dcj3sjt126com 程序员读书
长久以来我一直主张：好代码是廉价的代码。当我跟做开发的同事说出这话时，他们的第一反应是一种惊愕，然后是将近一个星期的嘲笑，把它当作一个笑话来讲。当他们走近看我的表情、知道我是认真的时，才收敛一点。当最初的惊愕消退后，他们会用一些这样的话来反驳： “好代码不廉价，好代码是采用经过数十年计算机科学研究和积累得出的最佳实践设计模式和方法论建立起来的精心制作的程序代码。” 我只
Android网络请求库——android-async-http dcj3sjt126com android
在iOS开发中有大名鼎鼎的ASIHttpRequest库，用来处理网络请求操作，今天要介绍的是一个在Android上同样强大的网络请求库android-async-http，目前非常火的应用Instagram和Pinterest的Android版就是用的这个网络请求库。这个网络请求库是基于Apache HttpClient库之上的一个异步网络请求处理库，网络处理均基于Android的非UI线程，通
ORACLE 复习笔记之SQL语句的优化 eksliang SQL优化 Oracle sql语句优化 SQL语句的优化
转载请出自出处：http://eksliang.iteye.com/blog/2097999 SQL语句的优化总结如下 sql语句的优化可以按照如下六个步骤进行：合理使用索引避免或者简化排序消除对大表的扫描避免复杂的通配符匹配调整子查询的性能 EXISTS和IN运算符下面我就按照上面这六个步骤分别进行总结：
浅析：Android 嵌套滑动机制（NestedScrolling） gg163 android 移动开发滑动机制嵌套
谷歌在发布安卓 Lollipop版本之后，为了更好的用户体验，Google为Android的滑动机制提供了NestedScrolling特性 NestedScrolling的特性可以体现在哪里呢？ 比如你使用了Toolbar，下面一个ScrollView，向上滚
使用hovertree菜单作为后台导航 hvt JavaScript jquery .net hovertree asp.net
hovertree是一个jquery菜单插件，官方网址：http://keleyi.com/jq/hovertree/ ，可以登录该网址体验效果。 0.1.3版本：http://keleyi.com/jq/hovertree/demo/demo.0.1.3.htm hovertree插件包含文件： http://keleyi.com/jq/hovertree/css
SVG 教程（二）矩形天梯梦 svg
SVG <rect> SVG Shapes SVG有一些预定义的形状元素，可被开发者使用和操作：矩形 <rect> 圆形 <circle> 椭圆 <ellipse> 线 <line> 折线 <polyline> 多边形 <polygon> 路径 <path>
一个简单的队列 luyulong java 数据结构队列
public class MyQueue { private long[] arr; private int front; private int end; // 有效数据的大小 private int elements; public MyQueue() { arr = new long[10]; elements = 0; front
基础数据结构和算法九：Binary Search Tree sunwinner Algorithm
A binary search tree (BST) is a binary tree where each node has a Comparable key (and an associated value) and satisfies the restriction that the key in any node is larger than the keys in all
项目出现的一些问题和体会 Steven-Walker DAO Web servlet
第一篇博客不知道要写点什么，就先来点近阶段的感悟吧。这几天学了servlet和数据库等知识，就参照老方的视频写了一个简单的增删改查的，完成了最简单的一些功能，使用了三层架构。 dao层完成的是对数据库具体的功能实现，service层调用了dao层的实现方法，具体对servlet提供支持。 &
高手问答：Java老A带你全面提升Java单兵作战能力！ ITeye管理员 java
本期特邀《Java特种兵》作者：谢宇，CSDN论坛ID: xieyuooo 针对JAVA问题给予大家解答，欢迎网友积极提问，与专家一起讨论! 作者简介：淘宝网资深Java工程师，CSDN超人气博主，人称“胖哥”。 CSDN博客地址： http://blog.csdn.net/xieyuooo 作者在进入大学前是一个不折不扣的计算机白痴，曾经被人笑话过不懂鼠标是什么，