机器学习社区

用通俗易懂的方式讲解：Stable Diffusion WebUI 从零基础到入门

本文主要介绍 Stable Diffusion WebUI 的实际操作方法，涵盖prompt推导、lora模型、vae模型和controlNet应用等内容，并给出了可操作的文生图、图生图实战示例。适合对Stable Diffusion感兴趣，但又对Stable Diffusion WebUI使用感到困惑的同学。

前面分享了两篇文章：十分钟读懂 Stable Diffusion 运行原理和一文教会你学会 AI 绘画利器 Stable Diffusion，喜欢的可以阅读一下

本文希望能够降低大家对 Stable Diffusion WebUI 的学习成本，更快速的体验到AIGC图像生成的魅力。喜欢记得收藏、关注、点赞。

文章目录

- 用通俗易懂的方式讲解系列
- 引言
- - - 安装
    - 模型
- 操作流程
- - - prompt推导
    - lora模型
    - ControlNet
    - 图生图示例
    - 文生图示例
    - 示例1
    - 示例2
    - 提示词解析
    - VAE
    - 模型的安装
    - 效果
- 结束语

用通俗易懂的方式讲解系列

用通俗易懂的方式讲解：不用再找了，这是大模型最全的面试题库
用通俗易懂的方式讲解：这是我见过的最适合大模型小白的 PyTorch 中文课程
用通俗易懂的方式讲解：一文讲透最热的大模型开发框架 LangChain
用通俗易懂的方式讲解：基于 LangChain + ChatGLM搭建知识本地库
用通俗易懂的方式讲解：基于大模型的知识问答系统全面总结
用通俗易懂的方式讲解：ChatGLM3 基础模型多轮对话微调）
用通俗易懂的方式讲解：最火的大模型训练框架 DeepSpeed 详解来了
用通俗易懂的方式讲解：这应该是最全的大模型训练与微调关键技术梳理
用通俗易懂的方式讲解：Stable Diffusion 微调及推理优化实践指南
用通俗易懂的方式讲解：大模型训练过程概述
用通俗易懂的方式讲解：专补大模型短板的RAG
用通俗易懂的方式讲解：大模型LLM Agent在 Text2SQL 应用上的实践
用通俗易懂的方式讲解：大模型 LLM RAG在 Text2SQL 上的应用实践
用通俗易懂的方式讲解：大模型微调方法总结
用通俗易懂的方式讲解：涨知识了，这篇大模型 LangChain 框架与使用示例太棒了

引言

Stable Diffusion （简称sd）是一个深度学习的文本到图像生成模型， Stable Diffusion WebUI是对Stable Diffusion模型进行封装，提供可操作界面的工具软件。Stable Diffusion WebUI上加载的模型，是在Stable Diffusion 基座模型基础上，为了获得在某种风格上的更高质量的生成效果，而进行再次训练后产生的模型。目前 Stable Diffusion 1.5版本是社区内最盛行的基座模型。

安装

sd web-ui的安装请参考：https://github.com/AUTOMATIC1111/stable-diffusion-webui/wiki/Install-and-Run-on-NVidia-GPUs

sd web-ui使用了gradio组件包，gradio在配置share=True时，会创建frpc隧道并链接到aws，详情可参考（https://www.gradio.app/guides/sharing-your-app），因此在sd web-ui应用启动时，请根据自身安全生产或隐私保护要求，考虑是否禁止开启share=True配置，或删除frpc客户端。

模型

https://civitai.com/是一个开源的sd模型社区，提供了丰富的模型免费下载和使用。在此简述一下模型的分类，有助于提高对sd web-ui的使用。sd模型训练方法主要分为四类：Dreambooth， LoRA，Textual Inversion，Hypernetwork。

Dreambooth：在sd基座模型的基础上，通过 Dreambooth 训练方式得到的大模型，是一个完整的新模型，训练速度较慢，生成模型文件较大，一般几个G，模型文件格式为 safetensors 或 ckpt。特点是出图效果好，在某些艺术风格上有明显的提升。如下图所示，sd web-ui中该类模型可以在这里进行选择。
LoRA: 一种轻量化的模型微调训练方法，在原有大模型的基础上对该模型进行微调，用于输出固定特征的人或事物。特点是对于特定风格的图产出效果好，训练速度快，模型文件小，一般几十到一百多 MB，不能独立使用，需要搭配原有大模型一起使用。sd web-ui提供了lora模型插件，以及使用lora模型的方式，具体操作可见本文的 “操作流程->lora模型” 。
Textual Inversion：一种使用文本提示和对应的风格图片来微调训练模型的方法，文本提示一般为特殊的单词，模型训练完成后，可以在text prompts中使用这些单词，来实现对模型生成图片风格和细节的控制，需要搭配原有的大模型一起使用。
Hypernetwork：与LoRA类似的微调训练大模型的方法，需要搭配原有的大模型一起使用。

操作流程

prompt推导

在sd中上传一张图片
反向推导关键词，有两个模型CLIP和DeepBooru，以图1为例：

图1: iphone 14 pro max 原相机拍摄的高清照片

使用CLIP进行prompt反推的结果：

a baby is laying on a blanket surrounded by balloons and balls in the air and a cake with a name on it, Bian Jingzhao, phuoc quan, a colorized photo, dada

使用DeepBooru进行prompt反推的结果：

1boy, ball, balloon, bubble_blowing, chewing_gum, hat, holding_balloon, male_focus, military, military_uniform, open_mouth, orb, solo, uniform, yin_yang

CLIP反推结果是一个句子，DeepBooru的反推结果是关键词。

可以修改正向prompt，也可以添加反向prompt，反向prompt用于限制模型在生产图片时不添加反向prompt中出现的元素。反向prompt不是必须的，可以不填。

lora模型

lora模型对大模型生成图的风格和质量有很强的干预或增强作用，但是lora模型需要与配套的大模型一起使用，不能单独使用。在sd-webui中使用lora模型的方式主要有两种：

方法一

安装additional-network插件，插件的github地址：https://github.com/kohya-ss/sd-webui-additional-networks，在sd-webui上可以在扩展中直接下载安装。该插件仅支持使用sd-script脚本训练的lora模型，目前https://civitai.com/上绝大多数的开源lora模型都是基于此脚本训练的，因此该插件支持绝大多数的lora模型。下载的lora模型需要放到

*/stable-diffusion-webui/extensions/sd-webui-additional-networks/models/lora

路径下, 新增模型需要重启sd-webui，插件和模型正确加载后，会在webui操作界面的左下角中出现“可选附加网络（LoRA插件）” 。在生成图片时触发lora，需要在插件中选中lora模型，并在正向提示词中加入Trigger Words。下图中选中的lora模型为blinndbox_v1_mix, trigger words为full body,chibi, 每个lora模型有自己独有的Trigger Words，在模型的简介中会注明。

如果插件在点击安装后没有反应，或者提示因为Flag引起的错误，是因为webui启动时允许扩展插件的设置配置为禁止，需要在webui启动时添加启动参数：–enable-insecure-extension-access

./webui.sh --xformers --enable-insecure-extension-access

方法二

不使用additional-network插件，使用sd-webui默认支持的lora模型使用方式，需要将lora模型放到

*/stable-diffusion-webui/models/Lora

目录下，重新启动sd-webui即可自动载入模型。

在正向提示词中加入lora模型启用语句，生产图片时即可触发lora模型：

web-ui提供了自动填充lora提示语句的功能，点击如图所示的图标，可以打开lora模型列表，然后点击模型区域，语句会自动填充到正向提示词区域：

以上两种方式，选用其中任意一种均能使lora模型在内容生产中生效，两种方式同时使用也不会引起问题。

ControlNet

controlNet通过支持额外的输入条件，试图控制预训练的大模型，如Stable Diffusion。单纯的文本控制方式令内容的生产就像碰运气抽卡，结果无法控制且不容易达到预期效果，controlNet的出现使stable diffusion大模型的内容生成进入可控时期，让创作变得可控使得AIGC在工业应用上更进一步。

安装controlNet

在sd-webui上，点击扩展，进入插件安装页面，找到controlNet插件，点击install即可完成插件安装。

下载开源的controlnet模型

下载地址：https://huggingface.co/lllyasviel/ControlNet-v1-1/tree/main

一个模型由两个文件组成: .pth 和 .yaml，需要同时下载。文件名中"V11"后面的字母，p:表示可以使用，e:表示还在试验中，u:表示未完成。下载好的模型放在如下目录，重启sd-webui 即可完成controlnet模型加载。

*\stable-diffusion-webui\extensions\sd-webui-controlnet\models

图生图示例

模型选择

1、stable diffusion大模型选用：revAnimated_v11 (https://civitai.com/models/7371?modelVersionId=46846)

2、lora模型选用blind_box_v1_mix (https://civitai.com/models/25995?modelVersionId=32988)

3、采样方法Euler a

4、源图片使用图1，使用DeepBooru模型进行正向prompts生成, 添加revAnimated_v11的特定prompts, 删除一些正向prompts，添加反向prompts，最后使用的prompt如下所示。

正向：

(masterpiece),(best quality), (full body:1.2), (beautiful detailed eyes), 1boy, hat, male, open_mouth, smile, cloud, solo, full body, chibi, military_uniform, lora:blindbox\_v1\_mix:1

反向：

(low quality:1.3), (worst quality:1.3)

生成的图片为：

图1:原图片

图2:sd生成图片

5、保持生成图片的条件不变，添加ControlNet模型，选择Openpose，control mode选择 balance ，生成的图片如下所示，生成的人物动作因为Openpose的作用被约束了，与原图像保持的更为相似。

图3:sd生成图片（添加openpose）

图4: openpose生成的图片

文生图示例

模型选择

stable diffusion大模型选用：revAnimated_v11 (https://civitai.com/models/7371?modelVersionId=46846)
lora模型选用blind_box_v1_mix (https://civitai.com/models/25995?modelVersionId=32988)
采样方法Euler a

示例1

提示词

正向：

(masterpiece),(best quality),(ultra-detailed), (full body:1.2), 1girl, youth, dynamic, smile, palace,tang dynasty, shirt, long hair, blurry, black hair, blush stickers, black hair, (beautiful detailed face), (beautiful detailed eyes), lora:blindbox\_v1\_mix:1, full body, chibi

反向：

(low quality:1.3), (worst quality:1.3)

生成的图片为：

图5: 文生图实例1

示例2

提示词

正向：

(masterpiece),(best quality),(ultra-detailed), (full body:1.2), 1girl,chibi,sex, smile, open mouth, flower, outdoors, beret, jk, blush, tree, :3, shirt, short hair, cherry blossoms, blurry, brown hair, blush stickers, long sleeves, bangs, black hair, pink flower, (beautiful detailed face), (beautiful detailed eyes), lora:blindbox\_v1\_mix:1,

反向：

(low quality:1.3), (worst quality:1.3)

生成图片为：

图6: 文生图实例2

提示词解析

(masterpiece),(best quality),(ultra-detailed), (full body:1.2), (beautiful detailed face), (beautiful detailed eyes) 这些带()的词为revAnimated_v11 模型配套prompts，用于提高图片的生成质量。
lora:blindbox\_v1\_mix:1 是触发 blind_box_v1_mix 模型的 prompt。
full body, chibi 为 blind_box_v1_mix 模型的 trigger words。
剩下的prompts为图片内容的描述。
revAnimated_v11 模型对prompt的顺序是敏感的，排在前面的提示词比排在后面的prompt对结果的影响更大。

VAE

在sd的实际使用中，vae模型起到滤镜和微调的作用，有些sd模型是自带vae的，并不需要单独挂载vae。与模型配套的vae的模型，通常会在模型的发布页面会附带vae的下载链接。

模型的安装

下载vae模型到sd web-ui的如下目录，重启sd web-ui，即可自动完成vae模型加载。

/stable-diffusion-webui/models/VAE

如下图所示，在sd web-ui上可以切换vae模型。

如果we-ui上看不到此选择框，则到设置-> 用户界面-> 快捷设置列表添加配置 “sd_vae”，如下所示：

效果

在保持图6生成条件不变的基础上，附加Blessed2（https://huggingface.co/NoCrypt/blessed_vae/blob/main/blessed2.vae.pt）模型，图片的颜色和对比度有了明显的变化。

图7: 添加vae模型前

图8：添加vae模型后图片的饱和度和对比度都有提升

结束语

sd web-ui的学习曲线比较陡峭，具有一定的图像处理领域知识能够帮助用户更好的选择和组合模型。
零基础小白用户容易出现随便选择模型，胡乱组合，对着sd web-ui界面进行一系列操作后，出图效果和预期完全不符的情况，建议先了解每个模型的特点后再根据实际目标进行选择。
sd是开源的，sd web-ui是一个工具箱，不是一个商业产品，社区中有很多效果很棒的模型，出图的上限很高，但下限也很低，开源不代表没有成本，因为sd we-ui部署要求较高的硬件配置。要节省学习成本，较为稳定的出图效果，简单便捷的用户体验，没有硬件配置要求，midjourney 是当前的首选，但需要支付订阅费。

掌握 Python 网络爬虫技术：从基础入门到高级实践（附带爬虫案例）一ge科研小菜鸡 Python 编程语言 python
个人主页：一ge科研小菜鸡-CSDN博客期待您的关注网络爬虫是自动访问网站并抓取网页数据的程序。Python凭借其丰富的库和易于使用的特性，成为开发网络爬虫的首选语言。本文将详细介绍如何使用Python进行网络爬虫开发，包括基本概念、主要工具、数据解析和高级爬取技术，并提供一个完整的实践案例。1.网络爬虫概述1.1什么是网络爬虫？网络爬虫（WebCrawler）是指用于访问和抓取网页内容的自动化脚
深度神经网络（DNN）详解古龙飞扬 dnn 人工智能神经网络
深度神经网络（DNN，DeepNeuralNetwork）是人工智能领域中的一种重要模型，它通过模拟人脑神经网络的结构和工作原理，实现了对复杂数据的处理和决策。以下是对深度神经网络（DNN）的超详细解析：一、DNN的基本概念DNN是一种具有多个隐藏层的神经网络模型，其核心在于其深度，即包含多个隐藏层。这些隐藏层通过非线性变换，使得模型能够捕捉到数据中的复杂关系和模式。DNN通常由输入层、隐藏层和输
Codeforces Round 925 (Div. 3) louisdlee. AtCoder CF 题解算法
CodeforcesRound925(Div.3)文章目录CodeforcesRound925(Div.3)A.RecoveringaSmallStringB.MakeEqualC.MakeEqualAgainD.DivisiblePairsE.AnnaandtheValentine'sDayGiftA.RecoveringaSmallString暴搜一共就三个字母，我们只要每次从第一个字母开始，
Azure AI-102 认证全攻略: (三十四)基本提示工程与 API 指南海棠AI实验室 AI-102 认证考试全攻略深度学习 azure microsoft AI-102
基本提示工程与API指南（修订版）本指南将详细介绍如何在AzureAIStudio中配置和使用AzureOpenAI服务，从创建和管理AIHub，到部署GPT-3.5Turbo及其他大语言模型（LLM），再到通过PromptEngineering优化交互体验。此外，我们将探讨API调用的最佳实践、安全合规要点，以及如何进行成本管理与常见问题排查。通过这些步骤，您可以在实际业务场景中快速上手并发挥模
基于架构的软件开发方法 light900 架构
（1）基于体系结构的设计方法(absd）：是由体系结构驱动的，即指由构成体系结构的商业、质量和功能需求的组合驱动的。absd方法有3个基础：第1基础是功能的分解，第2基础是通过选择体系结构风格来实现质量和商业需求。第3基础是软件模板的使用。ABSD模型把整个软件过程划分为：架构需求、设计、文档化、复审、实现、演化架构需求：需求是指用户对目标软件系统在功能、行为、性能、设计约束等方面的期望。架构需求
探索GigaChat与LangChain的完美结合：深度解析与实战指南 asdfujhgy langchain easyui 前端 python
探索GigaChat与LangChain的完美结合：深度解析与实战指南引言在人工智能的领域中，语言模型和嵌入技术正逐步改变我们与数据交互的方式。GigaChat作为一种创新的AI嵌入服务，结合LangChain可以提供强大的文本嵌入功能，促进自然语言处理任务的完成。本篇文章将带你深入了解如何结合GigaChat与LangChain进行文本嵌入，并提供实用的代码示例与解决方案。主要内容GigaCha
类和对象—封装及导语—C++ 逐光沧海 C++c++开发语言
1.类和对象定义C++面向对象的三大特征封装，继承，多态。对象C++认为万事万物皆为对象，对象有其属性和行为。成员类中的属性和成员属性也叫成员属性，成员变量行为也叫成员函数，成员方法（例如一个人可以称为对象，他的属性有姓名，年龄，身高，体重；行为有跑，走，跳。而具有相同性质的对象我们又叫做类，类如人类。）2.封装1.示例设计一个圆类，求圆的周长#includeusingnamespacestd;c
人工智能学习框架：深入解析与实战指南一ge科研小菜鸡人工智能人工智能
个人主页：一ge科研小菜鸡-CSDN博客期待您的关注引言随着人工智能（AI）技术的飞速发展，深度学习、强化学习和自然语言处理等领域的应用愈加广泛。掌握人工智能学习框架（如TensorFlow、PyTorch、Keras等）已成为开发智能系统、研究前沿技术的必备技能。本指南将全面介绍人工智能主流学习框架的特点、安装方法、核心功能，以及通过实践案例展示如何使用这些框架进行AI模型开发、训练与优化。1.
【大模型】Hugging Face下载大模型的相关文件说明神马都会亿点点的毛毛张深度学习 #大模型深度学习 chatgpt gpt
大家好！我是毛毛张!个人首页：神马都会亿点点的毛毛张随着大模型的火热，许多人开始纷纷入坑️大模型，不过目前很多人都只是基于开源的大模型做微调，今天毛毛张要分享的是关于HuggingFace下载大模型微调文件的说明，有助于大家下载的微调文件的作用文章目录1.前言2.文件说明1.前言上图是毛毛张在HuggingFace的官网上的ChatGLM-6B大模型的所有文件，对于初学者来说，对于上面的文件是
【安全漏洞】Mybatis-PageHelper 分页SQL注入漏洞 yixian123.com SBOM安全检测 mybatis sql 安全
发布厂商:com.github.pagehelper组件名称:pagehelper漏洞影响版本:5.3.0-5.3.1组件风险等级:超危组件路径:[xxx.jar/BOOT-INF/lib/pagehelper-5.3.0.jar]CVE编号:CVE-2022-28111CNNVD编号:CNNVD-202205-2091漏洞名称:Mybatis-PageHelperSQL注入漏洞漏洞风险等级:超危
c#提取字符串到Excel中深度解析超级无敌暴龙战士塔塔开 C#c#excel windows
usingSystem;usingSystem.Collections.Generic;usingSystem.IO;usingMicrosoft.Office.Interop.Excel;usingOfficeOpenXml;namespacedemo1{classProgram{staticvoidMain(string[]args){//定义字符串stringinput="艾伦,17,男";
json格式的标记文件转yolo格式（txt）的标记文件帅气的亮 json YOLO python
背景我在使用anylabeling标记软件时发现导出的标记文件格式只能是json格式，而我yolov8训练模型的标记文件需要时txt格式的，所以我需要写一个转换脚本脚本1.脚本1这个脚本是针对于矩形框标记的转换，也就是目标检测importjsonimportosdefconvert_json_to_yolo(json_file_path,output_dir,class_mapping):"""将
2015-2021年全国各地级市人口、城镇居民人均可支配收入、进出口总额、社会消费品零售总额小王毕业啦大数据人工智能大数据社科数据数据分析数据挖掘深度学习毕业论文
2015-2021年全国各地级市人口、城镇居民人均可支配收入、进出口总额、社会消费品零售总额.ziphttps://download.csdn.net/download/2401_84585615/89575925https://download.csdn.net/download/2401_84585615/895759252015-2021年，全国各地级市的经济与社会指标反映出中国各地经济发展
AI人工智能深度学习算法：搭建可拓展的深度学习模型架构 AI天才研究院大数据AI人工智能 AI大模型企业级应用开发实战大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
AI人工智能深度学习算法：搭建可拓展的深度学习模型架构作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着人工智能技术的飞速发展，深度学习作为其主要驱动力之一，已经在各个领域取得了显著的成果。然而，随着模型规模的不断扩大，如何高效地搭建、训练和部署深度学习模型，成为一个亟待解决的问题。传统的单机训练方式在计算资源有限的情况
python 只用opencv吗,python – OpenCV：使用solvePnP来确定单应性 weixin_39934296 python 只用opencv吗
在过去的几周里,我尝试学习纠正图像,并在这里的人们的帮助下,我已经设法更好地理解它.大约一个星期前,我设置了一个我想要纠正的测试示例(从上面查看图像).这很好(原始：http://sitedezign.net/original.jpg和纠正：http://sitedezign.net/rectified.jpg)功能T=cv2.getPerspectiveTransform(UV_cp,XYZ_g
opencv python视频教程-OpenCV视频操作 weixin_37988176
使用工具Python3.5，使用库numpy；opencv1.用摄像头捕获视频cv2.VideoCapture()：0为默认计算机默认摄像头，1可以更换来源；~~~importnumpyasnpimportcv2cap=cv2.VideoCapture(0)while(True):#captureframe-by-frameret,frame=cap.read()#ouroperationonth
solvepnp weixin_30677617 人工智能
CV_EXPORTS_WboolsolvePnP(InputArrayobjectPoints,-世界坐标系下的控制点的坐标，vector的数据类型在这里可以使用InputArrayimagePoints,-在图像坐标系下对应的控制点的坐标。vector在这里可以使用InputArraycameraMatrix,-相机的内参矩阵InputArraydistCoeffs,-相机的畸变系数Output
GPT4All:免费使用本地运行无需GPU的基于C++的GPT模型和UI: A free-to-use, locally running, privacy-aware chatbot. No GPU AI天才研究院 ChatGPT 大数据AI人工智能 LLM大模型落地实战指南 gpt 人工智能语言模型自然语言处理编程实践开发语言 c++
目录GPT4All:https://github.co:m/nomic-ai/gpt4allGPT4AllChatUIGPT4All聊天用户界面效果测试问题：HowtowriteamultipleThreadcodeInJava?输出：GPT4All如何运作RunningLLMsonCPU在CPU上运行LLMSideloadinganyggMLmodel加载任何ggML模型GPT4ALL:目前已经
OpenCV播放视频菜鸟小馒头图像识别
使用opencv播放视频很容易，即循环的顺序读取视频中的每一帧，并且能够退出循环操作。#include#include#includeusingnamespacestd;usingnamespacecv;intmain(intargc,constchar*argv[]){//insertcodehere...constchar*ImageLocation="/Users/linwang/LinMo
opencv 播放视频 smwhotjay opencv
看资料cv播放视频是用VideoCapture。结果始终打不开文件，open(0);倒是可以打开摄像头。于是抛弃他的c++类，用c接口来播放。结果ok.//打开CvCapture*capture=cvCreateFileCapture("a.avi");if(!capture){return-1;}//视频信息intcam_width=(int)cvGetCaptureProperty(captu
接口技术-第1次作业厂里英才作业接口技术
目录1、接口技术的基本任务是什么？2、接口芯片的编程模型方法是什么？采用编程模型方法对分析与应用微机系统的硬件资源有什么意义？3、什么是接口？阐述接口的功能。4、什么是多总线技术？多总线层次化总线结构主要有哪几个层次？5、如何实现在PCI总线系统中查找一个PCI设备？1、接口技术的基本任务是什么？微机接口的基本任务有两个：一是实现I/O设备与总线的连接；二是连接起来以后，CPU通过接口对I/O设备
# 第一章：认识chatgpt 出门喝奶茶 chatgpt chatgpt
chatgpt发展背景详细介绍一、基础理论背景人工智能和自然语言处理的兴起早期理论:20世纪中期，人工智能（AI）初见端倪，目标是模拟人类智能。自然语言处理作为AI的重要分支，致力于让机器理解和生成人类语言。关键里程碑:1980年代的统计方法和2000年代的神经网络技术，使NLP实现了从规则驱动到数据驱动的转变。神经网络与深度学习2010年代，深度学习的兴起极大推动了NLP的发展。基于大规模语料库
机器学习&深度学习目录 UQI-LIUWJ 各专栏目录深度学习人工智能 1024程序员节
机器学习模型机器学习笔记：Transformer_刘文巾的博客-CSDN博客attention相关机器学习笔记：attention_UQI-LIUWJ的博客-CSDN博客机器学习笔记：ELMOBERT_UQI-LIUWJ的博客-CSDN博客机器学习笔记：ViT（论文AnImageIsWorth16X16Words:TransformersforImageRecognitionatScale）_UQ
ESP32 之 ESP-IDF 教学（十二）WiFi篇—— LwIP 之 TCP 通信 Augtons正(单片机) ESP32 教学专栏 (基于ESP-IDF)udp tcp/ip 单片机物联网 c语言
本文章来自原创专栏《ESP32教学专栏(基于ESP-IDF)》，讲解如何使用ESP-IDF构建ESP32程序，发布文章并会持续为已发布文章添加新内容！每篇文章都经过了精打细磨！↓↓↓通过下方对话框进入专栏目录页↓↓↓CSDN请求进入目录_Ox是否进入ESP32教学导航(基于ESP-IDF)?确定文章目录一、建立连接——ESP32作TCPClient客户端1.TCPClient的基本思路2.TCPC
关于cv2.solvePnP和cv2.solveP3P ulimate_ opencv opencv 人工智能计算机视觉
一、cv2.solvePnP()函数是OpenCV中的一种用于计算相机位姿的函数。它可以根据一组已知的二维坐标点和对应的三维坐标点，以及相机的内参和畸变系数，计算出相机的位姿（旋转和平移向量）。以下是cv2.solvePnP()函数的基本用法：cv2.solvePnP(objectPoints,imagePoints,cameraMatrix,distCoeffs[,rvec[,tvec]])参数
使用Python调用OpenCV中的solvePnP函数 WzisTypescript python opencv 开发语言 OpenCV
OpenCV是一个广泛使用的计算机视觉库，它提供了许多用于处理图像和视频的功能。其中一个重要的功能是解决透视投影问题，也就是通过已知的3D点和对应的2D图像点来计算相机的位姿。在OpenCV中，solvePnP函数就是用于解决这个问题的。solvePnP函数使用了一种称为Perspective-n-Point（PnP）问题的算法，它可以估计相机的旋转和平移向量，从而确定相机在3D空间中的位置。这对
OpenCV实现Python视频播放控制详解夏勇兴
本文还有配套的精品资源，点击获取简介：本文详细介绍了如何使用OpenCV库在Python环境中播放视频，并展示了实现视频快进、后退控制的方法。首先通过cv2.VideoCapture()函数实现基础播放，然后利用set(cv2.CAP_PROP_FPS)函数控制播放速度实现快进和慢速播放，最后结合cv2.CAP_PROP_POS_MSEC属性实现精确的快进和后退。开发者可以根据实际需求选择合适的方
【AI论文】FilmAgent: 一个用于虚拟3D空间中端到端电影制作自动化的多智能体框架东临碣石82 自动化运维
摘要：虚拟电影制作涉及复杂的决策过程，包括剧本编写、虚拟摄影以及演员的精确定位和动作设计。受近期基于语言智能体社会的自动化决策领域进展的启发，本文提出了FilmAgent，这是一个新颖的、基于大型语言模型（LLM）的多智能体协作框架，旨在实现我们构建的3D虚拟空间中的端到端电影制作自动化。FilmAgent模拟了各种剧组成员角色，包括导演、编剧、演员和摄影师，并涵盖了电影制作工作流程的关键阶段：（
最小二乘法-线性回归和梯度下降法梦回楼~ 最小二乘法算法机器学习人工智能
最小二乘法一、最小二乘法概念以及应用最小二乘法（LeastSquaresMethod,LSE）是一种数学优化技术，主要用于寻找最佳拟合给定数据点的函数。它通过最小化观测值与模型预测值之间的差的平方和来估计模型参数。换成听得懂的话说就是，我们有一组数据(x1,y1),(x2,y2)…(xn,yn)，我们也知道他的数学表达式的形式例如y=kx+b(但是不知道k、b的具体值)，但是(xn,yn)
容器化检索增强框架（R2R） deepdata_cn RAG RAG
R2RbySciPhi-AI是一个专门的RAG框架，专注于通过迭代细化来改进检索过程。主要特点包括实现新颖的检索算法，支持多步检索过程，与各种嵌入模型和向量存储集成，以及用于分析和可视化检索性能的工具。适合有兴趣突破检索技术界限的开发人员和研究人员，特别是在需要创新检索方法的场景。具有RESTfulAPI的容器化检索增强一代（RAG）。具有生产就绪型功能，包括多模式内容摄取、混合搜索功能、可配置的
mysql主从数据同步林鹤霄 mysql主从数据同步
配置mysql5.5主从服务器(转) 教程开始：一、安装MySQL 说明：在两台MySQL服务器192.168.21.169和192.168.21.168上分别进行如下操作，安装MySQL 5.5.22 二、配置MySQL主服务器（192.168.21.169）mysql -uroot -p &nb
oracle学习笔记 caoyong oracle
1、ORACLE的安装 a>、ORACLE的版本 8i,9i : i是internet 10g,11g : grid (网格) 12c : cloud (云计算) b>、10g不支持win7 &
数据库，SQL零基础入门天子之骄 sql 数据库入门基本术语
数据库，SQL零基础入门做网站肯定离不开数据库，本人之前没怎么具体接触SQL，这几天起早贪黑得各种入门，恶补脑洞。一些具体的知识点，可以让小白不再迷茫的术语，拿来与大家分享。数据库，永久数据的一个或多个大型结构化集合，通常与更新和查询数据的软件相关
pom.xml 一炮送你回车库 pom.xml
1、一级元素dependencies是可以被子项目继承的 2、一级元素dependencyManagement是定义该项目群里jar包版本号的，通常和一级元素properties一起使用，既然有继承，也肯定有一级元素modules来定义子元素 3、父项目里的一级元素<modules> <module>lcas-admin-war</module> <
sql查地区省市县 3213213333332132 sql mysql
-- db_yhm_city SELECT * FROM db_yhm_city WHERE class_parent_id = 1 -- 海南 class_id = 9 港、奥、台 class_id = 33、34、35 SELECT * FROM db_yhm_city WHERE class_parent_id =169 SELECT d1.cla
关于监听器那些让人头疼的事宝剑锋梅花香画图板监听器鼠标监听器
本人初学JAVA，对于界面开发我只能说有点蛋疼，用JAVA来做界面的话确实需要一定的耐心（不使用插件，就算使用插件的话也没好多少）既然Java提供了界面开发，老师又要求做，只能硬着头皮上啦。但是监听器还真是个难懂的地方，我是上了几次课才略微搞懂了些。
JAVA的遍历MAP darkranger map
Java Map遍历方式的选择 1. 阐述　　对于Java中Map的遍历方式，很多文章都推荐使用entrySet，认为其比keySet的效率高很多。理由是：entrySet方法一次拿到所有key和value的集合；而keySet拿到的只是key的集合，针对每个key，都要去Map中额外查找一次value，从而降低了总体效率。那么实际情况如何呢？　　为了解遍历性能的真实差距，包括在遍历ke
POJ 2312 Battle City 优先多列+bfs aijuans 搜索
来源：http://poj.org/problem?id=2312 题意：题目背景就是小时候玩的坦克大战，求从起点到终点最少需要多少步。已知S和R是不能走得，E是空的，可以走，B是砖，只有打掉后才可以通过。思路：很容易看出来这是一道广搜的题目，但是因为走E和走B所需要的时间不一样，因此不能用普通的队列存点。因为对于走B来说，要先打掉砖才能通过，所以我们可以理解为走B需要两步，而走E是指需要1
Hibernate与Jpa的关系，终于弄懂 avords java Hibernate 数据库 jpa
我知道Jpa是一种规范，而Hibernate是它的一种实现。除了Hibernate，还有EclipseLink(曾经的toplink)，OpenJPA等可供选择，所以使用Jpa的一个好处是，可以更换实现而不必改动太多代码。在play中定义Model时，使用的是jpa的annotations，比如javax.persistence.Entity, Table, Column, OneToMany
酸爽的console.log bee1314 console
在前端的开发中，console.log那是开发必备啊，简直直观。通过写小函数，组合大功能。更容易测试。但是在打版本时，就要删除console.log，打完版本进入开发状态又要添加，真不够爽。重复劳动太多。所以可以做些简单地封装，方便开发和上线。 /** * log.js hufeng * The safe wrapper for `console.xxx` functions *
哈佛教授：穷人和过于忙碌的人有一个共同思维特质 bijian1013 时间管理励志人生穷人过于忙碌
一个跨学科团队今年完成了一项对资源稀缺状况下人的思维方式的研究，结论是：穷人和过于忙碌的人有一个共同思维特质，即注意力被稀缺资源过分占据，引起认知和判断力的全面下降。这项研究是心理学、行为经济学和政策研究学者协作的典范。　　这个研究源于穆来纳森对自己拖延症的憎恨。他7岁从印度移民美国，很快就如鱼得水，哈佛毕业
other operate 征客丶 OS osx
一、Mac Finder 设置排序方式，预览栏在显示－》查看显示选项中二、有时预览显示时，卡死在那，有可能是一些临时文件夹被删除了，如：/private/tmp[有待验证] -------------------------------------------------------------------- 若有其他凝问或文中有错误，请及时向我指出，我好及时改正，同时也让我们一
【Scala五】分析Spark源代码总结的Scala语法三 bit1129 scala
1. If语句作为表达式 val properties = if (jobIdToActiveJob.contains(jobId)) { jobIdToActiveJob(stage.jobId).properties } else { // this stage will be assigned to "default" po
ZooKeeper 入门 BlueSkator 中间件 zk
ZooKeeper是一个高可用的分布式数据管理与系统协调框架。基于对Paxos算法的实现，使该框架保证了分布式环境中数据的强一致性，也正是基于这样的特性，使得ZooKeeper解决很多分布式问题。网上对ZK的应用场景也有不少介绍，本文将结合作者身边的项目例子，系统地对ZK的应用场景进行一个分门归类的介绍。值得注意的是，ZK并非天生就是为这些应用场景设计的，都是后来众多开发者根据其框架的特性，利
MySQL取得当前时间的函数是什么格式化日期的函数是什么 BreakingBad mysql Date
取得当前时间用 now() 就行。在数据库中格式化时间用DATE_FORMA T(date, format) . 根据格式串format 格式化日期或日期和时间值date，返回结果串。可用DATE_FORMAT( ) 来格式化DATE 或DATETIME 值，以便得到所希望的格式。根据format字符串格式化date值: %S, %s 两位数字形式的秒（ 00,01,
读《研磨设计模式》-代码笔记-组合模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; abstract class Component { public abstract void printStruct(Str
4_JAVA+Oracle面试题(有答案) chenke oracle
基础测试题卷面上不能出现任何的涂写文字，所有的答案要求写在答题纸上，考卷不得带走。选择题 1、 What will happen when you attempt to compile and run the following code? （3） public class Static { static { int x = 5; // 在static内有效 } st
新一代工作流系统设计目标 comsci 工作算法脚本
用户只需要给工作流系统制定若干个需求，流程系统根据需求，并结合事先输入的组织机构和权限结构，调用若干算法，在流程展示版面上面显示出系统自动生成的流程图，然后由用户根据实际情况对该流程图进行微调，直到满意为止，流程在运行过程中，系统和用户可以根据情况对流程进行实时的调整，包括拓扑结构的调整，权限的调整，内置脚本的调整。。。。。在这个设计中，最难的地方是系统根据什么来生成流
oracle 行链接与行迁移 daizj oracle 行迁移
表里的一行对于一个数据块太大的情况有二种(一行在一个数据块里放不下) 第一种情况: INSERT的时候，INSERT时候行的大小就超一个块的大小。Oracle把这行的数据存储在一连串的数据块里(Oracle Stores the data for the row in a chain of data blocks)，这种情况称为行链接(Row Chain)，一般不可避免(除非使用更大的数据
[JShop]开源电子商务系统jshop的系统缓存实现 dinguangx jshop 电子商务
前言 jeeshop中通过SystemManager管理了大量的缓存数据，来提升系统的性能，但这些缓存数据全部都是存放于内存中的，无法满足特定场景的数据更新（如集群环境）。JShop对jeeshop的缓存机制进行了扩展，提供CacheProvider来辅助SystemManager管理这些缓存数据，通过CacheProvider,可以把缓存存放在内存,ehcache,redis，memcache
初三全学年难记忆单词 dcj3sjt126com english word
several 儿子；若干 shelf 架子 knowledge 知识；学问 librarian 图书管理员 abroad 到国外，在国外 surf 冲浪 wave 浪；波浪 twice 两次；两倍 describe 描写；叙述 especially 特别；尤其 attract 吸引 prize 奖品；奖赏 competition 比赛；竞争 event 大事；事件 O
sphinx实践 dcj3sjt126com sphinx
安装参考地址:http://briansnelson.com/How_to_install_Sphinx_on_Centos_Server yum install sphinx 如果失败的话使用下面的方式安装 wget http://sphinxsearch.com/files/sphinx-2.2.9-1.rhel6.x86_64.rpm yum loca
JPA之JPQL（三） frank1234 orm jpa JPQL
1 什么是JPQL JPQL是Java Persistence Query Language的简称，可以看成是JPA中的HQL， JPQL支持各种复杂查询。 2 检索单个对象 @Test public void querySingleObject1() { Query query = em.createQuery("sele
Remove Duplicates from Sorted Array II hcx2013 remove
Follow up for "Remove Duplicates":What if duplicates are allowed at most twice? For example,Given sorted array nums = [1,1,1,2,2,3], Your function should return length
Spring4新特性——Groovy Bean定义DSL jinnianshilongnian spring 4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
CentOS安装Mysql5.5 liuxingguome centos
CentOS下以RPM方式安装MySQL5.5 首先卸载系统自带Mysql： yum remove mysql mysql-server mysql-libs compat-mysql51 rm -rf /var/lib/mysql rm /etc/my.cnf 查看是否还有mysql软件： rpm -qa|grep mysql 去http://dev.mysql.c
第14章工具函数（下） onestopweb 函数
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
POJ 1050 SaraWon 二维数组子矩阵最大和
POJ ACM第1050题的详细描述，请参照 http://acm.pku.edu.cn/JudgeOnline/problem?id=1050 题目意思：给定包含有正负整型的二维数组，找出所有子矩阵的和的最大值。如二维数组 0 -2 -7 0 9 2 -6 2 -4 1 -4 1 -1 8 0 -2 中和最大的子矩阵是 9 2 -4 1 -1 8 且最大和是15
Java8全新打造，英语学习supertool yangshangchuan java superword 闭包 java8 函数式编程
superword是一个Java实现的英文单词分析软件，主要研究英语单词音近形似转化规律、前缀后缀规律、词之间的相似性规律等等。Clean code、Fluent style、Java8 feature: Lambdas, Streams and Functional-style Programming。升学考试、工作求职、充电提高，都少不了英语的身影，英语对我们来说实在太重要

用通俗易懂的方式讲解：Stable Diffusion WebUI 从零基础到入门

文章目录

用通俗易懂的方式讲解系列

引言

安装

模型

操作流程

prompt推导

lora模型

ControlNet

图生图示例

文生图示例

示例1

示例2

提示词解析

VAE

模型的安装

效果

结束语

你可能感兴趣的:(SD,自然语言,CV,stable,diffusion,大模型,自然语言处理,多模态,扩散模型)