Stable Diffusion

系列文章目录

第一章 Stable Diffusion
第二章 LoRa实操入门


文章目录

  • 系列文章目录
  • 前言
  • 一、大白话原理介绍
    • 1. 正向扩散
    • 2. 反向扩散


前言

Stable Diffusion是一种新型的图像生成模型,这里主要参考自b站up主大白话AI,这是我迄今为止见过将Stable Diffusion讲的最清晰的,up是个人才,推荐大家去观看原视频。
LoRa是大模型微调的一种基础方法,广泛应用于语言大模型、视觉大模型和Clip对齐模型。

一、大白话原理介绍

1. 正向扩散

  1. 高斯噪声和原图以一定的比例混合:
    Stable Diffusion_第1张图片

  2. 扩散过程中,每一步均基于上一步得到的混合噪声的图片,且每次添加的噪声均是新的高斯噪声,BeTa t逐渐增大。
    Stable Diffusion_第2张图片

推导从 xt-2 到 xT 的推导:

** 原理:** E(cX) = cE(X), D(cX) = c2D(X)
Stable Diffusion_第3张图片
在这里插入图片描述

归纳推理可得:
Stable Diffusion_第4张图片

可以用以下方程表示:
Stable Diffusion_第5张图片

2. 反向扩散

  1. 可以用贝叶斯概率公式给出前一刻的概率,并可以根据正向传播中得到的推论来表示其概率密度分布:

Stable Diffusion_第6张图片

Stable Diffusion_第7张图片

Stable Diffusion_第8张图片

  1. 得到P(xt-1|xt,x0)的正态分布参数,并通过正向推导中的公式替换掉X0
    Stable Diffusion_第9张图片

参考视频:https://www.bilibili.com/video/BV1tz4y1h7q1/?spm_id_from=333.788.recommend_more_video.4&vd_source=071a6a156f5d29dbb9701c2bdbda3878

你可能感兴趣的:(AIGC,stable,diffusion)