Stable Diffulusion

Stable Diffulusion是2022年发布的深度学习文本到图像生成模型。它主要用于根据文本的描述产生详细图像,尽管它也可以应用于其他任务,如内补绘制、外补绘制,以及在提示词指导下产生图生图的转变。

SD简单工作原理

生成步骤:

  1. 提示词咒语
  2. 文本编码器
  3. Diffulusion扩散模型
  4. 图像解码器
  5. 生成图片

搭建Stable Diffulusion Webui

搭建Stable Diffulusion Webui 可以自己搭建也可以选择整合包,这里我选择的是第一种,故只介绍第一种方法

Arclinux搭建步骤

  1. 安装依赖
1
2
# Arch-based:
sudo pacman -S wget git python3
  1. 克隆仓库
1
git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui
  1. 运行webui.sh脚本
  2. 运行webui-user.sh检测选项

模型解析

  1. stable diffusion大模型 出图的根本,所有图片的来源
  2. LoRA模型 在主模型原有能力上进行修正
  3. 嵌入式(Embeddings)模型 稳定控制角色特征
  4. 超网格(Hypernetwork)在扩散模型之外新建一个神经网络来调整模型参数
  5. 变分自编码器(VAE)模型 将潜空间的图像信息还原为正常图片

all-in-one插件可以选择安装,可以帮助生成提示词