文档中心

GPU-基于Diffusers和Gradio搭建SDXL推理应用

最近更新时间：2023.12.07 17:10:25

首次发布时间：2023.11.02 10:26:21

本文以搭载了一张V100显卡的ecs.g1ve.2xlarge实例，介绍如何在GPU云服务器上基于Diffusers搭建SDXL 1.0的base + refiner组合模型。

背景信息

SDXL
Stable Diffusion XL（简称SDXL）是最新的图像生成模型，与之前的SD模型（stable 1.5和 stable 2.1）相比，SDXL提供更有艺术感、更真实的图像。
Diffusers
Diffusers库是Hugging Face推出的一个操作扩散模型的工具箱，提供Diffusion推理训练全流程，简单方便的使用各种扩散模型生成图像、音频，也可以非常方便的使用各种噪声调度器，用于调节在模型推理中的速度和质量。目前，Diffusers已经支持SDXL 1.0的base和refiner模型，可生成1024 × 1024分辨率的图片。

软件要求

GPU驱动：用来驱动NVIDIA GPU卡的程序。本文以470.57.02为例。
Pytorch：开源的Python机器学习库，实现强大的GPU加速的同时还支持动态神经网络。本文以2.0.0为例。
Pytorch使用CUDA进行GPU加速时，在GPU驱动已经安装的情况下，依然不能使用，很可能是版本不匹配的问题，请严格关注虚拟环境中CUDA与Pytorch的版本匹配情况。
Anaconda：获取包且对包能够进行管理的工具，包含了Conda、Python在内的超过180个科学包及其依赖项，用于创建Python虚拟环境。本文以Anaconda 3和Python 3.10为例。
Gradio：快速构建机器学习Web展示页面的开源Python库。本文以3.43.2为例。

使用说明

下载本文所需软件需要访问国外网站，建议您增加网络代理（例如FlexGW）以提高访问速度。您也可以将所需软件下载到本地，参考本地数据上传到GPU实例中。

操作步骤

步骤一：创建实例

请参考通过向导购买实例创建一台符合以下条件的实例：
- 基础配置：
  - 计算规格：ecs.g1ve.2xlarge
  - 镜像：Ubuntu 20.04，并勾选“后台自动安装GPU驱动”。
  - 存储：云盘容量在100 GiB以上。
- 网络配置：勾选“分配弹性公网IP”。
创建成功后，在实例绑定的安全组中添加入方向规则：放行TCP 8000端口。具体操作请参见修改安全组访问规则。
登录实例。
执行以下命令，确认GPU驱动是否安装。
nvidia-smi
回显如下，可以看到驱动版本，表明已成功安装。

步骤二：准备虚拟环境

执行以下命令，下载Anaconda安装包。
wget https://repo.anaconda.com/archive/Anaconda3-2022.05-Linux-x86_64.sh
执行以下命令，静默安装Anaconda。
在静默模式下安装Anaconda时，将使用默认设置，包括安装路径（/root/anaconda3）和环境变量设置。如果您需要自定义这些设置，请使用交互式安装程序。
bash Anaconda3-2022.05-Linux-x86_64.sh -b -p /root/anaconda3
安装完成后执行以下命令，初始化Anaconda。
```
source /root/anaconda3/bin/activate
conda init
```
执行conda -V命令，回显如下，表明Anaconda安装成功。
执行source ~/.bashrc命令，使配置文件生效。
创建一个名为“sd-xl”的虚拟环境，并指定该环境中的python版本为3.10。
1. 执行conda create -n sd-xl python=3.10命令。
2. 回显Proceed ([y]/n)?时输入“y”确认。
3. 执行以下命令，激活虚拟环境。
  conda activate sd-xl
  回显如下，表示激活成功。
执行以下命令，安装git。回显Proceed ([y]/n)?时输入“y”确认安装。
conda install git
执行以下命令，安装CUDA 11.8对应的Pytorch。
本文所示“sd-xl”环境中使用的CUDA版本为11.8。您也可以自行指定CUDA版本并登录Pytorch官网，在Conda中查找与CUDA版本匹配的安装命令。
```
conda install pytorch==2.0.0 torchvision==0.15.0 torchaudio==2.0.0 pytorch-cuda=11.8 -c pytorch -c nvidia
```
执行以下命令，检查虚拟环境是否符合预期。
```
python
>>>import torch
>>>torch.cuda.is_available()
```
回显为True，表示Pytorch部署成功。输入exit()退出。

步骤三：模型部署

依次执行以下命令，下载base模型的权重文件。

mkdir -p /root/sd 
cd sd
apt install -y git-lfs
git lfs install
git clone https://huggingface.co/stabilityai/stable-diffusion-xl-base-1.0

依次执行以下命令，下载refiner模型的权重文件。

cd /root/sd
git lfs install
git clone https://huggingface.co/stabilityai/stable-diffusion-xl-refiner-1.0

执行ll命令查看目录中包含如下文件，表示已成功下载。

步骤四：模型推理

txt2img（文生图）示例

依次执行以下命令，安装相关依赖组件。

pip install diffusers --upgrade
pip install transformers accelerate safetensors

编写推理脚本。

依次执行以下命令，创建cli_txt2img.py文件。
```
cd /root/sd 
vim cli_txt2img.py
```

添加如下内容。

from diffusers import DiffusionPipeline
import torch

base = DiffusionPipeline.from_pretrained("/root/sd/stable-diffusion-xl-base-1.0", torch_dtype=torch.float16, use_safetensors=True, variant="fp16")
base.to("cuda")

refiner = DiffusionPipeline.from_pretrained(
    "/root/sd/stable-diffusion-xl-refiner-1.0", text_encoder_2=base.text_encoder_2,vae=base.vae, torch_dtype=torch.float16, use_safetensors=True, variant="fp16",)
refiner.to("cuda")

# Define how many steps and what % of steps to be run on each experts (80/20) here
n_steps = 40
high_noise_frac = 0.8

prompt = "Elon Musk standing in a workroom, in the style of industrial machinery aesthetics, deutscher werkbund, uniformly staged images, soviet, light indigo and dark bronze, new american color photography, detailed facial features"
negative_prompt= "(EasyNegative),(watermark), (signature), (sketch by bad-artist), (signature), (worst quality), (low quality), (bad anatomy), NSFW, nude, (normal quality)"

# run both experts
image = base(
    prompt=prompt,
    negative_prompt=negative_prompt,
    num_inference_steps=n_steps,
    denoising_end=high_noise_frac,
    output_type="latent",
).images

image = refiner(
    prompt=prompt,
    negative_prompt=negative_prompt,
    num_inference_steps=n_steps,
    denoising_start=high_noise_frac,
    image=image,
).images[0]

image.save("/root/sd/test.png")

按esc退出编辑模式，输入:wq并回车退出当前文件。
执行以下命令，运行脚本文件。
python cli_txt2img.py
如下图所示，代表文生图已经完成，可以在/root/sd/test.png查看生成的图片。

txt2img + img2img示例

基于Gradio搭建txt2img（文生图）和img2img（图生图）的web demo界面。

依次执行以下命令，安装Gradio和相关依赖。

pip install diffusers --upgrade
pip install transformers accelerate safetensors gradio

依次执行以下命令，下载反向提示词模型文件及模型代码。

cd /root/sd 
git clone https://github.com/AUTOMATIC1111/TorchDeepDanbooru.git
cd TorchDeepDanbooru
wget https://github.com/AUTOMATIC1111/TorchDeepDanbooru/releases/download/v1/model-resnet_custom_v3.pt