在4月份稳定扩散XL beta发布后,SDXL 0.9的图像和构图细节较之前的版本有了明显的提升。
尤其是在参数方面,这个SDXL 0.9拥有35亿参数基础模型和66亿参数模型的集成管道。相比之下,测试版只使用单一模型,有31亿个参数。
为了生成更真实的图像,更大的深度和更高的分辨率(1024x1024),SDXL 0.9使用了两种剪辑模型,包括迄今为止最大的OpenCLIP模型(OpenCLIP ViT-G/14)。
不仅如此,SDXL 0.9可以运行在消费级显卡上。你只需要Win10/11或Linux操作系统,16GB内存和8GB以上的英伟达RTX 20系列显卡。
官方表示,SDXL系列还将提供基本文本提示之外的一系列功能,包括:
图像对图像的prompt:输入一个图像以获得该图像的变化;内画:重建图像的缺失部分;外画:构建一个现有图像的无缝扩展。SDXL团队将很快发布一个研究博客,更详细地介绍这一模型的规范和测试。
今天可以通过ClipDrop访问该模型,API将很快推出。根据Stability AI的公告,7月中旬将发布v1.0版本。
下面是一个官方的例子: