Stable Diffusion WebUI Forge 形式的新用户界面已经发布,为用户提供了图像合成和处理领域的重大进步。Forge 专门设计用于增强基于 Gradio 框架的原始 Stable Diffusion WebUI 的功能和效率。WebUI Forge 界面旨在显着加快操作速度,使其成为专业人士和爱好者工具包的重要补充。本周,Stability AI 还推出了新的 Stable Cascade AI 艺术生成器。
本指南将概述新用户界面,重点介绍其灵感、性能改进和附加功能,并为希望将其集成到其工作流程中的人员提供安装指南。Forge 的命名和概念基础从 Minecraft Forge 中汲取灵感,Minecraft Forge 是一个流行的模组平台,有助于创建、管理和安装 Minecraft 模组。同样,Stable Diffusion WebUI Forge 旨在作为 Stable Diffusion 生态系统的基础层,增强开发体验,优化资源使用,并加速创作者和开发人员的推理过程。
提高性能
使用 Stable Diffusion WebUI Forge 的主要优势之一是在各种硬件配置中显着提高了性能指标。使用普通 GPU 的用户(例如具有 8GB VRAM 的用户)可以预期推理速度提高 30% 到 45% 不等。此外,Forge 还优化了 GPU 内存使用,将峰值内存占用量减少了 700MB,达到 1.3GB。
这种优化不仅加快了处理时间,而且还为扩散任务提供了更高的分辨率和更大的批量大小,而不会遇到内存不足 (OOM) 错误。同样,使用功能较弱和功能较强的 GPU 设置也观察到改进,推理速度有不同程度的加快,GPU 内存使用量有所减少,扩散分辨率和批量大小功能也有所增强。
Forge UI – 比 Automatic 1111 快 75%
使用 Forge UI 的好处是显而易见的,用户报告说速度提升令人印象深刻,具体取决于他们的硬件功能。例如,拥有 8 GB VRAM GPU 的个人在其流程中经历了 30-45% 的加速。那些拥有 6 GB VRAM GPU 的人看到了更显着的改进,速度提高了 60-75%。受益的不仅仅是那些 GPU 功能较弱的人;即使是最先进的 24 GB VRAM GPU 也能享受 3-6% 的提升。这些改进不仅仅是理论上的;它们具有实际意义,使用户能够更快、更高效地完成项目。
Forge 还扩大了可供用户使用的采样器范围,增加了 DDPM、DDPM Karras、DPM++ 2M Turbo 等选项。这些采样器扩展了图像生成的多功能性和质量,为用户提供了更广泛的选择,以满足他们的特定需求和偏好。
Forge 中一个值得注意的创新是引入了 Unet Patcher。该工具有助于以最少的编码工作(大约 100 行代码)实现高级方法,例如自注意力引导、Kohya 高分辨率修复等。Unet Patcher 消除了对 UNet 架构进行复杂修改的需要,从而避免了与其他扩展的冲突并简化了开发过程。通过这一新增功能,用户可以探索 SVD、Z123、屏蔽 IP 适配器等新功能,从而增强 Stable Diffusion 框架中可用的创意可能性和技术能力。
安装
设置 Forge UI 的便利性是用户欣赏的另一个方面。这个过程很简单:只需要从官方 GitHub 存储库下载安装包,提取文件,然后运行批处理文件。这种简单性也延伸到定制。用户可以深入研究 Web UI 文件夹来调整各种设置,例如主题和文件路径,确保界面满足他们的特定要求。
对于那些有兴趣将 Forge 集成到他们现有的 Stable Diffusion 设置中的人来说,这个过程需要一定程度的 Git 熟练程度。安装涉及将 Forge 设置为 SD-WebUI 的附加分支,允许用户利用所有以前安装的 SD 检查点和扩展。这种方法确保了向 Forge 的无缝过渡,保留了原始 WebUI 的功能和自定义,同时解锁了 Forge 的增强功能。
附加的功能
Forge UI 凭借其一系列附加功能将自己与其他界面区分开来。它包括用于训练和 SVD 的专用选项卡,以及 ControlNet、动态阈值和潜在修饰符等集成工具。这些工具为用户提供了前所未有的控制和灵活性,超越了其他接口,如自动 1111。此外,直接在 Forge UI 中创建蒙版的能力为用户提供了在项目中实现精确度和创造力的新途径。
应该注意的是,虽然 Forge UI 很全面,但需要单独下载某些模型,例如 ControlNet 模型。与 Forge UI 提供的创作自由度和多功能性相比,这个额外的步骤是一个小小的不便。通过允许将不同的 ControlNet 应用于图像的特定区域,用户可以更具体地定制他们的项目。
Forge 的特点
Stable Diffusion WebUI Forge 旨在作为 Stable Diffusion 的基础层,简化开发、优化资源管理和加快推理速度。
- 性能增强:
- 跨不同 GPU 的推理速度显著加快。
- 降低 GPU 内存峰值,从而提高资源使用效率。
- 提高了最大扩散分辨率,而不会遇到内存不足 (OOM) 错误。
- 无需 OOM 即可实现更大的最大扩散批量大小。
- Unet Patcher:
- 使用大约 100 行代码简化了自注意力引导和 Kohya 高分辨率修复等高级方法的实现。
- 避免了对 UNet 进行复杂修改的需要,从而防止了与其他扩展的冲突。
- 支持的新功能:
- 引入 SVD、Z123、屏蔽 IP 适配器、屏蔽控制网、photomaker 等功能。
- 支持在 Forge 平台中使用先进的图像合成和处理技术。
- 其他采样器:
- 扩展了可用采样器的范围,包括 DDPM、DDPM Karras、DPM++ 2M Turbo 等。
- 为用户提供更多种类的图像生成选项,以满足特定需求和偏好。
- 用户界面完整性:
- 保持 Automatic1111 WebUI 原有的用户界面设计,确保用户获得熟悉直观的体验。
- 承诺不对用户界面进行不必要或自以为是的更改。
- 高级用户安装:
- 为熟练的 Git 用户提供指导,以便将 Forge 安装为 SD-WebUI 的附加分支。
- 实现与现有 SD 检查点和扩展的无缝集成,在保留自定义设置的同时提供增强的功能。
新的 Forge 用户界面不仅仅是一个简单的用户界面;对于任何从事稳定扩散过程的人来说,它都是一个强大的增强功能。凭借其显着的速度改进、易于安装和广泛的功能,Forge UI 旨在优化和完善您的工作流程。它提供了一种高效、适应性强且省时的解决方案,有望将您的稳定扩散项目提升到一个新的水平。无论您是经验丰富的专业人士还是狂热的爱好者,Stable Diffusion WebUI Forge 都是一款可以帮助您释放工作新潜力的工具,确保您在竞争激烈且不断发展的技术领域保持领先地位。