该项目为Web浏览器带来了稳定的扩散模型。一切都在浏览器中运行,无需服务器支持。据我们所知,这是世界上第一个完全在浏览器上运行的稳定扩散。请查看我们的 GitHub 存储库,看看我们是如何做到的。还有一个演示,您可以尝试一下。
我们最近通过人工智能模型看到了惊人的进步。由于开源的努力,开发人员现在可以轻松地将开源模型组合在一起,以产生惊人的任务。稳定的扩散可以自动创建逼真的图像以及基于文本输入的各种样式的图像。这些模型通常很大且计算量很大,这意味着在基于这些模型开发 Web 应用程序时,我们必须将所有计算请求通过管道传输到 (GPU) 服务器。此外,大多数工作负载必须在特定类型的GPU上运行,在这些GPU上,流行的深度学习框架很容易获得。
该项目迈出了改变现状并为生态系统带来更多多样性的一步。有很多原因将部分(或全部)计算提供给客户端。有许多可能的好处,例如服务提供商方面的成本降低,以及个性化和隐私保护的增强。个人电脑(甚至移动设备)的发展正朝着实现这种可能性的方向发展。客户端变得非常强大。例如,最新的MacBook Pro可以拥有高达96GB的统一RAM,可用于存储模型权重和相当强大的GPU来运行许多工作负载。
直接将 ML 模型带到客户端,让用户打开浏览器选项卡,并立即在浏览器上运行稳定的扩散模型,这不是很有趣吗?这个项目为这个问题提供了第一个肯定的答案。
文本到图像生成演示
因为WebGPU还没有完全稳定,也从来没有这么大规模的AI模型运行在WebGPU之上,所以我们在这里测试极限。它可能在您的环境中不起作用。到目前为止,我们只在Chrome Canary(Chrome的夜间版本)中使用M1 / M2 GPU在Mac上对其进行了测试,因为WebGPU是相当新的。我们已经在 Windows 上进行了测试,由于可能的驱动程序问题,它目前无法正常工作。我们预计随着WebGPU的成熟,支持会扩大。请查看下面的使用说明和注意事项。
指示
如果您有一台装有 Apple 芯片的 Mac 电脑,以下是在本地浏览器上运行稳定扩散的说明:
- 安装 Chrome Canary,这是 Chrome 的开发者版本,支持使用 WebGPU。
- 启动Chrome Canary。建议您使用以下命令从终端启动:
/Applications/Google\ Chrome\ Canary.app/Contents/MacOS/Google\ Chrome\ Canary --enable-dawn-features=disable_robustness
此命令会关闭 Chrome Canary 的稳健性检查,这会减慢图像生成速度。这不是必需的,但我们强烈建议您使用此命令启动 Chrome。
- 输入您的提示,单击“生成” – 我们准备好了!将模型参数下载并提取到本地缓存后,将开始生成映像。下载可能需要几分钟,仅在第一次运行时。后续刷新和运行速度会更快。
- 随意输入不同的提示以及否定提示以生成所需的图像。
- 我们提供了一个选项来渲染 UNet 阶段中间步骤的图像。选择“在步骤10之后每隔两个UNet步骤运行VAE”作为“渲染中间步骤”,然后再次单击“生成”,您将看到图像是如何在此过程中生成的。
数据统计
数据评估
本站ChatGPT大全提供的Web Stable Diffusion都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由ChatGPT大全实际控制,在2023年4月20日 下午12:23收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,ChatGPT大全不承担任何责任。