Kandinsky 2.1:开源图像生成模型,基准比 SD 2.1 更好
Kandinsky2.1继承了Dall-E 2和潜在扩散的最佳实践,同时引入了一些新的想法。
作为文本和图像编码器,它使用CLIP模型和扩散图像先验(映射)在CLIP模态的潜在空间之间。这种方法提高了模型的视觉性能,并在混合图像和文本引导图像处理方面开辟了新的视野。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
Kandinsky2.1继承了Dall-E 2和潜在扩散的最佳实践,同时引入了一些新的想法。
作为文本和图像编码器,它使用CLIP模型和扩散图像先验(映射)在CLIP模态的潜在空间之间。这种方法提高了模型的视觉性能,并在混合图像和文本引导图像处理方面开辟了新的视野。