Midjourney 各版本差异

工具软件3年前 (2023)更新 AI观察员

472 0 0

V1、V2、V3、V4、V5

我们都用相同的 prompt 来看看各版本的差异，我使用的是官方案例里的 prompt：

vibrant California poppies

从上图里其实你就能看到 Midjourney 的进化方向：

越来越丰富的细节，生成的内容也越来越真实。V1 和 V2 基本上就是简笔画，看看 V2 第四张图前景和背景的处理就很粗暴，到了 V3 背景和透视都变得更加合理，然后到了 V4 基本就是一个可用的状态。
分辨率越来越高。V1~V3 单张图是 256 x 256，到了 V5 单图已经默认是 1024*1024。
参数更多，Prompt 更加重要。这个在 V5 版本更加明显，感觉以前的版本，并不太能理解一些词，比如材料词 marble 之类的。但到了 V5 理解能力变强了。
艺术风格词变得更重要。这个结论暂时没有得到官方的认证，甚至有很多人认为 V5 版本是个更「通用」的版本，我的理解是 V5 提高了整个基准线，不需要太多描述词，就能生成一个「可以看」的图片，但如果要生成一张你跟你预期完全一致的图，其实变难了，你需要了解更多的 prompt。

然后我们再来看看更复杂的 prompt 看看版本的差异：

21years chinese girl, in school, beauty, long black hair, sun light，insane detail, smooth light, real photography fujifilm superia, full HD, taken on a Canon EOS R5 F1.2 ISO100 35MM

看看生成的结果，是不是差距非常大，从 V1 到 V5 的进化，Midjourney 大约花了 1 年的时间，如果仅算研发时间，我觉得应该不到 1 年，非常了不起：