如果您想了解更多关于OpenAI最新的AI艺术生成器与成熟的Midjourney AI艺术创作者之间的差异。您一定会喜欢这个快速概述视频,该视频使用 20 种不同的 DallE 3 与Midjourney提示来比较两位 AI 艺术家之间的差异。正如您所期望的那样,两者都表现得很好,但某些任务在某些情况下由其中一个或另一个执行得更好。
您可能已经知道,两者都在根据提示解释和生成图像方面表现出非凡的能力,但它们都有其独特的优点和缺点。本文将深入比较这两种人工智能艺术生成器,检查它们对各种提示的解释,生成图像的质量、创造力和准确性,以及它们对提示的理解。
DallE 3(目前可通过Bing Image Creator免费获得)和Midjourney AI使用20多个提示进行测试,从简单的三个单词提示到更复杂的提示。目标是评估他们的表现和对提示的理解。
DallE 3 vs Midjourney
在第一个提示“阿索卡星球大战”中,DallE 3制作的图像准确地代表了角色,而Midjourney则倾向于更艺术的解释。这种趋势在提示“GPU”中继续存在,其中DallE 3产生了图形卡的准确表示,而Midjourney选择了更具创造性的解释。
当Ahsoka和GPU这两个概念结合起来时,DallE 3将Ahsoka的图像融入到技术产品中,而Midjourney则更关注没有GPU元素的Ahsoka图像。这表明DallE 3具有更强的能力将不同的概念组合成一个图像,而Midjourney倾向于专注于提示的一个元素。
提示“绿巨人驾驶汽车”看到DallE 3产生的图像准确地代表了提示,而Midjourney的图像更符合绿巨人典型的愤怒举止。同样,对于“绿巨人主题PC”,DallE 3制作了内部有绿巨人的PC图像,而Midjourney则制作了具有绿巨人主题的PC图像。
DallE 3
优点:
- 准确解释:生成与给定提示紧密一致的图像,尤其是对于事实或技术主题。
- 概念组合:有效地将提示中的多个元素合并为单个连贯图像。
- 事实理解:能够生成代表事实信息的图像,例如美国的首都建筑。
- 范围广:在处理简单和复杂的提示时用途广泛。
- 免费可用性:通过必应映像创建器免费提供。
缺点:
- 不太艺术:倾向于关注字面解释,可能会限制创造力。
- 风格限制:与Midjourney相比,对于高度艺术或抽象的概念可能不那么有效。
Midjourney人工智能
优点:
- 艺术解释:擅长生成更具艺术性或抽象性的图像。
- 创意提示:特别具有复杂和艺术提示,例如“色彩缤纷的幻想现实主义风格的赛博朋克牛仔”。
- 情感细微差别:可以产生反映提示所暗示的情绪或情感的图像,例如绿巨人的愤怒举止。
缺点:
- 不太准确:可能无法为事实或技术提示生成准确的表示。
- 单元素焦点:将提示中的多个元素或概念组合到单个图像中效果较差。
- 复杂的提示:可能需要组合不同或对比鲜明的概念的提示可能会遇到困难,例如“机器人的一半身体由旧技术制成,另一半由新技术制成”。
复杂的提示比较
对于更复杂的提示,例如宇宙飞船滑过紫色星云,DallE 3再次生成准确表示提示的图像,而Midjourney则倾向于更艺术的解释。这种模式也观察到提示“一只穿着西装的熊猫即将扣篮”。有趣的是,当被问及“美国的首都是什么”时,DallE 3和Midjourney都制作了华盛顿特区首都大楼的图像,展示了他们解释和回应事实提示的能力。
对于提示“星球大战X翼示意图”,DallE 3产生了准确的示意图,而Midjourney则产生了更多的艺术解释。这表明DallE 3可能更适合技术或事实提示,而Midjourney可能擅长更具创造性或抽象的提示。当被问及“什么有两个轮子和动作”时,DallE 3和Midjourney都制作了自行车的图像,展示了他们解释和响应简单,直接提示的能力。
艺术提示
对于更复杂、更艺术化的提示,比如“一个赛博朋克牛仔风格多彩的奇幻现实主义后世界末日景观卡特尔核心大胆图形插图怀旧核心强烈情感低角度”,Midjourney产生了更多的艺术解读,而DallE 3制作的图像则准确地表现了提示。
对于提示“一个机器人,一半身体由旧技术制成,另一半由新技术制成”,DallE 3 制作的图像准确表示提示,而 Midjourney 则不理解任务。这表明 DallE 3 可能对涉及组合不同概念的复杂提示有更好的理解。
虽然DallE 3和Midjourney AI在根据提示解释和生成图像方面都表现出了非凡的能力,但它们都有其独特的优势。DallE 3 似乎擅长理解和准确表示提示,尤其是那些涉及组合不同概念或需要事实响应的提示。另一方面,Midjourney人工智能在产生更多艺术解释方面大放异彩,特别是对于更具创造性或抽象的提示。