Meta图像生成AI模型CM3leon已超越Google

最新资讯3年前 (2023)发布 AI观察员

445 0 0

Meta 日前推出了一款全新的生成型 AI 模型 — CM3leon（发音像变色龙 Chameleon），具备文本转成图像以及图像转成文本的能力。 Meta 表示 CM3leon 是首个经由改良的纯文本语言模型配方进行训练的多模态模型，包含大规模检索增强的预训练阶段以及第二阶段的多任务监督微调（SFT）阶段。

Meta图像生成AI模型CM3leon已超越Google

根据Meta的说法，与以往的Transformer-based的方法相比，CM3leon只需要五倍的计算能力和更小的训练数据集。

在与最广泛使用的图像生成基准（zero-shot MS-COCO）进行比较时，CM3leon获得了 4.88 的 FID （Fréchet Inception Distance）得分，证实了其文本转图像技术超越了 Google 的文本转图像模型 Parti。

Meta图像生成AI模型CM3leon已超越Google

Meta 也指出 CM3leon 在广泛的视觉语言任务中表现出色，例如视觉问答和长篇字幕生成。尽管只在仅含三百亿文本标记的数据集上进行训练，CM3leon的 zero-shot 效能可与在更大数据集上训练的更大型模型看齐。

Meta 表示：「我们的目标是创建高质量的生成模型，我们相信 CM3leon 在各种任务上的强大表现是向更高保真度图像生成和理解迈出的一步。像 CM3leon 这样的模型最终可以帮助提升创意，并在元宇宙中应用。我们期待探索多模态语言模型的边界，并在未来释放更多模型。」

# 最新资讯 # CM3leon # Meta # 模型

© 版权声明

文章版权归作者所有，未经允许请勿转载。

相关文章

阿里开源视频生成模型2VGen-XL

AI观察员

502

LLaMA Factory 可让您轻松微调和训练大型语言模型（LLM）

AI观察员

703

如何使用开源模型构建大型语言模型（LLM）和 RAG 管道

AI观察员

494

Mixtral 8X7B AI Agent 经过令人难以置信的性能测试

AI观察员

498

Drivable 3D Gaussian Avatars-Meta

AI观察员

493

创作者谈论 Instagram 的 Reels 计划支出的斜线和飙升指标

AI观察员

435

天猫U特购 京东优惠购 京东优惠天猫优惠