Gemini 是一种多模态 AI,能够整合来自不同来源的信息。谷歌DeepMind创始人兼首席执行官Demis Hassabis表示,这种能力意味着它可以“概括和无缝地理解、操作和组合不同类型的信息,包括文本、代码、音频、图像和视频”。
根据谷歌的说法,Gemini 将向所有人开放。第一个版本,谷歌称之为Gemini 1.0,将有三个不同的版本:
- Gemini Ultra – “最有能力”的模型,用于“高度复杂的任务”。
- Gemini Pro — 跨范围任务扩展的“最佳模型”。
- Gemini Nano — 用于设备上的任务。
Gemini 旨在适用于所有设备类型,从智能手机和 PC 到数据中心。
双子座更胜一筹,谷歌说
谷歌声称 Gemini 的性能超过了其主要竞争对手 GPT-4。据该公司称,Gemini Ultra 在 32 个“广泛使用的学术基准”中的 30 个中成功击败了 GPT-4。
在许多列出的基准中,差异很小。Gemini 在 MATH 基准测试中得分为 53.2%,比 GPT-4 高 0.3%。唯一具有明显领先优势的基准测试是 HumanEval python 代码生成。根据谷歌的数据,Gemini 在基准测试中得分为 74.4%,GPT-4 仅为 67.0%。
双子座打破了多模态模式的现状。到目前为止,单独的组件被训练,然后合并在一起。谷歌表示,它已经通过从一开始就对 Gemini 进行不同模态的预训练,将其训练为原生多模态。
根据Hassabis的说法,这提高了AI的理解,“远远优于现有的多模态模型”。
谷歌训练双子座“同时识别和理解文本、图像、音频等”。这使得它更适合理解信息并为问题提供答案,甚至是复杂的问题。
双子座在编码方面也装备精良。据谷歌称,它“可以理解、解释和生成世界上最流行的编程语言的高质量代码”。
谷歌承诺,Gemini 是“以责任和安全为核心的”。
该公司计划将Gemini Pro集成到Google产品中。从今天开始,Google Bard 将使用“Gemini Pro 的微调版本”。该升级当时仅提供英文版本,但根据谷歌的说法,该升级在 170 多个国家和地区提供。
Gemini Nano 即将登陆 Google Pixel 8 Pro。它将具有新工具,例如 Recorder ap 中的 Summarizer、Gboard 中的 Smart Reply 等。
Gemini 将集成到其他 Google 产品中,包括 Chrome 网络浏览器、搜索、广告和 Duet AI。
从 12 月 13 日起,开发者和企业客户可以通过 Google AI Studio 中的 Gemini API 访问 Gemini Pro。