在 6 月的 Google I/O 2023 大会上,该公司向我们展示了其功能最强大的 AI 模型 Gemini 的一瞥。最后,在 2023 年底之前,谷歌向公众发布了 Gemini AI 模型。谷歌称其为“双子座时代”,因为这是该公司的一个重要里程碑。但究竟什么是谷歌双子座 AI,它能推翻长期统治的王者 GPT-4 吗?为了找出答案,让我们通过我们对 Gemini AI 模型的详细解释。
什么是Google Gemini 人工智能?
Gemini 是由总部位于伦敦的 Google 子公司 Google Deepmind 团队开发的最新、功能最强大的大型语言模型 (LLM)。它是作为 PaLM 2 模型的继任者推出的,该模型由内部的 Google AI 部门开发。这是我们第一次看到 Deepmind 团队向公众发布成熟的 AI 系统。
值得注意的是,谷歌于 2023 年 4 月合并了其 Google Brain 部门和 Deepmind 团队,提出了一个强大的模型,可以与 OpenAI 的最佳模型竞争。而双子座就是这种共同努力的巅峰之作。
现在来到一个至关重要的问题,是什么将 Gemini AI 与 OpenAI 的 GPT-4 或它自己的 PaLM 2 模型区分开来?好吧,首先,双子座确实是一个多模态模型。尽管 PaLM 2 支持图像分析,但它依赖于 Google Lens 和语义分析从上传的图像中推断数据点。基本上,这是谷歌为Bard带来图像支持的权宜之计。
对于同样是多模态模型的 GPT-4,Gemini AI 在这里也有所不同。在我们关于即将到来的 GPT-5 模型的详细文章中,我们解释说 GPT-4 不是一个密集的模型。相反,它基于“专家混合”架构,将 16 种不同的模型拼接在一起,用于不同的任务。因此,对于图像分析、图像生成和语音处理等各种任务,它具有不同的模型,例如 GPT-4 Vision、Dall -E、Whisper 等。