Google Gemini AI：多模态、GPT-4 竞争对手等

工具软件3年前 (2023)发布 AI观察员

622 0 0

在 6 月的 Google I/O 2023 大会上，该公司向我们展示了其功能最强大的 AI 模型 Gemini 的一瞥。最后，在 2023 年底之前，谷歌向公众发布了 Gemini AI 模型。谷歌称其为“双子座时代”，因为这是该公司的一个重要里程碑。但究竟什么是谷歌双子座 AI，它能推翻长期统治的王者 GPT-4 吗？为了找出答案，让我们通过我们对 Gemini AI 模型的详细解释。

什么是Google Gemini 人工智能？

Gemini 是由总部位于伦敦的 Google 子公司 Google Deepmind 团队开发的最新、功能最强大的大型语言模型（LLM）。它是作为 PaLM 2 模型的继任者推出的，该模型由内部的 Google AI 部门开发。这是我们第一次看到 Deepmind 团队向公众发布成熟的 AI 系统。

值得注意的是，谷歌于 2023 年 4 月合并了其 Google Brain 部门和 Deepmind 团队，提出了一个强大的模型，可以与 OpenAI 的最佳模型竞争。而双子座就是这种共同努力的巅峰之作。

现在来到一个至关重要的问题，是什么将 Gemini AI 与 OpenAI 的 GPT-4 或它自己的 PaLM 2 模型区分开来？好吧，首先，双子座确实是一个多模态模型。尽管 PaLM 2 支持图像分析，但它依赖于 Google Lens 和语义分析从上传的图像中推断数据点。基本上，这是谷歌为Bard带来图像支持的权宜之计。

对于同样是多模态模型的 GPT-4，Gemini AI 在这里也有所不同。在我们关于即将到来的 GPT-5 模型的详细文章中，我们解释说 GPT-4 不是一个密集的模型。相反，它基于“专家混合”架构，将 16 种不同的模型拼接在一起，用于不同的任务。因此，对于图像分析、图像生成和语音处理等各种任务，它具有不同的模型，例如 GPT-4 Vision、Dall -E、Whisper 等。