谷歌推出了一种新的开源人工智能模型 Gemma,标志着这家科技巨头在人工智能开发工作中迈出了重要一步。该模型有两种变体,提供 20 亿和 70 亿个参数的 AI 模型,旨在与 Meta 等竞争对手的先进 AI 技术相媲美。对于那些对人工智能的发展有浓厚兴趣的人来说,掌握 Gemma 的优势和劣势至关重要。
Gemma 是一个轻量级、最先进的开放式模型系列,采用与创建 Gemini 模型相同的研究和技术构建。Gemma 由 Google DeepMind 和 Google 的其他团队开发,灵感来自双子座,这个名字反映了拉丁语 gemma,意思是“宝石”。Gemma 是 Google Gemini 模型的演变,这表明它建立在强大的技术基础之上。Gemma AI 模型提供 7B 参数之间的选择,用于在消费级 GPU 和 TPU 上高效部署和开发,以及用于 CPU 和设备端应用程序的 2B 版本。两者都有基本和指令调整的变体。
然而,该模型的庞大规模引发了人们对希望在个人系统上操作它的个人的实用性质疑。性能基准测试表明,Gemma 在速度和准确性方面可能落后于 Llama 2 等其他型号,尤其是在实际应用中。Gemma 值得称道的方面之一是它在 Hugging Face 和 Google Colab 等平台上的可用性。谷歌的这一战略举措鼓励了人工智能社区内的实验和进一步发展的文化。通过使 Gemma 易于访问,更广泛的用户可以参与该模型,从而有可能加速其改进和适应。
Google Gemma 结果测试
尽管可访问性强,但杰玛还是面临着一些方面的批评。用户指出了该模型性能的问题,特别是在其速度和准确性方面。此外,人们还担心谷歌人工智能模型(包括Gemma)的审查程度。这可能会导致用户体验可能无法与限制较少的竞争对手提供的体验相提并论。
Gemma AI 功能:
- 谷歌开源 AI:
- Gemma 是 Google 推出的新一代开放模型,旨在帮助开发人员和研究人员负责任地构建 AI。
- 它是一系列轻量级、最先进的模型,由 Google DeepMind 和其他 Google 团队开发,灵感来自 Gemini 模型。
- “Gemma”这个名字反映了拉丁语“gemma”,意思是“宝石”。
- Gemma 型号的主要特点:
- 型号变体:有两种尺寸可供选择,Gemma 2B 和 Gemma 7B,每种尺寸都有预训练和指令调整的变体。
- 负责任的 AI 工具包:一个工具包,为使用 Gemma 创建更安全的 AI 应用程序提供指导和工具。
- 框架兼容性:通过原生 Keras 3.0 支持跨 JAX、PyTorch 和 TensorFlow 等主要框架的推理和监督微调。
- 可及性:即用型 Colab 和 Kaggle 笔记本电脑,与 Hugging Face、MaxText、NVIDIA NeMo 和 TensorRT-LLM 等工具集成。
- 部署:可以在笔记本电脑、工作站或 Google Cloud 上运行,并在 Vertex AI 和 Google Kubernetes Engine (GKE) 上轻松部署。
- 优化:针对多个 AI 硬件平台进行了优化,包括 NVIDIA GPU 和 Google Cloud TPU。
- 商业用途:使用条款允许所有组织负责任地进行商业使用和分发。
- 性能与安全性:
- 最先进的性能:Gemma 型号在其尺寸上实现了最佳性能,并且能够在开发人员笔记本电脑或台式机上运行。
- 安全可靠:Gemma 模型在设计时考虑了 Google 的 AI 原则,使用自动化技术过滤掉敏感数据,并通过微调和 RLHF 使模型与负责任的行为保持一致。
- 评估:包括手动红队、自动对抗测试和危险活动的能力评估。
- 负责任的生成式 AI 工具包:
- 安全分类:使用最少示例构建强大的安全分类器的方法。
- 调试工具:帮助调查 Gemma 的行为并解决潜在问题。
- 指导:模型构建者的最佳做法基于 Google 在开发和部署大型语言模型方面的经验。
- 优化和兼容性:
- 多框架工具:各种框架的参考实现,支持广泛的 AI 应用程序。
- 跨设备兼容性:跨设备运行,包括笔记本电脑、台式机、物联网、移动设备和云。
- 硬件平台:针对 NVIDIA GPU 进行了优化,并与 Google Cloud 集成,以实现领先的性能和技术。
然而,对于杰玛的未来,仍有乐观的余地。开发该模型的量化版本可能有助于解决与其规模和速度有关的问题。随着 Google 不断完善 Gemma,预计未来的迭代将克服当前的缺点。
谷歌的 Gemma AI 模型在竞争激烈的 AI 领域引起了轰动,带来了希望和挑战。该模型的相当大的规模、性能问题和审查问题是谷歌需要坚定解决的领域。随着该公司在这些方面的工作,人工智能社区将密切关注 Gemma 的发展,以及它是否能够实现其作为开源 AI 领域重要参与者的潜力。