Gemma 2是谷歌DeepMind推出的新一代开源人工智能模型,包含90亿和270亿参数版本。该模型以卓越的性能、高效的推理速度和广泛的硬件兼容性为特点,能够与参数量更大的模型(如Llama 3、Claude 3 Sonnet)相媲美。Gemma 2设计易于集成到开发者的工作流程中,支持多种AI框架,并通过Google Cloud、Kaggle和Hugging Face等平台免费提供。

Gemma 2可与用户常用的工具和工作流程轻松配合使用,与 Transformers、JAX、PyTorch 和 TensorFlow 等主流 AI 框架兼容,可通过原生 Keras 3.0、vLLM、、和实现。此外,Gemma 还通过进行了优化,可在 NVIDIA 加速基础设施上运行或作为推理微服务运行,并将针对进行优化。

Gemma 2现已在中推出,用户可以在无需硬件要求的情况下以 27B 的速度测试其全部性能。开发人员还可以从和下载Gemma 2的模型权重,即将推出。

Gemma 2 – 谷歌DeepMind推出的新一代开源人工智能模型  第1张
(图片来源网络,侵删)

为了便于研究和开发,Gemma 2 还可通过或 Colab 笔记本免费使用。首次使用 Google Cloud 的客户有资格获得。学术研究人员可以申请,以获得 Google Cloud 信用额度,以加速他们使用 Gemma 2 的研究。开放时间为即日起至 8 月 9 日。

Gemma 2 – 谷歌DeepMind推出的新一代开源人工智能模型  第2张
(图片来源网络,侵删)