GoogleDeepMind发布Gemma3：多模态能力与开放架构的突破性进展

Google DeepMind发布Gemma 3：多模态能力与开放架构的突破性进展

Google DeepMind于2025年3月12日发布了Gemma系列的最新产品——Gemma 3。这款创新模型不仅在规模上实现了扩展，还引入了图像识别能力、多语言功能以及更强大的上下文处理容量，其性能已超越DeepSeek-V3和Meta Llama3.1 405B等行业巨头。Gemma 3的问世标志着轻量级开放模型在多模态处理领域取得了显著突破。

核心功能亮点

Gemma 3提供了以下关键特性，用户可通过AI Studio平台进行实际体验：

视觉与文字融合能力：得益于先进的多模态技术，系统能够同时处理图像与文本输入，实现对视觉数据的深度理解与分析。

128K扩展上下文窗口：上下文容量实现16倍增长，使模型能够一次性处理更庞大的数据量，从而解决更为复杂的问题情境。

全面的语言覆盖：支持超过140种全球语言，使用户能以母语进行自然交互，同时为开发者提供了AI应用的多语言扩展基础。

灵活的模型规模选择：开发者可根据具体任务需求和可用算力资源，选择最适合的模型尺寸（1B、4B、12B、27B参数）及精度等级。

参数规模与量化选项

Gemma 3系列提供4种不同参数规模和5种精度等级，精度范围从完整的32位到高度压缩的4位不等。选择合适的模型规模与精度涉及AI应用的性能与资源平衡考量：

高参数量与高精度模型通常能提供更强的功能表现，但同时会增加计算周期、内存消耗和能源使用，导致更高的运行成本。相比之下，低参数量与低精度的配置虽然功能相对有限，但对于特定AI任务场景可能已经足够，同时大幅降低资源需求。

下文将详细介绍各种规模Gemma 3模型在实际推理过程中对GPU或TPU内存的具体需求量。

玩酷网

GoogleDeepMind发布Gemma3：多模态能力与开放架构的突破性进展

Magicflu小小汪