介绍 Gemma 3n

摘要： Gemma 3n 是一款专为边缘设备设计的 AI 模型，具有强大的多模态处理能力。它支持图像、音频、视频和文本输入以及文本输出，并优化了内存和计算效率。Gemma 3n 引入了 MatFormer 架构，允许创建不同大小的模型，同时 Per-Layer Embeddings 技术提高了内存效率。此外，Gemma 3n 还引入了新的音频理解功能，包括语音识别和翻译。MobileNet-V5 视觉编码器提供了先进的视觉处理能力。Gemma 3n 可通过 Google AI Studio 和其他平台轻松使用，并鼓励开发者通过 Gemma 3n Impact Challenge 创建具有实际影响的产品。

讨论： 这段内容主要讨论了DeepMind的Gemma模型，包括其与Gemma3的兼容性、在不同场景下的表现、与其他模型的比较以及一些用户对模型使用和性能的评价。用户们分享了如何在不同的工具和平台上使用Gemma模型，并讨论了模型在不同大小和量化下的内存占用情况。此外，还有一些用户对模型命名习惯和实用性提出了疑问。

原文标题：Introducing Gemma 3n
原文链接：https://developers.googleblog.com/en/introducing-gemma-3n-developer-guide/
讨论链接：https://news.ycombinator.com/item?id=44389202