Gemini 3.1 Flash-Lite：专为大规模智能而构建

摘要： 今天，我们推出了 Gemini 3.1 Flash-Lite，这是我们的最快且最具成本效益的 Gemini 3 系列模型。专为大规模的开发者工作负载而设计，3.1 Flash-Lite 以其价格和型号级别提供了高质量。从今天开始，3.1 Flash-Lite 作为预览版通过 Google AI Studio 的 Gemini API 向开发者推出，并通过 Vertex AI 向企业推出。它以每 100 万个输入令牌 0.25 美元和每 100 万个输出令牌 1.50 美元的价格提供增强性能，其成本仅为大型模型的一小部分。根据人工分析基准，它比 2.5 Flash 快 2.5 倍的首次回答令牌时间，输出速度提高了 45%，同时保持了相似或更好的质量。这种低延迟对于高频工作流程至关重要，使其成为开发者构建响应式、实时体验的理想模型。

讨论： 本文讨论了Gemini模型3.1 Flash-Lite的更新和定价变化。用户对价格变动表达了不同的看法，有人认为新版本在许多任务中成本低于2.5 Flash-Lite，但也有人指出其运行成本更高。同时，一些用户测试了新版本的转录能力，并分享了他们的基准测试结果。尽管价格有所上涨，但许多用户仍然对新的Flash-Lite模型持乐观态度，并期待其性能提升。

原文标题：Gemini 3.1 Flash-Lite: Built for intelligence at scale
原文链接：https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-1-flash-lite/
讨论链接：https://news.ycombinator.com/item?id=47234962