Gemini 3.1 Flash-Lite:专为大规模智能而构建

Mar 03, 2026     Author:meetpateltech     HN Points:57     HN Comments:12
Share this

摘要: 今天,我们推出了 Gemini 3.1 Flash-Lite,这是我们的最快且最具成本效益的 Gemini 3 系列模型。专为大规模的开发者工作负载而设计,3.1 Flash-Lite 以其价格和型号级别提供了高质量。从今天开始,3.1 Flash-Lite 作为预览版通过 Google AI Studio 的 Gemini API 向开发者推出,并通过 Vertex AI 向企业推出。它以每 100 万个输入令牌 0.25 美元和每 100 万个输出令牌 1.50 美元的价格提供增强性能,其成本仅为大型模型的一小部分。根据人工分析基准,它比 2.5 Flash 快 2.5 倍的首次回答令牌时间,输出速度提高了 45%,同时保持了相似或更好的质量。这种低延迟对于高频工作流程至关重要,使其成为开发者构建响应式、实时体验的理想模型。

讨论: 本文讨论了Gemini模型3.1 Flash-Lite的更新和定价变化。用户对价格变动表达了不同的看法,有人认为新版本在许多任务中成本低于2.5 Flash-Lite,但也有人指出其运行成本更高。同时,一些用户测试了新版本的转录能力,并分享了他们的基准测试结果。尽管价格有所上涨,但许多用户仍然对新的Flash-Lite模型持乐观态度,并期待其性能提升。

原文标题:Gemini 3.1 Flash-Lite: Built for intelligence at scale
原文链接:https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-1-flash-lite/
讨论链接:https://news.ycombinator.com/item?id=47234962