Qwen3 Coder 480B 已在 Cerebras 上线

Aug 01, 2025     Author:retreatguru     HN Points:41     HN Comments:6
Share this

摘要: 阿里巴巴的Qwen3 Coder 480B指令模型现已登陆Cerebras平台。该模型是世界顶级编码模型之一,其编码能力可与Claude 4 Sonnet和Gemini 2.5相媲美。在Cerebras Wafer Scale Engine上运行时,Qwen3 Coder每秒可处理高达2000个token,比Sonnet4快20倍。为了使Qwen3 Coder更易于访问,公司推出了Cerebras Code订阅计划,每月订阅费分别为50美元和200美元。Qwen3 Coder 480B在上线两周后迅速获得认可,在OpenRouter的编码模型排行榜上排名第二,超越了Gemini 2.5、DeepSeek V3、Kimi K2和Claude 4 Opus。它被广泛认为是在实际软件工程任务中与Claude 4 Sonnet相匹配的第一个模型。Cerebras自豪地将全球领先的开放重量级编码模型加速至每秒2000个token,这意味着开发者只需4秒钟就能生成1000行JavaScript代码,而Gemini 2.5 Flash需要30秒,Claude 4 Sonnet需要80秒。Cline是VS Code的领先编码代理工具,可以方便地使用Cerebras Inference。Qwen3 480B现在可在Cerebras Inference Cloud以及我们的合作伙伴OpenRouter和HuggingFace上以每百万输入或输出token 2美元的价格提供。我们从位于美国的数据中心提供服务,拥有131K的上下文、FP8精度和零数据保留政策。为了使即时AI编码更易于访问,公司推出了两个每月订阅计划:Cerebras Code Pro(每月50美元)和Cerebras Code Max(每月200美元)。这些计划提供的速率限制与Cursor和Anthropic的类似计划相当或更高,同时提供20倍以上的编码速度。

讨论: 用户对Cerebras Qwen3 Coder的性能和成本进行了讨论。一些用户对其在处理速度上的提升表示赞赏,特别是对于256k上下文大小的支持,认为这将是一个重要的差异化因素。然而,也有用户指出其API调用延迟较高,这可能会影响其在需要快速连续API调用的场景中的应用。此外,有用户对比了Qwen3 Coder与其他模型和服务的成本,认为Qwen3 Coder在成本上具有竞争力,并可能对现有市场产生冲击。一些用户对使用Qwen3 Coder进行代码生成表示兴趣,但也对模型在处理重复任务时的效果表示疑问。

原文标题:Qwen3 Coder 480B is Live on Cerebras
原文链接:https://www.cerebras.ai/blog/qwen3-coder-480b-is-live-on-cerebras
讨论链接:https://news.ycombinator.com/item?id=44760023