Qwen3 Coder 480B 已在 Cerebras 上线

摘要： 阿里巴巴的Qwen3 Coder 480B指令模型现已登陆Cerebras平台。该模型是世界顶级编码模型之一，其编码能力可与Claude 4 Sonnet和Gemini 2.5相媲美。在Cerebras Wafer Scale Engine上运行时，Qwen3 Coder每秒可处理高达2000个token，比Sonnet4快20倍。为了使Qwen3 Coder更易于访问，公司推出了Cerebras Code订阅计划，每月订阅费分别为50美元和200美元。Qwen3 Coder 480B在上线两周后迅速获得认可，在OpenRouter的编码模型排行榜上排名第二，超越了Gemini 2.5、DeepSeek V3、Kimi K2和Claude 4 Opus。它被广泛认为是在实际软件工程任务中与Claude 4 Sonnet相匹配的第一个模型。Cerebras自豪地将全球领先的开放重量级编码模型加速至每秒2000个token，这意味着开发者只需4秒钟就能生成1000行JavaScript代码，而Gemini 2.5 Flash需要30秒，Claude 4 Sonnet需要80秒。Cline是VS Code的领先编码代理工具，可以方便地使用Cerebras Inference。Qwen3 480B现在可在Cerebras Inference Cloud以及我们的合作伙伴OpenRouter和HuggingFace上以每百万输入或输出token 2美元的价格提供。我们从位于美国的数据中心提供服务，拥有131K的上下文、FP8精度和零数据保留政策。为了使即时AI编码更易于访问，公司推出了两个每月订阅计划：Cerebras Code Pro（每月50美元）和Cerebras Code Max（每月200美元）。这些计划提供的速率限制与Cursor和Anthropic的类似计划相当或更高，同时提供20倍以上的编码速度。

讨论： 用户对Cerebras Qwen3 Coder的性能和成本进行了讨论。一些用户对其在处理速度上的提升表示赞赏，特别是对于256k上下文大小的支持，认为这将是一个重要的差异化因素。然而，也有用户指出其API调用延迟较高，这可能会影响其在需要快速连续API调用的场景中的应用。此外，有用户对比了Qwen3 Coder与其他模型和服务的成本，认为Qwen3 Coder在成本上具有竞争力，并可能对现有市场产生冲击。一些用户对使用Qwen3 Coder进行代码生成表示兴趣，但也对模型在处理重复任务时的效果表示疑问。

原文标题：Qwen3 Coder 480B is Live on Cerebras
原文链接：https://www.cerebras.ai/blog/qwen3-coder-480b-is-live-on-cerebras
讨论链接：https://news.ycombinator.com/item?id=44760023