摘要: NVIDIA今日发布了新一代AI平台——Rubin,该平台包含六款新芯片,旨在提供强大的AI超级计算机。Rubin平台通过硬件和软件的极致协同设计,在推理token成本上实现最高10倍降低,在MoE模型训练中GPU数量减少4倍。NVIDIA Spectrum-X以太网光交换系统提供5倍提升的功率效率和可用性。新推出的NVIDIA推理上下文内存存储平台采用NVIDIA BlueField-4存储处理器,以加速智能体AI推理。微软下一代Fairwater AI超级工厂将采用NVIDIA Vera Rubin NVL72机架级系统,扩展至数十万个NVIDIA Vera Rubin Superchips。CoreWeave将成为首批提供NVIDIA Rubin的产品之一,通过CoreWeave Mission Control实现灵活性和性能。与Red Hat合作,为Rubin平台提供优化的完整AI堆栈。
讨论: 这段内容主要讨论了NVIDIA最新推出的Rubin平台及其相关技术。其中,mk_stjames表达了对平台长期稳定性和兼容性的担忧;wmf提供了一个包含更多技术细节的博客链接;codyb探讨了新平台对推理token成本降低的影响,并询问了与GPU折旧周期相关的变化;Animats指出Rubin平台采用了NVIDIA自家的CPU和GPU;TSiege介绍了NVIDIA不同组件之间的协同设计,以减少训练时间和推理token生成成本;Groxx澄清了“extreme codesign”实际上是指“co-design”;exacube询问了5倍性能提升如何转化为实际性能;2OEH8eoCRo0表达了对重建数据中心的需求;metalliqaz对Elon Musk的公关声明表示不满;dannersy表示内容引人入胜。
原文标题:Nvidia Kicks Off the Next Generation of AI with Rubin
原文链接:https://nvidianews.nvidia.com/news/rubin-platform-ai-supercomputer
讨论链接:https://news.ycombinator.com/item?id=46544016