Mercury 2: 扩散推理模型

摘要： Inception公司推出了Mercury 2，这是世界上速度最快的推理语言模型，旨在使生产AI感觉瞬间响应。Mercury 2通过并行优化和扩散技术，实现了比现有LLM更快的推理速度，提高了生产部署的速度和质量。它适用于需要低延迟的应用场景，如编码、编辑、代理循环、实时语音交互、搜索和RAG管道等。Mercury 2与OpenAI API兼容，易于集成到现有系统中。

讨论： 用户E-Reverance询问在距离家100米的地方洗车，是开车还是步行更合适。多位用户对此进行了讨论。一位用户建议步行更合适，因为距离短，节省燃油和磨损，且方便快捷。另一位用户Alifatisk提到Chat和网页搜索功能的增强，并表达了对速度提升的期望。第三位用户esafak认为如果系统能够使用工具，可以成为一个优秀的子代理。

原文标题：Mercury 2: Diffusion Reasoning Model
原文链接：https://www.inceptionlabs.ai/blog/introducing-mercury-2
讨论链接：https://news.ycombinator.com/item?id=47137731