摘要: Mistral 3是新一代Mistral模型,包括三个小型密集模型(14B、8B和3B)和Mistral Large 3,一个具有41B活动参数和675B总参数的稀疏混合专家模型。所有模型均以Apache 2.0许可证发布。Mistral Large 3在LMArena排行榜上非推理开源模型类别中排名第2,是业界领先的开放模型。Ministral 3系列适用于边缘和本地使用,提供三种模型大小(3B、8B和14B),并支持图像理解和多语言能力。Mistral AI提供定制模型训练服务,以满足特定需求。Mistral 3支持前沿性能、多模态和多语言、可扩展效率和可定制性,为AI的未来提供了开放、透明和可访问的解决方案。
讨论: 上述内容主要讨论了Mistral 3模型的发布和使用体验。用户们对Mistral 3的速度、成本和可靠性表示赞赏,尽管它在某些情况下仍会产生无意义的输出。一些用户将Mistral 3与OpenAI、Google和Anthropic的SOTA模型进行了比较,但也有人认为这些比较不够全面。讨论还涉及了Deepseek 3.2的发布,以及开源模型与专有模型之间的竞争。
原文标题:Mistral 3 family of models released
原文链接:https://mistral.ai/news/mistral-3
讨论链接:https://news.ycombinator.com/item?id=46121889