所以你想建立一个本地的RAG?

Nov 28, 2025     Author:pedriquepacheco     HN Points:361     HN Comments:25
Share this

摘要: 本文介绍了Skald如何支持本地部署的Retrieval-Augmented Generation(RAG)系统,并比较了使用专有API与自托管开源技术时的性能。文章详细讨论了RAG系统的核心组件,如向量数据库、向量嵌入模型、LLM、重排器和文档解析器,并列出了可用的开源替代方案。作者通过实验展示了Skald在不同配置下的表现,包括使用云服务和本地部署的方案。实验结果表明,虽然本地部署在处理复杂查询和多种语言时存在局限性,但在某些用例中仍然可以提供良好的性能。文章还讨论了Skald未来的发展方向和潜在的应用场景。

讨论: 上述内容主要讨论了构建检索增强型问答(RAG)系统的不同观点和建议。一些用户建议使用全文搜索或grep作为基础工具,因为它们更快、更便宜,并且如果结合代理工具循环,效果非常好。还有用户强调了语义搜索的优势,如模糊搜索和自动查询优化。一些用户提出了关于语义分块和上下文检索的建议,以提高性能。讨论中还涉及了测试套件的重要性、对非英语语言的支持、以及构建本地化、离线和开源软件的需求。

原文标题:So you wanna build a local RAG?
原文链接:https://blog.yakkomajuri.com/blog/local-rag
讨论链接:https://news.ycombinator.com/item?id=46080364