摘要: 本文讨论了人工智能搜索领域从RAG(检索增强生成)架构到基于代理的搜索架构的转变。作者认为,随着LLM(大型语言模型)上下文窗口的扩大和代理架构的成熟,RAG架构正在衰落。作者指出RAG架构在处理长文档和复杂结构时存在的局限性,如文档碎片化、语义搜索在数字上的失败、缺乏因果理解、词汇不匹配问题和时间盲点等。作者提出了基于代理的搜索方法,认为通过提供足够的上下文和智能导航,可以消除RAG的局限性。这种方法能够实现更精确的信息检索、更快的洞察、更高的准确性和巨大的基础设施成本节约。作者预测,未来的AI搜索将属于能够阅读和推理端到端系统的智能代理,而非仅仅依赖于检索的方法。
讨论: 这段内容主要讨论了RAG(Retrieval-Augmented Generation)技术在文档检索中的应用及其局限性。多位作者对RAG技术提出了批评,认为其在处理大规模文档集合时存在性能问题,例如无法将整个企业知识库放入上下文窗口中。同时,批评者指出grep等传统搜索方法在语义理解方面存在不足,而RAG通过嵌入技术可以解决词汇不匹配的问题。有作者认为RAG并非完全过时,而是需要根据具体任务进行调优。此外,还有讨论关于“agentic search”是否能够替代RAG,以及如何构建和维护企业级向量数据库的挑战。
原文标题:The RAG Obituary: Killed by agents, buried by context windows
原文链接:https://www.nicolasbustamante.com/p/the-rag-obituary-killed-by-agents
讨论链接:https://news.ycombinator.com/item?id=45439997