AI Applications
Evidence Packet: Agentic RAG 的上下文编译接口
把知识库从 top-k chunk 搜索升级为面向 Agent 的上下文编译器,用 Evidence Packet 统一检索信号、来源引用、权限范围、token budget、trace 和评测。
Evidence Packet: Agentic RAG 的上下文编译接口 Agentic RAG 的关键问题不只是“如何检索到相关 chunk”,而是“如何把知识库结果变成 Agent 可以稳定消费的上下文对象”。在通用 AI Assistant 中,模型、工具、记忆、任务规划和上下文预算都会同时参与决策。如果 KB 只返回 top k 文本片段,后续系统很难判断这些片段为什么出现、如何裁剪、如何引用,以及错误发生在检索链路的哪一层。 本文从一个很小的技术点切入: Evidence Packet 。它是 Assistant 与 KB 之间的结构化上下文中间表示。KB 不再只是向量搜索服务,而是一个面向 Agent 的 Context Compiler :把原始文档、召回信号、来源元数据、token 预算和引用约束编译成可执行上下文。 核心技术方向可以概括为: 这个方向的重点不是发明新的检索算法,而是把 RAG 从“搜索结果列表”提升为“Agent runtime 的上下文接口”。 Design Boundary Evidence Packet 是接口层和工程抽象,不等同于宣称已经完成一整套企业级 RAG 平台。它适合用来描述博客 Agent、文档助手和通用 Assistant 的后续演进方向:知识如何被检索、裁剪、授权、引用和评测。 文章只讨论公开可复用的系统设计,不披露私有实验指标、未发布结果或敏感实现细节。涉及 Qdrant、BM25、rerank、MMR、GraphRAG 等组件时,它们代表可替换的参考技术路线,而不是固定依赖。 1. Problem Boundary 传统 RAG 接口通常接近: 这个接口适合原型,但对 Agent 不够。Agent 需要的不只是文本,还需要围绕文本的证据结构: 候选是 dense 召回、BM25 召回,还是二者融合得到的。 结果是否经过 rerank,是否为了多样性做过 MMR。 chunk 属于哪个文档、章节、页码、版本和权限范围。 如果上下文超预算,哪些证据可以删,哪些必须保留。 最终回答应该引用哪一个 source,而...