2026/1/11 4:59:29
网站建设
项目流程
环卫公厕建设门户网站访谈,湛江seo排名外包,空压机网站开发公司,影视网站建设方案**Naive RAG 与 Advanced RAG 的核心区别在于#xff1a;**Naive RAG 只是“取相似段落 拼接给大模型”#xff0c;而 Advanced RAG 则引入多层过滤、压缩和知识增强#xff0c;使检索更准、上下文更干净、回答更可靠。Naive RAG 使用单次向量检索#xff0c;容易受到噪声…**Naive RAG 与 Advanced RAG 的核心区别在于**Naive RAG 只是“取相似段落 拼接给大模型”而 Advanced RAG 则引入多层过滤、压缩和知识增强使检索更准、上下文更干净、回答更可靠。Naive RAG 使用单次向量检索容易受到噪声片段、长文档稀释和幻觉影响Advanced RAG 则通过多路召回BM25 Embedding、段落切分优化、ReRank 重新排序、Selective Context/LLMLingua 压缩无关信息以及检索后推理ReAct / GraphRAG / Query Rewrite来保证模型只看到最有用、最精炼的知识从而大幅提高准确率、减少幻觉并显著降低 Token 成本。**简单说**Naive RAG 是“把文档喂给模型”Advanced RAG 是“挑最 relevant 最精华的上下文让模型以最小的成本说最正确的话”。Advanced RAG的索引优化检索前的优化**数据粒度优化**修订简化内容确保正确性删除不相关信息消除歧义维护上下文连贯性优化索引结构chunk大小调整根据场景特性动态切割文本过大导致噪声增加过小丢失上下文关联图数据索引知识图谱建立节点关系网络实现跨索引查询如感冒药有哪些副作用查询场景中先用问题丢给向量数据库得到一些文档再通过图谱找到感冒药1/2/3相关的知识把这些知识丢给向量数据库再得到一些文档最后把这些文档融合到一起在丢给大模型给我们回答层级索引构建构建多层索引结构以提高检索效率先生成文档摘要层20字代替1000字快速定位后再精查具体chunk**加入元数据信息**如对会议纪要、新闻等时效数据标注日期标题等加入元数据**混合检索与对齐优化**对一份文档预设用户可能会提问的问题用户查询时先把用户的问题对文档预设问题进行相似度的检索这和多层索引有点像多层索引是提炼文档的摘要这里是提炼可能会问的问题检索中的优化微调Embedding模型利用特定场景的语料去微调embedding模型将知识嵌入到模型中但比较少用领域适配微调使用金融/医疗等垂直语料微调向量模型提升专业术语捕捉能力冷启动方案先用通用模型检索积累足够数据后再进行微调迭代效果边界当领域术语占比超30%时建议微调否则可能带来过拟合检索后的优化**ReRank机制**用BERT等模型对Top100结果重排序比如拿到前3个最相关**Prompt Compression**对ReRank机制后的3个结果再进行压缩无关上下文、突出关键段落、减少整体上下文长度Selective Context 利用小模型或稀疏模型对文本进行片段级评分和 LLMLingua LLMLingua 是由微软发布的一种 大模型 Prompt 压缩框利用小模型对文本做逐句重要性评估等方法利用小语言模型来做