AI智慧与检索的巅峰融合:RAG解锁下一代信息生成新架构
作者:微信文章AI智慧与检索的巅峰融合:RAG解锁下一代信息生成新架构
这张图展示了"检索增强生成(Retrieval-Augmented Generation,RAG)"技术的不同架构,用来描述如何结合信息检索和生成式AI模型(如GPT)来更好地回答问题或生成内容。以下是大白话的逐步解读:
---
什么是RAG?
RAG是让AI不仅靠自己“想”,还可以通过检索外部数据(如文档、数据库、网页等)来获取更多的信息,然后再生成答案。它的流程通常分为两步:
1. 检索阶段:先从外部文档中找到相关内容。
2. 生成阶段:用这些相关内容作为“上下文”来帮助AI更准确地生成答案。
---
图中各架构的分类和特点
1. Naive RAG(最基础的RAG架构)
- 流程:
- 输入一个问题或查询(Query)。
- 从一堆文档中分块(Chunks),通过检索找到与问题相关的一些内容。
- 将这些内容作为上下文,传给大语言模型(LLM),然后生成答案。
- 特点:
- 简单直接,没有对检索结果进行进一步优化。
- 缺点是如果检索到的内容不够精准,生成结果可能不够好。
---
2. Retrieve-and-rerank RAG(检索并重新排序型RAG)
- 流程:
- 和Naive RAG类似,先从文档中找到相关内容。
- 然后对这些内容进行重新排序(Re-rank),把最相关的放在前面,确保提供给LLM的是质量最高的上下文。
- 特点:
- 比Naive RAG更精准,因为多了一个“挑选最好”的步骤。
- 缺点是增加了计算复杂度。
---
3. Multimodal RAG(多模态RAG)
- 流程:
- 支持多种输入形式,比如文字、图片、视频等(而不仅仅是文字)。
- 根据输入类型,从对应的数据源中检索相关内容,再用LLM结合这些多模态信息生成答案。
- 特点:
- 更灵活,不局限于文字型问题。
- 用于需要结合图片、音频或其他模态信息回答的问题场景。
---
4. Graph RAG(图结构RAG)
- 流程:
- 文档被存储为一个有节点和关系的图结构数据库。
- 查询时,通过图结构找到与问题相关的节点,然后用它们作为上下文帮助LLM生成答案。
- 特点:
- 对于关系复杂的信息,比如知识图谱、社交网络或因果关系网,这种方式更高效、更准确。
- 更适合深度挖掘知识间关联的问题。
---
5. Hybrid RAG(混合型RAG)
- 流程:
- 同时结合两种数据结构——传统文档库和图结构数据库。
- 根据查询需求,从两种数据源中分别提取信息,再组合起来传递给LLM生成答案。
- 特点:
- 灵活兼容不同类型的数据源,适合复杂且多样化的问题场景。
---
6. Agentic RAG (Router) (代理型路由RAG)
- 流程:
- 在查询过程中引入一个“路由代理”角色,根据问题选择最佳的数据源或处理方式。
- 比如,有的问题适合用普通文档库,有些适合用知识图谱,代理会根据情况决定路径。
- 特点:
- 智能化决策,让系统更高效地处理不同类型的问题。
---
7. Agentic RAG (Multi-Agent) (多代理型RAG)
- 流程:
- 引入多个独立的“智能代理”,每个代理负责不同的数据源或任务,例如:
- 一个负责普通向量搜索引擎A;
- 一个负责另一个搜索引擎B;
- 一个负责实时抓取网页;
- 一个专注于Slack消息搜索;
- 一个专注于Gmail邮件搜索;
最后将所有代理搜集到的信息整合起来传递给LLM生成答案。
- 特点:
- 功能最强大,因为它可以整合非常多样化的数据来源。
- 缺点是系统复杂度很高,需要多个模块配合工作。
这张图帮助我们理解,在不同场景下,可以选择不同架构,以最大化利用外部信息辅助AI模型回答问题或完成任务。
页:
[1]