新闻 发表于 2024-12-12 08:40

AI智慧与检索的巅峰融合:RAG解锁下一代信息生成新架构

作者:微信文章
AI智慧与检索的巅峰融合:RAG解锁下一代信息生成新架构


这张图展示了"检索增强生成(Retrieval-Augmented Generation,RAG)"技术的不同架构,用来描述如何结合信息检索和生成式AI模型(如GPT)来更好地回答问题或生成内容。以下是大白话的逐步解读:

---

什么是RAG?

RAG是让AI不仅靠自己“想”,还可以通过检索外部数据(如文档、数据库、网页等)来获取更多的信息,然后再生成答案。它的流程通常分为两步:

1. 检索阶段:先从外部文档中找到相关内容。

2. 生成阶段:用这些相关内容作为“上下文”来帮助AI更准确地生成答案。

---

图中各架构的分类和特点

1. Naive RAG(最基础的RAG架构)

- 流程:

- 输入一个问题或查询(Query)。

- 从一堆文档中分块(Chunks),通过检索找到与问题相关的一些内容。

- 将这些内容作为上下文,传给大语言模型(LLM),然后生成答案。

- 特点:

- 简单直接,没有对检索结果进行进一步优化。

- 缺点是如果检索到的内容不够精准,生成结果可能不够好。

---

2. Retrieve-and-rerank RAG(检索并重新排序型RAG)

- 流程:

- 和Naive RAG类似,先从文档中找到相关内容。

- 然后对这些内容进行重新排序(Re-rank),把最相关的放在前面,确保提供给LLM的是质量最高的上下文。

- 特点:

- 比Naive RAG更精准,因为多了一个“挑选最好”的步骤。

- 缺点是增加了计算复杂度。

---

3. Multimodal RAG(多模态RAG)

- 流程:

- 支持多种输入形式,比如文字、图片、视频等(而不仅仅是文字)。

- 根据输入类型,从对应的数据源中检索相关内容,再用LLM结合这些多模态信息生成答案。

- 特点:

- 更灵活,不局限于文字型问题。

- 用于需要结合图片、音频或其他模态信息回答的问题场景。

---

4. Graph RAG(图结构RAG)

- 流程:

- 文档被存储为一个有节点和关系的图结构数据库。

- 查询时,通过图结构找到与问题相关的节点,然后用它们作为上下文帮助LLM生成答案。

- 特点:

- 对于关系复杂的信息,比如知识图谱、社交网络或因果关系网,这种方式更高效、更准确。

- 更适合深度挖掘知识间关联的问题。

---

5. Hybrid RAG(混合型RAG)

- 流程:

- 同时结合两种数据结构——传统文档库和图结构数据库。

- 根据查询需求,从两种数据源中分别提取信息,再组合起来传递给LLM生成答案。

- 特点:

- 灵活兼容不同类型的数据源,适合复杂且多样化的问题场景。

---

6. Agentic RAG (Router) (代理型路由RAG)

- 流程:

- 在查询过程中引入一个“路由代理”角色,根据问题选择最佳的数据源或处理方式。

- 比如,有的问题适合用普通文档库,有些适合用知识图谱,代理会根据情况决定路径。

- 特点:

- 智能化决策,让系统更高效地处理不同类型的问题。

---

7. Agentic RAG (Multi-Agent) (多代理型RAG)

- 流程:

- 引入多个独立的“智能代理”,每个代理负责不同的数据源或任务,例如:

    - 一个负责普通向量搜索引擎A;

    - 一个负责另一个搜索引擎B;

    - 一个负责实时抓取网页;

    - 一个专注于Slack消息搜索;

    - 一个专注于Gmail邮件搜索;

    最后将所有代理搜集到的信息整合起来传递给LLM生成答案。

- 特点:

- 功能最强大,因为它可以整合非常多样化的数据来源。

- 缺点是系统复杂度很高,需要多个模块配合工作。

这张图帮助我们理解,在不同场景下,可以选择不同架构,以最大化利用外部信息辅助AI模型回答问题或完成任务。
页: [1]
查看完整版本: AI智慧与检索的巅峰融合:RAG解锁下一代信息生成新架构