多客科技 发表于 2025-6-20 08:08

智能体AI(Agentic AI)对数据库架构变革的影响与演进路径

作者:微信文章
↑↑↑点击上方蓝字把我们置顶/设为星标吧(本篇为口语版)
在上一篇文章中,我们探讨了如何设计面向AI,或更准确地说,对AI友好的数据库架构,以应对短期内大模型技术对数据系统的挑战。然而,随着Agentic AI(智能体AI)理念的逐渐成熟与广泛应用,我开始意识到,我们真正需要关注的已不仅仅是AI如何调用数据的问题,而是整个数据库系统如何在智能体主导的时代实现深层次的演进,尤其是在系统架构、交互方式与数据协同机制方面所面临的根本性变革。

这可能没那么简单。
现有场景

我们不妨回顾下数据库的应用场景,请注意我所要讨论的数据库,不是单一业务场景的数据库设计,而是从顶层上系统性地观看现有数据库设计。

假设在高校环境下,校领导想知道当前学校教师的科研工作量,并能够做个对比,查看哪个学院的人均科研工作量、人均教学工作量、科研工作量和教学工作量之间是否真的成反比,这该怎么做?
A. 无数据仓库(湖)的情况

将该需求描述给办公室(或秘书)。办公室(或秘书)让科技处、教务处分别给出基础数据。数据分析员对数据进行汇总,并进行统计分析比对,将结果反馈给办公室(或秘书)。办公室(或秘书)将结果反馈给校领导。
B. 有数据仓库(湖)的情况

数据仓库(湖)建设方案,定期对数据进行归集。将该需求描述给办公室(或秘书)。办公室(或秘书)让数据仓库管理员(如信息办)统计分析,获取结果。办公室(或秘书)将结果反馈给校领导。

对比两种场景,可以发现没有数据湖的场景,完全靠人工去操作,耗时久;有数据库的则靠数据仓库管理员即可完成操作,耗时短,但需要前期建设数据仓库(湖),需要运维。
Agentic AI介入

在当前的大模型技术日益成熟的背景下,Agentic AI(智能体AI)作为一种更加自主、持续、多步骤执行任务的能力形态,正逐步进入数据系统的核心环节。不同于传统AI仅限于辅助性分析或一次性任务执行,Agentic AI具备持续感知、自主决策、语义理解与多Agent协作的能力,因此也极大地影响着数据库的使用方式与架构形态。

Agentic AI的引入,不仅仅是引入一个新“工具”,而是一个架构性的改变:数据从“被动响应”转向“主动触达”,系统从“人驱动”转向“智能体驱动”,架构从“流程编排”进化为“语义协同”。

下面,我们介绍几个关键支撑Agentic AI与数据库协同工作的机制与协议:

如果此时我们把AI接入会怎样?尤其是Agentic Agent的出现,是否会改变这种方式?
Function Calling机制简介

Function Calling是大模型与外部系统交互的关键方式之一。它允许大模型在对话中识别出调用外部函数或服务的意图,并自动生成调用语句。这个机制打通了“语言理解”与“程序执行”的通路,使模型不仅能“理解”,还能“行动”。

比如,当用户说“请查一下商船学院过去三年的人均科研工作量”,大模型可以通过TEXT2SQL的方式,将自然语言解析为SQL查询指令。这类SQL语句可以被模型嵌入在函数调用体中,通过API访问数据库,实现自然语言向结构化查询的转化,从而实现自动查询和分析。大模型会解析出参数(学院=商船学院,时间范围=近三年),并调用一个如 get_research_workload(school, years) 的函数接口。这种机制极大地扩展了模型的实用性。
MCP协议简介

MCP(Model Context Protocol)协议由Anthropic等提出,定义了大模型与外部系统进行结构化交互的协议格式。它确保每一次Function调用都在明确的上下文中进行,并具备权限校验、接口描述、参数校验等机制。

MCP的引入,让模型可以像服务编排平台一样,串联多个系统完成复杂操作。例如,模型可以连续调用“查询科研数据”、“查询教学数据”、“计算人均比值”三个函数,而这些调用在MCP的上下文中是有状态的。
Agent-Agent协议简介

Agent-Agent协议,也被称为多智能体协同协议(A2A),用于不同智能体之间的信息交换与任务协同。在未来的数据系统中,不同部门(如科研处、教务处、人事处)可以部署各自的Agent,它们之间通过Agent协议协同完成复合任务。

这类协议涉及服务发现、任务分发、权限控制、错误恢复等机制。通过Agent-Agent协议,任务不再集中在某个中心系统中处理,而是分布式地由多个Agent协作完成,更像微服务协同模型,但适配AI语义驱动。
场景延展:使用智能体查询

设想一下未来的模式:校领导不再需要秘书中转,而是直接对着语音助手说:“告诉我商船学院和物流学院教师最近三年科研和教学工作量的对比情况。”

系统背后的中央智能体接收到指令后,调用教务Agent和科研Agent获取数据,再调用分析Agent进行比对,最后生成一份自然语言和可视化并存的报告。

用户无需接触数据库、SQL、Excel,甚至不需要点开网页,这是一种彻底从“人力+数据”到“智能体+数据”的演进。
数据库还需要吗?平台如何演进?

到了这里,问题就来了:
数据仓库还需要吗?数据中台要如何适应这种变化?数据平台的未来走向是什么?

我们可以先做一个类比:
人 vs Agent

传统:人提出问题,系统查询结果。

Agent时代:Agent自己判断是否有必要分析某个数据,比如教学工作量突然下降,它可以主动触发分析并推送结果。这就是“从拉到推”的根本变化。
拥有 vs 调用

传统:我们要将数据集成到自己的平台,统一存储。

Agent时代:我们并不需要拥有数据,而是调用对方Agent提供的服务。这是“数据可用不可见”的典型实现。只要Agent之间的协议达成,数据无需迁移,仅通过API或加密计算机制调用,就能实现跨域分析。
Agent时代的数据平台架构

因此,传统的平台架构必须重构,我们提出如下新的架构模型:
数据交互层

用于用户与Agent之间的互动。它的职责是:
接收自然语言或结构化查询;调用大模型进行解析;转化为Agent可识别的意图或函数调用。

这一层,既可以是语音接口、也可以是文本、图形化界面。它是系统的“第一印象”,体现交互体验。
数据协调层

这层是整个Agent系统的大脑。
负责意图的拆解、Agent发现与调度;管理多Agent的协作过程;保证任务流程、数据依赖与权限控制的正确性。

它就是原来的“流程引擎”+“任务调度”+“服务编排”的智能升级版本。
数据操作层

真正进行数据库或数据API访问操作的执行层。
这里可能有连接器(Connector)、驱动、ORM或SQL生成模块;支持对结构化数据的增删查改,也支持对API的调用和结果处理;负责调用日志、安全策略、数据回溯等。
数据存取层

就是我们传统意义上的数据源。
包括数据库、数据湖、数据文件、实时流;可是集中式的,也可是分布式的;本层重点在于提供高性能、高可用的数据服务。

特别说明:该架构不需要废弃已有平台。中台、数据仓库、BI系统仍然可以作为数据源接入,只是它们的角色变成了“被调用方”。
”更安全、更灵活的数据使用方式

我们真正迈入了“数据即服务”的时代:
数据保留在原平台;Agent负责暴露标准化调用接口;调用过程安全可控、可追溯;数据本身不出域,但可以服务其他智能体。

这种架构天然适合教育、金融、医疗等高隐私行业。
总结

有没有发现,这种方式和无数据仓库的场景非常类似,只是人的操作变革为了Agentic AI了。

传统:校领导 → 办公室 → 教务处、科研处 → 数据分析 → 汇报。

未来:校领导 → 智能体 → 汇报, 或者是:智能体 → 汇报 → 校领导。

这真的是方向吗?

我认为,它不仅是方向,而且是必然。

只不过,在迈向这个目标前,我们必须重塑认知:数据库不再是单纯的存储工具,而是Agent智能运行的底座。

数据通过Agent提供服务,才是未来智能组织的数据范式。

只是这一天不是今天。



AI友好的数据库该怎么设计?

【大学综合改革】AI冲击下,高校教师焦虑的不是失业,而是真相

如何正确部署DeepSeek R1,坚决不建议ollama

你需要了解的DeepSeek R1的十个问题

不要被推理的“显性聪明”蒙蔽,忽视大模型研发的“隐性智慧”

教育数字化转型08:到底是谁该提高数字素养?
页: [1]
查看完整版本: 智能体AI(Agentic AI)对数据库架构变革的影响与演进路径