📌 TL;DR: 多Agent系统的前提,是Agent之间能真正"说上话"。A2A出现之前,多Agent通信要么被锁在同一框架内,要么靠各自写定制API,无法规模化。A2A是Google发起、OpenAI/Anthropic/Microsoft/AWS等六家联合治理的开放协议,核心机制是Agent Card名片发现、任务生命周期管理和异步通信,解决的是跨厂商、跨框架的Agent协作标准化问题。MCP解决Agent和工具之间的通信,A2A解决Agent和Agent之间的通信,两者是分工关系不是竞争关系。Hermes早期用的ACP协议已于2025年8月合并入A2A,方向一脉相承。A2A对Agent生态的意义类似HTTP对互联网的意义——有了公共语言,封闭的局域网才能变成开放的互联网。

Agent之间怎么说话——这个问题,比你想的更重要

信息图

上一篇讲了多Agent分工协作的好处:专注度更高、可以并行、错误隔离、按能力匹配模型优化成本。

但有一个问题被跳过了。

这些Agent,怎么实际"对话"?一个Agent负责搜索,另一个负责分析,第三个负责撰写报告——它们互相怎么传递任务?怎么交接结果?怎么确认对方完成了?如果没有统一的沟通规则,多Agent系统就只是一堆各说各话的孤岛,分工再合理也无法真正协作。

这就是A2A协议要解决的问题。


NotebookLM的音视频概览,解读的比较通俗易懂,对于时间比较紧张的读者朋友,可以听听,会有启发。

* * *

没有协议之前,Agent之间怎么通信

A2A出现之前,多Agent通信基本靠两种方式撑着,两种都有根本性的缺陷。

方式一:把所有Agent关在同一个框架里。

LangGraph、CrewAI、AutoGen这些编排框架,可以在框架内部管理多个Agent的通信。问题是,这些Agent被"关"在同一个框架里——一旦需要和框架外的Agent协作,或者对接另一家公司开发的Agent,就完全不行。框架内部的通信再顺畅,也只是一个封闭的局域网。

方式二:各自写自定义API。

每个团队为自己的Agent定一套接口格式,对接时双方专门写适配代码。增加一个新的合作Agent,就要写一套新的适配。没有标准,每次对接都是从零开始,无法规模化。

这就是多Agent生态的"巴别塔"困境——每个Agent说自己的语言,互相理解的成本极高,多Agent协作的潜力被通信问题死死卡住。


A2A是什么,解决什么问题

A2A(Agent-to-Agent)是Google于2025年4月发布的开放标准协议,专门解决AI Agent之间的通信与协作问题。发布后迅速获得行业认可,2025年6月贡献给Linux Foundation,由新成立的Agentic AI Foundation负责管理,六大创始成员是OpenAI、Anthropic、Google、Microsoft、AWS和Block——基本上是AI行业最重要的几家公司同时背书。目前已有150+企业支持,涵盖Atlassian、Salesforce、SAP、ServiceNow、PayPal等主流企业软件厂商。

A2A解决的核心问题,用一句话说:让不同团队、不同厂商、不同技术栈开发的Agent,能够互相发现、互相理解、互相协作。

它的机制并不复杂,有三个关键设计:

Agent Card(名片机制)。 每个Agent在一个固定的公开地址发布一张"名片",说明自己是谁、能做什么、接受什么格式的任务、需要什么权限。其他Agent找到它,读懂它的能力范围,才能决定要不要把任务分配给它。这解决了"Agent之间怎么互相发现"的问题。

任务生命周期管理。 A2A定义了任务从创建到完成的完整流程——创建、执行中、进度更新、完成或失败。Agent之间传递的不只是文字消息,还有结构化的任务状态。接收方随时知道事情进展到哪里,不需要靠猜。

异步通信。 长任务不需要发送方一直等着。Agent把任务交出去之后可以继续做其他事,任务完成后收到通知再处理结果。这对复杂的长时间任务至关重要——总不能让整个系统为了等一个子任务卡在那里。


A2A和MCP是什么关系

两个协议都是Agent相关的通信标准,一句话说清楚分工:

MCP解决的是Agent和工具之间的通信——Agent怎么调用搜索引擎、数据库、代码执行器这些外部工具,怎么拿到工具返回的结果。

A2A解决的是Agent和Agent之间的通信——一个Agent怎么把子任务委托给另一个Agent,怎么接收它完成后的结果,怎么在多个Agent之间协调复杂任务。

两者不是竞争关系,是分工关系。一个完整的多Agent系统里,两个协议都需要:Agent用MCP调用工具,用A2A和其他Agent协作。

用一个比喻:MCP是Agent的"双手",让它能拿起工具、操作外部系统;A2A是Agent的"语言",让它能和同伴分工说话。手和语言解决的是两件完全不同的事,缺哪个都跑不起来。

还有一个历史注脚值得提一下:Hermes早期用的是ACP(Agent Communication Protocol)协议来调用外部Agent,这个协议后来合并进了A2A。方向是一脉相承的,只是现在有了统一的标准。


这个协议的出现,意味着什么

技术细节之外,A2A真正的价值在于它代表了一个生态转折点。

在A2A之前,多Agent系统是各家各自为政的状态。OpenClaw生态里的Agent和Hermes生态里的Agent,没有公共语言,不能直接协作。想要跨生态对接,要么把所有Agent塞进同一个框架,要么写大量定制化适配代码。

在A2A之后,只要都实现了这个标准,跨厂商、跨框架的Agent协作就有了公共基础。一个Agent发布自己的Agent Card,任何支持A2A的系统都能找到它、读懂它、把任务分配给它。不需要双方事先约定格式,不需要写适配代码。

这个转变,和互联网早期HTTP协议的出现非常相似。HTTP之前,不同网络系统之间的通信需要大量定制化工作,联网的成本极高。HTTP之后,任何人都可以基于同一套规则构建网站和服务,互联网才真正爆发。

A2A对Agent生态的意义是类似的:它是多Agent时代的基础设施。有了公共语言,Agent生态才能从封闭的局域网走向开放的互联网。

当然,协议标准化只是第一步。真正的生态繁荣,还需要足够多的Agent实现这个标准、足够多的工具链支持它、足够多的开发者基于它构建系统。A2A现在的150+支持企业是一个好的开始,但离"像HTTP一样无处不在"还有相当长的路要走。


写在最后

A2A不是一个你需要亲自动手实现的技术。但它是理解多Agent时代运作方式的必要认知。

多Agent系统的价值,建立在Agent之间能真正"说上话"的前提上。没有公共语言,分工再合理也是孤岛。A2A做的事,就是给这个时代的Agent一套共同的语法——让不同来源、不同能力的Agent,能够组成真正意义上的协作系统。

理解这个,你就理解了多Agent时代的地基是怎么打的。


我是「AioGeoLab」主理人塔迪Tardi,AioGeoLab是深度洞察AI第一性原理和应用实践的前瞻性研究实验室,目前有两个主要研究方向:

塔迪GEO判断工程」是基于GEO的价值SEO化,在AI从“说”到“做”的重要跃迁阶段,试图回答,如何让AI敢于行动、不因为责任问题而畏手畏脚,而做的一个前沿研究项目。

塔迪硅基禅心」是传统东方智慧、未来AI前沿、当下应用实践,深层共鸣的探索。不是用AI解读经典,也不是用经典指导AI。 这是一场跨越2500年的对话,在算法与古老智慧之间,照见意识、智能与存在的本质。
塔迪的微信 - tardyai2025