📌 TL;DR: 多Agent系统的前提，是Agent之间能真正"说上话"。A2A出现之前，多Agent通信要么被锁在同一框架内，要么靠各自写定制API，无法规模化。A2A是Google发起、OpenAI/Anthropic/Microsoft/AWS等六家联合治理的开放协议，核心机制是Agent Card名片发现、任务生命周期管理和异步通信，解决的是跨厂商、跨框架的Agent协作标准化问题。MCP解决Agent和工具之间的通信，A2A解决Agent和Agent之间的通信，两者是分工关系不是竞争关系。Hermes早期用的ACP协议已于2025年8月合并入A2A，方向一脉相承。A2A对Agent生态的意义类似HTTP对互联网的意义——有了公共语言，封闭的局域网才能变成开放的互联网。

Agent之间怎么说话——这个问题，比你想的更重要

信息图

上一篇讲了多Agent分工协作的好处：专注度更高、可以并行、错误隔离、按能力匹配模型优化成本。

但有一个问题被跳过了。

这些Agent，怎么实际"对话"？一个Agent负责搜索，另一个负责分析，第三个负责撰写报告——它们互相怎么传递任务？怎么交接结果？怎么确认对方完成了？如果没有统一的沟通规则，多Agent系统就只是一堆各说各话的孤岛，分工再合理也无法真正协作。

这就是A2A协议要解决的问题。

NotebookLM的音视频概览，解读的比较通俗易懂，对于时间比较紧张的读者朋友，可以听听，会有启发。

* * *

没有协议之前，Agent之间怎么通信

A2A出现之前，多Agent通信基本靠两种方式撑着，两种都有根本性的缺陷。

方式一：把所有Agent关在同一个框架里。

LangGraph、CrewAI、AutoGen这些编排框架，可以在框架内部管理多个Agent的通信。问题是，这些Agent被"关"在同一个框架里——一旦需要和框架外的Agent协作，或者对接另一家公司开发的Agent，就完全不行。框架内部的通信再顺畅，也只是一个封闭的局域网。

方式二：各自写自定义API。

每个团队为自己的Agent定一套接口格式，对接时双方专门写适配代码。增加一个新的合作Agent，就要写一套新的适配。没有标准，每次对接都是从零开始，无法规模化。

这就是多Agent生态的"巴别塔"困境——每个Agent说自己的语言，互相理解的成本极高，多Agent协作的潜力被通信问题死死卡住。

A2A是什么，解决什么问题

A2A（Agent-to-Agent）是Google于2025年4月发布的开放标准协议，专门解决AI Agent之间的通信与协作问题。发布后迅速获得行业认可，2025年6月贡献给Linux Foundation，由新成立的Agentic AI Foundation负责管理，六大创始成员是OpenAI、Anthropic、Google、Microsoft、AWS和Block——基本上是AI行业最重要的几家公司同时背书。目前已有150+企业支持，涵盖Atlassian、Salesforce、SAP、ServiceNow、PayPal等主流企业软件厂商。

A2A解决的核心问题，用一句话说：让不同团队、不同厂商、不同技术栈开发的Agent，能够互相发现、互相理解、互相协作。

它的机制并不复杂，有三个关键设计：

Agent Card（名片机制）。 每个Agent在一个固定的公开地址发布一张"名片"，说明自己是谁、能做什么、接受什么格式的任务、需要什么权限。其他Agent找到它，读懂它的能力范围，才能决定要不要把任务分配给它。这解决了"Agent之间怎么互相发现"的问题。

任务生命周期管理。 A2A定义了任务从创建到完成的完整流程——创建、执行中、进度更新、完成或失败。Agent之间传递的不只是文字消息，还有结构化的任务状态。接收方随时知道事情进展到哪里，不需要靠猜。

异步通信。 长任务不需要发送方一直等着。Agent把任务交出去之后可以继续做其他事，任务完成后收到通知再处理结果。这对复杂的长时间任务至关重要——总不能让整个系统为了等一个子任务卡在那里。

A2A和MCP是什么关系

两个协议都是Agent相关的通信标准，一句话说清楚分工：

MCP解决的是Agent和工具之间的通信——Agent怎么调用搜索引擎、数据库、代码执行器这些外部工具，怎么拿到工具返回的结果。

A2A解决的是Agent和Agent之间的通信——一个Agent怎么把子任务委托给另一个Agent，怎么接收它完成后的结果，怎么在多个Agent之间协调复杂任务。

两者不是竞争关系，是分工关系。一个完整的多Agent系统里，两个协议都需要：Agent用MCP调用工具，用A2A和其他Agent协作。

用一个比喻：MCP是Agent的"双手"，让它能拿起工具、操作外部系统；A2A是Agent的"语言"，让它能和同伴分工说话。手和语言解决的是两件完全不同的事，缺哪个都跑不起来。

还有一个历史注脚值得提一下：Hermes早期用的是ACP（Agent Communication Protocol）协议来调用外部Agent，这个协议后来合并进了A2A。方向是一脉相承的，只是现在有了统一的标准。

这个协议的出现，意味着什么

技术细节之外，A2A真正的价值在于它代表了一个生态转折点。

在A2A之前，多Agent系统是各家各自为政的状态。OpenClaw生态里的Agent和Hermes生态里的Agent，没有公共语言，不能直接协作。想要跨生态对接，要么把所有Agent塞进同一个框架，要么写大量定制化适配代码。

在A2A之后，只要都实现了这个标准，跨厂商、跨框架的Agent协作就有了公共基础。一个Agent发布自己的Agent Card，任何支持A2A的系统都能找到它、读懂它、把任务分配给它。不需要双方事先约定格式，不需要写适配代码。

这个转变，和互联网早期HTTP协议的出现非常相似。HTTP之前，不同网络系统之间的通信需要大量定制化工作，联网的成本极高。HTTP之后，任何人都可以基于同一套规则构建网站和服务，互联网才真正爆发。

A2A对Agent生态的意义是类似的：它是多Agent时代的基础设施。有了公共语言，Agent生态才能从封闭的局域网走向开放的互联网。

当然，协议标准化只是第一步。真正的生态繁荣，还需要足够多的Agent实现这个标准、足够多的工具链支持它、足够多的开发者基于它构建系统。A2A现在的150+支持企业是一个好的开始，但离"像HTTP一样无处不在"还有相当长的路要走。

写在最后

A2A不是一个你需要亲自动手实现的技术。但它是理解多Agent时代运作方式的必要认知。

多Agent系统的价值，建立在Agent之间能真正"说上话"的前提上。没有公共语言，分工再合理也是孤岛。A2A做的事，就是给这个时代的Agent一套共同的语法——让不同来源、不同能力的Agent，能够组成真正意义上的协作系统。

理解这个，你就理解了多Agent时代的地基是怎么打的。

我是「AioGeoLab」主理人塔迪Tardi，AioGeoLab是深度洞察AI第一性原理和应用实践的前瞻性研究实验室，目前有两个主要研究方向：
「塔迪GEO判断工程」是基于GEO的价值SEO化，在AI从“说”到“做”的重要跃迁阶段，试图回答，如何让AI敢于行动、不因为责任问题而畏手畏脚，而做的一个前沿研究项目。
「塔迪硅基禅心」是传统东方智慧、未来AI前沿、当下应用实践，深层共鸣的探索。不是用AI解读经典，也不是用经典指导AI。这是一场跨越2500年的对话，在算法与古老智慧之间，照见意识、智能与存在的本质。
塔迪的微信 - tardyai2025。

Agent之间怎么说话——这个问题，比你想的更重要#

没有协议之前，Agent之间怎么通信#

A2A是什么，解决什么问题#

A2A和MCP是什么关系#

这个协议的出现，意味着什么#

写在最后#