一个Agent搞不定的事——不是它不够聪明,是结构问题

你大概用过AI Agent独立完成一个复杂任务——调研、分析、写报告、发邮件,一口气跑下来。有时候跑得不错,有时候跑着跑着就偏了,或者中间某一步莫名其妙出了问题。
你可能以为是模型能力不够,或者提示词没写好。
但还有第三种可能:是结构问题,不是能力问题。
* * * ## 单Agent的天花板,不是智力问题NotebookLM的音视频概览,解读的比较通俗易懂,对于时间比较紧张的读者朋友,可以听听,会有启发。
一个Agent同时要做很多事:理解任务、制定计划、调用工具、处理返回结果、记录中间状态、决定下一步……这些事全部堆在一起,压在同一个Context窗口里。
上一篇讲过Context的注意力分配问题——模型对不同位置信息的处理能力不均匀,塞的东西越多,注意力越分散。任务越复杂,这个问题就越突出:规划质量、执行精度、记忆准确性会同时下降,互相干扰。
单Agent的天花板,不是"不够聪明"。是一个人同时担任策划、执行者、记录员、工具操作员,顾此失彼是结构性必然,不是个人能力问题。
换一个人,换一个更聪明的模型,遇到足够复杂的任务,同样会顾此失彼。因为问题出在角色设计上,不是出在执行者身上。
多Agent解决的是什么问题
多Agent的核心逻辑很简单:把原来压在一个Agent身上的事,按职责拆开,交给不同的Agent专门负责。
这带来四个结构性改善。
专注度提升。 每个Agent的Context只装自己负责的那部分,不被其他任务的噪音干扰。注意力更集中,执行更准,出错率更低。
并行提速。 不同Agent可以同时跑不同子任务,不需要等一个完成才开始下一个。原来串行跑完需要一小时的任务,并行跑可能二十分钟出结果。
错误隔离。 一个Agent出错,错误被限制在它的边界内,不会直接污染整条任务链。单Agent出错是全局性的,多Agent出错是局部性的。
按能力分工,优化成本。 这是多Agent最容易被忽视的优势。不同Agent可以挂载不同模型——信息收集这种简单任务用轻量模型跑,复杂推理和最终整合用主力模型跑。单Agent必须用同一个模型跑全程,多Agent可以做到每一步用最合适的模型,而不是最贵的模型。任务分工的同时,也是成本分工。
多Agent系统的基本分工结构
多Agent系统通常有两种角色,分工非常清晰。
Orchestrator(总调度):负责接收任务、制定计划、把任务拆成子任务、分配给各个执行Agent、监控进度、整合最终结果。它是多Agent系统的大脑,不直接执行具体操作,只负责规划和协调。
Worker Agent(执行Agent):负责接收具体子任务、专注执行、返回结果。它不需要知道整个任务是什么,也不需要关心其他Worker在做什么,只需要把自己那一块做好。
用一个具体场景说明。你让多Agent系统做一份竞品分析:
Orchestrator接到任务,把它拆成四块——信息收集、数据整理、分析对比、报告撰写——分配给四个Worker Agent。信息收集Agent在搜资料的时候,分析Agent可以同时处理上一批已经收集回来的数据。信息收集Agent用轻量模型跑,报告撰写Agent用主力模型跑。Orchestrator负责协调进度、检查中间结果、整合最终输出。
整个过程,每个Agent只看自己的Context,只做自己的事,互不干扰。
Hermes的多Agent实践——趋势已经到来
这不是理论设想,是已经在发生的事。
Hermes v0.13.0在5月7日刚刚发布,核心更新就是多智能体协同任务全流程闭环管理:单实例可部署多个看板,多个Hermes Worker可以自动认领任务、完成交接,内置心跳检测、僵尸进程识别和异常任务回收,确保任务不中断、不遗漏。
上一个版本v0.12.0(4月30日)新增了Autonomous Curator——一个专门负责管理其他Agent技能库的Agent。它在后台定时运行,自动对技能库评分、合并同类技能、清理失效技能。相当于用一个Agent来维护一群Agent的能力状态,管理层本身也是Agent。
架构层面,Hermes已经通过ACP协议支持调用外部专业Agent——Claude Code、Codex、OpenCode都可以作为子Agent接入,Hermes作为Orchestrator协调层,每个子Agent可以用不同模型、不同工具链。模型路由也是内置的:简单请求自动分配给轻量模型,复杂请求路由到主力模型,成本优化在系统层面完成,不需要人工干预。
同期,Mistral AI推出企业级多Agent工作流编排平台Workflows,谷歌开源Agent Skill工具箱并推出Agents CLI。三家同期发力,不是巧合,是行业共识正在形成:单Agent时代正在过渡到多Agent协作系统时代。
什么任务值得上多Agent,什么不值得
多Agent不是万能的。它有协调成本,有额外的复杂度,不是所有任务都适合。
值得上多Agent的任务:步骤多、部分步骤可以并行、各步骤的专业要求差异大、整体耗时长、出错代价高。这类任务,多Agent的结构收益远大于协调成本。
不值得的任务:步骤少、串行依赖强(必须A完成才能开始B,没有可并行的空间)、对响应速度要求极高、任务本身简单直接。这类任务,多Agent的协调开销反而是负担,一个Agent跑更快更简单。
一个直觉判断标准:如果这件事交给一个人做,你会不会考虑让一个小组来分工协作?会,就值得考虑多Agent;不会,单Agent够了。
任务的复杂度,而不是你对AI能力的期待,才是决定用单Agent还是多Agent的真实依据。
写在最后
多Agent不是"更多AI",是一种分工哲学。
它把原来压在一个Agent身上的复杂性——规划、执行、记忆、工具调用、错误处理——通过结构设计分散出去。每个Agent做更少的事,做得更专注,出错的边界更清晰,成本的分配更合理。
Hermes连续两个版本密集押注多Agent,Mistral和谷歌同期跟进。这个方向不是趋势预测,是已经在发生的现实。
单Agent是入门,多Agent是下一站。
我是「AioGeoLab」主理人塔迪Tardi,AioGeoLab是深度洞察AI第一性原理和应用实践的前瞻性研究实验室,目前有两个主要研究方向:
「塔迪GEO判断工程」是基于GEO的价值SEO化,在AI从“说”到“做”的重要跃迁阶段,试图回答,如何让AI敢于行动、不因为责任问题而畏手畏脚,而做的一个前沿研究项目。
「塔迪硅基禅心」是传统东方智慧、未来AI前沿、当下应用实践,深层共鸣的探索。不是用AI解读经典,也不是用经典指导AI。 这是一场跨越2500年的对话,在算法与古老智慧之间,照见意识、智能与存在的本质。
塔迪的微信 - tardyai2025。
