Agent的「反思」不是自省,是你设计出来的一套机制丨Agent误解系列

“Agent在反思”——这句话听起来很自然。
Reflection这个词本身带着强烈的拟人色彩。加上Chain of Thought让Agent把思考过程写出来,看起来像在逐步推敲;产品界面上那行"正在重新审视……“的提示,更强化了"它在想一想自己做得对不对"的感觉。
但Reflection在技术语境里描述的是一个工程机制,不是一种能力。
没有显式设计,它就不存在。 Agent不会因为觉得自己做得不够好而主动检查——它执行完任务,产出结果,停止。没有回头,没有检查,没有改进。“反思"不是Agent天然具备的,是被设计出来的。
NotebookLM的音视频概览,解读的比较通俗易懂,对于时间比较紧张的读者朋友,可以听听,会有启发。
Agent的默认行为:执行完,往前走
不做任何Reflection设计的情况下,Agent的执行路径是线性的:接到任务、规划步骤、逐步执行、输出结果。任务结束信号触发之后,它停下来。
它不会停下来问自己:“这个结果真的对吗?有没有更好的方式?“它没有这个内驱力。Reflection是当输出质量比速度更重要、且任务有足够清晰的正确性标准可以系统评估时,才值得引入的模式。也就是说,它是一个需要主动判断"要不要加"的设计决策,不是默认配置。
这个理解上的错位,会让使用者对Agent抱有一个不现实的期待:以为它会自己发现问题,自己纠正,越跑越好。实际上,不设计Reflection,它会在同一个地方重复犯同样的错误,每次都跑完,每次都"完成了”。
Reflection真正是什么:三种形态
Reflection是一套结构化自检机制,核心问题是:谁来检查、检查什么、检查完了触发什么。不同设计给出不同答案,形成三种主要形态。
第一种:自检型。 同一个Agent执行完之后,用另一个提示词让它审查自己的输出——找逻辑漏洞、查事实错误、对照验收标准。实现最简单,但有一个内在限制:生成错误答案的模型和被要求评估那个答案的模型,是同一个模型。如果最初的失败来自模型知识的系统性缺口或推理的结构性盲点,那么评估者共享这个盲点。换句话说,自检型Reflection发现不了它自己不知道的东西。
第二种:双Agent型。 一个Agent负责执行,另一个Agent专门负责评估。执行者和评估者分工明确,评估者的提示词可以专门针对常见错误模式设计,发现能力比自检型更强。代价是多一个Agent的开销,系统复杂度上升。
第三种:迭代循环型。 执行→评估→不达标→重新执行,循环直到通过或达到终止条件。在LangGraph(当前生产级Agent AI的主流框架)里,自我纠正被建模为一个条件循环:Agent节点输出结果,评估节点评估它,路由节点要么接受结果,要么把它连同评估反馈一起发回给Agent重新执行。这个循环有可配置的最大重试次数,防止无限循环。终止条件必须提前设计好,否则会在无效的循环里耗尽预算。
三种形态共同的特点:都需要人来设计,包括检查标准是什么、检查完了怎么处理、什么情况下停止。
两种不同的设计哲学
Reflection不是一个统一的东西,不同系统的设计取向差异很大。
OpenClaw的Reflection发生在任务结束之后:经验提炼,沉淀为可复用的Skill文件,供未来的任务调取。它是跨任务的、异步的——这次执行的反思,影响的是下一次的起点。
Hermes的nudge机制在会话内实时触发自检,节奏更短、更即时。GEPA引擎走得更远,每15次工具调用跨任务分析失败原因并进化——这套机制在ICLR 2026作为Oral论文发表,说明这不是产品宣传,是有同行评审支撑的机制设计。
两者都是Reflection,但触发时机、作用范围、对后续任务的影响方式完全不同。没有哪种天然更好,取决于任务特性和设计目标。
什么时候值得设计Reflection
Reflection不是免费的,加之前先问一个问题:这个任务的结果,执行完了之后有没有办法判断对不对?
有客观标准可以检验,Reflection才能真正发挥作用——它需要一个评估依据,没有依据,检查这个动作本身就是虚的。如果结果完全主观、没有可验证的标准,Reflection只是又跑了一遍,不一定更好。
四个值得设计的条件:结果有可验证标准(这是前提)、链条足够长(误差有时间积累)、迭代改进的空间真实存在(重跑一遍确实能更好)、预算能承担多跑一轮的成本。
四个条件里有任何一个不成立,加Reflection的收益就存疑。不可逆操作不是靠Reflection来兜底的,是靠在执行前加人工确认节点——那是另一套设计。
写在最后
Reflection是一个工程词汇,描述的是结构化自检的设计模式。它让Agent有机会在输出之前或之后做一次有结构的检查——但"有机会"的前提,是有人设计了这个机会。
Agent不会自己反思。 给它设计一个反思的结构,它才能反思。这个动作是你的,不是它的。
感谢你看到最后,如果你觉得有启发,随手点个赞、在看、转发吧,如果想第一时间收到推送,也可以给我加个星标⭐我们下期见。
我是「AioGeoLab」主理人塔迪Tardi,AioGeoLab是深度洞察AI第一性原理和应用实践的前瞻性研究实验室,目前有两个主要研究方向:
「塔迪GEO判断工程」是基于GEO的价值SEO化,在AI从“说”到“做”的重要跃迁阶段,试图回答,如何让AI敢于行动、不因为责任问题而畏手畏脚,而做的一个前沿研究项目。
「塔迪硅基禅心」是传统东方智慧、未来AI前沿、当下应用实践,深层共鸣的探索。不是用AI解读经典,也不是用经典指导AI。 这是一场跨越2500年的对话,在算法与古老智慧之间,照见意识、智能与存在的本质。
塔迪的微信 - tardyai2025。
