不是你没说清楚,是这类任务天然不适合Agent丨Agent误解系列

用了Agent一段时间之后,很多人会形成一个固定动作:任务跑不好,回头改提示词。
这个逻辑有它成立的地方。提示词写得更清楚,Agent确实经常跑得更好。于是"描述清楚"慢慢成了一种万能解——Agent出问题,先检查自己有没有说清楚,再考虑别的。
但有一类失败,不管你怎么打磨描述都解决不了。不是你没说清楚,是这个任务的结构和Agent的工作方式本质上不匹配。你在优化输入,但问题出在任务本身。
NotebookLM的音视频概览,解读的比较通俗易懂,对于时间比较紧张的读者朋友,可以听听,会有启发。
不匹配一:任务依赖"此刻才有的信息"
Agent的知识有截止日期。它在训练时看过海量信息,但训练结束之后的世界,它不知道。即便接入了搜索工具,它能查到的也是已经公开、已经落地成文字的内容——而不是此刻正在发生、还没有形成记录的动态。
举一个具体的情况。有人让Agent帮他分析一个候选人,判断要不要发offer。职位要求写得很详细,候选人简历也给得很完整。Agent给出了一份逻辑严密的分析。
但有一件事Agent不知道:这个团队上周刚调整了方向,原本这个岗位需要的技能组合已经变了。这个信息存在于昨天下午的内部会议记录里,还没有同步到任何公开文档。
这不是描述问题。候选人信息写得再详细,Agent也不知道它不知道的事。任何依赖"你的私有实时信息"才能做出正确判断的任务,都有这个结构性缺口。描述得再清楚,填不上的还是填不上。
不匹配二:任务的"对"由你的偏好定义
有些任务,没有客观的对错,只有"你觉得对不对"。Agent给出的是训练数据里概率最高的答案,也就是"通常情况下大多数人会认为合理的版本"。这两件事经常不一样。
一个编辑让Agent帮她改一篇稿子,要求是"保持原有风格,语言更流畅"。Agent改完,她看了一眼,觉得不对——味道变了,不是她想要的那个感觉。她改了提示词,加了更多风格描述,再跑了一遍。还是不对。又改,又跑。
问题在哪里?她脑子里那个"对"的感觉,是她在这个行业做了十年积累下来的审美判断,是私有的、隐性的、很难用语言完整外化的东西。Agent拿到的,永远只是她能说出口的那部分。说不出口的那部分,才是这个任务最难的地方。
只要"对不对"的标准存在于你的主观感受里,而不是可以客观检验的条件里,Agent就只能做参考,不能做主力。 它给的是合理,不是你要的那个对。这不是提示词能弥补的距离。
不匹配三:做错了,代价不可挽回
第三类不匹配,不是Agent做不到,是做错了你承受不起。
一个创业公司的法务负责人,让Agent帮他起草一份合同条款,涉及知识产权归属。他把情况描述得很详细:双方背景、合作模式、核心诉求。Agent给出了一份措辞专业、结构完整的条款。
他发出去了。对方律师看完,指出其中一个条款在他们所在地区的司法管辖下,表述方式会导致完全相反的法律效果——知识产权实际上归了对方。
不是描述不够清楚。是这类任务的风险结构决定了它不适合全程交给Agent主导:可验证性低(你很难在发出去之前判断对不对)、不可逆性高(发出去签了就算数)。这两个条件同时成立的任务,Agent能做辅助,不能最终决定。
知道不匹配,才能用对位置
这三类任务,不是完全不能用Agent。是Agent在这里的角色要变。
实时信息依赖型:Agent负责处理你已有的信息,你来补充它拿不到的实时上下文。
强主观判断型:Agent做初稿、做变体,你来判断哪个方向对,不是让它直接产出终稿。
高不可逆低可验证型:Agent做素材、做参考、做草稿,专业判断和最终确认留给有资质的人来做。
任务结构不变,改变的是Agent在其中承担的位置。
知道这三类之前,你会以为每一次失败都是提示词的问题,反复打磨,反复失望。知道之后,你能更快判断:这次跑不好,是我没说清楚,还是这个任务本来就不该全权交给它?
这一个问题想清楚,能省掉很多无效的打磨。
写在最后
提示词工程是真实有效的,但它有边界。边界在于:它能优化Agent在合适任务里的表现,但改变不了一个任务本身的结构性不匹配。
描述清楚是入场条件,不是万能钥匙。 在用Agent之前先判断任务类型,是比优化提示词更前置的一步,也是更少被人注意到的一步。
感谢你看到最后,如果你觉得有启发,随手点个赞、在看、转发吧,如果想第一时间收到推送,也可以给我加个星标⭐我们下期见。
我是「AioGeoLab」主理人塔迪Tardi,AioGeoLab是深度洞察AI第一性原理和应用实践的前瞻性研究实验室,目前有两个主要研究方向:
「塔迪GEO判断工程」是基于GEO的价值SEO化,在AI从“说”到“做”的重要跃迁阶段,试图回答,如何让AI敢于行动、不因为责任问题而畏手畏脚,而做的一个前沿研究项目。
「塔迪硅基禅心」是传统东方智慧、未来AI前沿、当下应用实践,深层共鸣的探索。不是用AI解读经典,也不是用经典指导AI。 这是一场跨越2500年的对话,在算法与古老智慧之间,照见意识、智能与存在的本质。
塔迪的微信 - tardyai2025。
