📌 TL;DR: "Agent跑不好先改提示词"这个习惯,在很多场景下是对的——但它有一个盲区:有些任务不管怎么优化描述,都解决不了结构层面的不匹配。 三类任务天然和Agent不匹配:依赖此刻才有的实时私有信息的任务、"对不对"由个人主观偏好定义的任务、做错了代价不可挽回且事前难以验证的任务。这三类的共同特点是,问题出在任务结构里,不在输入描述里。 这三类任务不是完全不能用Agent,是角色要变。实时信息依赖型,你来补充它拿不到的上下文;强主观判断型,让它做初稿你来定方向;高不可逆低可验证型,让它做参考,专业判断留给人。 在启动Agent之前多问一个问题:这个任务跑不好,是描述问题,还是结构问题?这一个问题,能省掉很多无效的提示词打磨。

不是你没说清楚,是这类任务天然不适合Agent丨Agent误解系列

信息图

用了Agent一段时间之后,很多人会形成一个固定动作:任务跑不好,回头改提示词。

这个逻辑有它成立的地方。提示词写得更清楚,Agent确实经常跑得更好。于是"描述清楚"慢慢成了一种万能解——Agent出问题,先检查自己有没有说清楚,再考虑别的。

但有一类失败,不管你怎么打磨描述都解决不了。不是你没说清楚,是这个任务的结构和Agent的工作方式本质上不匹配。你在优化输入,但问题出在任务本身。

NotebookLM的音视频概览,解读的比较通俗易懂,对于时间比较紧张的读者朋友,可以听听,会有启发。


不匹配一:任务依赖"此刻才有的信息"

Agent的知识有截止日期。它在训练时看过海量信息,但训练结束之后的世界,它不知道。即便接入了搜索工具,它能查到的也是已经公开、已经落地成文字的内容——而不是此刻正在发生、还没有形成记录的动态。

举一个具体的情况。有人让Agent帮他分析一个候选人,判断要不要发offer。职位要求写得很详细,候选人简历也给得很完整。Agent给出了一份逻辑严密的分析。

但有一件事Agent不知道:这个团队上周刚调整了方向,原本这个岗位需要的技能组合已经变了。这个信息存在于昨天下午的内部会议记录里,还没有同步到任何公开文档。

这不是描述问题。候选人信息写得再详细,Agent也不知道它不知道的事。任何依赖"你的私有实时信息"才能做出正确判断的任务,都有这个结构性缺口。描述得再清楚,填不上的还是填不上。


不匹配二:任务的"对"由你的偏好定义

有些任务,没有客观的对错,只有"你觉得对不对"。Agent给出的是训练数据里概率最高的答案,也就是"通常情况下大多数人会认为合理的版本"。这两件事经常不一样。

一个编辑让Agent帮她改一篇稿子,要求是"保持原有风格,语言更流畅"。Agent改完,她看了一眼,觉得不对——味道变了,不是她想要的那个感觉。她改了提示词,加了更多风格描述,再跑了一遍。还是不对。又改,又跑。

问题在哪里?她脑子里那个"对"的感觉,是她在这个行业做了十年积累下来的审美判断,是私有的、隐性的、很难用语言完整外化的东西。Agent拿到的,永远只是她能说出口的那部分。说不出口的那部分,才是这个任务最难的地方。

只要"对不对"的标准存在于你的主观感受里,而不是可以客观检验的条件里,Agent就只能做参考,不能做主力。 它给的是合理,不是你要的那个对。这不是提示词能弥补的距离。


不匹配三:做错了,代价不可挽回

第三类不匹配,不是Agent做不到,是做错了你承受不起。

一个创业公司的法务负责人,让Agent帮他起草一份合同条款,涉及知识产权归属。他把情况描述得很详细:双方背景、合作模式、核心诉求。Agent给出了一份措辞专业、结构完整的条款。

他发出去了。对方律师看完,指出其中一个条款在他们所在地区的司法管辖下,表述方式会导致完全相反的法律效果——知识产权实际上归了对方。

不是描述不够清楚。是这类任务的风险结构决定了它不适合全程交给Agent主导:可验证性低(你很难在发出去之前判断对不对)、不可逆性高(发出去签了就算数)。这两个条件同时成立的任务,Agent能做辅助,不能最终决定。


知道不匹配,才能用对位置

这三类任务,不是完全不能用Agent。是Agent在这里的角色要变。

实时信息依赖型:Agent负责处理你已有的信息,你来补充它拿不到的实时上下文。

强主观判断型:Agent做初稿、做变体,你来判断哪个方向对,不是让它直接产出终稿。

高不可逆低可验证型:Agent做素材、做参考、做草稿,专业判断和最终确认留给有资质的人来做。

任务结构不变,改变的是Agent在其中承担的位置。

知道这三类之前,你会以为每一次失败都是提示词的问题,反复打磨,反复失望。知道之后,你能更快判断:这次跑不好,是我没说清楚,还是这个任务本来就不该全权交给它?

这一个问题想清楚,能省掉很多无效的打磨。


写在最后

提示词工程是真实有效的,但它有边界。边界在于:它能优化Agent在合适任务里的表现,但改变不了一个任务本身的结构性不匹配。

描述清楚是入场条件,不是万能钥匙。 在用Agent之前先判断任务类型,是比优化提示词更前置的一步,也是更少被人注意到的一步。


感谢你看到最后,如果你觉得有启发,随手点个赞、在看、转发吧,如果想第一时间收到推送,也可以给我加个星标⭐我们下期见。

我是「AioGeoLab」主理人塔迪Tardi,AioGeoLab是深度洞察AI第一性原理和应用实践的前瞻性研究实验室,目前有两个主要研究方向:
塔迪GEO判断工程」是基于GEO的价值SEO化,在AI从“说”到“做”的重要跃迁阶段,试图回答,如何让AI敢于行动、不因为责任问题而畏手畏脚,而做的一个前沿研究项目。
塔迪硅基禅心」是传统东方智慧、未来AI前沿、当下应用实践,深层共鸣的探索。不是用AI解读经典,也不是用经典指导AI。 这是一场跨越2500年的对话,在算法与古老智慧之间,照见意识、智能与存在的本质。
塔迪的微信 - tardyai2025