📌 TL;DR: 自己用Agent用顺了,是因为积累了两周的隐性知识——什么指令有效、哪条边界不能碰、出错了怎么处理。这些知识在创建者脑子里,不在任何可以转交的地方。客户拿到的是工具,缺少的是这层前提。好的交付本质上是一次知识转移。 权限是交付前最重要的一步:从能访问什么、能做什么操作、能做到哪个范围三个维度收紧,起点必须保守。客户第一次使用时能出的最大问题,必须在可接受范围内。 文档是真正交到客户手里的产品。五件事必须写清楚:能做什么不能做什么、怎么给任务、结果怎么验收、出错了怎么处理、什么时候必须找人。检验标准只有一个:陌生人看完能不能独立完成一个任务。 边界条件要从文档建议变成系统约束:提示词层面硬编码禁止行为、工具层面从权限源头消除风险、输出层面设过滤作为最后防线。越靠近执行层的约束越可靠,越靠近人的提醒越容易被跳过。

Agent不是产品,交付才是——怎么让客户用得住

信息图

你花了两周搭好一个Agent,自己用得很顺。

帮客户处理咨询、整理需求、生成初稿——每个环节都跑通了,你演示的时候效果很好,客户也满意。然后你把它交出去了。

第一周,客户发来消息:Agent给出了一个奇怪的回复,客户不知道是不是该相信它。第二周:Agent做了一件它本来不该做的事,不知道怎么回事。第三周:出了问题,客户不知道该怎么处理,来找你。

你去查,Agent本身没有问题。它的行为,在你的使用习惯下是完全合理的。

问题出在交付。

你交出去的是一个工具,但客户需要的是一套可以独立使用的系统。 这两件事之间的差距,不是功能问题,是知识问题——你对这个Agent积累了两周的隐性理解,什么指令有效、哪条边界不能碰、出了什么问题怎么处理,这些全在你脑子里,一个字都没交出去。

Agent不是产品,交付才是。把Agent搭好只是开始,让客户用得住才是真正要解决的问题。

NotebookLM的音视频概览,解读的比较通俗易懂,对于时间比较紧张的读者朋友,可以听听,会有启发。


为什么"自己用顺了"是个陷阱

搭Agent的人有一个几乎无法避免的认知优势:他们知道这个Agent的"脾气"。

哪种描述方式会让它理解准确,哪种描述方式会让它跑偏——这是经验,不是文档。什么时候的输出可以直接用,什么时候需要复核一遍——这是判断,不是规则。出了问题先检查什么,怎么把任务重新拉回正轨——这是肌肉记忆,不是手册。

这些知识是真实存在的,但它们存在于创建者的脑子里,不存在于任何可以转交的地方。

客户拿到Agent之后,面对的是一个没有这层知识的工具。在他们眼里,Agent的行为有时候清晰,有时候莫名其妙,出了问题也不知道从哪里入手。这不是他们用法有问题,是他们缺少了使用这个Agent所需要的隐性前提。

好的交付,本质上是一次知识转移。把隐性知识显性化,是整个交付设计里最核心的工作。


交付前:权限要重新设计

自己用Agent的时候,权限往往是"够用就好"——有时候为了方便,会开得稍微宽一些。交给客户之前,这个权限配置必须重新审视。

原则只有一个:客户第一次使用时,能出的最大问题,必须在你可以接受的范围内。

从三个维度收紧权限:

能访问什么。 数据库、文件系统、外部API——客户在这个使用场景里需要访问哪些数据,只给这些。不需要访问的数据,即使开了权限也没有用,但一旦Agent出现误操作,这部分数据就成了爆炸半径的一部分。

能做什么操作。 读取、写入、删除、发送——根据实际使用场景,只开必要的操作类型。读取信息的Agent,不应该有写入权限;生成草稿的Agent,不应该有直接发送的权限。写操作和删除操作,是权限配置里最需要谨慎的两类。

能做到哪个范围。 同样是写入权限,能操作哪些记录、哪些客户的数据、哪个文件夹,边界必须明确。范围不明确的权限,是事故发生时追责最难的地方。

权限设计不是一劳永逸的。随着客户对Agent的使用逐渐成熟、信任逐渐建立,权限可以阶段性地扩展——但起点必须保守,不能反过来。


交付时:文档是真正的产品

Agent的系统提示词、工作流配置、工具设置,这些是技术实现。文档,才是交到客户手里的产品。

文档不是给技术人员看的,是给第一次使用这个Agent的普通用户看的。检验标准只有一个:一个完全不了解这个Agent的人,看完文档能不能独立完成一个任务,出了问题能不能自己处理。

有五件事必须写清楚:

这个Agent能做什么,不能做什么。 能做什么,决定了客户知道去哪里用它;不能做什么,同样重要——甚至更重要,因为客户在不知道边界的情况下,最容易在边界附近出问题。两件事都要写,而且要写得一样明确。

怎么给它任务。 有效指令长什么样,提供两到三个具体例子。然后反过来写:哪些描述方式容易导致理解偏差,举出来。这部分是最值得花时间的,因为指令质量直接决定输出质量,而客户在这里最容易踩坑。

结果怎么验收。 Agent做完之后,客户怎么判断结果是对的?验收标准是什么?如果没有明确的验收标准,客户要么过度依赖Agent的输出不加核实,要么对每个结果都持怀疑态度不知道该不该用。两种情况都不好。

出错了怎么处理。 把你自己遇到过的常见错误类型列出来,每种对应一个处理方式。客户遇到问题时,第一反应不应该是找你,而是翻文档——文档设计好了,你才能真正从这个Agent的日常维护里脱身。

什么时候必须找人。 超出Agent能力范围的情况,必须明确列出来,告诉客户遇到这种情况应该找谁、怎么联系。这不是承认Agent不够强,是在帮客户建立正确的使用预期——知道边界在哪里,才能在边界内放心用。


交付后:把"别踩这条线"变成系统约束

文档写了"不要做X",但人会忘,会误操作,会在某个时刻觉得这条规则可能不适用于这种情况。越靠近人的约束越容易被跳过,越靠近执行层的约束越可靠。

把边界条件从文档建议变成系统约束,有三个层次:

提示词层面的硬编码。 在Agent的系统提示词里明确禁止某些行为——不是提醒,是禁止。比如"不要在未经确认的情况下提及具体价格"、“回复中不包含任何客户的个人联系信息”。这层约束是Agent的内置护栏,不依赖客户记住文档里的某条规则。

工具层面的权限限制。 根本不给Agent开它不该有的工具,从源头消除某类风险。Agent没有发送工具,就不会发出任何东西;Agent没有删除权限,就不可能删掉任何数据。这层约束是最可靠的,因为它不依赖Agent的判断,也不依赖用户的操作。

输出层面的过滤。 对Agent的输出设置过滤层,某些内容类型——比如涉及法律责任的表述、超出服务范围的承诺——不允许直接输出给客户。这层约束是最后一道防线,捕捉前两层没有拦住的情况。

三层约束叠加,不是因为单层不够,是因为每层的覆盖范围不同,组合起来才能把风险压到可以接受的水平。


交付之后:反馈机制才是长期稳定的保障

文档写完、权限设好、约束部署好——交付还没有结束。

客户开始真实使用之后,会遇到你没有预见到的情况:指令方式和你预期的不一样,使用场景比你设计的范围稍微宽一点,某类问题反复出现。这些不是失败,是信息——是改进文档、调整配置、完善约束最好的原材料。

建立一个简单的反馈收集机制:客户遇到问题时有地方记录,你定期回顾这些记录。头几次出问题,不要直接替客户解决——先让他们按文档尝试,看文档能不能覆盖这个情况。文档覆盖了,这次问题解决了,客户也学会了一种处理方式。文档没覆盖,说明文档有盲区,补上去。

客户使用前三个月产生的问题记录,是这个Agent最有价值的质量文档。 比你在交付前写的任何假设都更接近真实使用场景。


写在最后

搭好Agent是技术问题,交付好Agent是设计问题。

权限收紧到最小安全集,文档写到陌生人也能独立使用,边界条件落到系统约束而不只是文字提醒,反馈机制建立起来持续改进——做完这四件事,你交给客户的才是一个可以独立运转的系统,而不是一个只有你能驾驭的黑盒。

Agent不是产品,交付才是。


感谢你看到最后,如果你觉得有启发,随手点个赞、在看、转发吧,如果想第一时间收到推送,也可以给我加个星标⭐我们下期见。

我是「AioGeoLab」主理人塔迪Tardi,AioGeoLab是深度洞察AI第一性原理和应用实践的前瞻性研究实验室,目前有两个主要研究方向:

塔迪GEO判断工程」是基于GEO的价值SEO化,在AI从“说”到“做”的重要跃迁阶段,试图回答,如何让AI敢于行动、不因为责任问题而畏手畏脚,而做的一个前沿研究项目。

塔迪硅基禅心」是传统东方智慧、未来AI前沿、当下应用实践,深层共鸣的探索。不是用AI解读经典,也不是用经典指导AI。 这是一场跨越2500年的对话,在算法与古老智慧之间,照见意识、智能与存在的本质。
塔迪的微信 - tardyai2025