📌 TL;DR: 自己用Agent用顺了，是因为积累了两周的隐性知识——什么指令有效、哪条边界不能碰、出错了怎么处理。这些知识在创建者脑子里，不在任何可以转交的地方。客户拿到的是工具，缺少的是这层前提。好的交付本质上是一次知识转移。权限是交付前最重要的一步：从能访问什么、能做什么操作、能做到哪个范围三个维度收紧，起点必须保守。客户第一次使用时能出的最大问题，必须在可接受范围内。文档是真正交到客户手里的产品。五件事必须写清楚：能做什么不能做什么、怎么给任务、结果怎么验收、出错了怎么处理、什么时候必须找人。检验标准只有一个：陌生人看完能不能独立完成一个任务。边界条件要从文档建议变成系统约束：提示词层面硬编码禁止行为、工具层面从权限源头消除风险、输出层面设过滤作为最后防线。越靠近执行层的约束越可靠，越靠近人的提醒越容易被跳过。

Agent不是产品，交付才是——怎么让客户用得住

信息图

你花了两周搭好一个Agent，自己用得很顺。

帮客户处理咨询、整理需求、生成初稿——每个环节都跑通了，你演示的时候效果很好，客户也满意。然后你把它交出去了。

第一周，客户发来消息：Agent给出了一个奇怪的回复，客户不知道是不是该相信它。第二周：Agent做了一件它本来不该做的事，不知道怎么回事。第三周：出了问题，客户不知道该怎么处理，来找你。

你去查，Agent本身没有问题。它的行为，在你的使用习惯下是完全合理的。

问题出在交付。

你交出去的是一个工具，但客户需要的是一套可以独立使用的系统。 这两件事之间的差距，不是功能问题，是知识问题——你对这个Agent积累了两周的隐性理解，什么指令有效、哪条边界不能碰、出了什么问题怎么处理，这些全在你脑子里，一个字都没交出去。

Agent不是产品，交付才是。把Agent搭好只是开始，让客户用得住才是真正要解决的问题。

NotebookLM的音视频概览，解读的比较通俗易懂，对于时间比较紧张的读者朋友，可以听听，会有启发。

为什么"自己用顺了"是个陷阱

搭Agent的人有一个几乎无法避免的认知优势：他们知道这个Agent的"脾气"。

哪种描述方式会让它理解准确，哪种描述方式会让它跑偏——这是经验，不是文档。什么时候的输出可以直接用，什么时候需要复核一遍——这是判断，不是规则。出了问题先检查什么，怎么把任务重新拉回正轨——这是肌肉记忆，不是手册。

这些知识是真实存在的，但它们存在于创建者的脑子里，不存在于任何可以转交的地方。

客户拿到Agent之后，面对的是一个没有这层知识的工具。在他们眼里，Agent的行为有时候清晰，有时候莫名其妙，出了问题也不知道从哪里入手。这不是他们用法有问题，是他们缺少了使用这个Agent所需要的隐性前提。

好的交付，本质上是一次知识转移。把隐性知识显性化，是整个交付设计里最核心的工作。

交付前：权限要重新设计

自己用Agent的时候，权限往往是"够用就好"——有时候为了方便，会开得稍微宽一些。交给客户之前，这个权限配置必须重新审视。

原则只有一个：客户第一次使用时，能出的最大问题，必须在你可以接受的范围内。

从三个维度收紧权限：

能访问什么。 数据库、文件系统、外部API——客户在这个使用场景里需要访问哪些数据，只给这些。不需要访问的数据，即使开了权限也没有用，但一旦Agent出现误操作，这部分数据就成了爆炸半径的一部分。

能做什么操作。 读取、写入、删除、发送——根据实际使用场景，只开必要的操作类型。读取信息的Agent，不应该有写入权限；生成草稿的Agent，不应该有直接发送的权限。写操作和删除操作，是权限配置里最需要谨慎的两类。

能做到哪个范围。 同样是写入权限，能操作哪些记录、哪些客户的数据、哪个文件夹，边界必须明确。范围不明确的权限，是事故发生时追责最难的地方。

权限设计不是一劳永逸的。随着客户对Agent的使用逐渐成熟、信任逐渐建立，权限可以阶段性地扩展——但起点必须保守，不能反过来。

交付时：文档是真正的产品

Agent的系统提示词、工作流配置、工具设置，这些是技术实现。文档，才是交到客户手里的产品。

文档不是给技术人员看的，是给第一次使用这个Agent的普通用户看的。检验标准只有一个：一个完全不了解这个Agent的人，看完文档能不能独立完成一个任务，出了问题能不能自己处理。

有五件事必须写清楚：

这个Agent能做什么，不能做什么。 能做什么，决定了客户知道去哪里用它；不能做什么，同样重要——甚至更重要，因为客户在不知道边界的情况下，最容易在边界附近出问题。两件事都要写，而且要写得一样明确。

怎么给它任务。 有效指令长什么样，提供两到三个具体例子。然后反过来写：哪些描述方式容易导致理解偏差，举出来。这部分是最值得花时间的，因为指令质量直接决定输出质量，而客户在这里最容易踩坑。

结果怎么验收。 Agent做完之后，客户怎么判断结果是对的？验收标准是什么？如果没有明确的验收标准，客户要么过度依赖Agent的输出不加核实，要么对每个结果都持怀疑态度不知道该不该用。两种情况都不好。

出错了怎么处理。 把你自己遇到过的常见错误类型列出来，每种对应一个处理方式。客户遇到问题时，第一反应不应该是找你，而是翻文档——文档设计好了，你才能真正从这个Agent的日常维护里脱身。

什么时候必须找人。 超出Agent能力范围的情况，必须明确列出来，告诉客户遇到这种情况应该找谁、怎么联系。这不是承认Agent不够强，是在帮客户建立正确的使用预期——知道边界在哪里，才能在边界内放心用。

交付后：把"别踩这条线"变成系统约束

文档写了"不要做X"，但人会忘，会误操作，会在某个时刻觉得这条规则可能不适用于这种情况。越靠近人的约束越容易被跳过，越靠近执行层的约束越可靠。

把边界条件从文档建议变成系统约束，有三个层次：

提示词层面的硬编码。 在Agent的系统提示词里明确禁止某些行为——不是提醒，是禁止。比如"不要在未经确认的情况下提及具体价格"、“回复中不包含任何客户的个人联系信息”。这层约束是Agent的内置护栏，不依赖客户记住文档里的某条规则。

工具层面的权限限制。 根本不给Agent开它不该有的工具，从源头消除某类风险。Agent没有发送工具，就不会发出任何东西；Agent没有删除权限，就不可能删掉任何数据。这层约束是最可靠的，因为它不依赖Agent的判断，也不依赖用户的操作。

输出层面的过滤。 对Agent的输出设置过滤层，某些内容类型——比如涉及法律责任的表述、超出服务范围的承诺——不允许直接输出给客户。这层约束是最后一道防线，捕捉前两层没有拦住的情况。

三层约束叠加，不是因为单层不够，是因为每层的覆盖范围不同，组合起来才能把风险压到可以接受的水平。

交付之后：反馈机制才是长期稳定的保障

文档写完、权限设好、约束部署好——交付还没有结束。

客户开始真实使用之后，会遇到你没有预见到的情况：指令方式和你预期的不一样，使用场景比你设计的范围稍微宽一点，某类问题反复出现。这些不是失败，是信息——是改进文档、调整配置、完善约束最好的原材料。

建立一个简单的反馈收集机制：客户遇到问题时有地方记录，你定期回顾这些记录。头几次出问题，不要直接替客户解决——先让他们按文档尝试，看文档能不能覆盖这个情况。文档覆盖了，这次问题解决了，客户也学会了一种处理方式。文档没覆盖，说明文档有盲区，补上去。

客户使用前三个月产生的问题记录，是这个Agent最有价值的质量文档。 比你在交付前写的任何假设都更接近真实使用场景。

写在最后

搭好Agent是技术问题，交付好Agent是设计问题。

权限收紧到最小安全集，文档写到陌生人也能独立使用，边界条件落到系统约束而不只是文字提醒，反馈机制建立起来持续改进——做完这四件事，你交给客户的才是一个可以独立运转的系统，而不是一个只有你能驾驭的黑盒。

Agent不是产品，交付才是。

感谢你看到最后，如果你觉得有启发，随手点个赞、在看、转发吧，如果想第一时间收到推送，也可以给我加个星标⭐我们下期见。

我是「AioGeoLab」主理人塔迪Tardi，AioGeoLab是深度洞察AI第一性原理和应用实践的前瞻性研究实验室，目前有两个主要研究方向：
「塔迪GEO判断工程」是基于GEO的价值SEO化，在AI从“说”到“做”的重要跃迁阶段，试图回答，如何让AI敢于行动、不因为责任问题而畏手畏脚，而做的一个前沿研究项目。
「塔迪硅基禅心」是传统东方智慧、未来AI前沿、当下应用实践，深层共鸣的探索。不是用AI解读经典，也不是用经典指导AI。这是一场跨越2500年的对话，在算法与古老智慧之间，照见意识、智能与存在的本质。
塔迪的微信 - tardyai2025。

Agent不是产品，交付才是——怎么让客户用得住#

为什么"自己用顺了"是个陷阱#

交付前：权限要重新设计#

交付时：文档是真正的产品#

交付后：把"别踩这条线"变成系统约束#

交付之后：反馈机制才是长期稳定的保障#

写在最后#