📌 TL;DR: 大多数企业把HITL（人类在环）当成了审批流程来建，结果是审批疲劳——每个输出都要确认，审批者训练成了无脑点击，真正重要的决策和无害查询得到同样的反应。这不是更安全，是把风险控制机制变成了形式。正确的设计逻辑从风险出发：在AI出错的代价超过人类介入代价的地方，才放裁定节点。四个触发标准：不可逆、高代价、受监管、高爆炸半径。符合这四个标准的决策点，需要人类真实介入；其余的，放开给系统自主处理。一个完整的裁定接口包含四个要素：可量化的触发条件、完整的上下文打包、同步或异步的介入方式、明确的责任归属。这四件事必须在部署阶段就设计清楚，上线后再改代价很高。这份设计是FDE交给判断工程的那道桥：判断工程定义了应该在哪里有人类判断，裁定接口设计定义了系统怎么让人类判断在那里真实发生。认知框架不落进系统设计，只是纸面原则。

FDE裁定接口设计：不是审批流程，是风险边界丨部署阶段交给判断工程的那份图纸

信息图

上一篇讲集成墙，最后说到身份权限墙的应对方向之一是"建立权限边界"。这篇深挖这条线怎么划——哪些决策AI可以自主做，哪些必须交给人类，这条边界画在哪里、由谁来画、怎么在系统里落地。

先说一个很常见的处理方式：搭一套审批系统，遇到AI不确定的输出就发给人审，人批了就继续，人没批就等。听起来合理，实际上这是把一个设计问题当成了流程问题来解决。

两者的区别，这篇重点来讲一下。

NotebookLM的音视频概览，解读的比较通俗易懂，对于时间比较紧张的读者朋友，可以听听，会有启发。

HITL和HOTL：先搞清楚这两件事

在讲裁定接口之前，需要先把两个概念区分开。

HITL（Human-in-the-Loop）要求人类在AI系统执行之前批准或授权一个行为，系统在定义好的检查点暂停并等待。HOTL（Human-on-the-Loop）允许AI自主行动，人类监控输出，保留事后介入的能力。

这不是非此即彼的选择，一个真实的业务工作流里，不同节点会用不同的模式。比如日常客服问询走HOTL加抽样审计，但超过1000美元的退款请求触发强制HITL审批。同一个系统，同一个流程，不同的决策节点，不同的监督密度。

这里有一个容易被忽视的复杂性：Agent在同一个工作流里可能既做低风险决策又做高风险决策。它订了一张机票（低风险），然后在同一个工作流里谈了一份供应商合同（高风险）。监督模式必须是动态的、策略驱动的，而不是给整个Agent贴一个标签然后一刀切。

这就是为什么"搭一套审批系统"不够用——审批系统解决的是流程问题，但在哪些节点触发审批、触发什么级别的审批，这是设计问题，比审批系统本身更重要。

第 5 页.png

审批疲劳：最常见的错误设计

在讲正确的设计之前，先说一个在实践中反复出现的错误。

很多企业在引入AI系统的初期，出于谨慎，把审批设置得很密——几乎每一个输出都要人确认。逻辑上听起来没问题：多一道人工审核，多一层保障。

但实际运行起来，会发生一件事。

如果每一个低风险的只读查询都要人确认，你是在训练审批者“无脑点击”。等到真正重要的高风险决策需要批准时，得到的是和无害查询一样的条件反射式确认。

这个现象叫审批疲劳（Approval Fatigue）。审批者每天面对几十上百个确认请求，绝大多数都没有问题，时间久了，审批这个动作本身就变成了一个习惯性的点击，不再包含真实的判断。当一个真正需要仔细审查的决策混进来，得到的也是同样的反应速度、同样的关注程度、同样的条件反射。

这让HITL从一个风险控制机制，退化成了一个徒有形式的合规动作——人确实在审批，但人的判断力实际上已经不在那里了。

审批疲劳有三种常见的触发方式：

第一种是全量审批——所有输出都经过人工确认，不区分风险高低。这是最直接的触发方式，审批量一旦超过审批者能认真处理的上限，疲劳就开始积累。

第二种是事后补洞——先让系统跑，出了问题再加审批节点。这种方式加的审批点，往往不是真正的风险点，而是上次出问题的地方——把历史故障当成了风险地图，而不是从系统逻辑出发来设计。

第三种是位置错位——审批节点和真实风险点没有对齐。审了不该审的，反而漏了真正需要人类判断的地方。这种错误最难发现，因为系统表面上有HITL，但保护的不是真正需要保护的位置。

第 3 页.png

正确的设计逻辑：从风险出发，不从流程出发

HITL是在自主运行的工作流中，在特定决策点刻意置入人类监督——在AI出错的代价超过人类介入的代价的地方。

第 7 页.png

这句话是裁定接口设计的起点。

设计的问题不是"哪些输出需要人审"，而是"在那个决策点，如果AI判断错了，后果的严重程度是什么"。这两个问题看起来相似，出发点完全不同——前者从流程出发，后者从风险出发。

四个触发裁定的标准：

不可逆：做了之后很难撤回的动作。删除数据、发出外部通信、修改系统权限、触发支付——这类操作一旦执行，撤回的代价很高，有些根本撤不回来。不可逆性本身就是需要人类确认的理由，不用考虑其他条件。

高代价：后果的代价超过了某个阈值。财务支出、合同承诺、影响大量用户的配置变更——代价不只是金钱，还包括声誉、关系、合规风险。这类决策需要设置可量化的触发阈值，不能靠AI自己判断"这个金额算不算大"。

受监管：涉及合规要求的决策需要有人类责任人签字。欧盟AI法案第14条要求高风险AI系统的设计必须支持自然人的有效监督，2026年8月生效。合规不是可选项，涉及监管要求的节点，HITL是强制的，不是设计选择。

高爆炸半径：单个决策的错误会连锁影响下游多个系统或流程。IT运维里，禁用MFA（多因素身份验证）、轮换密钥、修改防火墙规则、分配管理员权限——这类操作的错误会扩散到整个系统；数据层面，写入生产数据库、修改客户属性、删除记录——影响范围可能覆盖几十万条记录。爆炸半径越大，越需要在执行前有人确认。

FDE在部署阶段要做的，是把客户的业务流程过一遍，把符合以上四个标准的决策点逐一标记出来，为每个节点确定用HITL还是HOTL，以及触发条件是什么。

这份标记，就是交给判断工程的那份图纸。

图纸的四个要素

知道在哪里放裁定节点之后，还需要把每个节点的细节设计清楚。一个完整的裁定接口设计，包含四个要素。

触发条件

什么情况下系统暂停，等待人类介入。

触发条件必须是可执行的，不能是"遇到不确定的时候"——不确定是主观判断，没有办法被系统执行。需要翻译成具体的、可量化的规则：金额超过多少、影响用户数超过多少、涉及哪类数据、动作类型是否在预定义的高风险列表里。

触发条件越清晰，系统的行为就越可预测，审批者也知道什么情况下会收到通知，不会被意外打断。

上下文打包

系统暂停之后，给人类审批者呈现什么信息。

审批延误通常来自路由不畅和上下文不完整，而不是人类审批这个步骤本身。审批者收到一条"请审批这个操作"的通知，但没有足够的背景信息来判断，他们要么去找信息（慢），要么就直接批了（不安全）。

上下文打包要回答四个问题：AI在做什么，为什么触发了这个审批节点，可能的选项是什么，不同选择的后果分别是什么。把这四个问题的答案打包给审批者，审批的质量和速度都会显著提升。

介入方式

同步还是异步。

同步HITL：系统暂停，等待审批者确认之后才继续。适合高风险、时间敏感、后果不可逆的节点——系统必须等到人类确认才能动。

异步HOTL：系统记录这个决策，继续执行，审批者在规定时间内可以复查和干预。适合中等风险、速度重要、错误可以在一定时间内纠正的场景。

同步和异步的选择会直接影响工作流的效率——一个需要实时响应的客服系统，不能在每个判断节点都同步等待人工确认。这个选择需要和客户的业务目标对齐，不能只从风险角度看。

责任归属

这个裁定节点，谁有权批，谁的审批不算数。

这不只是系统配置的问题，是组织层面的决策。同一个审批节点，可能需要不同部门、不同级别的人来处理，取决于决策的性质——财务支出需要财务负责人批，合规相关需要法务确认，系统权限修改需要IT主管签字。

第 9 页.png

这件事必须在部署阶段就和客户的管理层确认清楚，写进系统设计里。等到系统上线之后再协商，会发现各方的理解出入很大，而此时系统已经在跑了，改起来代价高。

裁定接口和判断工程的连接

判断工程是认知框架层面的问题：谁来判断，判断什么，什么时候必须有人类裁定，裁定权应该设计在哪里。这是在系统建设之前需要想清楚的问题——把权力结构、判断边界、责任归属在认知层面理清楚。

FDE在部署阶段设计的裁定接口，是把这个认知框架转化成系统里真实存在的控制点。触发条件是"在哪里触发裁定"的系统表达，上下文打包是"给裁定者足够信息"的系统表达，介入方式是"裁定如何发生"的系统表达，责任归属是"谁的裁定有效"的系统表达。

两者的关系是：判断工程定义了应该在哪里有人类判断，裁定接口设计定义了系统怎么在那个地方让人类判断真实发生。

认知框架不落进系统设计，就只是纸面上的原则。系统设计没有认知框架的支撑，就只是一堆没有逻辑的审批节点。两者需要对齐，才能构成一个真正有效的治理机制。

这也是为什么裁定接口设计是FDE在部署阶段最重要的交付物之一——它不只是技术文档，是认知框架和工程实现之间的桥梁。

第 12 页.png

写在最后

裁定接口不是审批系统，不是风控模块，也不是合规要求的形式化应对。

它是一份图纸，画的是：在这个系统里，什么地方AI不应该自己决定，什么地方需要人类真正介入，介入的信息足不足够，介入之后的责任归谁。

设计对了，系统在大多数时候高效自主运行，在真正需要人类判断的地方可靠地暂停，审批者的注意力被保护起来，用在值得用的地方。设计错了，要么陷入审批疲劳，人的判断力形同虚设；要么在错误的地方过度自主，在真正需要人类的地方反而没有刹车。

下一篇进陪跑阶段——集成墙打通了，裁定接口设计好了，系统技术上已经能跑。但让用户真正信任并用起来，是另一件事，也是部署阶段最后、最容易被低估的一关。

感谢你看到最后，如果你觉得有启发，随手点个赞、在看、转发吧，如果想第一时间收到推送，也可以给我加个星标⭐我们下期见。

我是「AioGeoLab」主理人塔迪Tardi，AioGeoLab是深度洞察AI第一性原理和应用实践的前瞻性研究实验室，目前有两个主要研究方向：
「塔迪GEO判断工程」在AI从“说”到“做”进化阶段，试图回答，如何让AI敢于行动、不因为责任问题而畏手畏脚，而做的一个前沿研究项目。
「塔迪硅基禅心」是传统东方智慧、未来AI前沿、当下应用实践，深层共鸣的探索。不是用AI解读经典，也不是用经典指导AI。这是一场跨越2500年的对话，在算法与古老智慧之间，照见意识、智能与存在的本质。
塔迪的微信 - tardyai2025。

FDE裁定接口设计：不是审批流程，是风险边界丨部署阶段交给判断工程的那份图纸#

HITL和HOTL：先搞清楚这两件事#

审批疲劳：最常见的错误设计#

正确的设计逻辑：从风险出发，不从流程出发#

图纸的四个要素#

裁定接口和判断工程的连接#

写在最后#