
光有裁定权还不够:Harness Engineering丨判断工程的另一半
光有裁定权还不够:Harness Engineering丨判断工程的另一半 Agent能力越强,一个问题就越绕不开: 你把权力边界划清楚了,裁定机制也设计好了,但Agent在实际执行过程中还是会出问题。不是越界的问题,是跑着跑着跑偏了——工具调用出错、上下文膨胀导致遗忘、多个Agent协作时指令漂移、一个环节的小错误被下一个环节放大成大错误。 ...

光有裁定权还不够:Harness Engineering丨判断工程的另一半 Agent能力越强,一个问题就越绕不开: 你把权力边界划清楚了,裁定机制也设计好了,但Agent在实际执行过程中还是会出问题。不是越界的问题,是跑着跑着跑偏了——工具调用出错、上下文膨胀导致遗忘、多个Agent协作时指令漂移、一个环节的小错误被下一个环节放大成大错误。 ...