
你说「让Agent自己判断」,但判断的边界在哪里?丨裁定机制落地,需要回答这三个问题
你说「让Agent自己判断」,但判断的边界在哪里?丨裁定机制落地,需要回答这三个问题 一些读者反馈:判断工程的逻辑我懂了,规则覆盖不了边界情况,需要裁定层。Harness Engineering我也看了,执行环境要搭好,不能只靠调教模型。但看完之后,我还是不知道下一步该做什么。 这个困惑是真实的,也是合理的。前面的文章解决的是"为什么",这篇解决"怎么做"。 ...

你说「让Agent自己判断」,但判断的边界在哪里?丨裁定机制落地,需要回答这三个问题 一些读者反馈:判断工程的逻辑我懂了,规则覆盖不了边界情况,需要裁定层。Harness Engineering我也看了,执行环境要搭好,不能只靠调教模型。但看完之后,我还是不知道下一步该做什么。 这个困惑是真实的,也是合理的。前面的文章解决的是"为什么",这篇解决"怎么做"。 ...