
Agent越来越聪明,但翻车率并没有减少丨Harness Engineering
Agent越来越聪明,但翻车率并没有减少丨Harness Engineering 凌晨三点,没有人在盯着屏幕。 Agent已经独立跑了四个小时。任务是爬取一批竞品数据,整理成报告。Prompt写得很细,模型用的是最新的,工具调用逻辑也测试过。 然后它撞上了一个接口限流报错。 它重试了。又报错。又重试。就这样循环了两个小时,直到你早上起来看到账单通知,才发现它还在原地转圈。数据没有,报告没有,Token烧了一大笔。 ...








