tgje-139-hallucination-rate-is-not-agent-reliability

模型幻觉率降了,Agent不一定更可靠丨Agent误解系列

模型幻觉率降了,Agent不一定更可靠丨Agent误解系列 这两年模型迭代飞快,各家厂商也在持续公布幻觉率改善数据。从机制上讲,这个进步是真实的——通过更好的训练方式、更严格的事实核查、提示词层面的干预,模型生成错误内容的概率确实在降低。有研究显示,针对性的提示词干预能把幻觉率从53%压到23%,降幅接近一半。 但这个数字,几乎都是在聊天场景里测出来的。 ...

2026年6月4日 · 4 分钟 · 约 1799 字 · 塔迪Tardi