
模型幻觉率降了,Agent不一定更可靠丨Agent误解系列
模型幻觉率降了,Agent不一定更可靠丨Agent误解系列 这两年模型迭代飞快,各家厂商也在持续公布幻觉率改善数据。从机制上讲,这个进步是真实的——通过更好的训练方式、更严格的事实核查、提示词层面的干预,模型生成错误内容的概率确实在降低。有研究显示,针对性的提示词干预能把幻觉率从53%压到23%,降幅接近一半。 但这个数字,几乎都是在聊天场景里测出来的。 ...

模型幻觉率降了,Agent不一定更可靠丨Agent误解系列 这两年模型迭代飞快,各家厂商也在持续公布幻觉率改善数据。从机制上讲,这个进步是真实的——通过更好的训练方式、更严格的事实核查、提示词层面的干预,模型生成错误内容的概率确实在降低。有研究显示,针对性的提示词干预能把幻觉率从53%压到23%,降幅接近一半。 但这个数字,几乎都是在聊天场景里测出来的。 ...