可靠性设计 | AioGeoLab

模型幻觉率降了，Agent不一定更可靠丨Agent误解系列这两年模型迭代飞快，各家厂商也在持续公布幻觉率改善数据。从机制上讲，这个进步是真实的——通过更好的训练方式、更严格的事实核查、提示词层面的干预，模型生成错误内容的概率确实在降低。有研究显示，针对性的提示词干预能把幻觉率从53%压到23%，降幅接近一半。但这个数字，几乎都是在聊天场景里测出来的。 ...