AI Agent为什么总是"失忆"——它的记忆,其实是三个完全不同的东西

你大概知道AI Agent会"失忆"。
但你可能不知道,它其实有三套完全不同的记忆系统——同时运行,互不打通,各有各的死穴。
你以为的"它忘了",背后可能是三种完全不同的原因。搞清楚是哪种,应对方式天差地别。
* * *NotebookLM的音视频概览,解读的比较通俗易懂,对于时间比较紧张的读者朋友,可以听听,会有启发。
它不是在"记",它是在"看"
理解Agent记忆,得先打破一个根深蒂固的误解:Agent处理信息的方式,不像人脑,更像一张桌子。
人脑的记忆是连续的。你今天经历的事,会在睡眠中被整理、巩固,明天醒来还在。你不需要把昨天发生的事重新"放回脑子里",它本来就在那里。
Agent不一样。它每次工作,只能处理当前摆在桌上的信息。桌上有什么,它就用什么思考;桌上没有,它就不知道。这张桌子,就是我们常说的Context窗口——对话开始时铺开,对话结束时收走,下次重新铺一张新的。
所以它不是在"记",它是在"看"。这个区别,决定了你用Agent时90%的体验好坏。
三层记忆,各司其职,各有死穴
但如果只有这张桌子,Agent就真的什么都记不住了。实际上,现代AI Agent的记忆系统有三层,分别承担不同的职责——只是这三层各管各的,不会自动流转,更不会主动帮你同步。
第一层:工作台(短期记忆)
这就是Context窗口本身。当前对话里你说的、它回的、工具返回的结果,全在这里。对话结束,清空归零,不留痕迹。
工作台有两个关键限制。第一是容量有限——不同产品和模型的上限不同,但都是有限的。第二是满了就忘——不是主动删除最不重要的内容,而是物理上放不下了,最前面的内容会开始被截掉。你在对话最开头交代的背景信息,往往是最先消失的那批。
这解释了为什么长任务容易"跑偏"——不是Agent变笨了,是它的工作台满了,最开始设定的目标已经不在桌上了。
第二层:档案柜(长期记忆)
跨会话保存的信息,存在外部数据库或文件里。下次对话开始时,Agent会去检索,把"最相关的几条"取出来,注入当前的工作台。
注意这里有个关键细节:它不是把档案柜里的东西全部读进来,而是检索。
这意味着两件事。一,档案柜再大,每次能用的也只有检索命中的那几条。二,检索质量直接决定记忆质量。如果存进去的是一堆流水账,检索出来的也是流水账;如果关键信息没被正确标记,它就很可能在你最需要的时候找不到。
档案柜的死穴是:找到的不一定是你最需要的。
第三层:本能(参数记忆)
这层最容易被忽视,但其实一直在工作。这是训练进模型权重里的知识——历史事件、常识、语言规则、行业背景。不需要检索,永远在线,你问什么它都能直接调用。
但它有一条铁律:训练截止后不再更新。你跟它讲再多新发生的事、新出现的产品、刚刚定下的决策,都改变不了它"骨子里"已经固化的知识。这也是为什么当你问它最近的行业动态,它有时候会自信地告诉你一个几个月前的旧答案。
三层记忆放在一起,你会发现一件有点讽刺的事:最灵活、最实时的工作台,用完就走;最稳定、最持久的本能,又改不了。真正能跨会话保留信息的档案柜,偏偏是最考验检索准确性的那层。
两种哲学:OpenClaw和Hermes怎么解这道题
理解了三层结构,再来看真实产品,会发现一件有意思的事:面对同样的记忆难题,不同的Agent产品给出了截然不同的答案。
OpenClaw和Hermes是目前最受关注的两个开源Agent框架。两者都把长期记忆存成本地Markdown文件,但在"怎么管理这个档案柜"这件事上,走了完全不同的路。
OpenClaw:透明第一,文件即真理
OpenClaw的逻辑很直接:与其把记忆藏在只有机器看得懂的数据库里,不如存成普通的Markdown文件,人看得见、摸得着、随时能改。MEMORY.md存你的偏好和关键决策,每日日志记当天的工作上下文,检索时用关键词和语义搜索加权混合,70%靠语义、30%靠关键词精确匹配。
为了解决"档案柜越来越乱"的问题,OpenClaw引入了一个叫"Dreaming"的机制——定时让Agent自己回顾日志,把值得长期保留的内容升级到MEMORY.md,不重要的就留在日志里慢慢老化。相当于让Agent自己定期整理档案柜,而不是每条信息都无差别堆进去。
代价是:OpenClaw倾向于把当天的完整日志塞进工作台,信息最全,但Token消耗也最高。档案柜越丰富,每次对话的成本就越高。
Hermes:克制第一,缓存即护城河
Hermes的逻辑则非常克制。它同样用Markdown文件存长期记忆,但直接对文件大小设了硬上限:MEMORY.md最多2200字符,USER.md最多1375字符。超出上限,就必须删旧的才能写新的。
为什么要这么克制?因为Hermes把system prompt做成了session级缓存——稳定的system prompt前缀可以节省大量Token处理成本。一旦记忆文件频繁变动,缓存失效,成本反而更高。宁可少存,也要保持稳定。
但少存不等于丢失。Hermes还维护了一套可搜索的历史会话归档——关键事实放长期记忆(随时在线),历史细节放归档(需要时再查)。两者职责分得很清楚,不混在一起。
两种设计背后是同一个矛盾
OpenClaw追求丰富,Hermes追求精炼。但两者解决的是同一个问题:档案柜越丰富,Token成本越高;越克制,又怕漏掉重要信息。这个矛盾没有标准答案,只有适合你场景的选择。
日常使用、不在乎Token成本、希望Agent了解你越多越好——OpenClaw的哲学更适合你。长期运行、成本敏感——Hermes的克制反而是优势。
知道了这三层,你能做什么
这不是一份技巧清单。是从底层机理推出来的三条操作逻辑:
工作台是你唯一能主动控制的实时层。 关键信息不要假设Agent"记得"——它只记得当前桌上有的。每次开启重要任务,主动把核心背景放进当前对话,不要依赖它自己去检索。
存进档案柜的内容要精炼,不要流水账。 档案柜靠检索,检索靠标记质量。“今天开会讨论了很多事情"存进去没有用;“项目交付日期定为6月15日,优先级高于功能完整性"存进去才有用。你存什么,决定了它将来能找到什么。
长任务要主动设检查点。 不能一口气跑到底,工作台是有容量上限的。每隔一段,让Agent把当前进展和关键决策整理成摘要,这份摘要就是下一段任务的起点,不至于跑偏了才发现。
写在最后
Agent的三层记忆——工作台、档案柜、本能——各司其职,但各有死穴,而且不会自动帮你打通。工作台用完即走,档案柜检索不一定准,本能改不了。
知道它的记忆是怎么工作的,你就不会再怪它"又忘了”。因为从它的角度来看,它没有忘——它从来就没有你以为的那种记忆。
真正的问题不是"怎么让它记更多”,而是"你往它桌上放什么"。
我是「AioGeoLab」主理人塔迪Tardi,AioGeoLab是深度洞察AI第一性原理和应用实践的前瞻性研究实验室,目前有两个主要研究方向:
「塔迪GEO判断工程」是基于GEO的价值SEO化,在AI从“说”到“做”的重要跃迁阶段,试图回答,如何让AI敢于行动、不因为责任问题而畏手畏脚,而做的一个前沿研究项目。
「塔迪硅基禅心」是传统东方智慧、未来AI前沿、当下应用实践,深层共鸣的探索。不是用AI解读经典,也不是用经典指导AI。 这是一场跨越2500年的对话,在算法与古老智慧之间,照见意识、智能与存在的本质。
塔迪的微信 - tardyai2025。
