ChatGPT Memory Dreaming:OpenAI 要解决记忆变旧这件事
July 1, 2026 · 12:59 PM

ChatGPT Memory Dreaming:OpenAI 要解决记忆变旧这件事

OpenAI 发布 Dreaming V3,试图把 ChatGPT 的跨对话记忆从用户主动保存的便签,升级为会在后台整理、纠错和随时间更新的状态系统。本文拆解它解决的问题、评估方式、5 倍计算优化的意义,以及仍未公开的关键细节。

2024 年的 ChatGPT 记忆像一张用户主动填写的便签;OpenAI 这次讲的 Dreaming,更像是系统在后台定期整理一本会过期的工作手册。重点不是「记得更多」,而是把跨对话记忆做成一个能更新、能纠错、能扩展到数亿用户的状态系统。OpenAI 在 2026 年 6 月 4 日发布这篇官方博客,并称新系统要优化记忆的新鲜度、连续性和相关性。1

原文讲了什么

这篇博客发布的是 ChatGPT 记忆系统的新一代架构。OpenAI 说,它正在向美国 Plus 和 Pro 用户推出更强、可扩展性更好的记忆合成系统,随后会在几周内扩展到更多国家以及 Free 和 Go 用户。1
OpenAI 对记忆的定义很直白:它让 ChatGPT 学会用户的偏好、项目和约束,使后续对话不用从零开始。原文这句话值得保留:"Memory is what helps ChatGPT learn your preferences, projects, and constraints, allowing future conversations to start from shared context rather than from scratch."1
这不是一次单纯的 UI 更新。OpenAI 把它放在「Research」「Product」「Release」三个标签下,说明它同时涉及系统能力、产品入口和上线节奏。博客里真正有技术含量的部分,是 OpenAI 如何解释「saved memories」和「dreaming」这两类记忆机制的差异。1

从便签到后台整理:记忆系统的三步

OpenAI 把 ChatGPT 记忆的演进拆成三段。第一段是 2024 年 4 月上线的 saved memories:用户在对话里明确要求 ChatGPT 记住某件事,系统再把它写进可管理的记忆列表。原文举的触发方式是「remember I’m traveling to Singapore in July」这类强提示。1
这套方式的问题也很明显:用户没说「请记住」的内容,往往不会进入长期记忆;已经存下来的内容还会随时间变旧,最后变成错误或无关信息。OpenAI 自己的比喻很准确:这像是在和一个会做笔记、但只记下少数内容的人聊天。1
第二段发生在 2025 年 4 月。OpenAI 给 ChatGPT 加入引用聊天历史的能力,并引入第一版 dreaming。它的作用是让 ChatGPT 在后台自动整理记忆,不再只依赖用户明确发出「记住」指令。1
第三段就是这次的 Dreaming V3。OpenAI 说,新架构建立在 dreaming 之上,能力更强,也更省计算资源。过去一年,dreaming 只是补充 saved memories;这次它开始接近一个可以作为共同记忆基础的系统。1
ChatGPT 记忆摘要界面
OpenAI 展示的 Memory summary 页面把系统整理出的用户概况、偏好和可纠错入口放在同一处。1

Dreaming 真正在解决的三个问题

OpenAI 用三个目标描述「好的记忆」:带着有用上下文继续对话、遵守用户偏好和约束、随时间保持当前性。1
第一类是上下文延续。原文用水下摄影器材举例:没有记忆时,模型只能给出一份通用购物清单;有记忆时,模型能记起用户的具体相机、潜水壳和闪光灯组合,直接推荐匹配的 TTL 触发器。这里的关键不是回答更长,而是回答少走弯路。1
第二类是偏好约束。OpenAI 用新加坡旅行规划说明,模型如果记得用户喜欢野生动物摄影、偏好安静晚餐、对酒店空调有要求,就会把行程从「景点清单」改成更贴近个人约束的计划。换成日常场景,素食、预算、地区、工作方式这些偏好都属于同一类问题。1
第三类是时间更新。博客里的短句很重要:"Time doesn’t stop when your chat ends." 如果用户曾说自己 7 月要去新加坡,旅行结束后,系统应该把「准备去」更新为「已经去过」,而不是继续把用户当成仍在新加坡的人。1
这三类目标背后,是同一个工程难题:记忆不是数据库里多存几行文本就够了。它需要判断什么内容值得保留,什么内容已经过期,什么内容在当前问题里相关,以及当两段历史互相冲突时该相信哪一段。OpenAI 在博客里没有公开具体架构图或训练细节,但它反复强调 staleness、correctness 和 scalability,说明瓶颈主要在记忆合成与检索治理,而不是单次对话的上下文长度。1

评估重点:不是记住,而是用对

OpenAI 对记忆的评估不是问「系统存了多少条」,而是看模型在新对话里能不能正确使用过去信息。水下摄影例子衡量的是相关事实召回;新加坡行程例子衡量的是偏好应用;外卖推荐例子衡量的是随时间修正位置和状态。1
这个评估方向是对的。跨对话记忆真正危险的地方,不是忘了某件事,而是记错之后还很自信。比如把一次短期旅行当成长期所在地,把一次临时饮食限制当成永久偏好,或者把用户已经放弃的项目继续当成当前目标。OpenAI 在原文里承认 saved memories 会变旧并变得不正确,Dreaming 的价值就在于让系统自动修订这类状态。1
但原文也留下了几个空白。它没有给出公开基准的样本规模、错误类型分布和具体提升幅度,只说新系统在相关事实召回、偏好应用和时间更新上有改进。对研究读者来说,这意味着博客更像产品研究说明,不是可复现论文。1

为什么 5 倍计算优化很关键

原文最硬的数字是计算成本。OpenAI 说,近期改进把服务 dreaming 所需的计算量降低了约 5 倍,因此才有可能向 Free 用户推出达到质量标准、并且在规模上可承受的版本,同时增加 Plus 和 Pro 用户的记忆容量。1
这句话解释了为什么记忆系统比普通功能更难上线。一次回答消耗的是当前请求的推理资源;记忆还要处理历史对话、后台整理、冲突合并、过期判断和未来检索。用户越多、使用时间越长,后台记忆合成的成本越容易滚雪球。OpenAI 在开头就把问题描述为「数亿用户」和「多年时间跨度」下的陈旧性、正确性和可扩展性挑战。1
这也是 Dreaming V3 的产品意义:如果成本降不下来,跨对话记忆只能是高付费用户的小范围功能;如果成本能降到可服务免费用户,它会变成 ChatGPT 默认体验的一部分。那时用户对模型的期待也会变:他们不再把 ChatGPT 当成每次都要重新交代背景的工具,而会期待它像长期协作对象一样知道上下文。1

读者应该关注什么

对产品和工程团队来说,这篇文章有两个直接信号。
第一,长期个性化不只是 prompt engineering。把「用户偏好」塞进系统提示词,只能解决短窗口里的问题;真正的记忆系统要有写入、合成、可见、纠错、过期和检索策略。OpenAI 这次把 Memory summary 放到可见页面,并允许用户添加、更新信息或指定某些主题何时被提起,说明可控性正在变成记忆产品的一部分。1
第二,记忆能力会改变应用分层。过去很多 AI 应用的差异来自工作流和私有数据接入;如果基础模型产品逐渐拥有稳定的跨对话记忆,轻量个人助手、旅行规划、购物建议、学习陪伴和项目协作类应用都会受到影响。它们要么接入更具体的数据和动作权限,要么在垂直场景里做出比通用记忆更可靠的状态管理。
这篇博客还没有回答隐私边界、敏感推断、错误记忆回滚和企业管理策略这些问题。OpenAI 在文末把用户控制和 FAQ 作为延伸阅读入口,但正文没有展开。对真实用户来说,这些问题不会比 5 倍计算优化更小:一个能自动整理多年聊天历史的系统,必须让用户看得见、改得动、关得掉。1

一句话结论

Dreaming V3 的核心不是让 ChatGPT「更会记笔记」,而是让它把跨对话历史整理成一份会随时间更新的用户状态。OpenAI 还没有公开足够多的评测细节,但这篇博客已经把方向说清楚了:下一阶段的个人 AI 竞争,记忆的新鲜度和可控性会和模型本身的推理能力一样重要。

More from this channel

Related content

  • Sign in to comment.