2026/3/29 16:16:49
网站建设
项目流程
网站开发方向 英语翻译,课程网站资源建设小结,网站的电子画册怎么做,建设仿优酷视频网站文章提出Agent记忆分类框架#xff0c;核心维度是关系对象#xff08;用户、自我、世界、他者#xff09;#xff0c;辅助维度包括抽象层次、时间跨度和可共享性。不同记忆类型需差异化管理。设计时需权衡资源分配、动态更新、一致性和隐私保护#xff0c;记忆边界决定Age…文章提出Agent记忆分类框架核心维度是关系对象用户、自我、世界、他者辅助维度包括抽象层次、时间跨度和可共享性。不同记忆类型需差异化管理。设计时需权衡资源分配、动态更新、一致性和隐私保护记忆边界决定Agent能力边界从记什么到为何记是理解Agent记忆的关键。Agent 记忆的分类学从记什么到为何记当我们谈论 Agent 的记忆时最容易想到的是保存对话历史。但这只是冰山一角。记忆的边界决定了 Agent 的能力边界。一个只记得对话内容的 Agent和一个能记住用户偏好、自身经验、世界知识的 Agent是完全不同的存在。本文尝试建立一个 Agent 记忆的分类框架。不是为了学术上的完备性而是为了回答一个实际问题当我们设计 Agent 的记忆系统时应该考虑哪些维度一、核心维度我与谁的关系如果要找一个最本质的分类方式我认为是关系对象。Agent 的记忆本质上是关于关系的记忆。这些关系可以归纳为四类这四类关系对应四类记忆服务于四种不同的目标。1.1 关于用户的记忆个性化的基础核心问题用户是谁我们是什么关系这是目前 Agent 记忆系统最关注的维度因为它直接服务于个性化——让 Agent 能够根据用户的特点调整自己的行为。关于用户的记忆可以细分为几个层次用户画像User Profile这是最基础的一层记录用户的静态属性• 身份信息职业、角色、技术栈• 背景知识专业领域、经验水平• 偏好设置语言风格、详细程度、交互方式例如“用户是后端工程师主要使用 Python 和 Go偏好简洁的解释风格不需要太多入门级说明。”这类记忆相对稳定更新频率低但检索频率高——几乎每次交互都需要参考。用户意图User Intent比画像更动态的一层记录用户的目标和待办事项• 长期目标“用户想要重构这个项目的认证模块”• 进行中的任务“用户正在排查一个内存泄漏问题”• 悬而未决的事项“用户提到想学 Rust但还没开始”这类记忆服务于 Agent 的主动性。当 Agent 知道用户的长期目标它就能在合适的时机提供相关的建议而不是被动地等待指令。用户状态User State最动态的一层记录用户的即时状态• 情绪状态用户今天似乎比较急躁• 工作状态用户正在赶一个紧急 deadline• 上下文状态用户刚从一个会议中出来这类记忆的挑战在于时效性——它需要被快速感知快速使用也需要快速过期。一个用户昨天的情绪状态对今天的交互意义不大。关系历史Relationship History还有一类记忆不完全属于用户信息而是我们之间的关系• 信任程度用户愿意让我直接修改代码还是只看建议• 协作模式用户喜欢我主动还是被动详细还是简洁• 沟通风格我们之间形成了怎样的默契这类记忆是双方共同创造的不是单方面的用户属性。就像老朋友之间的默契——不是你的性格不是我的性格而是我们在一起时的样子。1.2 关于自我的记忆Agent 的自知之明核心问题我是谁我能做什么我不能做什么这是一个被严重忽视的维度。当前大多数 Agent 对自己没有持久的认知——它不记得自己上次做过什么不知道自己擅长什么也不清楚自己的局限在哪里。关于自我的记忆包括能力认知Capability Awareness• 我擅长什么代码生成、文档写作、数据分析……• 我不擅长什么实时信息获取如果没有工具、长期记忆如果没有存储• 我的边界在哪里什么任务我可以完成什么任务我应该拒绝或寻求帮助这类记忆服务于可靠性。一个知道自己能力边界的 Agent不会轻易承诺做不到的事也不会在擅长的领域过度谦虚。经验积累Experience Accumulation• 成功案例这类问题我用这个方法解决过• 失败教训上次这样做导致了问题• 技能模式处理 X 类任务的有效流程这类记忆是 Agent进化的基础。不同于参数层面的训练这是运行时的在线学习。一个能积累经验的 Agent会随着使用变得越来越好。处理风格Processing Style• 回答偏好我倾向于怎样组织回答• 决策倾向面对不确定性时我倾向于保守还是激进• 思考模式我习惯怎样分解问题这类记忆让 Agent 具有某种个性——不是预设的人格而是在长期交互中自然形成的风格。1.3 关于世界的记忆有效行动的前提核心问题世界是什么样的事物如何运作Agent 不是活在真空中的。它需要对外部世界有认知才能有效地行动。领域知识Domain Knowledge通过工具如搜索、文档检索获取的实时信息• 技术文档某个 API 的最新用法• 行业动态某个框架的最新版本• 事实信息某个公司的最新产品这类记忆的特点是外源性——它不是从交互中学习的而是主动获取的。挑战在于保持时效性过期的知识可能比没有知识更危险。环境状态Environment State关于当前工作环境的认知• 代码库结构项目用什么框架、目录怎么组织• 项目状态当前在哪个分支、有哪些未提交的改动• 依赖关系这个模块依赖哪些其他模块这类记忆对于代码类 Agent 尤其重要。一个不了解项目结构的 Agent即使有强大的代码能力也很难做出合适的修改。因果模型Causal Model关于如果…那么…的认知• 操作后果执行这个命令会发生什么• 风险评估这个改动可能影响哪些地方• 依赖链条A 依赖 BB 依赖 C改 C 会影响 A这类记忆让 Agent 能够预判而不只是反应。它是从执行者到规划者的关键。1.4 关于他者的记忆协作的基础核心问题其他 Agent 是谁我们如何协作在 Multi-Agent 系统中Agent 不再是孤立的个体而是网络中的节点。这时候关于其他 Agent 的记忆就变得重要。他者画像Other Agent Profile• 能力边界Agent A 擅长代码审查Agent B 擅长测试生成• 可用性Agent A 目前负载较高• 可靠性Agent A 在 X 类任务上的成功率协作协议Collaboration Protocol• 分工模式我们通常怎样分配任务• 通信格式我们用什么格式交换信息• 冲突解决意见不一致时怎么处理信任关系Trust Relationship• 信任程度Agent A 的输出我可以直接采用还是需要验证• 历史记录我们之前协作的结果如何• 风险控制如果 Agent A 出错影响范围有多大这类记忆目前还处于早期探索阶段但随着 Multi-Agent 系统的发展它会变得越来越重要。二、辅助维度一抽象层次核心维度回答了记谁的问题但还有一个问题记到什么程度同样是关于用户的记忆可以有不同的抽象层次层级类型内容Level 3模式 / 规律“用户喜欢简洁风格” “用户倾向于先看整体再看细节”Level 2事实 / 总结“用户是后端工程师” “用户的项目使用 React TypeScript”Level 1原始记录“2024-01-05 14:32 用户说’帮我简短点’” “2024-01-06 09:15 用户说’这个解释太长了’”Level 1原始记录最具体的一层保留完整的交互细节• 具体对话片段• 执行日志• 时间戳和上下文优点是信息完整缺点是冗余、难以检索、存储成本高。Level 2事实/总结从原始记录中提炼出的结构化信息• 用户属性“后端工程师”、“5年经验”• 项目信息“使用 React”、“部署在 AWS”• 事件摘要“帮用户解决了一个内存泄漏问题”这一层是可检索的基础。当需要回答用户是做什么的时不需要遍历所有对话直接查这一层即可。Level 3模式/规律从多个事实中抽象出的更高层次认知• 偏好模式“用户喜欢简洁风格”从多次太长了的反馈中归纳• 行为规律“用户通常在下午处理复杂任务”• 因果关系“当用户说’随便’时通常意味着他在赶时间”这一层是泛化能力的基础。它让 Agent 能够举一反三而不只是机械地匹配历史记录。层次之间的流动三个层次不是孤立的而是持续流动的• 原始记录不断产生• 定期或触发式抽象成事实• 事实积累到一定程度归纳成模式• 模式指导理解但也需要被新事实验证和修正设计记忆系统时需要决定每一层存多少存储预算什么时候触发抽象计算预算层次之间如何关联一致性保证三、辅助维度二时间跨度另一个重要的切面是记多久。记忆层级作用范围 / 内容生命周期长期记忆跨会话持久化用户画像、经验积累、关系历史数周到永久会话记忆单次会话内对话历史、任务上下文、临时状态会话开始到结束工作记忆当前任务正在处理的上下文、中间结果、待确认的信息任务开始到完成工作记忆Working Memory最短暂的一层服务于当前任务• 正在处理的文件内容• 刚才搜索到的结果• 用户刚刚提供的上下文这一层对应的是 LLM 的 Context Window。它的容量有限需要精心管理——什么放进去什么留在外面是一个持续的决策。会话记忆Session Memory中等时间跨度覆盖一次完整的交互会话• 这次对话聊了什么• 做了哪些操作• 还有什么没完成会话结束后这层记忆面临一个选择丢弃还是沉淀到长期记忆如果沉淀沉淀什么这需要一个记忆整理的过程。长期记忆Long-term Memory跨会话持久化的信息• 用户画像持续更新• 经验积累不断丰富• 关系历史逐渐深化这层记忆的挑战是容量管理和时效性维护。不能无限增长需要有遗忘机制也不能一成不变需要能被更新和修正。与人类记忆的对应这三层记忆在人类认知中也有对应Agent 记忆人类记忆特点工作记忆工作记忆Working Memory容量有限7±2、快速衰退会话记忆短期记忆Short-term Memory需要复述才能保持长期记忆长期记忆Long-term Memory容量大、可持久、需要编码和检索这个对应不是巧合。人类认知经过数百万年的演化形成了这样的分层结构一定有其内在的合理性。Agent 的记忆系统设计可以从中借鉴。四、辅助维度三可共享性还有一个常被忽视但很重要的维度这个记忆能不能共享给别人数据级别内容说明共享规则绝对私有用户个人信息、敏感偏好、隐私数据永远不能跨用户共享可匿名共享脱敏后的经验、技能模式、解决方案“处理 X 类问题的有效方法”不含用户信息公共知识通用领域知识、最佳实践、文档信息所有 Agent 可共享这个维度之所以重要是因为它决定了 Agent 能否进行群体层面的学习。绝对私有有些记忆涉及用户隐私必须严格隔离• 用户的个人信息• 用户的敏感偏好• 与用户的私密对话这类记忆只能服务于单一用户不能以任何形式泄露给其他用户或其他 Agent。可匿名共享有些记忆经过脱敏后可以成为集体知识• “处理 React 性能问题的一般方法”从服务用户 A 的经验中提炼• “排查内存泄漏的常见步骤”从多次任务中归纳• “与用户沟通技术方案的有效模式”从多次交互中学习这类记忆是 Agent群体进化的基础。一个 Agent 从用户 A 那里学到的经验经过抽象和脱敏后可以帮助服务用户 B。公共知识有些信息本身就是公开的• 技术文档• 开源代码• 行业标准这类信息可以自由共享甚至应该主动同步保证所有 Agent 都使用最新版本。隐私与进化的张力可共享性维度揭示了一个根本性的张力隐私保护与集体学习之间的矛盾。• 如果完全不共享每个 Agent 都要从零开始学习效率低下• 如果过度共享用户隐私面临风险好的记忆系统需要在两者之间找到平衡。技术上这涉及到差分隐私、联邦学习等方法设计上需要明确的分类标准和用户授权机制。五、综合视图多维度交叉把核心维度和辅助维度交叉起来就形成了一个完整的分类空间关系对象 \ 抽象层次模式事实原始记录关于用户偏好画像对话片段关于自我风格技能执行日志关于世界因果知识查询结果关于他者协作能力交互记录每个格子代表一类记忆有不同的特性格子示例更新频率检索方式存储策略用户-模式“喜欢简洁”低隐式总是参考长期用户-事实“后端工程师”中显式按需查询长期用户-原始对话记录高很少直接检索短期/归档自我-模式“擅长代码”低隐式长期世界-事实“项目用React”中显式会话/长期……………设计时的权衡不是每个格子都需要同等重视。根据 Agent 的使用场景可以选择重点投入的区域•个人助手型 Agent重点在关于用户维度尤其是用户画像和偏好模式•专业工具型 Agent重点在关于世界维度需要深入的领域知识•协作型 Agent需要平衡多个维度尤其是关于他者•通用型 Agent需要覆盖所有维度但每个维度可能不够深入六、记忆的动态性流动与演化到目前为止我们把记忆当作静态的分类来讨论。但实际上记忆是流动的。6.1 从原始到抽象的提炼原始记录不会永远保持原样。它会经历一个蒸馏的过程用户说太长了 ─┐用户说简短点 │── 用户偏好简洁风格用户说不需要太详细 ─┘帮用户修了内存泄漏bug ─┐帮用户优化了查询性能 │── 经验性能优化技能帮用户解决了N1问题 ─┘这个提炼过程可以是•定时触发每隔一段时间整理一次•事件触发会话结束时、达到某个数量阈值时•主动触发当需要某类信息但找不到时触发一次归纳6.2 记忆之间的冲突与仲裁随着记忆积累不可避免会出现冲突• 用户画像说喜欢详细解释但最近三次都说简短点• 经验库说这个方法有效但刚才用这个方法失败了• 世界知识说API 返回 JSON但实际返回了 XML如何处理这些冲突需要一个仲裁机制时间优先更近的记忆优先级更高频率优先更常出现的模式优先级更高来源优先直接观察 推断 继承置信度保留冲突记录不确定性好的记忆系统不是消除冲突而是管理冲突——知道哪些记忆是确定的哪些是存疑的。6.3 记忆的衰减与遗忘人会遗忘Agent 也应该遗忘。遗忘不是 bug而是 feature• 过时的信息需要被清除用户换了工作、项目换了技术栈• 错误的记忆需要被纠正之前的判断被证明是错的• 冗余的细节需要被丢弃节省存储和检索成本遗忘可以是•时间衰减长时间没有被访问的记忆逐渐降低权重•主动清除用户明确说忘掉这个•覆盖更新新信息替换旧信息•容量淘汰当存储满时淘汰最不重要的设计遗忘机制时关键是要区分应该遗忘的和必须保留的。用户的核心偏好可能几年不变不应该因为长时间没访问就被淘汰。七、设计启示如何构建记忆系统有了分类框架我们可以更有针对性地思考记忆系统的设计。7.1 写入策略什么时候记、记什么不是所有交互都值得记忆。需要有一个重要性评估• 这个信息会影响未来的交互吗• 这个信息是独特的还是冗余的• 这个信息是稳定的还是临时的高效的写入策略即时记录重要的用户偏好、关键的任务结果延迟归档普通对话历史会话结束后统一处理选择性丢弃明显临时性的信息直接不存7.2 检索策略什么时候用、怎么用记忆的价值在于被用到。检索策略决定了记忆的实际效用。隐式检索• 总是自动加载的记忆核心用户画像、当前项目信息• 不需要显式触发作为背景知识存在显式检索• 需要时才查询的记忆历史对话、过往经验• 通过语义匹配、关键词搜索等方式检索检索的挑战• 召回率相关的记忆能否被找到• 准确率找到的记忆是否真的相关• 效率检索的延迟是否可接受7.3 更新策略如何保持一致性记忆不是一次性写入的需要持续更新。更新策略需要考虑何时更新• 检测到新信息与旧记忆冲突时• 用户明确要求更新时• 定期的维护窗口如何更新•覆盖新值直接替换旧值•追加保留历史记录变化轨迹•合并将新旧信息融合一致性保证• 不同层次的记忆之间需要一致事实层说用户是工程师原始层不应该说用户是设计师• 需要有机制检测和修复不一致八、与人类记忆的映射讨论到这里你可能已经发现Agent 记忆的很多概念在人类认知科学中都有对应。这不是巧合。我们在设计 Agent 记忆时其实是在用另一种方式重新发现人类认知的结构。8.1 四重关系的认知基础Agent 记忆人类认知心理学概念关于用户对他人的认知心智理论Theory of Mind关于自我自我认知元认知Metacognition关于世界世界知识心智模型Mental Model关于他者社会认知社会智力Social Intelligence人类的认知也是围绕这四重关系组织的•心智理论理解他人的意图、信念、情绪•元认知对自己认知过程的认知——“我知道我知道什么”•心智模型对世界如何运作的内部表征•社会智力在社会网络中有效互动的能力Agent 记忆系统的设计可以从这些认知科学研究中获得启发。8.2 记忆类型的对应心理学将人类记忆分为几类人类记忆类型描述Agent 对应情景记忆 (Episodic)具体事件的记忆原始记录层语义记忆 (Semantic)事实和概念的记忆事实/知识层程序性记忆 (Procedural)技能和习惯的记忆经验/技能层工作记忆 (Working)当前处理的信息Context Window这种对应提示我们人类记忆的分层结构是经过演化优化的可能代表某种最优或至少足够好的设计。8.3 镜子的意义在设计 Agent 记忆时我们被迫去思考• 什么信息值得记住• 什么时候应该遗忘• 如何在有限的容量中做取舍• 如何让记忆服务于行动这些问题也是关于人类自身的问题。Agent 是一面镜子让我们看到自己认知的结构。通过设计 Agent 的记忆系统我们也在加深对人类记忆的理解。九、结语本文尝试建立一个 Agent 记忆的分类框架。核心维度是关系对象• 关于用户个性化的基础• 关于自我进化的基础• 关于世界行动的基础• 关于他者协作的基础辅助维度包括• 抽象层次原始 → 事实 → 模式• 时间跨度工作 → 会话 → 长期• 可共享性私有 → 可共享 → 公共这些维度交叉形成了一个完整的分类空间。每一类记忆有不同的特性需要不同的存储、检索、更新策略。但分类只是起点。真正的挑战在于权衡在有限资源下如何选择优先级动态如何让记忆系统随时间演化一致如何保证不同层次、不同类型记忆的一致性隐私如何在个性化和隐私保护之间取得平衡记忆的边界决定了 Agent 的边界。一个只记得对话历史的 Agent只能做到上下文连贯。一个能记住用户偏好的 Agent可以做到个性化服务。一个能积累自身经验的 Agent可以随时间进化。一个能理解协作伙伴的 Agent可以融入群体智能。从记什么到为何记是理解 Agent 记忆的关键跃迁。分类框架提供了记什么的地图而为何记的答案要回到那四重关系中去找——它们定义了 Agent 作为一个智能体的存在方式。AI时代未来的就业机会在哪里答案就藏在大模型的浪潮里。从ChatGPT、DeepSeek等日常工具到自然语言处理、计算机视觉、多模态等核心领域技术普惠化、应用垂直化与生态开源化正催生Prompt工程师、自然语言处理、计算机视觉工程师、大模型算法工程师、AI应用产品经理等AI岗位。掌握大模型技能就是把握高薪未来。那么普通人如何抓住大模型风口AI技术的普及对个人能力提出了新的要求在AI时代持续学习和适应新技术变得尤为重要。无论是企业还是个人都需要不断更新知识体系提升与AI协作的能力以适应不断变化的工作环境。因此这里给大家整理了一份《2026最新大模型全套学习资源》包括2026最新大模型学习路线、大模型书籍、视频教程、项目实战、最新行业报告、面试题、AI产品经理入门到精通等带你从零基础入门到精通快速掌握大模型技术由于篇幅有限有需要的小伙伴可以扫码获取1. 成长路线图学习规划要学习一门新的技术作为新手一定要先学习成长路线图方向不对努力白费。这里我们为新手和想要进一步提升的专业人士准备了一份详细的学习成长路线图和规划。2. 大模型经典PDF书籍书籍和学习文档资料是学习大模型过程中必不可少的我们精选了一系列深入探讨大模型技术的书籍和学习文档它们由领域内的顶尖专家撰写内容全面、深入、详尽为你学习大模型提供坚实的理论基础。书籍含电子版PDF3. 大模型视频教程对于很多自学或者没有基础的同学来说书籍这些纯文字类的学习教材会觉得比较晦涩难以理解因此我们提供了丰富的大模型视频教程以动态、形象的方式展示技术概念帮助你更快、更轻松地掌握核心知识。4. 大模型项目实战学以致用当你的理论知识积累到一定程度就需要通过项目实战在实际操作中检验和巩固你所学到的知识同时为你找工作和职业发展打下坚实的基础。5. 大模型行业报告行业分析主要包括对不同行业的现状、趋势、问题、机会等进行系统地调研和评估以了解哪些行业更适合引入大模型的技术和应用以及在哪些方面可以发挥大模型的优势。6. 大模型面试题面试不仅是技术的较量更需要充分的准备。在你已经掌握了大模型技术之后就需要开始准备面试我们将提供精心整理的大模型面试题库涵盖当前面试中可能遇到的各种技术问题让你在面试中游刃有余。为什么大家都在学AI大模型随着AI技术的发展企业对人才的需求从“单一技术”转向 “AI行业”双背景。企业对人才的需求从“单一技术”转向 “AI行业”双背景。金融AI、制造AI、医疗AI等跨界岗位薪资涨幅达30%-50%。同时很多人面临优化裁员近期科技巨头英特尔裁员2万人传统岗位不断缩减因此转行AI势在必行这些资料有用吗这份资料由我们和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理现任上海殷泊信息科技CEO其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证服务航天科工、国家电网等1000企业以第一作者在IEEE Transactions发表论文50篇获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。资料内容涵盖了从入门到进阶的各类视频教程和实战项目无论你是小白还是有些技术基础的技术人员这份资料都绝对能帮助你提升薪资待遇转行大模型岗位。大模型全套学习资料已整理打包有需要的小伙伴可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】