2026/2/14 11:52:07
网站建设
项目流程
网站前端浏览器兼容如何做,公司变更法人债务怎么处理,赶集网招聘,wordpress 阅读本文详解Agent架构设计中5种上下文压缩方案#xff1a;3种无损压缩#xff08;省略相同参数、延迟长文显示、分段读取#xff09;和2种有损压缩#xff08;就地压缩、LLM口令压缩#xff09;。这些方法解决大模型上下文窗口有限和长文本导致的注意力分散问题#xff0c;提…本文详解Agent架构设计中5种上下文压缩方案3种无损压缩省略相同参数、延迟长文显示、分段读取和2种有损压缩就地压缩、LLM口令压缩。这些方法解决大模型上下文窗口有限和长文本导致的注意力分散问题提高Agent运行效率。建议优先采用无损方案有损压缩需权衡信息损失。本系列实践主要用于构建完全自主规划的Agent类似Manus而非基于workflow的Agent至于二者区别本系列实践中也将有专门论述。本系列实践的相关内容架构选项讨论自主型的Agent vs. Workflow型的Agent架构详细设计从多智能体到智能体工具交互协议上下文工程上下文压缩的几种方案本文上下文工程Agent运行过程中错误处理的几种方案其他主题如有兴趣可以评论区或私信交流。ps. 欢迎订阅本公众号以便于接收后续更新.上下文压缩的几种方案为什么要做上下文压缩在上下文工程中为什么要做压缩这个问题的答案很明显大模型的上下文窗口有限虽然近来新模型Gemini 3 pro/kimi k2/minimax m2等上来就是百万token但是依然无法承载几百轮Agent Loop上下文的叠加对于几万页的pdf更是无法处理假设大模型的上下文窗口是无限的根据注意力机制上下文变长后注意力将“涣散”无法准确理解任务意图。在《上下文腐败逐步增长的Tokens如何影响LLM的性能》https://research.trychroma.com/context-rot一文中作者通过实验证明长下文会使LLM的性能严重衰减。因而要让Agent稳定可靠地运行下去必须对上下文进行压缩。本文仅讨论5种工程方案。当然除了工程方案也有算法方案不过算法方案对大部分人来说门槛过高。因而本文不做介绍。上下文压缩的方案上下文压缩方案从是否有损的角度看分为有损以及无损两种。先来看一段原始上下文操作 第0轮 执行IDop00000/执行ID 执行函数create_todo_list/执行函数 参数 { id: todo001, steps: [ 搜索最新的人工智能发展趋势, 整理搜索结果, 撰写总结报告 ] } /参数 执行结果 { status: success, message: 待办事项列表已创建ID为 todo001 steps: [ 搜索最新的人工智能发展趋势, 整理搜索结果, 撰写总结报告 ] } /执行结果 /第0轮 第1轮 执行IDop12345/执行ID 执行函数search_with_google/执行函数 参数 { query: 最新的人工智能发展趋势, num_results: 5 } /参数 执行结果 { results: [ { title: 2024年人工智能发展趋势分析, link: https://example.com/ai-trends-2024, snippet: 本文详细分析了2024年人工智能的发展趋势包括生成式AI、AI伦理和可解释性等方面。 }, { title: 人工智能的未来2024及以后的展望, link: https://example.com/future-of-ai-2024, snippet: 探讨了人工智能在各个行业中的应用前景以及未来的发展方向。 }, { title: 2024年人工智能技术的十大趋势, link: https://example.com/top-ai-trends-2024, snippet: 列出了2024年最重要的人工智能技术趋势包括自动化、机器学习和深度学习的最新进展。 }, { title: 人工智能在医疗领域的最新进展, link: https://example.com/ai-in-healthcare-2024, snippet: 介绍了人工智能在医疗诊断、治疗和患者管理中的最新应用和发展。 }, { title: 生成式AI的崛起及其影响, link: https://example.com/rise-of-generative-ai-2024, snippet: 分析了生成式AI技术的发展及其在内容创作、设计和娱乐领域的影响。 } ] } /执行结果 /第1轮 第2轮 执行IDop67890/执行ID 执行函数file_reader/执行函数 参数 { file_path: ai_trends_summary.txt } /参数 执行结果 { content: 2024年人工智能发展趋势总结\n 1. 生成式AI技术的快速发展推动内容创作和设计领域的创新。\n 2. AI伦理和可解释性成为关注焦点推动行业规范和政策制定。\n 3. 人工智能在医疗、金融等关键行业的应用不断深化提高效率和服务质量。\n 4. 自动化和机器学习技术的进步促进各行业的数字化转型。 \n 5. 多模态AI的发展使得AI系统能够处理和理解多种类型的数据提高交互体验。 \n 6. 边缘AI的兴起推动实时数据处理和智能设备的发展。 } /执行结果 /第2轮 /操作以上内容约4000个token。我们来逐步分析以上内容如何压缩。首先我们观察到第0轮create\_todo\_list出入参有相同之处可以省略。2.1 无损压缩方案1当出入参部分一致时可以省略部分出参create_todo_list可以压缩为第0轮 执行IDop00000/执行ID 执行函数create_todo_list/执行函数 参数 { id: todo001, steps: [ 搜索最新的人工智能发展趋势, 整理搜索结果, 撰写总结报告 ] } /参数 执行结果 { message: 待办事项列表已创建ID为 todo001 } /执行结果 /第0轮对于todo list、plan相关的函数可以使用类似压缩策略。出入参压缩完成后我们看search\_with\_google的压缩方案。这类长文的压缩方案我们可以在第n3轮调用时进行省略通过给LLM提供一个长文查阅的工具以备不时之需。2.2 无损压缩方案2长文在第n3轮调用时进行省略例如在第1轮时调用了search\_with\_google方法在第4轮Agent Loop时其相关上下文会被省略为第1轮 执行IDop12345/执行ID 执行函数search_with_google/执行函数 参数 { query: 最新的人工智能发展趋势, num_results: 5 } /参数 执行结果 执行结果被省略如需要请使用view_return_value(execution_id)查看结果 /执行结果 /第1轮这种方法适用于search、file_reader等长文执行结果方法。在长文压缩后我们再看file_reader如何压缩与优化。file_reader主要作用是从文档中读取内容使其对LLM可见可是一旦文档内容过长上下文里面就“爆掉”对此我们的压缩方案是分段读取或就地压缩。2.3 无损压缩方案3长文分段读取所谓长文分段读取就是在file_reader中要求读取必须提供begin_lineend_line序号且要求一次最多不许超过n行如下注意参数部分第2轮 执行IDop67890/执行ID 执行函数file_reader/执行函数 参数 { file_path: ai_trends_summary.txt begin_line: 0 end_line:5 max_range:10 } /参数 执行结果 { content: 2024年人工智能发展趋势总结\n 1. 生成式AI技术的快速发展推动内容创作和设计领域的创新。\n 2. AI伦理和可解释性成为关注焦点推动行业规范和政策制定。\n 3. 人工智能在医疗、金融等关键行业的应用不断深化提高效率和服务质量。\n 4. 自动化和机器学习技术的进步促进各行业的数字化转型。 \n 5. 多模态AI的发展使得AI系统能够处理和理解多种类型的数据提高交互体验。 \n 6. 边缘AI的兴起推动实时数据处理和智能设备的发展。 } /执行结果 /第2轮注意这种方法只能让文本被正常读取但不能彻底解决长文问题甚至还可能引发多次读取的副作用。如果要彻底解决该问题需要进行有损就地压缩。2.4 有损压缩方案1就地压缩长文所谓就地压缩就是不读取内容而是直接让LLM尝试回答文章的问题。我们把file_reader换成ask_document:第2轮 执行IDop678900/执行ID 执行函数ask_document/执行函数 参数 { file_path: ai_trends_summary.txt question: 提取文章的核心内容不超过20字 } /参数 执行结果 { content: 2024年人工智能发展趋势总结内容创新、边缘AI等 } /执行结果 /第2轮注意这里只是提取了核心内容更多文章细节可能丢失因而称为“有损压缩”。最后我们讨论一种方法堪称压缩的“大招”。就是做完以上压缩方案后内容依然超长。此时就需要使用有损压缩的终极方案。2.5 有损压缩的终极方案通过LLM 压缩口令Prompt进行压缩方案分两步走检测Agent Loop上下文窗口超过一定数量以后启动压缩例如超过60000 token后开始压缩将Agent Loop的上下文以及压缩口令Prompt交给LLM启动压缩压缩口令Prompt如下请将以下操作记录进行压缩保留所有轮次包括第0轮、第2-4轮的关键信息 如执行ID、执行函数、参数和执行结果的核心内容但简化描述以减少冗余。 压缩后的输出应保持原始的XML格式结构 包括使用相同的标签如操作、第X轮、执行ID等 并确保内容简洁明了。使用这段口令对原始上下文压缩后的结果为from deepseek网页版操作 第0轮 执行IDop00000/执行ID 执行函数create_todo_list/执行函数 参数{id: todo001, steps: [搜索最新的人工智能发展趋势, 整理搜索结果, 撰写总结报告]}/参数 执行结果{status: success, message: 待办事项列表已创建}/执行结果 /第0轮 第1轮 执行IDop12345/执行ID 执行函数search_with_google/执行函数 参数{query: 最新的人工智能发展趋势, num_results: 5}/参数 执行结果{results: [{title: 2024年人工智能发展趋势分析}, {title: 人工智能的未来2024及以后的展望}, {title: 2024年人工智能技术的十大趋势}]}/执行结果 /第1轮 第2轮 执行IDop67890/执行ID 执行函数file_reader/执行函数 参数{file_path: ai_trends_summary.txt}/参数 执行结果{content: 2024年AI趋势总结生成式AI、AI伦理、医疗应用、自动化、多模态AI、边缘AI等关键发展。}/执行结果 /第2轮 /操作只有1200 token但是我们看到部分内容也丢失了。所以使用有损压缩要充分考虑损失是否影响最终结果。总结本文讨论了在Agent架构设计中具有代表性的5种上下文压缩方案及其应用场景。在实践中优先考虑使用无损压缩再考虑有损压缩。AI时代未来的就业机会在哪里答案就藏在大模型的浪潮里。从ChatGPT、DeepSeek等日常工具到自然语言处理、计算机视觉、多模态等核心领域技术普惠化、应用垂直化与生态开源化正催生Prompt工程师、自然语言处理、计算机视觉工程师、大模型算法工程师、AI应用产品经理等AI岗位。掌握大模型技能就是把握高薪未来。那么普通人如何抓住大模型风口AI技术的普及对个人能力提出了新的要求在AI时代持续学习和适应新技术变得尤为重要。无论是企业还是个人都需要不断更新知识体系提升与AI协作的能力以适应不断变化的工作环境。因此这里给大家整理了一份《2026最新大模型全套学习资源》包括2026最新大模型学习路线、大模型书籍、视频教程、项目实战、最新行业报告、面试题、AI产品经理入门到精通等带你从零基础入门到精通快速掌握大模型技术由于篇幅有限有需要的小伙伴可以扫码获取1. 成长路线图学习规划要学习一门新的技术作为新手一定要先学习成长路线图方向不对努力白费。这里我们为新手和想要进一步提升的专业人士准备了一份详细的学习成长路线图和规划。2. 大模型经典PDF书籍书籍和学习文档资料是学习大模型过程中必不可少的我们精选了一系列深入探讨大模型技术的书籍和学习文档它们由领域内的顶尖专家撰写内容全面、深入、详尽为你学习大模型提供坚实的理论基础。书籍含电子版PDF3. 大模型视频教程对于很多自学或者没有基础的同学来说书籍这些纯文字类的学习教材会觉得比较晦涩难以理解因此我们提供了丰富的大模型视频教程以动态、形象的方式展示技术概念帮助你更快、更轻松地掌握核心知识。4. 大模型项目实战学以致用当你的理论知识积累到一定程度就需要通过项目实战在实际操作中检验和巩固你所学到的知识同时为你找工作和职业发展打下坚实的基础。5. 大模型行业报告行业分析主要包括对不同行业的现状、趋势、问题、机会等进行系统地调研和评估以了解哪些行业更适合引入大模型的技术和应用以及在哪些方面可以发挥大模型的优势。6. 大模型面试题面试不仅是技术的较量更需要充分的准备。在你已经掌握了大模型技术之后就需要开始准备面试我们将提供精心整理的大模型面试题库涵盖当前面试中可能遇到的各种技术问题让你在面试中游刃有余。为什么大家都在学AI大模型随着AI技术的发展企业对人才的需求从“单一技术”转向 “AI行业”双背景。企业对人才的需求从“单一技术”转向 “AI行业”双背景。金融AI、制造AI、医疗AI等跨界岗位薪资涨幅达30%-50%。同时很多人面临优化裁员近期科技巨头英特尔裁员2万人传统岗位不断缩减因此转行AI势在必行这些资料有用吗这份资料由我们和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理现任上海殷泊信息科技CEO其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证服务航天科工、国家电网等1000企业以第一作者在IEEE Transactions发表论文50篇获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。资料内容涵盖了从入门到进阶的各类视频教程和实战项目无论你是小白还是有些技术基础的技术人员这份资料都绝对能帮助你提升薪资待遇转行大模型岗位。大模型全套学习资料已整理打包有需要的小伙伴可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】