西安网站制作顶尖免费开设网站
2026/2/19 4:38:54 网站建设 项目流程
西安网站制作顶尖,免费开设网站,展厅设计施工一体化,手机域名免费注册自从ChatGPT横空出世以来#xff0c;AI“黑话”层出不穷#xff0c;什么RAG、Agent、MCP、A2A… 现在又来了个Context Engineering#xff08;上下文工程#xff09;#x1f92f; 那什么是Context#xff1f;Context Engineering又是什么#xff1f;它解决了什么问题AI“黑话”层出不穷什么RAG、Agent、MCP、A2A… 现在又来了个Context Engineering上下文工程那什么是ContextContext Engineering又是什么它解决了什么问题以及如何解决问题是不是有点懵别担心这篇文章会一一给你解答。准备好了吗让我们开始这场上下文之旅什么是Context从黑盒子说起单纯从外部来看大模型就像是一个神秘的黑盒。你给它输入 → 它就给你输出就这么简单粗暴不过这个输入是有大小限制的这就是上下文窗口Context Window就像你的大脑一样一次只能记住有限的信息。这里的Context指的就是模型输入。Context到底是什么简单来说Context就是模型在处理当前任务时能够看到的所有信息。它包括❓ 用户的问题 背景信息 用户的历史对话 相关资料 可用工具列表⚡ 工具执行结果Context WindowAI的记忆容量而Context Window指的就是模型输入中最多能包含的token数量。Token可以理解为文本被拆分成的最小单位可能是一个字、一个词、或者是一个标点符号。简单记住1个token ≈ 0.75个英文单词1个token ≈ 1.5个汉字举个栗子Gemini 2.5 Pro最多能输入100万token的上下文一旦超过这个限制前面的内容就会被无情丢弃只保留最后的100万token。 100万token大约相当于七本书的长度也就是说Gemini 2.5 Pro可以一次性读完约七本书的内容这个容量已经是非常惊人了。看到这里你可能会想“Context这么长那我直接把所有资料都丢进去让模型自己理解不就行了”理想很丰满现实很骨感 智能客服的美好幻想假设你想做一个智能客服希望它能回答用户关于公司产品的各种问题。这个智能客服的核心就是一个大模型。大模型虽然很强但直接问它关于你们公司产品的问题它只能无奈地回答“我不知道啊我知道个锤子‍♂️”。于是你灵机一动“没关系我们有产品使用手册直接丢给大模型就好了”你的想法是这样的产品手册几十页丢进去几百页也丢进去上千页统统丢进去反正Context Window这么大管它哪些内容相关不相关让模型自己去理解这样做对吗答案是不对❌ 三个残酷的现实问题事实并没有那么简单在实际使用过程中我们会遇到三个非常现实的问题1️⃣ 大多数模型的Context Window其实很小气虽然Gemini 2.5 Pro有100万token但看看其他模型模型Context Window备注Gemini 2.5 Pro100万土豪级别 GPT-440万还算够用Claude 420万中规中矩Deepseek V312.8万有点紧张 要命的是有时候为了节省成本我们经常使用一些小模型它们的Context Window可能只有几万token。连一个完整的产品使用手册都装不下2️⃣ 信息太杂乱AI也会选择困难症即使你的模型有超大Context Window也不能把所有资料不加筛选地全部丢给它想象一下你让一个人在一堆杂乱无章的文件中找答案他会怎么样‍ 被信息淹没 分不清重点 给出模糊的回答AI模型也是一样的杂乱、冗余、矛盾的信息会让它选择困难最终输出含糊其辞的回答。关键insight与其把所有信息都塞进去不如精心设计和组织确保模型看到的是准确、有结构、重点突出的内容。3️⃣ 输入越多钱包越瘪 这是最现实的问题大多数模型厂商都是按token计费如果不加控制地塞入大量上下文内容即使效果还行也可能带来不必要的开销。优化输入 优化成本所以我们看到直接把资料丢给大模型的思路是行不通的这里存在很多的问题。那我们该如何解决它们呢这就引出Context Engineering了什么是Context Engineering 定义解析Context Engineering翻译成中文就是上下文工程。从字面上来看Context Engineering似乎就是针对Context所做的一些技术。回想一下Context的含义Context 给模型的输入Context Engineering 对模型输入做优化 核心理念Context Engineering关注的不是怎么训练模型而是怎么精心设计给模型的输入内容。它要让模型在有限的Context Window里面尽可能地理解更准答得更好花得更少核心思想不改变模型的结构只改变模型能看到什么。就像给AI戴上了一副智能眼镜为什么Context Engineering突然火了其实Context这个概念一直都存在但是Context Engineering却是最近一段时间才火起来。 两大推动力1️⃣ 模型足够强大了现在的模型已足够强大对比一年前的模型简直是天壤之别对于现在的模型来说你只要给到它✅ 足够精细的要求✅ 足够完整的相关资料模型就能给出非常准确有用的回答关键insight在大部分情况下如果模型的回答不能让你满意这并不是因为模型不够强大而是因为你没有给到模型足够清晰、完整的信息。而这一点正是Context Engineering要解决的问题2️⃣ Agent的兴起Agent是一种把大模型和工具结合起来让模型能够独立感知环境、影响环境从而解决用户问题的技术。Agent运行时会产生大量信息 可用工具信息⚡ 工具执行结果 运行历史记录使用多少次工具 → 就有多少个工具执行结果 → Agent运行时间长了 → 这些结果占满整个Context Window → 影响模型后续回答效果这就是为什么Agent兴起之后Context Engineering的话题也随之火了起来因为Context的管理效果直接影响到Agent的执行结果。Context Engineering的四大绝招在了解了Context Engineering兴起的原因之后接下来我们就看一下它具体的实现方法。Context Engineering并不是某项单一的技术而是多种技术组成的方法体系。四大核心步骤Context Engineering分为四个步骤保存Context选择Context️压缩Context隔离Context让我们逐一击破 第一招保存Context保存Context就是说我们把Context做个筛选总结并找个地方保存起来比如内存/硬盘之类的地方在模型需要的时候再发给模型。 经典案例ChatGPT的记忆功能这里一个比较典型的例子就是ChatGPT的记忆功能。比如我在一次对话中跟ChatGPT说我的名字是蔡坨坨我有一个公众号叫测试蔡坨坨在这个公众号里我分享过软件测试、Python测试开发、AI、RAG、GraphRAG、MCP等相关的内容记住这些注意到这个已更新保存的记忆这代表ChatGPT把这段内容存入到它的记忆库里面去了核心价值这个保存的动作是Context Engineering的第一步它解决了信息持久化的问题。就像给AI装了个外置硬盘但光存下来还不够ChatGPT的记忆库是可以存放很多条记录的那在未来的工作中ChatGPT是如何从这个庞大的记忆库里面精准的找到它想要的信息呢 第二招选择Context这就引出了Context Engineering的第二个步骤选择Context选择Context就是从海量的信息中选择出一部分与用户问题最相关的内容并且把它们放在模型的Context里面。关键insight一个好的选择策略是整个系统高效准确运行的保障就像一个聪明的图书管理员选择又分为静态选择和动态选择 静态选择AI的基本法静态选择就是把一些永远重要、必须要遵守的信息在每一次请求时全部放到Context里面。它就像是给AI焊在脑子里的系统指令或者核心原则⚡经典例子 Cursor的rules文件 Claude Code的CLAUDE.md文件 Trae的user_rules.md、project_rules.md文件这些文件指定了 当前项目的信息 编码时需要遵守的规范 AI行为的核心原则策略要点这些信息至关重要无论用户问什么都必须在场对于这类短小但至关重要的信息最有效的策略就是全部都要只要确保它们加起来不会撑爆Context Window就行。 动态选择智能图书管理员说完了静态选择接下来我们看一下更强大、也更为常见的动态选择。动态选择是指选择与用户问题最相关的内容并且把它放入Context中。它不是所有的东西都塞进去而是像一个聪明的图书管理员为你精准地找到需要的那几页。经典案例 ChatGPT从记忆库中挑选与用户问题最相关的记忆。 从数十个甚至数百个工具中挑选最相关的3个工具放入Context这也是一种动态选择。最著名的实现方式RAG检索增强生成️ 第三招压缩Context压缩Context是指在保留关键信息的前提下减少Context的长度。核心理念用最少的字符传达最多的信息就像把一本厚书压缩成精华版➡️️ 常见压缩方式压缩Context有很多种方式总结把长对话浓缩成几句话关键词提取提炼文档核心要点信息去重删除重复内容结构化提取保留关键数据结构 实战案例Agent的历史消息压缩Agent在运行时会在Context中积累大量的历史消息一般来说这些历史消息中最占空间的便是模型的输出文本和工具执行结果两类数据。如果不做处理的话这些消息便会迅速挤满Context的全部空间从而影响模型的后续回答效果。经典解决方案Claude Code的auto-compact程序 对以往的Context做压缩 总结之前的内容️ 把原来的内容扔掉 总结后Context Window的使用量就会降下来⚙️ 用户甚至可以在Claude.md里面指定压缩方案压缩的好处让我们在有限的Context Window中放入更多信息从而提高模型性能 第四招隔离Context说完压缩Context下面我们就来说说最后一个策略隔离Context。隔离Context是指把不同类型的信息分别放在不同的Context中从而避免信息之间的相互干扰核心思想让不同类型的信息各司其职避免串台现象就像把不同的菜分装在不同的盘子里️ 经典案例Anthropic的Multi-Agent系统隔离Context最典型的应用场景就是Multi-Agent系统。不同模块之间的Context是互相隔离的互不干扰。原文「How we built our multi-agent research system」在Multi-Agent系统中Lead Agent系统的总指挥官负责任务下发和归纳总结。Subagent各司其职的专业助手工作流程 用户请求 → Lead Agent用户请求会先打到Lead Agent Lead Agent分解任务 → 各个Subagent在接收到用户请求之后Lead Agent便会把用户的问题拆解成多个task并下发到其他的Agent系统里Anthropic把这些Agent称为Subagent 搜索内部知识库的Subagent → 获取内部信息 联网搜索的Subagent → 获取外部信息 Lead Agent汇总所有结果 → 生成最终报告Context隔离体现 每个Subagent都有专属的Context 各Context之间互不干扰职责清晰这就是隔离Context的典型例子不同系统拥有不同Context各司其职互不干扰总结Context Engineering 的关键在于“让模型看到对当前任务最必要且组织良好的信息”。通过先保存与结构化知识再用静态/动态策略精准选择配合总结与关键词等方式压缩并在多主体/多任务中做好隔离可在有限的上下文窗口内显著提升回答质量降低冗余与成本。普通人如何抓住AI大模型的风口领取方式在文末为什么要学习大模型目前AI大模型的技术岗位与能力培养随着人工智能技术的迅速发展和应用 大模型作为其中的重要组成部分 正逐渐成为推动人工智能发展的重要引擎 。大模型以其强大的数据处理和模式识别能力 广泛应用于自然语言处理 、计算机视觉 、 智能推荐等领域 为各行各业带来了革命性的改变和机遇 。目前开源人工智能大模型已应用于医疗、政务、法律、汽车、娱乐、金融、互联网、教育、制造业、企业服务等多个场景其中应用于金融、企业服务、制造业和法律领域的大模型在本次调研中占比超过30%。随着AI大模型技术的迅速发展相关岗位的需求也日益增加。大模型产业链催生了一批高薪新职业人工智能大潮已来不加入就可能被淘汰。如果你是技术人尤其是互联网从业者现在就开始学习AI大模型技术真的是给你的人生一个重要建议最后只要你真心想学习AI大模型技术这份精心整理的学习资料我愿意无偿分享给你但是想学技术去乱搞的人别来找我在当前这个人工智能高速发展的时代AI大模型正在深刻改变各行各业。我国对高水平AI人才的需求也日益增长真正懂技术、能落地的人才依旧紧缺。我也希望通过这份资料能够帮助更多有志于AI领域的朋友入门并深入学习。真诚无偿分享vx扫描下方二维码即可加上后会一个个给大家发【附赠一节免费的直播讲座技术大佬带你学习大模型的相关知识、学习思路、就业前景以及怎么结合当前的工作发展方向等欢迎大家~】大模型全套学习资料展示自我们与MoPaaS魔泊云合作以来我们不断打磨课程体系与技术内容在细节上精益求精同时在技术层面也新增了许多前沿且实用的内容力求为大家带来更系统、更实战、更落地的大模型学习体验。希望这份系统、实用的大模型学习路径能够帮助你从零入门进阶到实战真正掌握AI时代的核心技能01教学内容从零到精通完整闭环【基础理论 →RAG开发 → Agent设计 → 模型微调与私有化部署调→热门技术】5大模块内容比传统教材更贴近企业实战大量真实项目案例带你亲自上手搞数据清洗、模型调优这些硬核操作把课本知识变成真本事‌02适学人群应届毕业生‌无工作经验但想要系统学习AI大模型技术期待通过实战项目掌握核心技术。零基础转型‌非技术背景但关注AI应用场景计划通过低代码工具实现“AI行业”跨界‌。业务赋能突破瓶颈传统开发者Java/前端等学习Transformer架构与LangChain框架向AI全栈工程师转型‌。vx扫描下方二维码即可【附赠一节免费的直播讲座技术大佬带你学习大模型的相关知识、学习思路、就业前景以及怎么结合当前的工作发展方向等欢迎大家~】本教程比较珍贵仅限大家自行学习不要传播更严禁商用03入门到进阶学习路线图大模型学习路线图整体分为5个大的阶段04视频和书籍PDF合集从0到掌握主流大模型技术视频教程涵盖模型训练、微调、RAG、LangChain、Agent开发等实战方向新手必备的大模型学习PDF书单来了全是硬核知识帮你少走弯路不吹牛真有用05行业报告白皮书合集收集70报告与白皮书了解行业最新动态0690份面试题/经验AI大模型岗位面试经验总结谁学技术不是为了赚$呢找个好的岗位很重要07 deepseek部署包技巧大全由于篇幅有限只展示部分资料并且还在持续更新中…真诚无偿分享vx扫描下方二维码即可加上后会一个个给大家发【附赠一节免费的直播讲座技术大佬带你学习大模型的相关知识、学习思路、就业前景以及怎么结合当前的工作发展方向等欢迎大家~】

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询