2026/4/8 21:23:11
网站建设
项目流程
php 网站版面素材,重庆网站优化排名推广,购物网站建设思维导图,优秀的网站有哪些本文是台大教授李宏毅爆火油管视频《AI Agent》的精华文字实录#xff0c;内容从基础概念到实战应用层层递进#xff0c;逻辑清晰、案例通俗#xff0c;是零基础小白入门AI Agent、程序员深化大模型应用认知的优质教材。原视频时长较长#xff0c;智能超参数团队特意整理了…本文是台大教授李宏毅爆火油管视频《AI Agent》的精华文字实录内容从基础概念到实战应用层层递进逻辑清晰、案例通俗是零基础小白入门AI Agent、程序员深化大模型应用认知的优质教材。原视频时长较长智能超参数团队特意整理了核心内容方便大家高效学习。建议先收藏反复研读吃透AI Agent核心逻辑以下enjoy视频链接https://www.youtube.com/watch?vM2Yg1kwPptsPPT链接https://docs.google.com/presentation/d/1kTxukwlmx2Sc9H7aGPTiNiPdk4zN_NoH一、先搞懂到底什么是AI AgentAI Agent是当前大模型领域最热门的方向之一但这个概念没有统一标准每个人的理解可能都不同。我们先从「日常使用AI的方式」对比帮你快速get核心差异现在我们用AI大多是「指令驱动」——你说“翻译AI Agent”它就输出翻译结果你问“写一段Python代码”它就生成代码完全是“一个口令一个动作”不会多做一步。而AI Agent的核心是「目标驱动」人类只需要给出最终目标不用告诉AI具体步骤AI会自己规划路径、解决问题。比如你说“完成某课题的文献调研并生成分析报告”AI Agent会自动检索文献、筛选重点、分析数据、撰写报告甚至如果发现数据不足还会回头补充检索——整个过程完全自主像一个有独立思考能力的助手。更关键的是AI Agent要应对「复杂且动态的环境」目标的达成往往需要多步骤互动环境还可能出现不可预测的变化比如检索文献时遇到付费墙、数据格式不兼容这就要求AI Agent能灵活调整计划而不是机械执行预设流程。二、AI Agent的核心运作逻辑一张图看懂AI Agent之所以能自主完成目标背后的运作流程可以简化为「感知-决策-行动-反馈」的循环用一张幻灯片就能看明白输入目标Goal人类给出的最终需求比如“赢下围棋比赛”“完成数据分析”感知观察ObservationAI Agent获取当前环境状态比如棋盘上的棋子位置、手头的数据集信息决策行动Action根据目标和当前观察决定下一步要做什么比如围棋落子位置、调用数据分析工具反馈环境变化行动执行后环境会产生新的状态比如对手落子、工具返回分析结果AI Agent再次感知新状态重复循环直到目标达成。举个通俗例子AlphaGo就是AI Agent大家熟悉的AlphaGo完美契合这个逻辑目标赢下围棋比赛观察棋盘上黑白子的实时位置行动选择19×19棋盘上的合法落子点反馈对手落子后棋盘状态更新AlphaGo重新观察并决策。其实AlphaGo的底层逻辑就是强化学习RL的经典应用——过去打造AI Agent大多依赖RL算法把目标转化为“奖励Reward”比如赢棋得1、输棋得-1让AI通过训练最大化奖励值。但这种方式有个致命缺点任务迁移能力差——AlphaGo只会下围棋想让它下西洋棋必须重新训练一个全新模型。三、新时代的突破用LLM直接做AI AgentAI Agent再次爆火不是因为发明了新技术而是大语言模型LLM的崛起让“通用AI Agent”成为可能——我们不再需要为每个任务单独训练模型直接用现成的LLM就能搭建AI AgentLLM做AI Agent的核心逻辑LLM的优势在于「自然语言理解通用推理能力」把它当作AI Agent的核心运作流程会变成这样目标输入用自然语言告诉LLM目标比如“帮我规划3天东京旅行预算5000元”环境感知环境信息可以是文字比如旅行攻略、预算限制现在很多LLM支持图片输入比如机票截图、景点照片无需额外转换行动生成LLM用文字描述下一步行动比如“搜索东京往返机票筛选2000元内航班”行动执行通过工具调用模块把文字描述转化为实际操作比如调用机票搜索API、打开浏览器检索信息循环反馈工具返回结果比如找到符合条件的航班LLM接收后继续规划下一步直到目标完成。小插曲LLM下棋翻车现场可能有人会问LLM这么强能直接下棋吗答案是目前还不行但这不妨碍它做其他AI Agent任务。早在2022年ChatGPT出现前的“上古时代”就有人用LLM测试下西洋棋——把棋盘位置转化为文字输入结果没有任何模型能给出正确走法弱一点的模型甚至会违反规则乱走。到了现在就算是ChatGPT o1、DeepSeek-R1这样的强模型下棋依然翻车把兵当马走、主教无视阻挡、甚至凭空“变出”棋子最后还会出现“自己吃自己棋子然后宣布胜利”的荒诞场景。这说明LLM在「规则明确、需要精准逻辑推理」的任务上还有短板但在「开放场景、需要灵活规划」的任务中比如旅行规划、文献调研、日常办公LLM驱动的AI Agent已经能发挥巨大作用。四、LLM做AI Agent的2个核心优势相比传统RL方法LLM驱动的AI Agent有两个不可替代的优势1. 行动无局限近乎无限的可能性传统AI Agent的行动是预设的比如AlphaGo只能落子而LLM能生成任意文字输出这意味着AI Agent的行动可以是调用工具“用Python读取CSV文件并做数据可视化”生成内容“根据数据分析结果写一份报告”沟通协作“联系团队成员确认项目进度”甚至自我修正“刚才的代码有语法错误修改如下”。这种灵活性让AI Agent能适配各种复杂场景从办公自动化到科研辅助几乎无所不能。2. 无需手动设计Reward用反馈直接优化传统RL需要人工设计Reward函数比如“程序编译成功得1失败得-1”但Reward的数值设定非常主观为什么失败是-1不是-10还会影响模型效果。而LLM驱动的AI Agent完全不需要Reward如果程序编译失败直接把错误日志传给LLM它能读懂日志并修正代码如果旅行规划超预算把预算提醒告诉它它会自动调整住宿或交通方案。这种「直接反馈自然语言理解」的方式比单一数值的Reward更高效、更精准。五、AI Agent的3个经典应用场景从虚拟到现实LLM驱动的AI Agent已经有了很多落地案例从虚拟世界到现实应用覆盖多个领域1. 虚拟世界AI驱动的NPC2023年有个经典实验——用LLM搭建虚拟村庄里面的NPC都有自己的目标比如“举办情人节派对”“准备考试”。这些NPC会感知环境通过文字描述了解周围情况“看到Eddy在读书”“伊丽莎白在装饰房间”自主行动根据目标做出决策“时间不早了上床睡觉”互动协作比如为了举办派对NPC会主动邀请其他人帮忙布置。甚至有人在《我的世界》Minecraft中用AI替换所有NPC这些AI不仅能自主交易还能组成“政府”制定规则、管理社群真实性有待考证但足以体现AI Agent的潜力。2. 现实办公AI替你用电脑现在最实用的AI Agent应用就是让AI像人类一样使用电脑——代表产品有Claude的Computer Use、ChatGPT的Operator。它们能订机票、订披萨、预约居家清洁浏览网页、填写表单、处理邮件甚至使用办公软件比如Excel数据分析、Word文档编辑。这种AI Agent的运作逻辑是目标用户的自然语言需求“帮我订下周五上海到北京的机票”观察电脑屏幕画面LLM直接识别图片行动控制鼠标/键盘点击、输入文字比如打开购票网站、筛选航班。其实早在2017年就有类似尝试但当时没有LLM只能用CNN识别屏幕画面效果很差。现在有了LLM的自然语言理解和推理能力AI使用电脑的准确率大幅提升已经能处理大部分日常办公任务。3. 科研开发AI帮你做研究、训模型更高级的应用是让AI Agent参与科研和模型开发科研辅助Google的AI Coscientist能根据研究方向自主制定实验方案、撰写研究提案号称“把人类10年的研究成果压缩到2天”真实性待验证模型训练AIDE框架能让AI Agent扮演“机器学习工程师”自主编写训练代码、调整参数、优化模型甚至参加数据科学竞赛多Agent协作多个AI Agent分工合作一个负责数据采集一个负责模型训练一个负责结果分析高效完成复杂任务。六、AI Agent的3个核心能力拆解必学重点要让LLM成为好用的AI Agent需要具备3个关键能力经验学习、工具使用、计划执行。这也是入门AI Agent必须掌握的核心知识点1. 经验学习让AI Agent“吃一堑长一智”AI Agent需要能从过去的互动中学习调整后续行为——比如第一次写代码出错第二次要能避免同样的错误。但LLM的参数是固定的不微调的情况下怎么实现学习答案是不调参数靠“记忆检索”。核心逻辑给AI Agent一个“长期记忆库”存储过去的互动经验比如错误日志、成功案例当遇到新问题时通过「检索模块类似RAG技术」从记忆库中找出相关经验和当前问题一起传给LLMLLM根据“相关经验当前问题”生成行动相当于“站在过去的经验上做决策”。关键技巧只记“重要信息”用一个“写入模块Write Module”筛选经验避免记忆库被无关信息塞满比如只记成功的代码方案不记中间的无效尝试强化正面经验实验证明给LLM看“正确案例”比“错误案例”更有效——与其告诉它“不要这么做”不如直接展示“应该这么做”抽象经验用“反思模块Reflection Module”把零散的经验抽象成规律比如“处理CSV文件时先检查数据格式再读取”甚至建立知识图谱让检索更高效。实际案例ChatGPT的“记忆功能”现在ChatGPT已经支持长期记忆你告诉它“我周五下午要上机器学习课”它会把这个信息存入记忆库。之后你问“周五下午出去玩怎么样”它会检索记忆并提醒你“你周五下午有课要不要调整时间”。不过要注意ChatGPT的记忆可能出错比如把“老师”误记为“学生”因为它会对记忆内容进行抽象加工不是原封不动存储。2. 工具使用让AI Agent“借力打力”LLM虽然强但有短板比如实时数据查询、精准计算、多模态处理而工具能弥补这些不足。对AI Agent来说工具就是“函数”——不需要知道工具内部原理只要知道“怎么调用”就行。常用工具类型基础工具搜索引擎RAG、计算器、文件处理工具专业工具API接口机票预订、天气查询、办公软件、科研设备控制工具其他AI比如文字LLM调用语音识别AI处理音频小模型调用大模型解决复杂问题。工具使用的通用方法所有强LLM都适用用System Prompt告诉LLM“可以使用工具”并定义工具调用格式比如用[Tool]包裹调用指令[Output]包裹工具返回结果列出可用工具的功能和参数比如“Temperature工具查询指定地点和时间的气温参数地点、时间”用户输入需求后LLM判断是否需要调用工具生成调用指令开发者搭建“工具调用桥梁”把LLM的文字指令转化为实际工具调用工具返回结果后LLM结合结果生成最终回答用户看不到工具调用过程。避坑指南工具太多怎么办把工具说明存入记忆库用检索模块筛选合适的工具类似经验学习的逻辑工具出错怎么办LLM有一定的判断力——如果工具返回“高雄气温10000度”这种明显错误的结果LLM会识别并提示“工具输出可能有误请检查”要不要调用工具简单问题比如3×4直接回答更高效复杂问题比如实时天气、大数据分析再调用工具避免“杀鸡用牛刀”。3. 计划执行让AI Agent“有条理地做事”复杂目标需要多步骤完成AI Agent必须具备“规划能力”——比如规划3天旅行要先订机票、再找住宿、最后安排行程还要应对突发情况比如航班取消。计划执行的核心逻辑初始规划收到目标后LLM先生成详细步骤比如“旅行规划步骤1. 确定出行日期2. 搜索往返机票3. 预订住宿4. 规划每日行程”动态调整每完成一步接收环境反馈比如“机票已订好价格1800元”LLM重新评估计划是否需要调整比如预算剩余3200元住宿可以选中等价位应对突发如果遇到意外比如“预订的酒店满房”LLM重新规划比如“搜索附近同价位酒店或调整住宿区域”。现在LLM的规划能力怎么样简单任务比如叠积木、刷牙步骤能准确拆解步骤规划能力较好复杂任务比如旅行规划、科研方案单独LLM表现较差2024年初GPT4 Turbo的旅行规划成功率仅0.6%但结合工具后能大幅提升用Solver工具辅助成功率可达90%极端场景比如自定义规则的“神秘方块世界”普通LLM几乎无法完成专门的推理模型比如GPT-4o、LLaMA 3.1 405B能完成简单案例。强化规划能力的技巧脑内小剧场Tree Search让LLM在“脑海中”模拟不同行动的结果比如“如果订这家酒店预算够不够如果不够换哪家”找出最优路径世界模型World Model让LLM模拟环境变化比如“如果现在订机票会不会遇到高峰期涨价”提前规避风险避免“想太多”有些推理模型会过度思考比如“按钮点下去会怎么样”想个不停反而影响效率需要设置“思考阈值”到时间就执行行动。七、最后总结AI Agent的核心是“LLM的应用创新”这门课的核心观点的是AI Agent不是新技术而是LLM能力的延伸——利用LLM的自然语言理解、通用推理、文字生成能力结合记忆、工具、规划模块打造出“能自主完成目标”的智能体。对小白来说学习AI Agent可以从“理解核心逻辑”开始记住“目标-观察-行动-反馈”的循环搞懂记忆、工具、规划三个模块的作用对程序员来说可以从“实战入手”用ChatGPT API工具调用搭建简单的AI Agent比如自动处理邮件、生成周报再逐步优化记忆和规划功能。AI Agent的潜力巨大未来会渗透到办公、科研、教育、生活等各个领域。现在收藏这篇教程反复学习核心逻辑就能在AI Agent爆发期抢占先机如何学习大模型 AI 由于新岗位的生产效率要优于被取代岗位的生产效率所以实际上整个社会的生产效率是提升的。但是具体到个人只能说是“最先掌握AI的人将会比较晚掌握AI的人有竞争优势”。这句话放在计算机、互联网、移动互联网的开局时期都是一样的道理。我在一线互联网企业工作十余年里指导过不少同行后辈。帮助很多人得到了学习和成长。我意识到有很多经验和知识值得分享给大家也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限很多互联网行业朋友无法获得正确的资料得到学习提升故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】为什么要学习大模型我国在A大模型领域面临人才短缺,数量与质量均落后于发达国家。2023年人才缺口已超百万凸显培养不足。随着AI技术飞速发展预计到2025年,这一缺口将急剧扩大至400万,严重制约我国AI产业的创新步伐。加强人才培养,优化教育体系,国际合作并进是破解困局、推动AI发展的关键。大模型入门到实战全套学习大礼包1、大模型系统化学习路线作为学习AI大模型技术的新手方向至关重要。 正确的学习路线可以为你节省时间少走弯路方向不对努力白费。这里我给大家准备了一份最科学最系统的学习成长路线图和学习规划带你从零基础入门到精通2、大模型学习书籍文档学习AI大模型离不开书籍文档我精选了一系列大模型技术的书籍和学习文档电子版它们由领域内的顶尖专家撰写内容全面、深入、详尽为你学习大模型提供坚实的理论基础。3、AI大模型最新行业报告2025最新行业报告针对不同行业的现状、趋势、问题、机会等进行系统地调研和评估以了解哪些行业更适合引入大模型的技术和应用以及在哪些方面可以发挥大模型的优势。4、大模型项目实战配套源码学以致用在项目实战中检验和巩固你所学到的知识同时为你找工作就业和职业发展打下坚实的基础。5、大模型大厂面试真题面试不仅是技术的较量更需要充分的准备。在你已经掌握了大模型技术之后就需要开始准备面试我精心整理了一份大模型面试题库涵盖当前面试中可能遇到的各种技术问题让你在面试中游刃有余。适用人群第一阶段10天初阶应用该阶段让大家对大模型 AI有一个最前沿的认识对大模型 AI 的理解超过 95% 的人可以在相关讨论时发表高级、不跟风、又接地气的见解别人只会和 AI 聊天而你能调教 AI并能用代码将大模型和业务衔接。大模型 AI 能干什么大模型是怎样获得「智能」的用好 AI 的核心心法大模型应用业务架构大模型应用技术架构代码示例向 GPT-3.5 灌入新知识提示工程的意义和核心思想Prompt 典型构成指令调优方法论思维链和思维树Prompt 攻击和防范…第二阶段30天高阶应用该阶段我们正式进入大模型 AI 进阶实战学习学会构造私有知识库扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架抓住最新的技术进展适合 Python 和 JavaScript 程序员。为什么要做 RAG搭建一个简单的 ChatPDF检索的基础概念什么是向量表示Embeddings向量数据库与向量检索基于向量检索的 RAG搭建 RAG 系统的扩展知识混合检索与 RAG-Fusion 简介向量模型本地部署…第三阶段30天模型训练恭喜你如果学到这里你基本可以找到一份大模型 AI相关的工作自己也能训练 GPT 了通过微调训练自己的垂直大模型能独立训练开源多模态大模型掌握更多技术方案。到此为止大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗为什么要做 RAG什么是模型什么是模型训练求解器 损失函数简介小实验2手写一个简单的神经网络并训练它什么是训练/预训练/微调/轻量化微调Transformer结构简介轻量化微调实验数据集的构建…第四阶段20天商业闭环对全球大模型从性能、吞吐量、成本等方面有一定的认知可以在云端和本地等多种环境下部署大模型找到适合自己的项目/创业方向做一名被 AI 武装的产品经理。硬件选型带你了解全球大模型使用国产大模型服务搭建 OpenAI 代理热身基于阿里云 PAI 部署 Stable Diffusion在本地计算机运行大模型大模型的私有化部署基于 vLLM 部署大模型案例如何优雅地在阿里云私有部署开源大模型部署一套开源 LLM 项目内容安全互联网信息服务算法备案…学习是一个过程只要学习就会有挑战。天道酬勤你越努力就会成为越优秀的自己。如果你能在15天内完成所有的任务那你堪称天才。然而如果你能完成 60-70% 的内容你就已经开始具备成为一名大模型 AI 的正确特征了。这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】