中国上海门户网站公众号宁波网络推广哪家公司好
2026/4/17 11:52:23 网站建设 项目流程
中国上海门户网站公众号,宁波网络推广哪家公司好,网站建设的税收编码,移动外贸网站建设文章目录 1. 写在最前面2. ReActAgent 浅析2.1 什么是 ReAct2.2 为什么无需设置 prompt 3. ReActAgent 的核心机制3.1 ReAct 循环#xff1a;推理与行动的交替3.2 为什么需要多轮推理#xff1f;3.3 错误处理与自我修正 4. ReActAgent 的使用场景4.1 适合场景4.2 不适合的场景…文章目录1. 写在最前面2. ReActAgent 浅析2.1 什么是 ReAct2.2 为什么无需设置 prompt3. ReActAgent 的核心机制3.1 ReAct 循环推理与行动的交替3.2 为什么需要多轮推理3.3 错误处理与自我修正4. ReActAgent 的使用场景4.1 适合场景4.2 不适合的场景5. 碎碎念6. 参考资料1. 写在最前面趁着假期前继续学习一下之前没有深入理解的 ReActAgent 的工作原理。果然假期马上就可以出去玩的想法会让人心猿意马。ps 但是今天晚上还是要继续去锻炼的……2. ReActAgent 浅析2.1 什么是 ReActReAct 这个名字很有意思它其实是Reasoning推理和Acting行动两个词的组合。这个命名本身就揭示了 ReActAgent 的核心思想通过推理来决定行动通过行动的结果来指导下一步推理。具体代码示例frombeeai_framework.agents.reactimportReActAgentfrombeeai_framework.backendimportChatModelfrombeeai_framework.memoryimportUnconstrainedMemoryfrombeeai_framework.tools.codeimportPythonTool,SandboxTool# ReActAgent 的创建非常简单agentReActAgent(llmChatModel.from_name(ollama:granite3.3:8b),tools[python_tool,sandbox_tool],memoryUnconstrainedMemory())从代码来看ReActAgent 的 API 非常简洁只需要提供 LLM、工具列表和内存管理即可。但简洁的背后隐藏着强大的自主决策能力。注思考一下理论上 LLM 都需要提供特定的 prompt 才能够让 LLM 按照预期返回但是上面的 ReActAgent 木有要求设置2.2 为什么无需设置 prompt答案是因为ReActAgent 需要 LLM 严格按照 ReAct 格式输出Thought: → 思考过程Action: → 选择的工具Action Input: → 工具输入Observation: → 工具执行结果Final Answer: → 最终答案这个格式是固定的必须由框架内置的 Prompt 模板来保证。3. ReActAgent 的核心机制3.1 ReAct 循环推理与行动的交替ReActAgent 的核心是一个循环过程每次循环都包含以下几个步骤Thought思考Agent 分析当前情况思考下一步应该做什么Action行动根据思考结果选择并调用合适的工具Action Input行动输入为选定的工具提供输入参数Observation观察观察工具执行的结果Final Answer最终答案如果任务完成提供最终答案否则继续下一轮循环这个循环过程可以用下面的流程图表示用户问题 ↓ [Thought] → 分析问题决定需要什么工具 ↓ [Action] → 选择工具如 PythonTool ↓ [Action Input] → 提供工具输入如 Python 代码 ↓ [Observation] → 观察执行结果 ↓ [Thought] → 分析结果决定下一步 ↓ ├─→ 如果任务完成 → [Final Answer] └─→ 如果未完成 → 继续循环举例本地的调用如下3.2 为什么需要多轮推理很多复杂任务无法一次性完成需要多轮推理。举个例子用户问题“计算 1 到 100 的平方和然后找出所有大于 1000 的平方数”这个任务需要第一轮计算 1 到 100 的平方和第二轮根据第一轮的结果找出所有大于 1000 的平方数如果使用RequirementAgent开发者需要预先定义这两步的执行顺序。但如果使用ReActAgentAgent 可以自主决定先执行第一步观察结果根据结果决定是否需要执行第二步如果第一步的结果已经足够可能直接给出答案这种灵活性在处理复杂、动态的任务时特别有用。3.3 错误处理与自我修正ReActAgent 的另一个强大之处在于它的错误处理能力。当工具执行失败时Agent 可以分析错误原因通过 Observation 观察错误信息推理修复方案在下一轮 Thought 中分析如何修复尝试修复调用工具进行修复或重试# 示例Agent 执行代码时遇到错误# Round 1:# Thought: 需要计算 10/0# Action: PythonTool# Action Input: result 10 / 0# Observation: ZeroDivisionError: division by zero# Round 2:# Thought: 出现了除零错误需要添加错误处理# Action: PythonTool# Action Input:# try:# result 10 / 0# except ZeroDivisionError:# result Cannot divide by zero# Observation: 代码执行成功result Cannot divide by zero这种自我修正的能力让 ReActAgent 能够处理一些不可预见的错误情况。4. ReActAgent 的使用场景4.1 适合场景代码执行和计算动态生成和执行代码代码解释器Code Interpreter数学计算和数据分析复杂问题求解需要多步推理的任务步骤间有依赖关系的任务例如分析 CSV → 找出最高销售额类别 → 计算平均利润率交互式任务需要根据结果调整策略需要多轮迭代和修正例如写代码 → 测试 → 修复错误 → 再测试错误恢复需要处理不确定性和错误能够自我修正和重试动态错误处理4.2 不适合的场景严格流程控制需要精确控制每一步执行简单工具调用只需一次或少量工具调用LLM 不支持LLM 输出格式不符合 ReAct 要求5. 碎碎念发现关于 AI 的很多不理解其实是因为同一个意思有多种的表达方式比如下面这几个其实是类似同义词来着。人类大模型大脑思考、推理、决策LLM 推理能力理解、分析、决策小脑协调动作、执行操作工具调用能力调用工具、执行操作记忆存储知识、经验RAG检索知识库、增强回答所以说再讨论问题之前还是得先统一概念。你有没有想过从公元前 221 年秦朝建立到如今这看似漫长的 2245 年其实也不过是麦子熟了 2245 回。其实 1978 年宣布改革开放时距离清朝灭亡也才过去66年。如果一个人的生命有 70 年那么 2245 年也只是 32 个人生死相接的一生。我们总是被一些大词裹挟沉迷于一些宏大叙事、空洞概念其实不如实在一点想想这短暂的一生到底要为什么而活。注参考 普通人的一生应该是怎样的6. 参考资料万字长文从零开始构建你的第一个 ReAct Agent别让米其林主厨削土豆英伟达用“小脑指挥大脑”重构AGI生产力

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询