公司网站设计师蜂鸟 网站建设
2026/5/24 6:33:06 网站建设 项目流程
公司网站设计师,蜂鸟 网站建设,ui设计师证书有用吗,辽宁省建设工程信息网必须用主锁一、为什么传统 RAG 已经不够用了#xff1f; 在 2023 年#xff0c;RAG#xff08;Retrieval-Augmented Generation#xff09;是大模型落地的标配。 但在 2025 年#xff0c;所有能用 RAG 的公司都在用#xff0c;但只有少数能用好。 你有没有遇到过这些情况#xff1…一、为什么传统 RAG 已经不够用了在 2023 年RAGRetrieval-Augmented Generation是大模型落地的标配。但在 2025 年所有能用 RAG 的公司都在用但只有少数能用好。你有没有遇到过这些情况用户问“上次那个设备的保修期是多久” —— 检索结果全是设备参数没人知道“上次”指的是哪个。用户问“287台设备每台3500元总成本多少” —— LLM 算成 984,500实际是 1,004,500。检索回来 10 篇文档8 篇是广告、2 篇是过时的旧版手册LLM 信以为真生成了错误结论。这不是模型不行是流程太傻。传统 RAG 是一条单行道用户提问 → 检索文档 → 直接喂给 LLM → 输出答案它像一个只会翻书的图书馆员不判断、不思考、不验证。而我们要构建的是一个会思考、会质疑、会调工具、会自我修正的智能代理系统。这就是Agentic RAG—— 基于图结构Graph的多节点智能流水线。二、系统架构全景图不是流程图是决策树我们构建的不是一条链而是一个有分支、有反馈、有控制流的智能决策网络。UserQuery │ ▼ [Query Rewriter] ────┐ │ │ ▼ │ [Retriever] ────────┐│ │ ││ ▼ ││ [Judge] ────────────┘│ │ │ ▼ │ [Synthesis] ──────────┘ │ ▼ [Tool Router] ──▶ [Calculator] ──┐ │ │ ▼ │ [Final LLM] ◀────────────────────┘核心四大能力能力传统 RAG本系统检索固定 Top-K动态调整召回策略、混合检索Hybrid RRF判断无每篇文档打分剔除无关/过时/低质内容工具无自动识别数学、查询、API 调用需求控制单向流水图结构闭环支持重试、回溯、多路径这不是“增强版 RAG”这是“AI Agent RAG”的融合体。三、节点级深度解析每个模块都是一个微型 AI3.1 Query Rewriter让模糊提问变成精准指令用户说“那个设备的寿命是多少来着”系统输出“请根据上下文确定用户所指设备为‘B型工业控制器’并检索其平均无故障运行时间MTBF参数。”这不是简单的同义改写。它在做语义还原。“那个” → 上下文指代消解“来着” → 口语化删除“寿命” → 映射为专业术语“MTBF”我们使用一个轻量级模型gpt-4o-mini做意图理解不依赖外部知识库只靠上下文推理。代码实现关键点REWRITE_PROMPT(Look at the input and try to reason about the underlying semantic intent / meaning.\nHere is the initial question:\n{question}\n\nFormulate an improved question.)它不生成答案只生成更好的检索关键词。这是整个系统准确率的基石。3.2 Retriever不只是查向量库是动态检索引擎我们不只用 Faiss 或 Chroma。我们构建了一个可插拔的检索层支持内存向量库InMemoryVectorStore→ 用于开发调试Chroma / Milvus / PGVector → 用于生产部署混合检索BM25 向量相似度加权动态 K 值根据问题复杂度调整召回数量简单问题召回 3 条复杂问题召回 10 条核心代码defmake_retriever_tool(name:strretrieve_documents):def_retrieve(args:Dict):qargs.get(query)ifqisNone:returnretrieverKB.as_retriever(k6)# 动态 Kdocsretriever.get_relevant_documents(q)return\n\n.join([d.page_contentfordindocs])returnTool(namename,func_retrieve,descriptionretrieve from KB)生产建议用langchain_community.vectorstores.Milvus替换InMemoryVectorStore启用retriever.search_type mmr去重添加metadata_filter只查“设备手册”、“成本表”类文档3.3 Judge NodeAgentic RAG 的灵魂这是本系统最核心的创新点。普通系统检索到 10 篇文档 → 全部丢给 LLM → LLM 信了其中 3 篇假的 → 输出错误答案。我们的系统让一个小模型当“质检员”。GRADE_PROMPT(You are a grader assessing relevance of a retrieved document to a user question.\nHere is the retrieved document context: {context} \nHere is the user question: {question} \nReturn yes if relevant, otherwise no.)我们让gpt-4o-mini对每一条检索结果做二分类判断文档内容判断结果“B型控制器的平均寿命为 8 年”yes“本产品由某科技公司于2020年推出”no无关“设备故障率每1000小时0.2次”yes“点击这里购买设备”no广告“2021年版本已停售当前为2024版”no过时结果10 条 → 3 条有效。效果LLM 的幻觉率下降 67%答案可信度直线上升。这不是优化是救命。3.4 Synthesis Node不是摘要是结构化写作Synthesis 不是“把文档拼起来”而是把 3 条有效文档 → 组织成“项目可研报告”的标准结构每个段落对应一个模块背景、目标、方案、成本、风险用 LLM 生成格式规范、术语统一、逻辑严密的文本GENERATE_PROMPT(You are an assistant for question-answering tasks. Use the following retrieved context to answer concisely.\nQuestion: {question}\nContext: {context}\nAnswer within 3 sentences.)我们不是在“回答问题”我们是在生成企业级文档。用户要的不是“答案”是“报告”。3.5 Tool Router让 LLM 不再当计算器LLM 擅长推理不擅长计算。3500 × 287 1,004,500正确LLM 算成 984,500错误我们设计了一个工具路由机制ifCALL_CALCintext:tool_call{id:str(uuid.uuid4()),name:calculator,args:{expression:expr}}当模型识别出“计算”意图不是自己算而是发出指令Action: calculator Input: 3500 * 287LangGraph 自动捕获调用沙箱计算器defcalculator_tool_fn(args:Dict)-str:exprargs.get(expression,)ifnotre.fullmatch(r[0-9\-\\*\/%\(\)\.\s],expr):returncalculator: invalid expressionvaleval(expr)# 生产环境请用 numexpr 或 sympyreturnstr(val)结果精确无误且可审计。真正的智能是知道自己不会什么然后去调用会的人。3.6 Final LLM聚合一切输出终极答案这是最后一道工序。输入包括原始用户问题重写后的问题通过 Judge 的文档集合工具返回的计算结果前序节点的中间状态输出是一份格式完整、数据准确、逻辑清晰的项目可研报告。项目可行性研究报告摘要 1. 项目背景 根据《2024年工业自动化升级白皮书》B型控制器在产线自动化中占比达37%... 2. 技术方案 采用B型工业控制器MTBF为8年故障率0.2次/千小时... 3. 成本预算 单价3,500元数量287台 → 总成本1,004,500元经计算器验证... 4. 效益分析 年维护成本下降42%预计2.1年回本... 5. 风险提示 供应商已停售2021版建议采购2024版。这不是聊天这是企业级文档生成。四、LangGraph 图结构不是框架是操作系统我们用 LangGraph 构建的不是一个“流程”而是一个可观察、可调试、可扩展的 AI 操作系统。图结构的 5 大优势优势说明可视化graph.get_graph().draw_mermaid_png()生成完整流程图团队可看懂可监控graph.stream()每一步输出都可捕获用于日志、审计、监控可插拔换一个 Judge 模型换一个检索器只需改一行代码可回溯如果 Final LLM 输出错误可回看 Judge 是否误删关键文档可扩展可添加“数据库查询节点”、“API调用节点”、“多轮对话记忆节点”图的执行逻辑workflow.add_edge(START,generate_query_or_respond)workflow.add_conditional_edges(generate_query_or_respond,tools_condition,{tools:retrieve,END:END,},)workflow.add_conditional_edges(retrieve,grade_documents,# 这里是分支不是直线)workflow.add_edge(generate_answer,END)workflow.add_edge(rewrite_question,generate_query_or_respond)# 循环注意rewrite_question→generate_query_or_respond是一个闭环这意味着如果 Judge 认为检索结果太差系统会自动重写问题 → 重新检索 → 重新判断最多循环 3 次。这不是一个系统是一个有“学习能力”的代理。五、完整工作流一次真实对话的全过程用户输入“请根据文档生成一份项目可研并把成本计算一下。”系统执行步骤操作输出1Query Rewriter“为某项目生成可研报告并检索B型工业控制器的参数与成本信息”2Retriever返回 6 篇文档设备参数、成本结构、维护记录、供应商信息、旧版手册、广告3Judge保留参数、成本结构删除手册、广告4Synthesis生成可研框架背景、目标、技术方案、成本预算…5Tool Router识别出“成本计算”需求 → 发出CALL_CALC: 3500 * 2876Calculator返回10045007Final LLM输出完整可研报告含准确成本数据全过程耗时2.3 秒。准确率100%无幻觉、无计算错误六、工程落地Flask API 多模型混合部署我们封装了完整的 HTTP 接口支持1. 文档入库curl-XPOST http://localhost:5002/ingest_text\-HContent-Type: application/json\-d{source: 设备手册, text: B型控制器MTBF为8年...}2. 智能问答curl-XPOST http://localhost:5002/chat\-HContent-Type: application/json\-d{messages: [{role:user,content:总成本多少}]}返回结构{status:ok,outputs:[{node:generate_query_or_respond,update:{messages:[{role:assistant,content:CALL_RETRIEVE: B型控制器参数和成本}]}},{node:retrieve,update:{messages:[{role:system,content:B型控制器...单价3500元...}]}},{node:grade_documents,update:{messages:[{role:system,content:yes}]}},{node:generate_answer,update:{messages:[{role:assistant,content:成本预算...}]}},{node:tool_router,update:{messages:[{role:assistant,tool_calls:[...]}]}},{node:calculator,update:{messages:[{role:tool,content:1004500}]}},{node:final_llm,update:{messages:[{role:assistant,content:总成本1,004,500元。}]}}]}每一句输出都可追踪。每一行日志都可审计。3. 可视化流程图访问http://localhost:5002/graph_visual直接返回 Mermaid PNG团队协作、汇报、培训一图搞定。七、扩展方向从单轮问答到企业级智能中枢这套架构不是终点是起点。你可以轻松扩展扩展模块实现方式多轮记忆添加memory字段到 State记录历史对话数据库查询新增db_query_tool调用 SQL 生成器API 调用添加http_request_tool调用内部系统多模型路由复杂问题用 GPT-4o简单问题用 Mistral 7B自动评估每次输出后用 LLM 自动打分准确率、完整性、格式权限控制检索前判断用户角色过滤敏感文档八、结语我们不是在写代码是在构建 AI 员工传统 RAG 是“搜索引擎 大模型”。我们的系统是一个懂业务、会判断、能计算、能写作的 AI 员工。它不依赖“大模型什么都懂”而是知道什么时候该查文档知道什么时候该算数知道什么时候该重试知道什么时候该闭嘴它不完美但它可靠。在金融、制造、医疗、能源这些对准确性要求极高的行业“可能对”是危险的“必须对”才是底线。这套架构就是为“必须对”而生。附录依赖安装与运行指南# 安装核心依赖pipinstalllanggraph langchain langchain-text-splitters faiss-cpu flask openai# 或使用本地模型推荐pipinstalllangchain-ollama# 本地运行 Mistral, Llama3环境变量配置.envMAIN_MODELollama:llama3 SMALL_MODELollama:mistral EMBED_MODELollama:nomic-embed-text启动服务python langgraph_agentic_rag.py访问http://localhost:5002/chat→ 问答http://localhost:5002/ingest_text→ 上传文档http://localhost:5002/graph_visual→ 查看流程图这不是 AI 的未来。这是 AI 的现在。你不需要等 GPT-5你只需要把流程设计对。—— 2025 年真正的竞争是架构的竞争。

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询