专业做包装的电商网站做内贸注册什么网站
2026/4/16 22:19:35 网站建设 项目流程
专业做包装的电商网站,做内贸注册什么网站,做网站最基础需要什么条件,ui培训机构设计你这个系统#xff0c;准确率能达到多少#xff1f; V3.0版本#xff1a;简单问答95%#xff0c;复杂问答92%#xff0c;关系推理85%#xff0c;多模态检索88%。 响应时间呢#xff1f; 平均1.2秒#xff0c;比V1.0快了4…你这个系统准确率能达到多少V3.0版本简单问答95%复杂问答92%关系推理85%多模态检索88%。响应时间呢平均1.2秒比V1.0快了40%。成本呢API调用成本降低了45%一个月能省好几千。那你用了什么黑科技没有黑科技就是把每个环节都做到极致。好久没亲自写过公众号了距离上次写文章已经过去整整半年了。这应该是我写技术文章以来停更时间最长的一次。以前总觉得再忙也能挤出时间写一篇文章吧但这次是真的没时间。忙到每天睁开眼就是工作闭上眼脑子里还在想代码怎么优化。这三个月团队一直在做一件事从零开始打造一个企业级RAG知识库系统并且一路迭代到了V3.0。最终成果✅ 准确率95%简单、92%复杂、85%关系推理✅ 响应时间1.2秒比V1.0快40%✅ 成本降低45%✅ 功能文本检索 知识图谱 多模态检索✅ 评分4.75/5超越95%开源方案媲美大厂商业产品为什么要做这个故事要从今年9月说起。那时候我在研究各种RAG框架LangChain、LlamaIndex、Dify都玩了个遍。说实话这些开源框架都挺好的文档齐全社区活跃demo跑起来也很顺畅。但当我真正想把它们用到企业项目里的时候就发现问题来了。第一个问题是准确率。 客户给我一堆PDF文档有产品手册、技术规范、会议纪要让我做一个智能问答系统。我用最简单的方式做了一版文档切片 → 向量化 → 存到ChromaDB → 检索 → 喂给大模型。结果呢简单问题还行稍微复杂一点的问题就开始胡说八道。客户问我们产品的核心技术参数是什么系统回答的内容东拼西凑把三个不同产品的参数混在一起了。第二个问题是成本。 我当时用的是豆包每次查询都要调用API一个月下来光API费用就花了好几千。客户一看账单直接说这成本太高了能不能降下来第三个问题是响应速度。 企业用户是没有耐心的等待超过3秒就会觉得卡。但我那个版本从查询到返回答案平均要5-6秒高峰期甚至要10秒。我意识到开源框架给的是一个能跑的demo但离能用还差得远离好用就更远了。于是我决定自己从头做一个。一开始我也很天真决定做这个事情的时候我其实挺天真的。我以为做一个企业级RAG系统不会太难毕竟技术路线很清晰文档处理 → 向量检索 → 大模型生成无非就是把这几个模块做扎实一点。我还跟自己说给我一个月时间肯定能把MVP做出来。现在想想当时真是too young too naive。真正动手之后才发现我完全低估了这个系统的复杂度。一个好的企业级RAG系统绝不是简单地把文档、向量数据库、大模型拼在一起就行了。每一个环节都有无数的坑等着你。第一个坑文档处理企业的文档千奇百怪。有扫描版PDF有Word文档有Excel表格还有各种图片。最头疼的是跨页表格。你见过那种一个表格跨了三页纸的文档吗用常规的PDF解析工具直接就把表格切断了后面的数据完全对不上。我花了整整一周时间研究MinerU这个开源工具它专门针对复杂PDF做了优化能够识别表格结构自动合并跨页表格。但即使这样还是有很多边界情况需要处理。还有OCR识别。客户给的很多文档都是扫描件文字识别错误率高得吓人。机器学习识别成机器字习深度神经网络识别成深度神经纲络。这种错误如果不纠正后面的检索就全废了。我的解决方案是用PaddleOCR识别 豆包大模型纠错。先用OCR把文字提取出来然后喂给大模型让它根据上下文纠正明显的错误。这个方案让OCR准确率从85%提升到了95%以上。第二个坑文档切片这是整个系统最核心、也是最容易被忽视的环节。一开始我用的是最简单的Token切片每1024个Token切一刀重叠100个Token。结果发现这种机械式的切分会严重破坏语义完整性。举个例子有一段文档是这样的LlamaIndex的核心组件包括 1. 文档加载器负责解析和处理各种格式的文档 2. 向量化服务将文本转换为向量表示 3. 向量数据库存储和检索向量数据用Token切片很可能把文档加载器和它的解释切到两个不同的块里。用户问文档加载器是干什么的系统检索到的块里只有文档加载器这几个字没有后面的解释大模型就只能瞎猜了。我研究了LlamaIndex的SemanticSplitter它的思路是根据语义边界来切分而不是机械地按字符数切。具体做法是先把文档按句子拆分用Embedding模型计算相邻句子的语义相似度当相似度突然下降时说明主题发生了变化就在这里切一刀这个方法确实好用但也有问题如果某个语义段落太长怎么办我的最终方案是语义切片 滑动窗口的混合策略。第一步用语义切片把文档切成若干个语义完整的段落第二步检查每个段落的大小如果超过阈值比如300个Token就用滑动窗口再切一次这样既保证了语义完整性又控制了切片大小检索效果提升了至少30%。第三个坑检索策略纯向量检索不够用。我做过对比实验同样的问题纯向量检索的准确率只有70%左右。为什么因为向量检索擅长理解语义但对精确匹配不敏感。比如用户问GB-T 12345这个标准的内容是什么这是一个精确匹配的需求但向量检索可能会把GB-T 12346、GB-T 12344这些相似的标准也检索出来反而把正确的标准排在后面。我的解决方案是混合检索 BGE重排序。混合检索就是同时用向量检索和关键词检索然后把结果融合起来。向量检索负责理解语义关键词检索负责精确匹配。我设置的权重是向量70%、关键词30%这个比例是经过大量测试调出来的。但光有混合检索还不够因为融合后的排序可能还是不准。这时候就需要重排序Rerank。我用的是BGE-Reranker模型它会重新计算每个检索结果和用户问题的相关性然后重新排序。这套组合拳下来检索准确率从70%提升到了90%以上。第四个坑成本控制企业最关心的就是成本。一开始我用的是豆包的pro-32k模型效果很好但成本也很高。一个月下来光API费用就要好几千。我做了两个优化第一个是多级缓存。 很多问题是重复的比如公司的退货政策是什么这种问题可能每天都有人问。我设计了一个三级缓存系统L1缓存内存缓存存最近1小时的查询命中率30%L2缓存Redis缓存存最近24小时的查询命中率15%L3缓存语义缓存用向量相似度匹配历史查询命中率5%三级缓存加起来总命中率达到50%直接省了一半的API调用。第二个是智能路由。 不是所有问题都需要用最贵的模型。简单的问题用lite模型就够了复杂的问题才用pro模型。我设计了一个基于Gumbel-Softmax的智能路由器它会分析问题的复杂度然后自动选择合适的模型。这个优化让API成本又降低了35%。V2.0多智能体协作做到这里系统已经能用了。简单问答的准确率达到90%响应时间控制在2秒以内成本也降下来了。但我不满足。因为我发现对于复杂问题单一的RAG流程还是不够。比如用户问对比一下我们公司和竞争对手在供应链管理上的差异并给出改进建议。这个问题需要检索我们公司的供应链文档检索竞争对手的供应链文档对比分析两者的差异基于差异给出改进建议单一的RAG流程很难处理这种多步骤、需要推理的复杂任务。于是我设计了多智能体协作系统。这个系统有四个Agent检索Agent负责从知识库中检索相关文档问答Agent负责基于检索结果生成答案评估Agent负责评估答案质量决定是否需要重新生成协调Agent负责协调各Agent之间的工作流程对于复杂问题协调Agent会把任务分解成多个子任务分配给不同的Agent处理最后把结果汇总起来。这个设计让复杂问答的准确率从75%提升到了88%。V2.0HTN任务规划多智能体解决了复杂问题的处理但还有一个问题如何自动分解任务一开始我是手写规则比如如果问题包含对比关键词就分解成检索A、检索B、对比分析三个子任务。但这种方式太死板了覆盖不了所有情况。后来我引入了HTNHierarchical Task Network任务规划器。HTN的核心思想是把复杂任务层层分解直到分解成可以直接执行的原子任务。比如对比供应链差异这个任务HTN会这样分解每个子任务都可以继续分解直到变成检索文档、提取信息、生成文本这种原子操作。这个规划器让系统能够自动处理各种复杂任务不需要我手写规则了。V3.0知识图谱 多模态质的飞跃做到V2.0的时候我以为已经够好了。但在实际使用中我又发现了两个致命的局限局限1无法处理关系类问题添加图片注释不超过 140 字可选例如李白的老师的学生都有谁系统懵了。它能检索到李白的老师是贺知章也能检索到贺知章的学生有李白、张若虚但它无法把这两条信息串起来做多跳推理。这就是纯向量检索的局限它只能做语义匹配不能做关系推理。于是我决定引入知识图谱。一开始我想用Neo4j但部署和运维太复杂了。后来我选择了一个轻量级方案用networkx构建内存图 豆包API提取实体关系。具体做法是文档入库时用豆包API提取实体和关系比如李白 -[师从]- 贺知章把这些实体和关系存到networkx图中查询时先判断是否是关系类问题如果是就在图上做遍历支持1-2跳推理把图检索结果和向量检索结果融合喂给大模型这个方案让系统能够回答各种关系类问题A公司的CEO曾在哪些公司工作过这个技术的发明者还发明了什么找出所有相互引用的论文关系推理准确率提升了40%。局限2看不懂图片和图表还有一次客户给了一堆产品手册里面有大量的架构图、流程图、对比表。用户问找出所有包含产品对比表的文档。我的系统只能匹配文字对比表但看不懂图片里的表格内容。很多重要信息都在图表里系统完全检索不到。这就是纯文本检索的局限丢失了大量视觉信息。于是我决定引入多模态检索。我用的是CLIP模型它能够理解图像和文本的语义关联。具体做法是文档入库时提取所有图片用CLIP模型把图片编码成向量把图像向量和文本向量都存到向量数据库查询时同时检索文本和图像支持文找图、图找文、图找图三种模式这个功能让系统能够理解图表内容提取表格数据分析架构图、流程图根据图片内容检索相关文档回答这个架构图说明了什么这类问题多模态检索让信息覆盖率提升了25%。真实案例V3.0解决了哪些实际问题案例1制造业供应链分析添加图片注释不超过 140 字可选一家制造企业有上千份供应商文档。他们的需求是找出所有和A供应商有合作关系的其他供应商分析我们的供应链中有哪些单点故障风险V2.0的纯向量检索完全搞不定因为这需要理解供应商之间的关系网络。V3.0的知识图谱轻松解决1. 自动提取供应商实体和合作关系2. 构建供应链关系图3. 通过图遍历找出所有关联供应商4. 识别出3个关键节点单点故障风险案例2设计公司图纸管理添加图片注释不超过 140 字可选客户是一家工业设计公司有几万张CAD图纸和产品照片。他们的需求是找出所有包含齿轮结构的设计图这个零件图和哪些产品图相关V2.0只能通过文件名和标注文字检索大量图纸检索不到。V3.0的多模态检索完美解决用CLIP模型理解图纸内容支持以图搜图功能自动识别图纸中的关键结构齿轮、轴承等建立图纸之间的视觉相似度关系客户反馈以前找一张图要翻半天现在几秒钟就能找到。V3.0的技术挑战知识图谱和多模态听起来很美好但实现起来坑很多。知识图谱的坑实体识别准确率不够一开始用开源NER模型准确率只有70%后来换成豆包API准确率提升到90%关系抽取很难同一个关系可能有多种表达方式需要大量的prompt工程多模态的坑CLIP模型很吃GPU一开始在4070上跑慢得要死后来咬牙买了张RTX 4090图像预处理很重要图片大小、分辨率、裁剪方式都会影响效果图文融合的权重调优文本和图像的相似度分数不在一个量级需要归一化核心技术亮点从V1.0到V3.0的完整技术栈添加图片注释不超过 140 字可选回顾这三个月系统经历了三次重大迭代每次都有核心技术突破V1.0 基础能力第1-2周1. 术语管理系统企业文档里有大量专业术语而且同一个概念可能有多种表达方式。比如机器学习可能被写成ML、Machine Learning。我做了一个术语管理系统能够自动识别文档中的专业术语建立术语和同义词的映射关系在检索时自动进行术语标准化这个功能让检索准确率提升了10%。2. 混合切片策略语义切片 滑动窗口的混合策略这是整个系统的灵魂。它既保证了语义完整性又控制了切片大小还通过重叠机制避免了边界信息丢失。3. 混合检索 BGE重排序向量检索70%权重 关键词检索30%权重 BGE-Reranker重排序。这个组合让检索准确率从70%提升到90%。4. Lost in Middle解决方案把最相关的内容放在开头和结尾次相关的内容放在中间[1, 3, 5, ..., 6, 4, 2]。这个小技巧让答案质量提升了5%。V2.0 智能增强第3-6周5. 多智能体协作系统四个Agent协同工作检索Agent从知识库检索相关文档问答Agent基于检索结果生成答案评估Agent评估答案质量决定是否重新生成协调Agent协调各Agent的工作流程复杂问答准确率从75%提升到88%。6. Gumbel-Softmax智能路由根据问题复杂度自动选择合适的模型简单问题 → lite模型快速、便宜复杂问题 → pro模型准确、稍贵多模态问题 → VLM模型理解图像API成本降低35%。7. HTN任务规划器自动分解复杂任务支持3层嵌套、最多10个子任务。多步骤任务成功率达到85%。8. 多级缓存系统三级缓存内存 Redis 语义缓存让缓存命中率达到50%。V3.0 终极进化第7-12周9. 轻量级知识图谱用networkx构建内存图 豆包API提取实体关系。核心能力实体识别准确率90%关系抽取准确率85%支持1-2跳图遍历图检索响应时间500ms图向量混合检索问李白的老师的学生都有谁 答李白 -[师从]- 贺知章 -[学生]- [李白, 张若虚, 包融, 张旭] 问A公司的CEO曾在哪些公司工作过 答通过图遍历找到完整的职业履历 问找出所有相互引用的论文 答通过引用关系图找到论文网络关系推理准确率85%。10. 多模态检索系统基于CLIP模型的图文混合检索。核心能力图像向量化CLIP-ViT-L/14支持文找图、图找文、图找图图表内容理解和提取架构图、流程图分析典型应用场景问找出所有包含产品对比表的文档 答✓ 能理解图表内容识别表格结构 问这个架构图说明了什么 答✓ 能分析图片内容提取关键信息 问找一张类似的流程图 答✓ 支持以图搜图多模态检索准确率88%信息覆盖率提升25%。11. 查询优化引擎集成了多种查询优化技术HyDE假设性文档嵌入生成假设答案提升检索准确率查询分解把复杂问题拆成多个子问题查询改写用大模型改写用户问题提升匹配度查询路由自动判断用向量检索、图检索还是多模态检索12. 上下文管理器智能管理大模型的上下文窗口动态调整检索文档数量根据问题复杂度上下文压缩保留关键信息去除冗余上下文重排Lost in Middle优化Token预算管理避免超过模型限制适用场景与竞品对比这个系统特别适合中型到大型企业10-5000人尤其是需要处理大量文档的企业产品手册、技术规范、会议纪要、合同文件等需要智能问答的场景客服系统、内部知识库、技术支持等需要关系推理的场景供应链分析、人员关系网络、技术依赖图谱等需要多模态检索的场景图纸管理、设计文档、产品图册等对成本和性能都有要求的企业既要效果好又要成本可控与市面方案的对比基于我们的实际测试和使用经验做了一个简单的对比仅供参考踩过的坑这三个月踩的坑太多了挑几个印象深刻的说说坑1向量数据库的选择一开始我用的是Milvus功能很强大但部署和运维太复杂了。后来换成ChromaDB虽然功能没那么强但对于中小规模的应用完全够用而且部署简单一个pip install就搞定。坑2Embedding模型的选择我试过OpenAI的text-embedding-ada-002效果很好但成本太高。后来换成开源的text2vec-base-chinese效果差不多但完全免费。坑3切片大小的调优切片太小上下文不够大模型理解不了切片太大检索不精准而且容易超过大模型的上下文窗口。我测试了从256到2048的各种大小最后发现1024是最佳平衡点。坑4重排序的必要性一开始我觉得混合检索已经够好了不需要重排序。后来发现混合检索的融合算法再怎么优化也比不上专门的Reranker模型。加上BGE-Reranker后准确率直接提升了15%。坑5缓存的过期策略一开始我设置的缓存过期时间是7天结果发现很多文档更新后用户还是拿到旧的答案。后来改成文档更新时主动清除相关缓存同时把缓存过期时间缩短到24小时。V3.0已实现但未来还有更多可能V3.0已经很强了但在实际使用中我发现还有很多可以优化的空间。这里分享一下我的优化规划也是接下来几个月要做的事情。写在最后从V1.0到V3.0的感悟这三个月真的很累但也很充实。从最初的V1.0基础RAG到V2.0多智能体协作再到V3.0知识图谱多模态每一次迭代都是一次质的飞跃。V1.0教会我基础要扎实。 文档处理、切片策略、混合检索这些看似简单的基础功能其实最考验功力。基础不牢地动山摇。V2.0教会我架构要灵活。 多智能体、智能路由、HTN规划这些高级功能让系统能够处理复杂任务。但如果架构设计不好再多的功能也只是堆砌。V3.0教会我要敢于突破。 知识图谱和多模态听起来很难但只要敢于尝试就能找到解决方案。轻量级的networkx图谱、基于CLIP的多模态检索都是在不断尝试中找到的最优解。做技术的人很容易陷入一个误区就是只关注技术本身觉得技术牛逼就行了。但实际上技术只是手段解决问题才是目的。这个系统能做到现在这个程度不是因为我用了多么高深的技术而是因为我真正理解了企业的需求知道他们的痛点在哪里。准确率、响应时间、成本、信息覆盖率这四个指标缺一不可。准确率不够用户不信任响应时间太长用户没耐心成本太高用户用不起信息覆盖率低很多问题答不上来只有四个指标都做好了才是一个真正能用、好用的企业级系统。V3.0完整技术栈基础设施后端框架Python 3.10 FastAPI向量数据库ChromaDB图数据库NetworkX轻量级内存图缓存Redis 内存缓存AI模型Embedding模型text2vec-base-chinese大语言模型豆包APIDoubao-pro-32k / Doubao-lite-32k重排序模型BGE-Reranker-base多模态模型CLIP-ViT-L/14OCR引擎PaddleOCR核心服务文档处理MinerU表格处理 PaddleOCR图像识别切片策略语义切片 滑动窗口混合检索服务向量检索 关键词检索 图检索 多模态检索智能路由Gumbel-Softmax路由器任务规划HTN规划器多智能体4个Agent协作系统监控与优化日志Loguru监控自研监控API成本追踪实时Token统计和预算管理注本系统为公司商业项目暂不开源。商务合作如果你的企业有以下需求定制化的企业级RAG知识库系统RAG系统的技术咨询和架构设计系统性能优化和成本优化服务知识图谱或多模态检索解决方案欢迎联系商务合作添加图片注释不超过 140 字可选V3.0已经很强了但这只是开始。我们下期见。编辑 LYDZA2025 \ 责任编辑: LYiAgent \ 审核: LYiAgent声明凡“灵怡Agent”原创稿件转载或引用请注明来源部分素材来自网络版权归原作者所有如有侵权请联系我们谢谢本文使用 文章同步助手 同步

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询