2026/6/1 13:54:33
网站建设
项目流程
如何用网站模板建站,有不花钱做网站,山西通州集团网站建设,网站开发 保修期本文详解RAG(检索增强生成)技术#xff0c;通过结合外部知识库与文本生成#xff0c;有效提升大模型回答准确性并减少幻觉。文章系统介绍了RAG原理、发展历程、核心组件(文档解析、知识构建、检索、增强、生成)及企业级应用方案#xff0c;包括知识库搭建流程、优化策略和典…本文详解RAG(检索增强生成)技术通过结合外部知识库与文本生成有效提升大模型回答准确性并减少幻觉。文章系统介绍了RAG原理、发展历程、核心组件(文档解析、知识构建、检索、增强、生成)及企业级应用方案包括知识库搭建流程、优化策略和典型应用场景。RAG技术使企业能快速应用内部数据价值无需自研大模型即可实现专业知识精准问答是当前大模型应用的创新方向。学习AI大语言模型是一个系统的过程需要从基础开始逐步深入到更高级的技术。大语言模型本身存在一些局限性而RAG就像那种上学时的“开卷小天才”——会查资料还会加工能有效减少产生误导性信息的可能它是AI大模型应用的创新方法为AI的回答能力打开了新世界的大门为企业搭建知识库提供了全新的解决方案即通过结合信息检索、增强和文本生成能力有效提升大模型在知识密集型任务的准确性、可靠性、可解释性以及大幅减少大模型的幻觉。一、RAG知识库相关名称解释1、文档解析文档→结构化数据将可解析pdf非扫描件、word、txt格式的非结构化文本文档解析为标准的结构化文档数据。2、知识构建结构化数据→构建索引基于结构化文档数据按照知识索引构建策略生成若干类型的知识索引用于后续知识问答过程中的检索任务。3、知识检索用户问题→检索索引→检索结果对用户问题进行意图识别、改写、优化按照检索策略进行知识召回用于后续的大模型生成任务。4、Prompt是给AI的指令引导模型生成符合业务场景的响应输出.5、RAG问答生成问答提示词→大模型生成根据RAGRetrieval-Augmented Generation检索增强生成范式规则将用户问题、知识检索结果构建为问答提示词提供给大模型利用大模型的文本生成能力输出问答形式的结果回复。二、基于大语言模型搭建知识库问答的三种解决思路1、模型微调Fine-Tuning基于专有知识建立训练数据集用大模型在数据集上进行微调改变神经网络中参数的权重相当于让模型去学习这些知识。微调方式适合特定的任务但也存在一些问题如没有解决事实性问答可靠的问题、计算资源和时间成本较高、需要构建特定领域的微调训练语料、微调的结果存在不确定性等。2、使用提示工程Prompt Engineering使用领域的专业知识作为输入信息提供给模型类似于短期记忆容量有限但是清晰其优势是模型解析回答的正确性和精度高不足在于所有的大模型均对输入信息的最大长度有限制一次能够处理的文本数量有限对于知识库来说从可行性和效率角度都是不合适的。3、结合知识检索增强大模型在进行模型问答时使用信息检索构建知识库查询将检索结果提供给大模型进行理解和生成。该方法使大模型作为用户和搜索系统中介发挥其自然语言处理能力对用户请求进行纠错、提取关键点等预处理实现“理解”对输出结果在保证正确性的基础上进行概括、分析、推理。这样无论是数据规模、查询效率、更新方式都可以满足常见知识库应用场景的需要。 RAG主要是指上面的第三种解决思路它的核心就是让AI大语言模型学会查资料再用查到的内容回答提问。在DeepSeek出来之前很多模型不具备联网搜索能力目前市面上的【联网搜索】实际也是一种RAG也称为知识库外挂。但是在企业应用中RAG往往是企业内部不便公开的业务数据、知识库。RAG技术价值在垂直领域大模型里非常明显。比如企业内部的用户数据、沉淀多年的数据仓库、搜索平台数据研报、法律文本、合同等。RAG让数据孤岛不再孤单让没有能力自研大模型没有能力购买GPU的企业也可以快速应用处于孤岛的数据价值。三、知识库发展历程1、早期的知识库以纸质文档为主对于检索和更新使用非常低效且随着时间的推移文件的数量逐渐庞大纸质文档常年缺乏维护损坏后也无法产生有效的价值。2、进入信息时代文档管理逐步电子化存储到计算机系统中对文档进行管理很大程度上便捷了使用但都是孤立存储的没有建立文档知识的关系缺乏相关知识的联动。3、云计算和大数据推动了一系列人工智能技术的落地和发展使人们从信息时代迈入了智能时代。四、RAG技术发展历程1、朴素RAGNaive RAG最早期RAG应用实践使用简单的全文检索或者向量检索得到与输入内容相关的数据。Naive RAG由于存在缺少语义理解能力对输出效果提升还有较大空间。2、进阶RAGAdvanced RAG在Naive RAG基础上进行了优化对检索前、中、后进行了加强。1索引过程中使用了滑动窗口、细粒度分割和元数据整合等技术来提高被索引内容的质量。包括知识库数据质量优化、索引优化、Query内容重写、以及Embedding微调生成对上下文理解更准确的语义向量。2在检索阶段引入了预检索。3检索后对检索文档的相关性进行Reranking如扩展、重写和排序、摘要以获得更高的检索效率和准确性让最终提供给大模型的信息更加集中使生成内容丰富、准确。3、智能体RAGAgentic RAG这个是目前最强大的RAG技术流程上对 RAG 模块之间进行设计和编排可以动态决策整合多种API或者系统工具能力和调用LLM-based Agent实时解决复杂问题。这些设计不仅提升了系统的整体效能还为开发者提供了定制化的解决方案。五、RAG技术核心原理外挂知识库的优势在于它能够利用海量的外部数据进行知识补充从而提升回答的质量和准确性特别是在动态性强、知识库更新频繁的场景中尤为重要。它是一种低成本的实现方式能够通过利用本地专业知识将高质量的数据信息加工为知识库再由大模型完成检索召回与总结生成辅助各行各业实现专业知识精准问答。RAG 是一种结合了检索和生成的混合式深度学习模型常用于处理复杂的自然语言处理任务。RAG模型通过将外部知识库中的信息与大语言模型结合在一起可以提供更准确和上下文相关的答案。具体来说RAG核心技术主要包括检索、增强和生成三个步骤。1、问题来了先搜一搜检索Retrieval当用户查询内容RAG通过向量检索技术负责从预先建立的外挂知识库比如数据库、网页、文档检索等中检索与查询内容最相关的文档或信息片段具体来说就是将用户的查询通过“嵌入模型”转换成向量以便与向量数据库中存储的知识相关的向量进行比对。通过相似性搜索从向量数据库中找出最匹配的前K个数据通过“Rerank模型”等技术对初步检索结果进行重排序提高检索结果的相关性和质量。对应【联网搜索】就是先从互联网上搜索相关资讯、文章、内容。2、知识到手加工一下增强Augment将用户的查询内容和检索到的相关内容一起嵌入到一个预设的提示词模板中。3、生成答案妙笔生花生成Generation将上面预设提示词模板内容输入到大语言模型比如DeepSeek等中大语言模型会基于检索内容生成有明确依据的响应可以大幅提升大模型可解释性、并减少大模型凭空编造的风险。六、RAG搭建高效知识库可分为5个基本流程知识文本准备、嵌入模型Embedding Model、向量数据库、封装检索接口、根据查询生成回答。1、知识文本准备文档的预处理和加载并按一定条件切割成片段知识库本身的文本质量对最终效果的影响至关重要这是大模型最终生成回答的原始语料。文档预处理优化应制定标准化的文档模板确保内容的一致性和易读性。1文档命名统一控制在名称长度涵义简洁避免无意义的数字、符号或缩写2文档语言统一中文描述因为量化模型对于中英文、繁简体的支持不一样向量化导致乱码或没有用的数据3文档内容设置清晰的层级标题对图片、表格、公式、超链接、附件等进行特殊处理。建立问答对基于用户可能的提问方式构建问答对作为知识库原始数据2、嵌入模型Embedding Model上传文本语料开始构建本地的知识库时为了便于分析和处理需要将长文本进行切割分块1通过设置合理的文档切割chunk_size验证所选取的Embedding模型在多大的chunk_size上表现最佳2文档段落处理基于文档切割时所设置的 chunk_size对知识库文档的段落进行拆分或者合并尽量保证连贯语义数据不会被切割3知识库文档标注为了提升召回准确性一方面在导入前先对知识库文档内容进行标注处理3、向量数据库将切割的文本片段灌入向量数据库1将知识库文档切割成chunk文本片段之后需要通过Embedding技术转换为算法可以处理的向量存入向量数据库2选择不同的Embedding模型进行验证实践中也发现bge-large-zh优于m3e-base3召回准确率一般采用Top5和Top10来评估Embedding模型的好坏TopN召回准确率TopN条chunk包含回答数 /总查询数4、封装检索接口问题理解和查询检索用户提问-将问题用嵌入模型做Embedding - 问题向量化 - 到知识库所在向量数据库中进行相似的匹配 - Rerank模型召回得分最高的k个Chunks1用户提问后同样将用户的问句向量化。将用户的问句与向量数据库中的chunk匹配匹配出与问句向量最相似的Top K个2k的取值根据实际的场景不断测试选择最佳的k值。一般来说调大k值会增加召回片段中含有正确答案的概率但召回的无关信息更多模型生成的答案质量反而会更差3Temperature参数设置1 代表十分精确而0代表发散生成的内容会更有创造性需要根据自己的场景设置合适的Temperature值4Top K的排序方式检索返回的Top K会按照数据库中的顺序进行排序目的是保留原始数据库的上下文结构可以增加Top k的大小比如从10个增加到30个然后再使用更加精确的算法进行Rerank5、RAG知识库工程具体搭建流程请参考《[开启智能体和知识库探索之旅Dify知识库搭建RAG]》Query - 检索 - Prompt - LLM - 回复1连接向量数据库2加载向量模型3创建索引4取本地的文本文件并进行切分然后向索引中添加数据5使用查询从向量数据库中检索数据6将检索的结果进行汇总7将检索到的结果Prompt原始查询文本用户promptk个Chunks三者送到大语言模型LLMLLM将生成回答返回给用户七、企业知识库还需进行一些针对性的功能设计1、知识库管理支持对知识库、知识数据的全生命周期治理管理。用户可通过界面、接口等方式使用知识库管理功能。2、知识处理支持多种文件格式、多种数据类型的知识处理从杂乱无序的原始数据中处理获得高质量的知识信息。3、知识构建支持丰富的知识构建策略用户可根据实际知识数据情况进行配置从而达到最优的知识构建效果。4、知识检索支持向量、全文、混合等知识检索模式提供丰富的检索参数配置项。用户可通过任务流组件、接口等方式使用知识检索功能。八、大语言模型LLM在行业内典型的知识库应用场景1、文档片段检索利用知识库对完整文档分块并进行知识构建。通过用户输入的文本进行检索返回最相似的TopK个文档块。2、文本检索利用知识库对已经完成分块的文本直接进行知识构建。通过用户输入的文本进行检索返回最相似的TopK个文本。3、QA检索利用知识库对QA数据进行知识构建。通过用户输入的文本对QA进行检索返回最相似的TopK个QA数据。4、简易检索问答通过用户问题进行上述三类知识检索将检索结果用户问题拼接成提示词然后提供给大模型获得模型的回复典型的RAG检索生成问答流程。5、复杂检索对话复杂对话逻辑如拒答、问题分类、回答分路等需要通过任务流方式进行编排开发。业务侧需要进行对话逻辑、路径的设计从而明确使用知识检索的具体环节。九、基于RAG的知识库最基本的步骤实际应用时优化建议1、知识库的动态更新随着时间的推移知识库中的信息可能会过时或无效因此需要设计自动化的知识更新机制以保证系统回答的准确性和时效性。2、模型微调在不同的应用场景中可能需要对调用的模型进行选择或者对提示词进行优化来引导模型生成更符合预期的输出。3、混合检索策略可以结合向量检索与传统的关键词检索策略在保证检索精度的同时提高召回率。4、系统可扩展性确保系统能够随着数据量和请求量的增加而扩展避免性能瓶颈。使用分布式检索和生成技术是实现这一目标的关键。5、用户反馈循环引入用户反馈机制定期分析用户的查询和系统的响应持续改进模型和定期维护更新知识库提升整体系统的智能水平。6、多模态知识处理利用OCR技术等技术处理图片和视频等非文本知识源将其转换为可理解的纯文本数据丰富知识库的内容。如何系统的学习大模型 AI 由于新岗位的生产效率要优于被取代岗位的生产效率所以实际上整个社会的生产效率是提升的。但是具体到个人只能说是“最先掌握AI的人将会比较晚掌握AI的人有竞争优势”。这句话放在计算机、互联网、移动互联网的开局时期都是一样的道理。我在一线互联网企业工作十余年里指导过不少同行后辈。帮助很多人得到了学习和成长。我意识到有很多经验和知识值得分享给大家也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限很多互联网行业朋友无法获得正确的资料得到学习提升故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。一直在更新更多的大模型学习和面试资料已经上传带到CSDN的官方了有需要的朋友可以扫描下方二维码免费领取【保证100%免费】01.大模型风口已至月薪30K的AI岗正在批量诞生2025年大模型应用呈现爆发式增长根据工信部最新数据国内大模型相关岗位缺口达47万初级工程师平均薪资28K数据来源BOSS直聘报告70%企业存在能用模型不会调优的痛点真实案例某二本机械专业学员通过4个月系统学习成功拿到某AI医疗公司大模型优化岗offer薪资直接翻3倍02.大模型 AI 学习和面试资料1️⃣ 提示词工程把ChatGPT从玩具变成生产工具2️⃣ RAG系统让大模型精准输出行业知识3️⃣ 智能体开发用AutoGPT打造24小时数字员工熬了三个大夜整理的《AI进化工具包》送你✔️ 大厂内部LLM落地手册含58个真实案例✔️ 提示词设计模板库覆盖12大应用场景✔️ 私藏学习路径图0基础到项目实战仅需90天第一阶段10天初阶应用该阶段让大家对大模型 AI有一个最前沿的认识对大模型 AI 的理解超过 95% 的人可以在相关讨论时发表高级、不跟风、又接地气的见解别人只会和 AI 聊天而你能调教 AI并能用代码将大模型和业务衔接。大模型 AI 能干什么大模型是怎样获得「智能」的用好 AI 的核心心法大模型应用业务架构大模型应用技术架构代码示例向 GPT-3.5 灌入新知识提示工程的意义和核心思想Prompt 典型构成指令调优方法论思维链和思维树Prompt 攻击和防范…第二阶段30天高阶应用该阶段我们正式进入大模型 AI 进阶实战学习学会构造私有知识库扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架抓住最新的技术进展适合 Python 和 JavaScript 程序员。为什么要做 RAG搭建一个简单的 ChatPDF检索的基础概念什么是向量表示Embeddings向量数据库与向量检索基于向量检索的 RAG搭建 RAG 系统的扩展知识混合检索与 RAG-Fusion 简介向量模型本地部署…第三阶段30天模型训练恭喜你如果学到这里你基本可以找到一份大模型 AI相关的工作自己也能训练 GPT 了通过微调训练自己的垂直大模型能独立训练开源多模态大模型掌握更多技术方案。到此为止大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗为什么要做 RAG什么是模型什么是模型训练求解器 损失函数简介小实验2手写一个简单的神经网络并训练它什么是训练/预训练/微调/轻量化微调Transformer结构简介轻量化微调实验数据集的构建…第四阶段20天商业闭环对全球大模型从性能、吞吐量、成本等方面有一定的认知可以在云端和本地等多种环境下部署大模型找到适合自己的项目/创业方向做一名被 AI 武装的产品经理。硬件选型带你了解全球大模型使用国产大模型服务搭建 OpenAI 代理热身基于阿里云 PAI 部署 Stable Diffusion在本地计算机运行大模型大模型的私有化部署基于 vLLM 部署大模型案例如何优雅地在阿里云私有部署开源大模型部署一套开源 LLM 项目内容安全互联网信息服务算法备案…学习是一个过程只要学习就会有挑战。天道酬勤你越努力就会成为越优秀的自己。如果你能在15天内完成所有的任务那你堪称天才。然而如果你能完成 60-70% 的内容你就已经开始具备成为一名大模型 AI 的正确特征了。这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】