2026/3/28 22:46:34
网站建设
项目流程
网站设置专栏,深圳网站建设外贸公司排名,网站建设swot分析,漯河网站推广公司本文详细介绍了如何将Obsidian与Dify知识库相结合#xff0c;打造基于向量存储的AI友好知识系统。作者开发了自定义同步插件#xff0c;解决了Obsidian原生搜索对AI不友好的问题#xff0c;实现了语义检索功能。文章涵盖Dify知识库创建、Embedding模型配置、API密钥获取打造基于向量存储的AI友好知识系统。作者开发了自定义同步插件解决了Obsidian原生搜索对AI不友好的问题实现了语义检索功能。文章涵盖Dify知识库创建、Embedding模型配置、API密钥获取以及Obsidian插件安装配置的全过程最终通过n8n工作流演示知识库调用方法构建了从知识生产到存储再到消费的完整闭环。最近我把 Obsidian 打造成了一个中心知识库然后把我所有进行内容生成的工具如扣子空间、Trae、n8n、Coze 全部跟它进行了打通。现在我只需要维护这一套知识库所有下游的 AI 工具就都能调用到了。然而在使用过程中我发现Obsidian 原生的搜索方式对 AI 其实并不友好。特别是当内容量变大以后仅靠关键词匹配知识调用的准确率非常低。举个最常见的例子明明我的知识库里有一篇名为“Obsidian使用说明”的文章。当我问 AI“Obsidian如何安装”时AI 可能会提取“Obsidian安装”这个关键词去搜索。结果呢Obsidian 告诉我“找不到”为什么因为文件名里没有“安装”这两个字。虽然我们可以通过 Prompt 让 AI 多尝试几次但这种“碰运气”的方式效率太低经常导致 AI 无法获取到关键资料。而专业的知识库通常会使用向量数据库技术。它会将知识通过大模型处理转化为语义向量进行存储。通过这种技术当我们搜索“Obsidian如何安装”时系统通过语义匹配就能自动关联到“Obsidian使用说明”、“Obsidian配置”等含义相近的内容。这才是 AI 时代的知识库该有的样子。为了让我的众多 AI Agent 能更精准地调用中心知识库我决定引入一个基于向量存储的知识库。经过一番调研我最终选择了 Dify —— 它开源、生态成熟且相对可靠。选定 Dify 后摆在我面前的问题就是如何把 Obsidian 里的笔记自动同步到 Dify这也正是我喜欢 Obsidian 的原因它的自由度太高了如果是其他笔记软件不支持 Dify 同步可能就只能手动“下载-上传”了每写一篇笔记都要折腾一次想想都头大。但在 Obsidian 里我们可以利用插件解决。虽然翻遍了社区也没找到现成的 Dify 同步插件但这难不倒我索性自己写一个经过几天的开发和优化我终于搞定了这个同步插件。接下来就把完整的配置过程分享给大家。一、知识库准备1、创建知识库Dify 的官网地址是 https://dify.ai大家可以直接注册使用。不过免费空间有限我自己是部署了开源版。进入 Dify 后找到顶部的“知识库”菜单点击“创建知识库”。因为我们稍后会从 Obsidian 同步文档过来所以这里选择创建一个空的知识库即可。输入知识库名称点击“创建”。2、配置 Embedding 模型关键这一步非常重要 很多人同步失败就是因为漏了这一步。如前所述为了实现语义检索我们需要用到向量化存储技术这就需要 Embedding 模型的支持。这里我推荐使用通义千问的 Embedding 模型性价比很高。首先进入 Dify点击右上角头像选择“设置”。点击左侧的“模型供应商”搜索“通义”找到并点击安装/配置。在配置模型之前我们需要先去 阿里云百炼平台https://bailian.console.aliyun.com/ 申请一个 API Key。回到 Dify在通义千问的配置窗口中填入刚刚申请的 API Key。配置完成后找到“系统模型设置”将 Embedding 模型 的默认模型设置为通义千问的模型例如 text-embedding-v3。这一步不做Obsidian 里的文档是传不上去的。3、获取知识库 ID 和 API 密钥打开我们刚刚创建好的知识库。看浏览器地址栏URL 中 datasets/ 后面那一串字符就是 知识库 ID把它复制保存下来后面要用。接着点击左侧菜单的“API 密钥”右上角的 API 端点是我们的请求地址记下来。然后点击“创建密钥”生成一个新的 API Key 并保存。二、Obsidian 同步配置知识库准备好了接下来就是配置 Obsidian让它能一键把笔记同步过去。因为找不到现成的插件我找了一份开源代码并在此基础上进行了重构和优化完美实现了增量同步功能。插件获取方式请看文末1、安装插件按照下图指示点击 Obsidian 设置里的“打开插件文件夹”。将下载解压后的插件文件夹放入这个目录中。回到 Obsidian 的“第三方插件”页面点击刷新就能看到 Dify Sync 插件了。启用它并点击齿轮图标进入配置页面。2、配置插件进入配置页后主要填写三个参数就是我们在第一部分第 3 步获取的那些Dify API URL这里注意只需要填域名即可不要带 /v1 后缀例如 http://localhost:5000 或你的公网地址。DIfy API 秘钥填入 Dify 知识库的密钥。DIfy 知识库 ID填入知识库 ID。其他选项如自动同步间隔、同步文件夹限制可以根据自己的需求设置。配置无误后点击侧边栏或命令面板中的“同步到 Dify”按钮。Obsidian 就会开始工作将你的笔记一键同步到 Dify 中。看文档已经全部同步上来了三、使用知识库实战知识库搭建好了怎么用呢核心思路就是利用 Dify 提供的 API 来检索知识。这里我用 n8n 做一个简单的演示展示如何在工作流中调用这个知识库。首先在 n8n 里搭建一个简单的 AI Agent 工作流我们需要在 AI Agent 的“Tools”部分挂载我们的 Dify 知识库。点击 Tool 下方的 号添加一个 HTTP Request 节点。接下来打开 Dify 的 API 文档在知识库页面左侧有入口找到“知识库检索”接口点击右侧复制 cURL 代码。回到 n8n双击 HTTP 节点点击“Import cURL”把刚才复制的代码粘贴进去导入。导入后记得把参数修改为你自己的信息URL如果你是私有部署的要把前面的域名换成你自己的 Dify 地址。Authorization确认 API Key 是否正确。然后修改请求体Body中的 query 参数。我们要让 AI 根据上下文自动生成搜索词所以这里填入 {{ $fromAI(“query”) }}。⚠️ 这里有个坑需要注意Dify 的知识库支持多种检索模式。如果不指定参数默认可能会使用“混合检索”这要求你在 Dify 知识库设置里开启“高质量”模式。如果你没有开启高质量模式或者只想用关键词检索建议在 Body 里显式指定检索模式。完整的 JSON 参数参考如下{ query:{{ $fromAI(query) }},retrieval_model:{ search_method:keyword_search, reranking_enable:true, top_k:3, score_threshold_enabled:true, score_threshold:0.5, weights:0.7}}最后别忘了给这个 HTTP 工具写一个详细的 Description工具描述。告诉 AI 这个工具是干嘛的、怎么用。AI Agent 的 System Prompt系统提示词也需要相应调整引导它在遇到不知道的问题时去调用这个工具。测试一下我询问了一个关于 Obsidian 的具体问题AI Agent 自动分析意图调用了知识库检索接口并根据检索到的信息给出了回答。完美至此从 知识生产Obsidian 到 知识存储Dify 再到 知识消费n8n/AI Agent 的闭环彻底打通了。如何系统的学习大模型 AI 由于新岗位的生产效率要优于被取代岗位的生产效率所以实际上整个社会的生产效率是提升的。但是具体到个人只能说是“最先掌握AI的人将会比较晚掌握AI的人有竞争优势”。这句话放在计算机、互联网、移动互联网的开局时期都是一样的道理。我在一线互联网企业工作十余年里指导过不少同行后辈。帮助很多人得到了学习和成长。我意识到有很多经验和知识值得分享给大家也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限很多互联网行业朋友无法获得正确的资料得到学习提升故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。一直在更新更多的大模型学习和面试资料已经上传带到CSDN的官方了有需要的朋友可以扫描下方二维码免费领取【保证100%免费】01.大模型风口已至月薪30K的AI岗正在批量诞生2025年大模型应用呈现爆发式增长根据工信部最新数据国内大模型相关岗位缺口达47万初级工程师平均薪资28K数据来源BOSS直聘报告70%企业存在能用模型不会调优的痛点真实案例某二本机械专业学员通过4个月系统学习成功拿到某AI医疗公司大模型优化岗offer薪资直接翻3倍02.大模型 AI 学习和面试资料1️⃣ 提示词工程把ChatGPT从玩具变成生产工具2️⃣ RAG系统让大模型精准输出行业知识3️⃣ 智能体开发用AutoGPT打造24小时数字员工熬了三个大夜整理的《AI进化工具包》送你✔️ 大厂内部LLM落地手册含58个真实案例✔️ 提示词设计模板库覆盖12大应用场景✔️ 私藏学习路径图0基础到项目实战仅需90天第一阶段10天初阶应用该阶段让大家对大模型 AI有一个最前沿的认识对大模型 AI 的理解超过 95% 的人可以在相关讨论时发表高级、不跟风、又接地气的见解别人只会和 AI 聊天而你能调教 AI并能用代码将大模型和业务衔接。大模型 AI 能干什么大模型是怎样获得「智能」的用好 AI 的核心心法大模型应用业务架构大模型应用技术架构代码示例向 GPT-3.5 灌入新知识提示工程的意义和核心思想Prompt 典型构成指令调优方法论思维链和思维树Prompt 攻击和防范…第二阶段30天高阶应用该阶段我们正式进入大模型 AI 进阶实战学习学会构造私有知识库扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架抓住最新的技术进展适合 Python 和 JavaScript 程序员。为什么要做 RAG搭建一个简单的 ChatPDF检索的基础概念什么是向量表示Embeddings向量数据库与向量检索基于向量检索的 RAG搭建 RAG 系统的扩展知识混合检索与 RAG-Fusion 简介向量模型本地部署…第三阶段30天模型训练恭喜你如果学到这里你基本可以找到一份大模型 AI相关的工作自己也能训练 GPT 了通过微调训练自己的垂直大模型能独立训练开源多模态大模型掌握更多技术方案。到此为止大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗为什么要做 RAG什么是模型什么是模型训练求解器 损失函数简介小实验2手写一个简单的神经网络并训练它什么是训练/预训练/微调/轻量化微调Transformer结构简介轻量化微调实验数据集的构建…第四阶段20天商业闭环对全球大模型从性能、吞吐量、成本等方面有一定的认知可以在云端和本地等多种环境下部署大模型找到适合自己的项目/创业方向做一名被 AI 武装的产品经理。硬件选型带你了解全球大模型使用国产大模型服务搭建 OpenAI 代理热身基于阿里云 PAI 部署 Stable Diffusion在本地计算机运行大模型大模型的私有化部署基于 vLLM 部署大模型案例如何优雅地在阿里云私有部署开源大模型部署一套开源 LLM 项目内容安全互联网信息服务算法备案…学习是一个过程只要学习就会有挑战。天道酬勤你越努力就会成为越优秀的自己。如果你能在15天内完成所有的任务那你堪称天才。然而如果你能完成 60-70% 的内容你就已经开始具备成为一名大模型 AI 的正确特征了。这份完整版的大模型 AI 学习资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】