Dify
Ragflow
minerU
azure blob + dify 实现图片 Rag 的检索
实验描述
上传的文本为纯 pdf 文件,将相关的文档存储到 Azure Blob 上,并通过 dify 来制作 知识库
要求回复的文档中携带着 img
实现思路
自定义 pdf 处理 pipleline ,使用 minerU 来处理成 markdown 并将 markdown 传送到指定的 Azure Blob存储中 【Azure Frontdoor (CDN服务)来实现对域的指定访问】
我们在 Dify 上的知识为 knowledge
比如下列的 markdown 文本,文件名为 xxx.md
文件夹结构大概如下:
写的是相对路径,或者 公网上的地址

变成
借助 视觉型LLM 描述图片大概有什么东西,将其配合着使用,其中涉及到了一个 域名替换

> <图片的相关描述>
具体实现
参考文章
- Blog