dify-minerU-md-Rag

  1. 实验描述
  2. 实现思路
  3. 具体实现
  4. 参考文章

Dify

Ragflow

minerU

azure blob + dify 实现图片 Rag 的检索

实验描述

上传的文本为纯 pdf 文件,将相关的文档存储到 Azure Blob 上,并通过 dify 来制作 知识库

要求回复的文档中携带着 img

实现思路

自定义 pdf 处理 pipleline ,使用 minerU 来处理成 markdown 并将 markdown 传送到指定的 Azure Blob存储中 【Azure Frontdoor (CDN服务)来实现对域的指定访问】

我们在 Dify 上的知识为 knowledge

比如下列的 markdown 文本,文件名为 xxx.md

文件夹结构大概如下:

写的是相对路径,或者 公网上的地址

![xx](./imgs/aa.jpg)

变成

借助 视觉型LLM 描述图片大概有什么东西,将其配合着使用,其中涉及到了一个 域名替换

![xx](domain/imgs/aa.jpg)
> <图片的相关描述>

具体实现

参考文章

  • Blog

图像检索-RAG详细教程:从海量猫娘中挑选符合自己需求的猫娘(Qwen3&QvQ-max) - 知乎

github