News
阿里通义开源全模态知识库 RAG 框架 VimRAG
阿里通义实验室推出 VimRAG 框架,用动态有向无环图(DAG)替代线性上下文拼接,通过分支试错机制、视觉能量分配策略及图引导优化(GGPO),实现跨文本、图像、视频的精准检索与关联推理。实验显示,模型在Qwen3-VL-8B模型上准确率达50.1%,显著优于传统方案。
阿里通义实验室推出 VimRAG 框架,用动态有向无环图(DAG)替代线性上下文拼接,通过分支试错机制、视觉能量分配策略及图引导优化(GGPO),实现跨文本、图像、视频的精准检索与关联推理。实验显示,模型在Qwen3-VL-8B模型上准确率达50.1%,显著优于传统方案。