标签:视觉感知

通义开源视觉感知多模态RAG推理框架VRAG-RL

近日,通义实验室自然语言智能团队正式发布并开源了VRAG-RL——一款视觉感知驱动的多模态RAG推理框架,旨在解决在真实业务场景中,AI如何从图像、表格、设计稿...