近日,清华大学THUNLP实验室、东北大学NEUIR实验室与OpenBMB及AI9Stars联合发布了UltraRAG2.0,这是首个基于ModelContextProtocol(MCP)架构设计的检索增强生成(RAG)框架。
该框架致力于简化RAG系统的构建过程,使科研人员可以在短时间内实现复杂的多阶段推理系统。UltraRAG2.0的亮点在于用户只需通过编写YAML文件,即可轻松声明复杂的逻辑,如串行、循环和条件分支,从而显著减少代码量,降低实现的门槛。
在当前的RAG发展趋势中,许多系统逐渐融入了自适应知识组织、多轮推理及动态检索等复杂特性,代表项目包括DeepResearch和Search-o1。然而,这些复杂特性也给开发者带来了高昂的工程成本,制约了新想法的快速迭代与复现。UltraRAG2.0应运而生,它通过将RAG的核心组件封装为独立的MCP服务器,实现了功能的灵活调用和扩展。
具体而言,与以往的实现方式相比,UltraRAG2.0在代码量上大幅减少。例如,经典方法IRCoT的官方实现需要近900行代码,而使用UltraRAG2.0只需约50行代码就能完成同等功能。其中一半的代码是用于流程编排的YAML伪代码,极大降低了开发门槛。框架支持通过简洁的声明式方式来构建多阶段推理流程,使得复杂的推理逻辑不再需要冗长的手动编码。
UltraRAG2.0还支持动态检索、条件判断及多轮交互等
此外,UltraRAG2.0的MCP架构允许不同模块间的无缝复用,并支持模块的灵活扩展和接入,方便科研人员快速适配新的模型和算法。这一设计极大提升了系统开发的效率和可复现性。
-
GitHub:https://github.com/OpenBMB/UltraRAG
-
项目主页:https://openbmb.github.io/UltraRAG
划重点:
🌟UltraRAG2.0由清华与东北大学联合推出,旨在简化复杂的RAG系统构建过程。
🛠️用户通过编写YAML文件即可实现复杂推理逻辑,大幅降低代码量与开发门槛。
📈相较于传统方法,UltraRAG2.0在性能上提升约12%,适用于多轮推理和动态检索等
高级功能。