​清华与东北大学联合推出 UltraRAG 2.0:50 行代码实现高性能检索增强生成系统

AI资讯2周前发布 阿力
9 0

近日,清华大学THUNLP实验室、东北大学NEUIR实验室与OpenBMB及AI9Stars联合发布了UltraRAG2.0,这是首个基于ModelContextProtocol(MCP)架构设计的检索增强生成(RAG)框架。

该框架致力于简化RAG系统的构建过程,使科研人员可以在短时间内实现复杂的多阶段推理系统。UltraRAG2.0的亮点在于用户只需通过编写YAML文件,即可轻松声明复杂的逻辑,如串行、循环和条件分支,从而显著减少代码量,降低实现的门槛。

在当前的RAG发展趋势中,许多系统逐渐融入了自适应知识组织、多轮推理及动态检索等复杂特性,代表项目包括DeepResearch和Search-o1。然而,这些复杂特性也给开发者带来了高昂的工程成本,制约了新想法的快速迭代与复现。UltraRAG2.0应运而生,它通过将RAG的核心组件封装为独立的MCP服务器,实现了功能的灵活调用和扩展。

具体而言,与以往的实现方式相比,UltraRAG2.0在代码量上大幅减少。例如,经典方法IRCoT的官方实现需要近900行代码,而使用UltraRAG2.0只需约50行代码就能完成同等功能。其中一半的代码是用于流程编排的YAML伪代码,极大降低了开发门槛。框架支持通过简洁的声明式方式来构建多阶段推理流程,使得复杂的推理逻辑不再需要冗长的手动编码。

UltraRAG2.0还支持动态检索、条件判断及多轮交互等高级功能,科研人员可以在短时间内搭建出高性能的实验平台,满足复杂多跳问题的需求。其性能较传统的VanillaRAG提升约12%。该系统的设计旨在让研究者在工程实现方面节省时间和精力,将更多的注意力放在算法创新和实验设计上。

此外,UltraRAG2.0的MCP架构允许不同模块间的无缝复用,并支持模块的灵活扩展和接入,方便科研人员快速适配新的模型和算法。这一设计极大提升了系统开发的效率和可复现性。

  • GitHub:https://github.com/OpenBMB/UltraRAG

  • 项目主页:https://openbmb.github.io/UltraRAG

划重点:

🌟UltraRAG2.0由清华与东北大学联合推出,旨在简化复杂的RAG系统构建过程。

🛠️用户通过编写YAML文件即可实现复杂推理逻辑,大幅降低代码量与开发门槛。

📈相较于传统方法,UltraRAG2.0在性能上提升约12%,适用于多轮推理和动态检索等高级功能。

© 版权声明

相关文章

暂无评论

暂无评论...