在编程界,一个全新的开源项目正在引起热议,那就是由SWE-bench和SWE-agent的开发团队推出的mini-SWE-agent。这个项目的亮点在于,它仅需100行代码,就能在真实的GitHub项目中修复65%的Bug,这一性能与原版相比丝毫不逊色,但架构却极其轻量。
mini-SWE-agent的设计理念是尽量简化,让更多开发者能够轻松上手。与之前的SWE-agent相比,这个迷你版本取消了复杂的工具调用接口,仅通过基础的Bash环境执行命令。每一步操作都由语言模型输出一个完整的Shell命令,兼容性大幅提升,无需依赖多个插件或工具。
该项目不仅减轻了依赖关系,mini-SWE-agent的代码量也被压缩到约100行,加上所需的环境和模型,整体代码量不到200行。这种极简架构让开发者在使用时能更专注于编程本身,而不是被繁琐的配置和工具所困扰。
mini-SWE-agent保留了强大的功能,在SWE-bench的验证中仍然能够解决约65%的问题。同时,它配备了批量推理和轨迹浏览器等工具,帮助用户进行大规模评测与决策分析。此外,开发者可以通过命令行工具快速启动代理,甚至提供可视化界面,方便开发者实时监控执行过程。
该项目的发起团队表示,mini-SWE-agent更适合那些希望快速运行并追求简洁控制流的开发者,而SWE-agent则更适合需要高度可配置和复杂历史状态管理的用户。这种灵活的选择使得mini-SWE-agent成为了日常开发中一款极具吸引力的工具。
mini-SWE-agent体现了可读性强、易于扩展的开发理念,它不仅可以作为命令行工具使用,还能集成到其他Python应用中,帮助开发者高效解决问题。
项目地址:https://github.com/SWE-agent/mini-swe-agent