“问小白”发布第四代开源大模型 XBai o4

21 0 0

开源大模型领域迎来新突破。“问小白”正式发布其第四代开源模型XBaio4，该模型在复杂推理能力上表现卓越，其Medium模式已全面超越OpenAIo3-mini，并在部分基准测试中优于AnthropicClaudeOpus。

XBaio4引入了创新的“反思型生成范式”，通过结合Long-CoT强化学习和过程评分学习，实现了深度推理和高效推理链路筛选，同时显著降低了推理成本。

Table of Contents

技术突破:独创“反思型生成范式”

XBaio4的核心创新在于其独有的“反思型生成范式”（reflectivegenerativeform）。这一范式将Long-CoT强化学习与过程评分学习（ProcessRewardLearning）相结合，使得单个模型能够同时完成两个关键任务:

深度推理:像人类一样进行多步骤的复杂思考。
高质量推理链路筛选:能够评估和选择最优的推理路径。

更值得关注的是，XBaio4通过共享过程评分模型（PRMs）和策略模型的主干网络，将过程评分的推理耗时降低了99%。这一优化大幅提升了模型的运行效率，为实际应用提供了坚实基础。

性能卓越:多基准测试领先

XBaio4模型提供了三种模式（low、medium、high），以适应不同复杂度的任务需求。在多项关键基准测试中，其强大性能得到了充分验证:

在Medium模式下，XBaio4全面超越了OpenAI的o3-mini模型。
在部分基准测试中，其表现甚至优于Anthropic的ClaudeOpus。
该模型在AIME24、AIME25、LiveCodeBenchv5、C-EVAL等多个测试中均展现出卓越的推理能力。

“问小白”已在GitHub上开源了相关的训练和评估代码，这不仅为AI研究社区提供了宝贵的资源，也预示着开源大模型在复杂推理领域的竞争力正在迅速增强。

地址:https://github.com/MetaStone-AI/XBai-o4

打赏赞

# AI资讯

文章版权归作者所有，未经允许请勿转载。

NFedora 社区推出 AI 辅助贡献政策草案，征求意见中

阿力

3 0

OpenAI首度实现月入10亿！但算力不足成最大难题

阿力

16 0

一图生动画，人物无缝替换！Wan-Animate开源引爆AI视频革命，阿里黑科技免费玩转？

阿力

4 0

OpenAI进军韩国市场，携手三星与SK海力士共建AI未来！

阿力

11 0

AI评测新标杆！GPT-5等前沿模型惨遭零分，博士级推理能力究竟几何？

阿力

14 0

京东物流发布自研无人轻卡“京东物流VAN”，L4级别公开道路自动驾驶

阿力

19 0

暂无评论

暂无评论...

“问小白”发布第四代开源大模型 XBai o4

技术突破:独创“反思型生成范式”

性能卓越:多基准测试领先

小米全量开源MiDashengLM-7B：音频理解性能刷新SOTA，推理速度暴增20倍

问小白推出XBai o4开源大模型：反思型推理架构颠覆传统，性能全面碾压OpenAI o3-mini

相关文章

暂无评论

热门文章

热门标签

“问小白”发布第四代开源大模型 XBai o4

技术突破:独创“反思型生成范式”

性能卓越:多基准测试领先

相关文章：

小米全量开源MiDashengLM-7B：音频理解性能刷新SOTA，推理速度暴增20倍

问小白推出XBai o4开源大模型：反思型推理架构颠覆传统，性能全面碾压OpenAI o3-mini

相关文章

暂无评论

热门文章

热门标签