MiniCPM4.0系列包含两款重量级产品:一款是8B闪电稀疏版,以其创新稀疏架构掀起高效风暴;另一款则是仅0.5B的轻巧灵动版,被誉为“
在速度方面,MiniCPM4.0实现了极限情况下220倍、常规5倍的速度提升,这一突破得益于系统级稀疏创新的层层加速。通过高效双频换挡技术,模型能够根据文本长度自动切换稀疏与稠密注意力机制,确保长文本处理快速且高效,同时大幅减少端侧存储需求,相较于同类模型Qwen3-8B,仅需1/4的缓存存储空间。
效能上,MiniCPM4.0贡献了行业首例全开源的系统级上下文稀疏化高效创新,以5%的
性能方面,MiniCPM4.0延续了“以小博大”的传统,0.5B版本仅以2.7%的训练开销便达到了一半参数、性能翻倍的效果;而8B稀疏版则以22%的训练开销对标并超越Qwen3及Gemma312B,巩固了其在端侧领域的领先地位。
落地应用上,MiniCPM4.0展现出强悍的实力。通过自研CPM.cu极速端侧推理框架,结合投机采样创新、模型压缩量化创新及端侧部署框架创新,实现了模型瘦身90%的同时
目前,该模型已成功适配Intel、高通、MTK、华为昇腾等主流芯片,并在多个开源框架上实现部署,进一步拓展了其应用潜力。
模型合集:
https://www.modelscope.cn/collections/MiniCPM-4-ec015560e8c84d
Github:
https://github.com/openbmb/minicpm