近日,上海的AI独角兽公司MiniMax正式推出了全球首个开源大规模混合架构推理模型——MiniMax-M1。该模型一经推出,便迅速跻身
MiniMax-M1的亮相不仅令人瞩目,其在技术细节上的表现更是出色。该模型在长文本处理和工具调用等方面显示出强大的优势,支持高达100万token的上下文输入能力,足以一次性处理整部《三体》英文原著。这一性能是DeepSeek同类模型的八倍,甚至可以与谷歌
更令人惊叹的是,MiniMax在强化学习阶段的研发投入仅为53.5万美元,远低于业内普遍的千万级研发成本,展现了其卓越的研发效率和产品化能力。在M1发布后的短短四个工作日内,MiniMax便接连推出了多款创新产品,包括视频生成模型Hailuo02、通用智能体MiniMaxAgent、视频创作智能体HailuoVideoAgent及音色设计工具VoiceDesign,保持着令人瞩目的“日更”节奏。
作为一家扎根于上海徐汇的AI企业,MiniMax自2022年底ChatGPT引发全球热潮之前,就已开始布局通用人工智能(AGI)领域,并果断摒弃了当时流行的大模型稠密架构和传统注意力机制。面对全球大模型研发企业的普遍收缩,MiniMax坚决坚持基础模型研发的战略选择,最终实现了这一技术突破。
可以说,MiniMax-M1的发布不仅是技术上的一大步,也是对行业未来的一次有力推动,或许将重新定义开源AI模型的发展方向。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...