星知

logo
logo
登录

MiniMax发布全球首款开源混合架构模型M1,强化训练成本实现数量级突破!

2025/06/20

超长上下文处理能力引领技术前沿

MiniMax-M1模型的最大技术亮点在于其原生支持高达100万Token的超长上下文窗口,这一技术指标甚至在推理输出环节支持业界最长的8万Token处理能力。这项技术突破使得M1模型的性能水平与谷歌的Gemini 2.5 Pro相当,展现了MiniMax在大模型技术领域的深厚实力。

MiniMax发布全球首款开源混合架构模型M1,强化训练成本实现数量级突破!

在工具使用场景(TAU-bench)的权威测试中,MiniMax-M1-40k版本的表现成功超越了Gemini-2.5 Pro,充分证明了其在实际应用场景中的卓越性能。这一成果不仅验证了MiniMax在技术研发方面的创新能力,也为其在激烈的市场竞争中奠定了坚实的技术基础。

革命性成本控制实现训练效率飞跃

在成本控制方面,MiniMax取得了令人瞩目的突破性进展。据官方披露,M1模型的强化训练成本仅为53.5万美元,相比传统训练方法减少了一个数量级,这一成就在业界引起了广泛关注。

MiniMax此次还同步推出了创新的CISPO算法,该算法的收敛速度比字节跳动近期推出的DAPO算法快了一倍,强化学习阶段的算力需求仅为DeepSeek R1的30%。这种算法优化使得MiniMax-M1模型的训练过程更加高效,所需算力资源显著减少,进一步降低了整体运营成本。

阶梯式定价策略提升市场竞争力

在商业化策略方面,MiniMax采用了灵活的阶梯式定价模式,根据输入文本长度的不同设置相应的费用标准。具体定价结构如下:0-32k Token的输入费用为每百万Token 0.8元,输出费用为每百万Token 8元;32k-128k Token档位的输入和输出费用分别为1.2元和16元;128k-1M Token的输入和输出费用则分别为2.4元和24元。

这一定价策略使得MiniMax-M1在市场上具备了更强的竞争优势,特别是在前两个价格档位上,其定价均低于同类竞品DeepSeek-R1,为用户提供了更具性价比的选择。

开源战略推动行业技术共享

作为全球首个开源的大规模混合架构推理模型,MiniMax-M1的发布体现了公司对开源技术生态的积极贡献。通过开源策略,MiniMax不仅展示了其技术实力,也为整个AI行业的技术进步和知识共享做出了重要贡献。

MiniMax表示将持续进行开源技术的更新和完善,预计在未来一段时间内会有更多创新技术和产品面世,进一步推动开源AI技术的发展和普及。

市场竞争格局中的战略定位

在AI行业"六小虎"的激烈竞争环境中,MiniMax此次M1模型的发布标志着其在大模型竞争赛道上的重要战略布局。随着DeepSeek R2等竞品的即将推出,未来的市场格局将更加复杂多变。

MiniMax通过技术创新、成本优化和开源策略的三重组合,展现了其在激烈市场竞争中的差异化优势和持续发展能力。这一战略布局不仅有助于巩固其在AI领域的技术地位,也为其未来的市场扩张奠定了坚实基础。

最新发布