本文作者:访客

MiniMax开源大规模混合架构推理模型M1

访客 2025-06-17 14:08:26 77882
MiniMax开源大规模混合架构推理模型M1摘要:   上证报中国证券网讯(记者孙小程)6月17日,MiniMax正式开源推理模型M1。据介绍,M1采用开源的大规模混合架构,支持目前业内最高100万token上下文输入,同时支持最多...

MiniMax开源大规模混合架构推理模型M1

  上证报中国证券网讯(记者孙小程)6月17日,MiniMax正式开源推理模型M1。据介绍,M1采用开源的大规模混合架构,支持目前业内最高100万token上下文输入,同时支持最多8万token输出。成本方面,M1在用8万Token深度推理的时候,需要使用DeepSeek R1约30%的算力。MiniMax表示,M1整个强化学习阶段使用512块H800三周时间,租赁成本为53.74万美元。

阅读
分享