由中国互联网协会主办的2025(第二十四届 中国互联网大会于7月23日—25日在京召开,大会主题为“数驱新质•智创未来”。在7月24日上午举办的“人工...
2025-07-26 0
7月18日,英伟达(NVIDIA)创始人兼首席执行官黄仁勋在单独会见了中国大模型初创公司MiniMax(希宇科技)创始人闫俊杰,双方进行了两个小时的深入交流,分享了对中美AI行业当下与未来的看法。有消息称,闫俊杰也是唯一单独会见黄仁勋的中国AI创业公司创始人。
据了解,MiniMax 由前商汤科技副总裁、研究院副院长兼智慧城市事业群 CTO闫俊杰在2021 年创立。
今年6月17日,MiniMax宣布推出了全球首个开源的大规模混合架构的推理模型M1,不仅性能超过国内的闭源模型,接近最新版的DeepSeek R1以及海外的最领先模型,同时还拥有更为出色的效率和业内最高的性价比。
在阿里巴巴集团、腾讯和 IDG 资本的支持下,MiniMax 声称其 Lightning Attention 机制是一种计算注意力矩阵的方法,可以提高训练和推理效率,使其 M1 模型在计算长上下文输入和尝试推理时具有优势。
因此,M1显著的优势是支持目前业内最高的100万上下文的输入,跟闭源模型里面的 Google Gemini 2.5 Pro 一样,是 DeepSeek R1 的 8 倍,以及业内最长的8万Token的推理输出。
MiniMax表示,这主要得益于其独创的以闪电注意力机制为主的混合架构,从而在计算长的上下文输入以及深度推理的时候显著高效。例如,在用8万Token深度推理的时候,只需要使用DeepSeek R1约30%的算力。这个特性使得MiniMax M1在训练和推理的时候都有很大的算力效率优势。
除此之外,MiniMax提出了更快的强化学习算法CISPO,通过裁剪重要性采样权重(而非传统token更新)提升强化学习效率。在AIME 的实验中,MiniMax发现这比包括字节近期提出的 DAPO 等强化学习算法收敛性能快了一倍,显著的优于 DeepSeek 早期使用的 GRPO。
得益于上述两个技术创新,MiniMax最终强化训练过程非常高效,超出预期。实际上整个强化学习阶段只用到512块H800三周的时间,租赁成本只有53.47万美金。这比一开始的预期少了一个数量级。
MiniMax在业内主流的 17 个评测集上详细评测了M1,结果显示M1在长上下文理解任务中表现卓越,仅以微弱差距落后于Gemini 2.5 Pro,但在在代理工具使用场景(TAU-bench)中战胜了Gemini 2.5 Pro。具体的结果如下:
因为相对高效的训练和推理算力使用,MiniMax宣布在 MiniMax APP 和 Web 上都保持不限量免费使用。
同时,还将以业内最低的价格在官网提供API:在0-32k的输入长度的时候,输入0.8元/百万token, 输出8元/百万token;在32k-128k的输入长度的时候,输入1.2元/百万token, 输出16元/百万token;在最长的 128k-1M 的输入长度的时候,输入2.4元/百万token, 输出24元/百万token。
前面两种模式都比 DeepSeek-R1 性价比更高,后面一种模式 DeepSeek 模型不支持。
编辑:芯智讯-浪客剑
相关文章
由中国互联网协会主办的2025(第二十四届 中国互联网大会于7月23日—25日在京召开,大会主题为“数驱新质•智创未来”。在7月24日上午举办的“人工...
2025-07-26 0
近日,2025国际低空经济博览会暨低空经济基础设施发展大会在上海国家会展中心举行。浙江省绍兴市越城区精心组织14家低空经济代表性企业参展,集中展示40...
2025-07-26 0
最近,国家有关部门,约谈了美团阿里京东三大外卖巨头,约谈内容核心总结就一句话:外卖战打归打,可必须理性,必须遵纪守法。俗话说,上天不会掉下馅饼,要掉也...
2025-07-26 0
数码博主数码闲聊站爆料称,华为三折叠旗舰迭代机型Mate XTs(研发代号GreenLan)已定档9月前后发布,将延续前代玄黑、瑞红配色,并新增皓白、...
2025-07-26 0
手机号码在被注销或者停用后,经过大约3个月的“冻结”,被运营商重新投放市场供新用户使用,这种“二次放号”本是盘活有限闲置号码资源的常见做法,却也将用户...
2025-07-26 0
央视新闻联播镜头中,西藏林芝派镇的雅鲁藏布江畔,巨型盾构机正缓缓切入喜马拉雅山脉的花岗岩山体。这个被称为“全球超级工程”的雅鲁藏布江下游水电项目,以其...
2025-07-26 0
23岁以前,龚琦从没想过自己会当上CEO。他不是传统意义的“好学生”,没有耀眼的学历背景,也没有拿得出手的文艺特长,上一次受到表扬还是初二数学考试拿满...
2025-07-26 0
当生产线上的机械臂规律摆动时,总有人相信闪烁的红外传感器能编织出绝对安全的防护网。可现实就像精密齿轮间突然卡住的一粒铁屑——那些被寄予厚望的AI监控系...
2025-07-26 0
发表评论