她曾经是中国戏剧界的一颗冉冉上升的新星,得到过梅兰芳大师的高度称赞。这个人就是齐淑芳。可身为中国戏剧界的翘楚的她,在1988年,带领团队前往美国演出,...
2025-07-26 0
界面新闻记者 | 伍洋宇
界面新闻编辑 | 刘方远
作为少数仍在坚持基础模型训练的创业公司,阶跃星辰刚刚公布了自己的最新进展。
7月25日,阶跃星辰正式发布第三代模型Step 3,并将于7月31日全球开源。Step 3采用MoE(混合专家模型)架构,总参数量321B,激活参数量38B。与行业趋势一致,它的最大亮点也在于降本增效。
据阶跃星辰创始人兼CEO姜大昕介绍,Step 3在架构设计阶段便考量了系统与硬件的特性,可实现广泛硬件平台上的高效推理。
具体而言,Step 3在国产芯片上的上下文32K推理效率最高可达DeepSeek-R1的300%;在英伟达Hopper架构芯片进行分布式推理时,实测相较于DeepSeek-R1的吞吐量提升超70%。
阶跃星辰联合创始人兼副总裁朱亦博对Step 3在国产芯片上的表现进行了简单的技术解释。
他表示,模型每推理一个token所访问的显存和进行的计算量,与其注意力机制有关。团队考虑到行业当前在英伟达H800和H20等芯片所受到的限制,在架构设计层面重点考量了国产芯片的计算特性,在访存比(计算量/访存量)斜率上优先贴近国产芯片,使其运行过程中不会出现严重的计算瓶颈或显存瓶颈。
姜大昕在接受界面新闻等媒体采访时表示,大模型走到今天已经从GPT范式的1.0走到了强化学习范式下的2.0,当前坚持训练模型的公司正在变少,“每个行业节点都会有公司掉队。”
直到今天,阶跃星辰仍然坚持“超级模型+超级应用”的发展路径,并且坚定认为模型能力决定应用上限。
在模型能力究竟如何影响应用上限的问题上,姜大昕对界面新闻记者表示,模型智能的上限没有止境,但就像推理模型打开了代码等理科问题的应用市场,技术进步、模型能力上升的确会不断解锁应用。
他指出,多模态领域也开向强化学习过度,模型性能还有很大提升空间,比如未来可能做到“没有AI味的电影生产”。
为进一步实现大模型和算力双向价值最大化,阶跃星辰联合近10家芯片及基础设施厂商成立“模芯生态创新联盟”,在芯片、模型和平台全链路技术上进行合作。
该联盟首批成员包括华为昇腾、沐曦、壁仞科技、燧原科技、天数智芯、无问芯穹、寒武纪、摩尔线程、硅基流动等。目前,华为昇腾芯片已实现Step 3的搭载和运行。沐曦、天数智芯和燧原等也已初步实现运行Step 3。
除了基础模型研发进展,阶跃星辰还发布了智能终端Agent和垂类Agent等领域的应用落地。
例如,阶跃星辰、千里科技和吉利汽车集团合作打造的智能座舱Agent OS(预览版),内嵌阶跃星辰的多模态大模型和端到端语音大模型。
阶跃星辰还在商业化方面披露了一个颇有野心的目标。
目前,Step 3模型在智能终端、智能座舱、金融、内容创作和城市治理等多个领域实现了商业化应用。据姜大昕透露,阶跃星辰计划将全年收入冲刺目标定为10亿元人民币。
负责商业化的阶跃星辰联合创始人、副总裁李璟对界面新闻等媒体表示,公司今年上半年合同收入规模已有数亿,确认收入和毛利水平都表现较好,今年全年有望完成10亿收入目标。
相关文章
她曾经是中国戏剧界的一颗冉冉上升的新星,得到过梅兰芳大师的高度称赞。这个人就是齐淑芳。可身为中国戏剧界的翘楚的她,在1988年,带领团队前往美国演出,...
2025-07-26 0
一场席卷全国的抓捕行动已经收网。它针对的不是普通罪犯,而是一个遍布海内外的诈骗帝国。这个帝国的头目们,那些藏在最深处的人,现在一个接一个地被从暗处揪了...
2025-07-26 0
7月24日,2025年世界互联网大会数字丝路发展论坛在福建泉州开幕。本次论坛主题为“数智海丝 共迎未来——携手构建网络空间命运共同体”。来自全球49个...
2025-07-26 0
“订好闹钟蹲守,抢到了!”“拼手速拼网速,又没抢到”……新湖南客户端 “十年同行,感恩有你”的美团夏日福利活动推出以来,火爆异常。满18-18外卖券连...
2025-07-26 0
伴随着科技水平的不断提高,手机地图、导航、打车等日常软件也越来越丰富,并且已经成为很多人出行必不可少的工具,而这一个个软件背后,都离不开全球卫星导航系...
2025-07-26 0
金融界2025年7月25日消息,国家知识产权局信息显示,中国海洋石油集团有限公司;中海油田服务股份有限公司取得一项名为“海洋地震勘探的时钟同步方法及系...
2025-07-26 0
今天给各位分享功夫川麻小程序万能开挂器的知识,其中也会对功夫川麻能开挂吗进行解释,如果能碰巧解决你现在面临的问题,别忘了关注本站,现在开始吧!功夫川麻...
2025-07-26 0
发表评论