潮新闻 通讯员 施东杰 丁梦 记者 张帆图为航空器在杭州机场北跑道起飞 郑禹从 摄暑运过半,杭州机场多项运输数据突破整数大关,同比显著增长。8月1日,...
2025-08-12 0
IT之家 8 月 12 日消息,昆仑万维 SkyWork AI 技术发布周于 8 月 11 日启动,连续五天每天发布一款模型,覆盖多模态 AI 核心场景。
今日,昆仑万维带来了自研世界模型 Matrix 系列中 Matrix-Game 交互世界模型的升级版本 ——「Matrix-Game 2.0」,号称是实现了通用场景下的交互式实时长序列生成的世界模型。
并且为促进交互式世界模型领域的发展,「Matrix-Game 2.0」全面开源,号称是业内首个在通用场景上实现实时长序列交互式生成的世界模型开源方案。
「Matrix-Game 2.0」号称在实时生成和长序列能力上实现了“质的飞跃”。相较于上一版本,2.0 版本更加侧重低延迟、高帧率的长序列交互性能,能够以 25 FPS 的速度,在多种复杂场景中稳定生成连续视频内容,且生成时长可扩展至分钟级,大幅提升了连贯性与实用性。
在推理速度显著提升的同时,模型依然保持了对物理规律与场景语义的“精准理解”,支持用户通过简单指令,自由探索、操控并实时构建结构清晰、细节丰富、规则合理的虚拟环境。
昆仑万维还开源了 Matrix-3D 大模型,从单图像出发,生成高质量、轨迹一致的全景视频,并直接还原可漫游的三维空间,对标李飞飞 WorldLabs 的生成效果,可实现更大范围的探索空间。
Matrix-3D 由以下核心部分组成:
轨迹引导的全景视频生成模块:利用场景 Mesh 渲染图作为条件输入,训练视频扩散模型生成符合给定相机轨迹的全景视频。提升生成视频在空间结构上的一致性,缓解遮挡错误与图像伪影问题。
双路径可选择的全景 3D 重建模块:优化路径,对生成的视频进行超分与 3DGS 优化,获取高质量 3D 结构。前馈网络路径:基于 Transformer 直接回归,从生成视频 Latent 特征快速预测 3D 几何属性,实现高效重建。
Matrix-Pano 数据集:大规模高质量合成数据集,包含 116K 条带有相机轨迹、深度图和文本注释的静态全景视频序列。
IT之家附两个模型的开源地址如下:
相关文章
潮新闻 通讯员 施东杰 丁梦 记者 张帆图为航空器在杭州机场北跑道起飞 郑禹从 摄暑运过半,杭州机场多项运输数据突破整数大关,同比显著增长。8月1日,...
2025-08-12 0
金融界2025年8月12日消息,国家知识产权局信息显示,西安热工研究院有限公司、华能集团技术创新中心有限公司、西安西热控制技术有限公司取得一项名为“一...
2025-08-12 0
8月11日,在新疆北斗同创信息科技有限公司,研发人员正在研究人工智能运维管理平台在无人机上的使用。 (记者牟敏摄)新疆网讯(记者牟敏)8月11日,在新...
2025-08-12 0
我们都爱AI带来的「认知捷径」,但CEO Greg Shove却分享了他认知滑坡的亲身经历。真正的分水岭不是用或不用AI,而是你选择成为驾驭AI的「驾...
2025-08-12 0
8 月7日,汇来米2025服务商攻坚共赢峰会在汇付天下总部举行。来自全国各地汇来米的数十家核心服务商合作伙伴齐聚一堂,共话战略升级、共商生态共建、共启...
2025-08-12 0
以5000万88VIP用户的行为数据为基底、从最受用户关注的TOP品类中严选88个“年度单品”,在8月8日这个88VIP的专属时点,天猫榜单联合《时尚...
2025-08-12 0
金融界2025年8月12日消息,国家知识产权局信息显示,郑州大学;郑州市规划勘测设计研究院有限公司取得一项名为“一种岩土收缩性能测量装置和方法”的专利...
2025-08-12 0
本篇文章给大家谈谈微信里的雀神麻将有没有挂,以及微信雀神麻将挂挂软件对应的知识点,希望对各位有所帮助,不要忘了收藏本站喔。 雀神麻雀可以作弊吗开瑞是什...
2025-08-12 0
发表评论