金融界2025年8月15日消息,国家知识产权局信息显示,东莞展欣精密模具有限公司取得一项名为“一种小圆多孔模具”的专利,授权公告号CN22322227...
2025-08-15 0
IT之家 8 月 14 日消息,字节跳动 Seed 团队今日发布并开源了全模态 PyTorch 原生训练框架 ——VeOmni。
近年来,大模型技术正从单一文本模态,向包含图像、语音、视频等多种信息的“全模态”(Omni-Modal)理解生成方向演进。但目前训练一个能“看”、能“听”、能“说”的全能模型,依然面临着系统性的工程挑战。
字节跳动介绍称,VeOmni 采用以模型为中心的分布式训练方案,可将复杂的分布式并行逻辑与模型计算解耦,让研究员像搭积木一样,为全模态模型组合设置高效的并行训练方案。这一方式可大幅降低工程开销,提升训练效率和扩展性,将数周的工程开发时间缩短至几天。
此前,使用 Megatron-LM 等以系统为中心的分布式训练框架训练全新架构的视觉-语言模型,往往需要一周以上进行工程研发,以及更长时间推进分布式优化和精度对齐,且耗时高度依赖于 Infra 工程团队的经验积累。而使用 VeOmni 只需一天即可完成模型代码构建,开启训练任务,工程耗时可压缩 90% 以上。
实验结果表明,基于 VeOmni 框架,一个 300 亿参数的全模态 MoE 模型(支持文本、语音、图片、视频的理解和生成),在 128 张卡上训练吞吐量可超过 2800 tokens / sec / GPU,并能轻松扩展至 160K 超长上下文序列。
目前,VeOmni 的相关论文和代码仓库均已对外公开,GitHub Star 数超过 500。IT之家附开源地址:
arXiv:https://arxiv.org/pdf/2508.02317
GitHub:https://github.com/ByteDance-Seed/VeOmni
相关文章
金融界2025年8月15日消息,国家知识产权局信息显示,东莞展欣精密模具有限公司取得一项名为“一种小圆多孔模具”的专利,授权公告号CN22322227...
2025-08-15 0
金融界2025年8月15日消息,国家知识产权局信息显示,冷王有限责任公司申请一项名为“控制电力供应的方法和电气系统”的专利,公开号CN12049785...
2025-08-15 0
日前中国一家存储芯片企业表示所有芯片生产设备都国产化的生产线已建成,下半年就将投产,这是中国芯片的一个突破性进展,美国没有想到封锁中国数年,却逼出了一...
2025-08-15 0
金融界2025年8月15日消息,国家知识产权局信息显示,清华珠三角研究院;赛业(广州)生物科技有限公司取得一项名为“一种免疫原性肽呈递的预测方法、系统...
2025-08-15 0
“你在长清怎么还搞海水淡化?根本不靠海啊!”山东国辰实业集团董事长马立新站在车间的模块化设备前,笑着调侃起外界的质疑:“我们凭借 EPC 总包优势,为...
2025-08-15 0
声明丨本文内容均引用权威资料结合个人观点进行撰写,文末已标注文献来源及截图,请知悉。 太空赛道,各国必争,如今的中美正在国际中上演一场“登月大戏”。曾...
2025-08-15 0
AdvLibSuite.CCPro的R2025.2版本已发布。本版本基于TIA V20.0。除了修复一些已发现的bug外,对Motor、AI等组件也做...
2025-08-15 0
发表评论