金融界2025年8月7日消息,国家知识产权局信息显示,江苏腾沅机械科技有限公司申请一项名为“一种汽轮机叶片加工用精度检测装置及其方法”的专利,公开号C...
2025-08-08 0
IT之家 8 月 6 日消息,Bilibili Index 团队于 8 月 4 日发布博文,宣布通过自研 IndexTTS2 模型,推出“原声风格”视频配音功能,可以支持将部分中文视频翻译为外语的原声风格配音。
IT之家此前曾介绍该功能上线,而在最新博文介绍中,官方介绍了该功能背后的 AI 模型。
该团队表示通过该自研模型,让视频人物不再是千篇一律的“代言人声线”,而是像本人亲自讲外语一样自然,声音、语气、节奏,甚至个性表达都和原片几乎一致,观众可以听到“这个人用另一种语言在说话”。
该模型创新性地提出了一种通用于 AR 系统的“时间编码”机制,首次解决了传统 AR 模型难以精确控制语音时长的问题。这一设计在保留 AR 架构在韵律自然性、风格迁移能力、多模态扩展性等方面优势的同时,也具备了合成定长语音的能力。
团队还推出通过音色克隆、声场一致性、多声源融合等技术,解决了传统配音中声音人格缺失、字幕干扰及本地化成本高等痛点。
系统还针对多说话人场景优化说话人分割、情绪迁移与语速控制,并引入 RIVAL 对抗式强化学习框架提升翻译质量与风格适配度。
在视频层面,结合字幕擦除与基于 Diffusion 的高保真唇形同步,确保音画一致与沉浸感。B站表示,未来将支持更多语言,并计划开源模型,推动多语言、跨模态内容全球化传播。
参考
相关文章
金融界2025年8月7日消息,国家知识产权局信息显示,江苏腾沅机械科技有限公司申请一项名为“一种汽轮机叶片加工用精度检测装置及其方法”的专利,公开号C...
2025-08-08 0
金融界2025年8月7日消息,国家知识产权局信息显示,河北伟亿新材料科技有限公司申请一项名为“热稳定剂、制备含氯发泡材料的方法”的专利,公开号CN12...
2025-08-08 0
金融界2025年8月7日消息,国家知识产权局信息显示,浙江唯联科技有限公司申请一项名为“一种拾音氛围灯的音频分析控制方法及其氛围灯”的专利,公开号CN...
2025-08-08 0
金融界2025年8月7日消息,国家知识产权局信息显示,江苏盱能集团有限公司申请一项名为“一种配电网故障诊断用故障检测装置”的专利,公开号CN12042...
2025-08-08 0
金融界2025年8月7日消息,国家知识产权局信息显示,聚变新能(安徽)有限公司;中国科学院合肥物质科学研究院申请一项名为“聚变堆装置中用于传输弹丸的管...
2025-08-08 0
2025最值得购买的三款海信电视推荐。海信是最值得购买的电视品牌之一,凭借行业领先的画质芯片和超高的性价比,全球销量仅次于三星,位列第二。Vidda是...
2025-08-08 0
中国青年报客户端讯(中青报·中青网记者 林洁)从探索物质微观结构的“超级显微镜”——中国散裂中子源,到深入地下700米捕捉“幽灵粒子”的江门中微子实验...
2025-08-08 0
发表评论