数据库是否“可信”,不是由厂商自己说了算,而是要经得起标准体系的验证。近日,TDengine 顺利通过中国信通院组织的《时序数据库基础能力》全项能力验...
2025-08-04 0
自今年5月哔哩哔哩(以下简称B站)宣布将下架原国际版APP,与国内版合并为一个统一APP后,B站的出海下一步便引来各方关注。
近日,在世界人工智能大会上,B站公布了其为服务海外用户而全新自研的「AI原声翻译功能」,以便海外用户更好体验游戏、科技、二次元等主推内容。在完成了APP合并、海外用户页面多语种适配、特别是视频原声翻译功能上线后,B站似乎已经做好准备蓄力开拓海外市场。
AI原声翻译开启页面
本次发布的「AI原声翻译」功能除了自动擦除中文字幕改为英文、弹幕翻译及各类按钮英文适配等基础的文本互译之外,还能完美还原UP主的声线、音色、气口,而非传统的机器音翻译,同时还能基于翻译语言进行口型模拟。这意味着在未来中文用户观看外语UP主视频或海外用户观看中文UP主视频时能无差别体验原汁原味的“本地化”翻译视频。后续,B站还将视需求把日语等语言加入「AI原声翻译」功能中,持续扩展在海外市场的适配能力。
据悉,目前B站「AI原声翻译功能」中,跨语言声音还原技术源自内部代号为「 IndexTTS2」的语音生成模型 ,其整体框架如下图所示。该模型引入了一种新颖、通用且兼容自回归架构的语音时长及情感控制方法。该方法支持指定token数量,从而实现对语音时长的精确调控,降低了翻译任务的难度。另外对情感表达与说话人身份进行了有效解耦,实现了高质量地复刻原片语音中蕴含的情感。
海外用户页面
为攻克「AI原声翻译功能」中的核心挑战——尤其在游戏、二次元等专名梗点密集领域——实现原风格精准保留与语音时长完美对应,B站技术团队基于大语言模型(LLM)构建翻译引擎,独创性基于语音时长匹配、原声翻译标准与UP主独特风格构建多目标奖励模型,并采用对抗式强化学习(RL)训练驱动模型持续进化与精准适配。同时,引入Deep Research深度挖掘技术,专攻专有名词与流行梗点的翻译难点,确保最终译文准确、地道、传神。字幕擦除部分则结合了先进的多模态大模型OCR技术和基于STTN网络的视频重绘技术,实现字幕区域的精准检测与高还原度擦除。
文丨记者 杭莹受访者供图
相关文章
数据库是否“可信”,不是由厂商自己说了算,而是要经得起标准体系的验证。近日,TDengine 顺利通过中国信通院组织的《时序数据库基础能力》全项能力验...
2025-08-04 0
金融界2025年8月4日消息,国家知识产权局信息显示,中芯国际集成电路制造(北京)有限公司;中芯国际集成电路制造(上海)有限公司申请一项名为“半导体结...
2025-08-04 0
南方财经8月4日电,隆扬电子发布异动公告,随着大数据、AI高算力服务器及云服务等技术的飞速发展,相应带动对高频高速线路板市场的关注,HVLP铜箔主要用...
2025-08-04 0
近日,多家人工智能企业在2025世界人工智能大会上发布了具身智能平台,致力于推动机器人向更高层次的自主化与智能化方向演进。例如,智元发布行业首个面向真...
2025-08-04 0
7月30日至31日,“中国—东盟人工智能+文旅创新应用大赛”北京赛区火热举行,来自全球的参赛团队齐聚一堂,围绕智能导览、沉浸式体验、文旅大数据分析、东...
2025-08-04 0
您好:这款游戏可以开挂,确实是有挂的,很多玩家在这款游戏中打牌都会发现很多用户的牌特别好,总是好牌,而且好像能看到-人的牌一样。所以很多小伙伴就怀疑这...
2025-08-04 0
亲,这款游戏可以开挂的,确实是有挂的,很多玩家在这款游戏中打牌都会发现很多用户的牌特别好,总是好牌,而且好像能看到-人的牌一样。所以很多小伙伴就怀疑这...
2025-08-04 0
发表评论