青海新闻网2025-08-11 08:42:158月8日,记者从高原康养与低氧医学学术研讨会上获悉,《高原康养蓝皮书》正式在西宁启动研创。《高原康养蓝...
2025-08-13 0
微软已升级Azure AI Speech服务,用户现在只需几秒钟的音频样本就能快速生成令人信服的语音复制品。
个人语音功能于2024年5月21日正式发布。虽然之前版本已经相当出色,但需要一定的训练才能获得最佳效果。据微软介绍,该功能已升级为名为"DragonV2.1Neural"的全新零样本文本转语音模型,能够生成"更自然、更富表现力的语音",并支持100多种语言的音频生成。
微软表示,与之前的模型相比,此次升级"在语音自然度方面带来了显著改进,提供更真实稳定的韵律,同时保持更好的发音准确性"。
这一原本就相当出色的系统现在变得更加准确,令人担忧。微软称:"这项能力开启了广泛的应用场景,从定制聊天机器人语音到用演员原声为视频内容进行多语言配音,实现真正沉浸式的个性化音频体验。"
然而,这项技术也可能被恶意或欺骗性目的所利用,我们可以想象使用该服务制作的音频深度伪造内容将变得越来越难以识别。
但不必担心——除了添加水印以便更容易识别生成的音频(尽管人耳无法听出),微软坚持表示"所有客户都必须同意我们的使用政策,包括要求获得原始说话者的明确同意、披露所创建内容的合成性质,以及禁止冒充任何人或使用个人语音服务欺骗他人"。
微软并非首家提供仅需几秒音频即可克隆用户语音服务的公司。今年早些时候,总部位于帕洛阿尔托的AI初创公司Zyphra推出了一对开源文本转语音模型,声称只需几秒钟的音频样本。在我们的测试中发现,大约需要30秒的语音样本才能创建出令人毛骨悚然的准确效果。
近年来,AI语音克隆已成为一个严重问题,因为技术发展速度超过了安全保障措施。今年3月,《消费者报告》指出四家提供AI语音克隆软件的公司未能提供有意义的安全保障,而FBI也警告称,诈骗者正在使用美国政府高级官员的深度伪造语音进行大规模欺诈活动。
Q&A
Q1:Azure AI Speech的个人语音功能有什么新升级?
A:微软将Azure AI Speech升级为"DragonV2.1Neural"零样本文本转语音模型,只需几秒钟音频样本就能生成更自然、更富表现力的语音复制品,支持100多种语言,在语音自然度、韵律稳定性和发音准确性方面都有显著改进。
Q2:AI语音克隆技术存在哪些安全风险?
A:AI语音克隆可能被用于恶意或欺骗目的,包括制作难以识别的音频深度伪造内容。FBI已经警告诈骗者正在使用深度伪造的政府官员语音进行大规模欺诈活动,这项技术的发展速度已经超过了安全保障措施。
Q3:微软采取了哪些措施来防止AI语音克隆被滥用?
A:微软要求所有客户同意使用政策,包括必须获得原始说话者的明确同意、披露内容的合成性质、禁止冒充他人或欺骗用户。此外,生成的音频还会添加水印以便识别,尽管人耳无法直接听出。
相关文章
青海新闻网2025-08-11 08:42:158月8日,记者从高原康养与低氧医学学术研讨会上获悉,《高原康养蓝皮书》正式在西宁启动研创。《高原康养蓝...
2025-08-13 0
证券日报网讯 阿莱德8月12日在互动平台回答投资者提问时表示,公司目前为全球知名通信设备厂商爱立信、诺基亚、中兴通讯和三星供应产品和服务,公司始终秉持...
2025-08-13 0
今天给各位分享微乐小程序万能开挂器2023的知识,其中也会对微乐小程序万能开挂器优势进行解释,如果能碰巧解决你现在面临的问题,别忘了关注本站,现在开始...
2025-08-13 0
来源:【邢台日报-邢台网】以太行智算中心为核心布局智算产业园我市全力打造冀中南地区数字产业基地本报讯(记者刘瑞凤)8月11日,位于市高新区的太行智算中...
2025-08-13 0
本文内容均引用权威资料结合个人观点进行撰写,文末已标注文献来源,请知悉。前言:中日关系趋于缓和的当下,日本媒体“旧事重提”,谈及一年前中方朝日本军舰连...
2025-08-13 0
8月12日,国务院关税税则委员会公布公告调整对原产于美国的进口商品加征关税措施。为落实中美经贸会谈共识,根据《中华人民共和国关税法》、《中华人民共和国...
2025-08-13 0
您好:这款游戏是可以开挂的,软件加微信【添加图中微信】确实是有挂的,很多玩家在这款游戏中打牌都会发现很多用户的牌特别好,总是好牌,而且好像能看到其他人...
2025-08-13 0
一位千万粉丝博主,回家采访她的舅舅舅妈。两口子已经54岁了,都是普通人。不过,他们算是第一批“丁克一代”。如今年过半百,眼看养老问题将至,大家对他们充...
2025-08-13 0
发表评论