来源:8月13日《新华每日电讯》作为引领新一轮科技革命和产业变革的战略性技术,人工智能正深刻改变人类生产生活方式。数据显示,2025年上半年,生成式人...
2025-08-14 0
IT之家 8 月 13 日消息,FFmpeg 是一个流行的开源媒体播放器通用框架,现在包含了一个新的 af_whisper 音频工具,可以直接在 FFmpeg 生态系统中实现自动语音识别(ASR)。
该工具使用了 whisper.cpp 库,为媒体处理工作流程添加了一个 AI 模型,允许进行灵活的音频转译文本,包括选择 AI 模型、指定语言以及设置输出格式,如文本、SRT 或 JSON。
该工具可以处理预录制的文件和实时音频流,用户还可以使用语音激活检测(VAD)来提高转写的准确性和效率。
IT之家注意到,该工具还支持 GPU 加速,可以显著加快转写过程。对于用户来说,这一功能取代了对外部、多步骤转写过程的需求,将任务整合到一个高效的单命令行工作流程中。
相关文章
来源:8月13日《新华每日电讯》作为引领新一轮科技革命和产业变革的战略性技术,人工智能正深刻改变人类生产生活方式。数据显示,2025年上半年,生成式人...
2025-08-14 0
《科创板日报》8月13日讯随着全球首届世界人形机器人运动会临近举行,越来越多赛事细节逐一浮出水面。首先是参赛队伍,近几日多个人形机器人整机企业官宣参赛...
2025-08-14 0
在浙江杭州的一片测试场地上,一头银白色合金骨架的“机械猛兽”如离弦之箭般飞驰而出……8月12日,红星新闻记者从吉尼斯世界纪录获悉,由浙江大学交叉力学中...
2025-08-14 0
您好:这款游戏是可以开挂的,软件加微信【添加图中微信】确实是有挂的,很多玩家在这款游戏中打牌都会发现很多用户的牌特别好,总是好牌,而且好像能看到其他人...
2025-08-14 0
8月14日,一场注定载入科技与体育史册的盛会——2025世界人形机器人运动会将在国家速滑馆“冰丝带”震撼启幕。这不是科幻电影,而是正在发生的未来。作为...
2025-08-14 0
特朗普已经向英伟达发放许可证,H20芯片可以卖给中国,但英伟达必须向美政府上缴销华晶片15%收入。特朗普发放许可证到底有哪些细节?向美上缴15%收入又...
2025-08-14 0
发表评论