首页 百科大全文章正文

网易有道密集展示大模型成果!100集短剧翻译、配音、润色成本仅100元,音视频翻译平台开启内测

百科大全 2025年08月20日 21:06 1 admin
网易有道密集展示大模型成果!100集短剧翻译、配音、润色成本仅100元,音视频翻译平台开启内测

智东西

作者 | 程茜

编辑 | 心缘

智东西8月20日报道,今天,网易有道集中展示了多项大模型成果,包括子曰3系列大模型的新进展,以及AI有道词典、有道音视频平台、有道AI答疑笔SpaceX等多项软硬件成果。

网易有道CEO周枫谈道,目前网易有道聚焦于广告和教育领域。

教育领域,其今年6月开源的子曰3系列数学大模型,是14B参数的轻量级推理模型,每百万token服务成本0.15美元,是通用大模型的1/10。此外网易有道还升级了AI有道词典,二代AI答疑笔新增了全景拼图、视频答疑等功能,二代有道答疑笔Wi-Fi版本售价1199元,4G版本1399元。

广告领域,网易有道针对电商、短剧出海等需求推出的有道音视频平台,可以处理1GB、60分钟音视频的原声人声翻译能力。网易有道智能应用事业部负责人张艺透露,目前处理一部100集短剧的行业平均价格为1500元,有道音视频翻译平台成本仅为100元,能一次性提供翻译、配音到润色的全流程服务。

网易有道密集展示大模型成果!100集短剧翻译、配音、润色成本仅100元,音视频翻译平台开启内测

对于AI教育行业的发展,周枫将教育行业类比自动驾驶的分级,他认为,教育AI正在从L3的学习辅助到L4的虚拟导师完成一次关键的跃迁。目前,AI已经不是被动的应答者,而是具备了接近人类老师的思考能力,能主导引导学生思路甚至预判学生的难点。

一、AI应用加速向高价值垂直场景渗透,有道聚焦教育和广告

周枫分享了基于当下大模型行业的发展,其对大模型应用落地、技术迭代的思考。

首先,他认为大模型的推理能力更强、思考更加深入,当下从推理迈向Agent时代体现出两大新变化,Agent可以自主执行复杂任务,能自主完成此前需要人工分解的繁琐步骤;Agent能自主检查和修正答案,可以攻克更难的问题。

第二个趋势是AI应用正在加速向高价值垂直场景渗透,在创意设计、市场营销、办公、医学研究等高度专业化场景的AI工具越来越好用。

网易有道密集展示大模型成果!100集短剧翻译、配音、润色成本仅100元,音视频翻译平台开启内测

在此基础上,网易有道已经形成了聚焦教育和广告两大领域的业务体系。

广告和市场营销层面,今年以来,网易有道依托模型能力,有道智选推出了小智广告AI优化师与创意生产工具箱iMagicBox。

小智广告AI优化师基于AI投放决策模型可满足企业从投前到投后全流程的辅助决策,投前针对广告策略素材投放计划和行业素材解决广告主需求,投中一键生成最优的人群投放决策,投后生成投放问题的诊断报告;iMagicBox可以帮助广告企业独立生成图像、视频模版。

网易有道密集展示大模型成果!100集短剧翻译、配音、润色成本仅100元,音视频翻译平台开启内测

这两大产品实现了企业从广告创意到投放优化的全流程智能化。

在教育层面,今年6月,网易有道推出14B轻量级子曰3系列数学大模型,在CK12-math(Internal)、GAOKAO-Bench(Math)、MathBench(K12)、MATH500等数据集上各项得分均高于DeepSeek-R1等通用大模型,在数学解题和讲题方面的多个评测中,表现达到SOTA水平。

此外,网易有道子曰教育大模型在翻译和辅导场景进行了重点优化。

翻译场景,小语种翻译模型可以实现38种语言实时翻译,并具备多模态深度理解能力;辅导场景覆盖英文作文批改、文言文解析、数学习题拆解等全学科高频场景。

网易有道密集展示大模型成果!100集短剧翻译、配音、润色成本仅100元,音视频翻译平台开启内测

技术层面,小语种翻译模型实现基于单一模型原生支持38种使用语言。周枫透露,其研究人员实现了使得模型底层具备理解和多语言表达能力,并通过针对翻译需求的打分模型,进行多阶段强化学习训练,解决了模型翻译复杂句式、专业术语的难题。

在子曰3系列数学大模型上,网易有道同样采用了强化学习训练策略,引入难度加权策略等加强模型的解题能力等。

二、有道词典累计用户量超10亿人,有道音视频翻译平台开启内测

网易有道智能应用事业部负责人张艺透露,2023年至今,网易有道AI应用订阅的销售额超过3余亿元,AI功能整体渗透率超过40%。截至目前,网易有道词典累计用户量超过10亿人次。据他们观察,词典用户的需求正变得更加细分、专业。

网易有道升级后的AI有道词典搭载了14B小参数的子曰翻译大模型2.0,在翻译和多模态能力方面进行了升级,该模型已经实现翻译能力超越国内外通用大模型。

具体来看,首先是AI同传能力,其围绕识别能力、语言覆盖、翻译质量三个方面进行了升级。

AI有道词典可实现抗噪声稳定识别输出,同时新增支持71种语言、125种口音,以及经济、化学、计算机、医学等学术术语库。张艺称,有道词典AI同传已服务超1000万人次。

此外,他谈道,随着大模型的发展,AI翻译已经进入多模态内容深度理解与生成的阶段,基于此网易有道展示了基于多模态大模型的AI翻译平台有道音视频翻译。

该平台内测版本已经上线,正式版本9月初发布,发布初期可以限时免费使用。有道音视频翻译平台支持任意语种音视频上传,实现原声克隆、人声翻译,已经在电商出海、短剧出海有所应用。

网易有道密集展示大模型成果!100集短剧翻译、配音、润色成本仅100元,音视频翻译平台开启内测

这背后的技术优势在于,网易有道研发了文本、音频、视频多模态一体化原声翻译系统VocalFusion,可以识别主播的性别、年龄、动作、场景,进行深度还原。音色方面,有道自研TTS技术Adaptive Voice Cloning,用户可以通过简单提示词调节主播说话的语气,如让说话声音更兴奋、更低沉等。

网易有道密集展示大模型成果!100集短剧翻译、配音、润色成本仅100元,音视频翻译平台开启内测

在时间方面,有道音视频翻译平台处理10分钟视频耗时3分钟,可以处理1GB、60分钟的视频。

网易有道密集展示大模型成果!100集短剧翻译、配音、润色成本仅100元,音视频翻译平台开启内测

三、AI答疑笔升级,新增视频讲题、扫描拼图

今年2月网易有道推出AI答疑笔SpaceOne,网易有道高级副总裁吴映晖透露,目前小P答疑累计响应次数已经超过1.4亿次,AI答疑功能的使用频次从每人每日4-5次,到现在超过10次。他补充说,AI答疑笔会先给学生关键提示,鼓励学生尝试自己解决,如果还是没有解决,会提供详细解决过程,分步解析,学生中途不明白的地方可以随时追问。

此次有道推出的二代AI答疑笔SpaceX,新增了全景拼图、板书式视频答疑等新功能。

SpaceX笔头宽度为3.6cm,吴映晖称,据他们调研,这可以实现80%的题目一次扫描完成,对于带图片、长篇幅的题目,SpaceX可以基于全景拼图功能自动拼接题目。

网易有道密集展示大模型成果!100集短剧翻译、配音、润色成本仅100元,音视频翻译平台开启内测

此外,有道将答疑功能放置到了答疑笔的第一入口,可以让用户快速调用相应功能,并且不同于拍照搜题,提笔扫描的交互方式,直接扫描可以简化用户打开摄像头、拍照等步骤,更便捷、速度更快。

讲题过程中,该答疑笔在文字分步骤答疑模式、苏格拉底引导答疑模式之外,新增了板书式视频答疑功能。这一新功能通过图片、文字、声音的形式,更适合于推演过程复杂、本身就有图片的题目。

网易有道密集展示大模型成果!100集短剧翻译、配音、润色成本仅100元,音视频翻译平台开启内测

硬件层面的升级,二代有道AI答疑笔搭载4.4英寸OLED全面屏,机身厚度为13mm,重量为105g,支持4G插卡上网,满电续航可以达到7天。

结语:软硬件融合破解教育、广告行业痛点

从有道词典笔到有道答疑笔,网易有道正不断发掘大模型在教育领域的多样化需求,并通过软硬件结合的方式推陈出新,解决更多教育上的痛点。与现在市面上的学习机等硬件形态相比,网易有道聚焦于扫读的交互形式,覆盖到其在查词、翻译等教育领域的更多高频使用场景。

与此同时,AI应用正在加速向高价值垂直场景渗透的当下,网易有道基于其在多模态大模型领域的布局,聚焦于教育和广告领域,将进一步将这些场景的痛点与大模型发展深度融合。

发表评论

泰日号Copyright Your WebSite.Some Rights Reserved. 网站地图 备案号:川ICP备66666666号 Z-BlogPHP强力驱动