2025世界机器人大会近日在北京举行。本届大会吸引了200多家国内外优秀的机器人企业带来1500多件展品,其中首发新品就有100多件。探展现场,不难发...
2025-08-17 0
金融界2025年8月4日消息,国家知识产权局信息显示,巨人移动技术有限公司申请一项名为“一种生成专业钢琴声音的方法”的专利,公开号CN120412504A,申请日期为2025年04月。
专利摘要显示,本发明涉及一种生成专业钢琴声音的方法,包括以下步骤:构建数据集,所述数据集包含10小时钢琴声的专业数据;采用多阶段流匹配框架的训练策略进行训练,阶段如下:第一阶段为监督训练:基于流匹配构建多流DiT架构,融合视频CLIP特征与文本FLAN-T5编码;在Encodec音频潜空间进行跨模态特征映射;第二阶段为CoP指导学习:引入MIDI特征控制生成模块与演奏视频到MIDI特征预测器;分步生成以下流程:顶视图、多视图以及风格化音频生成;第三阶段为组合优化:采用因子化对比学习,解耦音视频共享特征与独立特征,优化互信息边界;采用直接偏好优化方法,基于钢琴家演奏风格偏好数据微调,提升风格可控性。本发明可以基于视频引导的音效生成模型来生成专业钢琴声音。
天眼查资料显示,巨人移动技术有限公司,成立于2017年,位于上海市,是一家以从事软件和信息技术服务业为主的企业。企业注册资本5000万人民币。通过天眼查大数据分析,巨人移动技术有限公司专利信息50条,此外企业还拥有行政许可7个。
本文源自金融界
相关文章
2025世界机器人大会近日在北京举行。本届大会吸引了200多家国内外优秀的机器人企业带来1500多件展品,其中首发新品就有100多件。探展现场,不难发...
2025-08-17 0
近日,花园集团旗下杭州知兴制药有限公司首席科学家王兆霖博士领衔的研发团队,经过多年技术攻关,成功通过国内首例中国市场进口沙美特罗替卡松吸入粉雾剂低剂量...
2025-08-17 0
8月8日至12日,2025年世界机器人大会(以下简称“大会”)在北京经开区盛大启幕。经开区打造的“北京·亦庄 科技馆之城”特推出“智汇亦庄 创享未来”...
2025-08-17 0
从车轮到旋翼:十堰低空经济如何跑出“加速度”文/低空经济探索者在十堰竹山县的群山之间,一架无人机正沿着新开辟的航线飞行。机舱里装载的不仅是山区村民网购...
2025-08-17 0
曾经,地震预警系统是少数几个拥有先进地震监测网络的国家的专属;而如今,谷歌巧妙地将全球逾20亿部安卓手机连接成一张巨大的地震监测网络,成功在全球部分地...
2025-08-17 0
曾几何时,手表仅是腕间的计时装饰,而今智能手表已悄然成为现代人的"第二必备品"。纵观市场,从百元级到几千元档,智能手表正以惊人的功能集成重塑着我们的生...
2025-08-17 0
相信影音爱好者一定对 SIM2 这个品牌不会陌生,作为影音设备的前沿探索者,这个意大利品牌此前为投影领域做出的贡献相信各位都有目共睹。今年是 SIM2...
2025-08-17 0
发表评论