
本期为TechBeat人工智能社区第711期线上Talk。
北京时间8月21日(周四) 20:00,深圳北理莫斯科大学长聘副教授曾润浩的Talk将准时在TechBeat人工智能社区开播!
他与大家分享的主题是: “直播高光秒捕捉 - 一句话、一张图、一段视频精准锁定”,届时他将解释一种基于混合模态查询的线视频定位任务:在视频直播时,能根据你输入的一句话、一张图或一小段参考视频,实时找到匹配的感兴趣片段。
Talk·信息
▼
主题:直播高光秒捕捉 - 一句话、一张图、一段视频精准锁定
嘉宾:深圳北理莫斯科大学 · 长聘副教授 - 曾润浩
时间:北京时间 8 月21日(周四) 20:00
地点:TechBeat人工智能社区
http://www.techbeat.net/
长按识别二维码,一键预约TALK!
Talk·介绍 ▼
视频感兴趣内容定位旨在根据用户输入的查询(query)在长视频里找对应片段。传统方法存在两个局限:只能处理文本查询,只能针对离线视频进行分析。 本文提出基于混合模态查询的线视频定位任务:在视频直播时,能根据你输入的一句话、一张图或一小段参考视频,实时找到匹配的、感兴趣的片段。 为此构建了数据集和新指标,并设计了相应的基线模型。
Talk大纲
1. 背景与任务动机:离线单模态Video Grounding局限
2. 新方法:参数化记忆+跨模态蒸馏
3. 新数据集、新指标:QVHighlights-Unify+在线指标
4. 实验结果:精度与速度分析
5. 总结:统一多模态实时定位
Talk·预习资料
▼

论文链接:
https://arxiv.org/abs/2004.03545

论文链接:
https://arxiv.org/abs/2508.11903

论文链接:
https://arxiv.org/abs/2308.07102

论文链接:
https://arxiv.org/abs/2508.04546
Talk·提问交流
▼
在Talk界面下的 【交流区】 参与互动!留下你的打call和问题,和更多小伙伴们共同讨论,被讲者直接翻牌解答!

你的每一次贡献,我们都会给予你相应的i豆积分,还会有惊喜奖励哦!

Talk·嘉宾介绍
▼

曾润浩
深圳北理莫斯科大学 · 长聘副教授
曾润浩,博士,深圳北理莫斯科大学长聘副教授,北理工博导。广东省重大人才工程青年拔尖人才,深圳市科技创新人才,深圳市鹏城孔雀人才,广东潮博智库专家。研究领域为计算机视觉、多模态数据分析,核心方向包括视频动作识别、情绪识别等,在IEEE TPAMI、IEEE TIP、CVPR等国际顶级期刊和会议发表论文30余篇,谷歌学术总引2000余次,单篇最高引600余次。所提出的视频时序动作分析方法在THUMOS14权威基准连续14个月排名全球第一。近三年主持国家自然科学基金项目、广东省教育厅重点领域项目等纵向科研项目7项。获教育部自然科学二等奖,中国图象图形学学会优博提名奖,IEEE计算机学会杰出组织奖,成果入选CVPR 2024最佳论文Final List。受邀担任NeurIPS、CVPR等人工智能领域顶级会议和TPAMI、TIP等权威期刊的程序委员会委员和审稿人。担任国际会议2024 IEEE SmartIoT本地主席、2023 CSIG青年科学家会议论坛主席,2025 VALSE人体动作理解与生成论坛主席,CSIG多媒体专委会委员,广东图象图形学会青工委委员,计算机视觉专委会委员。
个人主页:
https://www.techbeat.net/grzytrkj?id=45440
长按识别二维码,一键预约TALK!
-The End-

如果你也想成为讲者
▼
自荐 / 推荐

单人Talk | 团队专场 | 录播or直播 | 闭门交流
多种方式任你选择!
推荐讲者成功也有奖励哦~
关于TechBeat人工智能社区
▼ TechBeat(www.techbeat.net)隶属于将门创投,是一个荟聚全球华人AI精英的成长社区。
我们希望为AI人才打造更专业的服务和体验,加速并陪伴其学习成长。
期待这里可以成为你学习AI前沿知识的高地,分享自己最新工作的沃土,在AI进阶之路上的升级打怪的根据地!
更多详细介绍>>TechBeat,一个荟聚全球华人AI精英的学习成长社区
发表评论