金融界8月6日消息,有投资者在互动平台向粤 传 媒提问:微短剧《志》入选国家广播电视总局办公厅 2023 年第一季度优秀网络视听作品,能否介绍下公司广...
2025-08-06 0
金磊 发自 凹非寺
量子位 | 公众号 QbitAI
谷歌拿下IMO(国际数学奥林匹克竞赛)金牌的模型——Gemini 2.5 Deep Think,现在可以用起来了。
根据谷歌DeepMind的最新消息,这个模型已经在Gemini App中推出。
并且这个发布的版本,跟拿下IMO金牌的版本还有略微的区别。
之前的模型需要好几个小时才能解决复杂的数学问题,但App中发布的版本,速度会更快,实用性也会更强。
但相对的,实力定然不如之前的“完全体”,不过同样是拿IMO’25的试题实验,可以达到铜牌的水平。
DeepMind在发布Gemini 2.5 DeepThink之际,还拉来了数学家Michel van Garrel来站台:
当我问它一个猜想,我大概有三个思路,但它似乎在考虑20甚至100个
不过这个模型只对Ultra的订阅用户开放,每月订阅费为249.99美元,折合人民币约1803元。
除了“发布”的动作之外,DeepMind这次还秀了一波推理性能的肌肉,对标的选手是OpenAI的o3和马斯克的Grok 4。
主要考量的能力聚焦在了编码、科学、知识和推理能力上。
结果显示,在衡量代码性能的LiveCodeBench V6测试中,以及在衡量不同领域(包括科学和数学)专业知识的Humanity’s Last Exam测试中,与不使用工具的其他模型相比,Gemini 2.5 Deep Think均取得最好的成绩。
整体来看,Gemini 2.5 Deep Think功能具备以下优势:
至于其背后的原理,DeepMind总结了一句话:
扩展Gemini的并行“思考时间”。
具体而言,正如人类在解决复杂问题时,会花时间从不同角度探索、权衡潜在的解决方案并完善最终答案一样,Deep Think通过使用并行思维技术,拓展了思维能力的边界。
这种方法让Gemini能够一次性生成众多想法并同时进行考量,甚至随着时间的推移修正或结合不同的想法,最终得出最佳答案。
此外,通过延长推理时间或“思考时间”,DeepMind为Gemini提供了更多时间去探索不同的假设,并为复杂问题找到创造性的解决方案。
DeepMind还开发了新颖的强化学习技术,旨在激励模型利用这些扩展的推理路径,从而使Deep Think随着时间的推移,成为一个更出色、更直观的问题解决者。
团队成员还表示,Gemini 2.5 Deep Think用来看论文:
它不只是简单地复述研究论文,而是能以我前所未见的方式,融合不同论文中的观点。
参考链接:
[1]https://blog.google/products/gemini/gemini-2-5-deep-think/
[2]https://x.com/SamuelAlbanie/status/1951322935198630356
— 完 —
量子位 QbitAI · 头条号
关注我们,第一时间获知前沿科技动态
相关文章
金融界8月6日消息,有投资者在互动平台向粤 传 媒提问:微短剧《志》入选国家广播电视总局办公厅 2023 年第一季度优秀网络视听作品,能否介绍下公司广...
2025-08-06 0
金融界2025年8月6日消息,国家知识产权局信息显示,合普动力股份有限公司申请一项名为“利用曳引轮散热的曳引机”的专利,公开号CN120423410A...
2025-08-06 0
清晨7时,呼和浩特市赛罕区市民打开手机,指尖轻点,就完成了孩子的入学报名;上午10时,政务大厅里,工作人员通过AI大模型,快速生成材料初稿;傍晚18时...
2025-08-06 0
2025年天猫淘宝超级88活动时间于2025年8月6日20:00开始,至8月11日23:59结束,活动共计6天。在淘宝天猫超级88年中盛典活动时间内,...
2025-08-06 0
金融界2025年8月6日消息,国家知识产权局信息显示,天能电池集团(江西)有限公司申请一项名为“一种铅酸蓄电池酸饱和度测试方法”的专利,公开号CN12...
2025-08-06 0
来源:环球网 【环球网科技综合报道】8月6日消息,据可靠消息人士向macrumors 透露,苹果公司计划于 2025 年晚些时候发布新款 Apple...
2025-08-06 0
AI 快讯OpenAI发布开放权重人工智能模型OpenAI 8月5日表示,两个分别名为GPT-oss-120b和GPT-oss-20b的模型将在AI软...
2025-08-06 0
您好:这款游戏可以开挂,确实是有挂的,很多玩家在这款游戏中打牌都会发现很多用户的牌特别好,总是好牌,而且好像能看到-人的牌一样。所以很多小伙伴就怀疑这...
2025-08-06 0
发表评论