本篇文章给大家谈谈微信蜀山麻将有挂是真的么,以及微信蜀山麻将开挂神器下载对应的知识点,希望对各位有所帮助,不要忘了收藏本站喔。 微信小程序里面亲友房打...
2025-07-26 0
【来源:人民邮电报】
7月19日,2025年国际数学奥林匹克竞赛(IMO)结果揭晓,中国队6位选手全员斩金,中国队时隔4年重登第一!
更令人震惊的是,今年IMO首次有AI夺金。
7月21日,谷歌DeepMind宣布其搭载了“深度思考”能力的Gemini Deep Think,以6题解出5题、总分35分的成绩,达到金牌标准,且这一成绩经过了IMO官方评分专家们的认证。这标志着在处理高度抽象和复杂的数学问题方面,AI的能力实现了质的飞跃。
根据IMO的比赛规则,参赛者需在4.5小时内解决6道极具深度的数学问题,涵盖代数、组合学、几何和数论,而且只有排名前8%的选手才能摘得金牌。数学问题不仅需要逻辑推理,还考验创造性思维和严谨性,这对AI系统提出了极高要求。
近年来,IMO已成为AI模型挑战解决、推理数学问题的新目标,吸引了众多开源和闭源模型的参与。2024年,谷歌DeepMind的AlphaProof和AlphaGeometry 2系统,利用“形式语言”(人类专家首先将问题从自然语言翻译成形式语言,然后模型再进行证明),在2~3天的计算时间内,破解了6题中的4题,取得了银牌。
时隔一年,AI模型的数学推理能力又取得了惊人的进步。Gemini Deep Think直接从官方问题描述中生成严格的数学证明,并完美破解6道题中的5道——所有这些都在4.5小时的比赛时限内完成,且得到了IMO组委会的官方认证。
“我们可以确认,谷歌DeepMind已经达到了人们所期望的里程碑,获得了42分中的35分(金牌分数)。他们的解决方案令人惊讶,IMO评分专家们认为解法清晰、精确且大多数易于理解。”IMO主席Gregor Dolinar教授表示。
根据DeepMind团队介绍,Gemini Deep Think结合了平行思考在内的最新研究技术,这使模型可以同时探索和组合多个可能的解决方案,而不是追求单一的线性思维链。此外,研究团队还为Gemini提供了高质量的数学问题解答语料库,并在其说明中添加了一些关于如何应对IMO问题的一般提示和技巧。
研究团队和数学界保持合作,将向部分数学家提供Gemini Deep Think版本做进一步测试,逐渐构建能够解决更复杂和高级数学问题的AI。
“结合自然语言流畅性和严格推理能力(包括形式语言验证)的Agent将成为数学家、科学家、工程师等研究人员们的重要工具,推进人类知识进步,加快迈向AGI的道路。”研究人员表示。
消息来源:IMO 2025、Google DeepMind官网
编辑:潇栋 于莉莉李珮雯
监制:朱筠
声明:此文版权归原作者所有,若有来源错误或者侵犯您的合法权益,您可通过邮箱与我们取得联系,我们将及时进行处理。邮箱地址:jpbl@jp.jiupainews.com
相关文章
本篇文章给大家谈谈微信蜀山麻将有挂是真的么,以及微信蜀山麻将开挂神器下载对应的知识点,希望对各位有所帮助,不要忘了收藏本站喔。 微信小程序里面亲友房打...
2025-07-26 0
“凡是敌人反对的,我们就要拥护;凡是敌人拥护的,我们就要反对”,这段经典的毛主席语录至今依然被奉为真理且无处不在。尤其在正式场合中方与美对立之时,中国...
2025-07-26 0
中国商飞是一家专门从事民用飞机及相关产品的设计、制造、销售及服务的大型国有企业。电科数字主要业务涉及行业信息化解决方案、数据中心智能化解决方案、专项服...
2025-07-26 0
金融界2025年7月26日消息,国家知识产权局信息显示,重庆邮电大学、北京海云捷迅科技股份有限公司申请一项名为“基于迁移强化学习的机器人避障方法和装置...
2025-07-26 0
来源:东哥笔记作者:金珊当监管叫停外卖补贴,刘强东选择走一条更重的路。京东要亲自炒菜了。今年6月刘强东曾在媒体分享会上表示,“未来,我们会打造一种与美...
2025-07-26 0
西藏林芝雅鲁藏布江边最近开始修水电站,总投资1.2万亿人民币。这个项目不建大水坝,而是挖隧道引水发电。工程重点不是给西藏自己用,主要是要把发的电卖给南...
2025-07-26 0
最近,济南出现一个自带热搜体质的“白胖子”。 就在前些天,看到这样一条帖子。 中国外交部发言人毛宁在海外平台上发帖,点赞了济南的基坑气膜,在海...
2025-07-26 0
烟台融媒7月26日讯(记者 刘晓阳 通讯员 高欢)7月25日,备受瞩目的盒马鲜生烟台首店在烟台大悦城B1层盛大开业,为烟台商业版图增添了一抹亮丽的色彩...
2025-07-26 0
发表评论