烟台融媒7月26日讯(记者 刘晓阳 通讯员 高欢)7月25日,备受瞩目的盒马鲜生烟台首店在烟台大悦城B1层盛大开业,为烟台商业版图增添了一抹亮丽的色彩...
2025-07-26 0
AI突破数学奥林匹克:DeepMind与OpenAI在国际数学竞赛中的创新表现
2023年7月21日,Google DeepMind宣布其最新研发的软件成功解答了一组国际数学奥林匹克(IMO)中的数学问题,取得了与全球顶级高中生相当的成绩,达到了金牌标准。这一成绩标志着大型语言模型(LLM)首次与数学奥林匹克金奖得主的表现平起平坐,展示了AI在数学领域的重大突破。
表面上看,DeepMind今年的表现似乎仅比去年有所改进。去年,DeepMind的系统在2024年国际数学奥林匹克上获得了接近银牌的成绩,而今年则成功突破,达到了金牌水平。但是,DeepMind计算机科学家Thang Luong指出,这一看似小小的成绩提升背后,其实蕴含着“巨大的范式转变”。
奥数金牌(图片来源:MoiraM/Alamy,侵删)
从编程到自然语言:AI推理的新突破
与以往的AI工具不同,DeepMind这次采用了一个新的大型语言模型(LLM)——DeepThink。这一系统基于DeepMind的Gemini架构进行了强化,能更好、更快地进行数学推理,特别是在并行处理多个思维链条方面,取得了显著进展。“这一切完全是自然语言处理,从头到尾都可以通过自然语言进行交互,”Luong表示。
之前,DeepMind采用的AI工具如AlphaGeometry和AlphaProof,要求人类专家先将数学问题转化为类似编程语言的表达形式,再通过AI来完成解答。今年,DeepMind的系统打破了这一限制,实现了完全通过自然语言完成问题的理解和解答,大大简化了操作流程,提高了效率。
DeepThink在今年的国际数学奥林匹克比赛中,解答了6道数学问题,最终得到了42分中的35分。根据与赛事主办方的协议,AI的解答由与人类选手相同的评审团进行评判,结果与金奖选手的表现不相上下。
OpenAI与DeepMind的同场竞技:AI的进步与挑战
与此同时,总部位于美国加利福尼亚的OpenAI也在这一领域取得了突破。OpenAI的系统同样解决了国际数学奥林匹克的数学问题,表现达到了金奖水平,并由独立评审进行打分。尽管DeepMind和OpenAI的实现方式有所不同,但它们的成功都证明了AI在数学领域的强大潜力。
行业专家指出,长期以来,AI研究人员主要分为两派。一派主张“手工编码逻辑”,即通过传统编程方式将逻辑推理规则写入机器,而另一派则倾向于通过神经网络来自动学习和推理。2012年之后,神经网络的发展取得了一系列突破,如今,OpenAI的ChatGPT和DeepMind的DeepThink等AI工具已经进入主流应用。
AI数学表现令人印象深刻,但面临研究挑战
纽约大学神经科学家Gary Marcus称DeepMind与OpenAI的成绩“实在令人惊叹”,并赞扬它们解决数学问题的能力。他同时指出,这些AI系统的表现虽然优异,但是否能够突破现有的研究瓶颈,进行更为复杂的数学研究仍然是一个悬而未决的问题。
英国帝国理工学院的数学家Kevin Buzzard也认为,数学奥林匹克的成功不意味着AI就能胜任高端研究。“数学奥林匹克的金奖表现并不代表这些AI系统能够应对复杂的理论研究问题,”他说道。
弗吉尼亚大学的数学家Ken Ono同样持有相似看法。他认为,AI目前作为研究伙伴,能够快速访问科学文献、总结数据,提供应对复杂问题的策略,但这些测试和基准并不完全符合理论数学家的研究需求。
AI与数学研究的未来:合作与发展
尽管如此,DeepMind表示,未来将允许部分研究人员与DeepThink版本的AI系统进行合作,进一步探索AI在数学研究中的潜力。Luong表示:“很快,我们将看到AI与数学家们的深度合作,推动数学领域的进一步发展。”
这一突破不仅代表着人工智能在解决数学问题上的能力提升,也为AI在科学研究中的应用开辟了更广阔的空间。随着AI技术的不断进步,我们有理由相信,未来AI将在学术研究、科技创新等领域扮演更加重要的角色。
总结
DeepMind与OpenAI的突破不仅是数学奥林匹克的一次奇迹,也是人工智能在科研领域进步的一个重要里程碑。随着AI技术的不断发展,未来数学、物理等领域的研究将越来越依赖于AI的强大推理能力和数据处理能力。AI的迅速发展不仅为学术界带来了创新机遇,也为相关市场带来了广阔的前景,推动着全球科技格局的变革。
相关文章
烟台融媒7月26日讯(记者 刘晓阳 通讯员 高欢)7月25日,备受瞩目的盒马鲜生烟台首店在烟台大悦城B1层盛大开业,为烟台商业版图增添了一抹亮丽的色彩...
2025-07-26 0
AIGC短片《你的样子》运用人工智能技术“复原”了杨靖宇、赵尚志、赵一曼、左权、彭雪枫、张自忠等十余位抗日英烈拍摄历史照片时的鲜活模样。Ta们长眠,我...
2025-07-26 0
科技媒体小米时代消息,小米宣布其全球服务门店数量已突破2000家,并计划在2025年底前将这一数字提升至20000家,大幅拓展线下服务网络覆盖范围。...
2025-07-26 0
7月1日起,美团一项关爱骑手的重要举措正式落地——骑手保险补贴在四川成都、湖北武汉、广东深圳、河北石家庄、江苏无锡5座城市率先上线。这一补贴政策旨在减...
2025-07-26 0
金融界2025年7月24日消息,国家知识产权局信息显示,淄博秦鼎昌特钢科技有限公司取得一项名为“镍基高温耐腐蚀合金车轴”的专利,授权公告号CN2231...
2025-07-26 0
近日,朗格森(西安)电子有限公司定制项目在沣西新城的秦创原·亿沣创智科技谷开工建设,项目正式投运后预计年产值约1.2亿元,新增技术人员约120人。朗格...
2025-07-26 0
国家等六部委联合发文开展智能工厂梯度培育行动,特变电工电装集团鲁缆公司(以下简称“鲁缆公司”)继今年3月获评属地“泰安市智能工厂”后成功获评“山东省先...
2025-07-26 0
最近刷到个挺有意思的话题:运20和C919同样是飞机。200吨的大块头实现了国产化,70吨的客机却还得靠进口部件撑场子!这到底是咱们军工太强,还是民航...
2025-07-26 0
发表评论