AI数学突破：DeepMind与OpenAI挑战国际数学奥林匹克金奖

游戏天地 2025年07月25日 10:24 1 admin

AI突破数学奥林匹克：DeepMind与OpenAI在国际数学竞赛中的创新表现

2023年7月21日，Google DeepMind宣布其最新研发的软件成功解答了一组国际数学奥林匹克（IMO）中的数学问题，取得了与全球顶级高中生相当的成绩，达到了金牌标准。这一成绩标志着大型语言模型（LLM）首次与数学奥林匹克金奖得主的表现平起平坐，展示了AI在数学领域的重大突破。

表面上看，DeepMind今年的表现似乎仅比去年有所改进。去年，DeepMind的系统在2024年国际数学奥林匹克上获得了接近银牌的成绩，而今年则成功突破，达到了金牌水平。但是，DeepMind计算机科学家Thang Luong指出，这一看似小小的成绩提升背后，其实蕴含着“巨大的范式转变”。

奥数金牌（图片来源：MoiraM/Alamy，侵删）

从编程到自然语言：AI推理的新突破

与以往的AI工具不同，DeepMind这次采用了一个新的大型语言模型（LLM）——DeepThink。这一系统基于DeepMind的Gemini架构进行了强化，能更好、更快地进行数学推理，特别是在并行处理多个思维链条方面，取得了显著进展。“这一切完全是自然语言处理，从头到尾都可以通过自然语言进行交互，”Luong表示。

之前，DeepMind采用的AI工具如AlphaGeometry和AlphaProof，要求人类专家先将数学问题转化为类似编程语言的表达形式，再通过AI来完成解答。今年，DeepMind的系统打破了这一限制，实现了完全通过自然语言完成问题的理解和解答，大大简化了操作流程，提高了效率。

DeepThink在今年的国际数学奥林匹克比赛中，解答了6道数学问题，最终得到了42分中的35分。根据与赛事主办方的协议，AI的解答由与人类选手相同的评审团进行评判，结果与金奖选手的表现不相上下。

OpenAI与DeepMind的同场竞技：AI的进步与挑战

与此同时，总部位于美国加利福尼亚的OpenAI也在这一领域取得了突破。OpenAI的系统同样解决了国际数学奥林匹克的数学问题，表现达到了金奖水平，并由独立评审进行打分。尽管DeepMind和OpenAI的实现方式有所不同，但它们的成功都证明了AI在数学领域的强大潜力。

行业专家指出，长期以来，AI研究人员主要分为两派。一派主张“手工编码逻辑”，即通过传统编程方式将逻辑推理规则写入机器，而另一派则倾向于通过神经网络来自动学习和推理。2012年之后，神经网络的发展取得了一系列突破，如今，OpenAI的ChatGPT和DeepMind的DeepThink等AI工具已经进入主流应用。

AI数学表现令人印象深刻，但面临研究挑战

纽约大学神经科学家Gary Marcus称DeepMind与OpenAI的成绩“实在令人惊叹”，并赞扬它们解决数学问题的能力。他同时指出，这些AI系统的表现虽然优异，但是否能够突破现有的研究瓶颈，进行更为复杂的数学研究仍然是一个悬而未决的问题。

英国帝国理工学院的数学家Kevin Buzzard也认为，数学奥林匹克的成功不意味着AI就能胜任高端研究。“数学奥林匹克的金奖表现并不代表这些AI系统能够应对复杂的理论研究问题，”他说道。

弗吉尼亚大学的数学家Ken Ono同样持有相似看法。他认为，AI目前作为研究伙伴，能够快速访问科学文献、总结数据，提供应对复杂问题的策略，但这些测试和基准并不完全符合理论数学家的研究需求。

AI与数学研究的未来：合作与发展

尽管如此，DeepMind表示，未来将允许部分研究人员与DeepThink版本的AI系统进行合作，进一步探索AI在数学研究中的潜力。Luong表示：“很快，我们将看到AI与数学家们的深度合作，推动数学领域的进一步发展。”

这一突破不仅代表着人工智能在解决数学问题上的能力提升，也为AI在科学研究中的应用开辟了更广阔的空间。随着AI技术的不断进步，我们有理由相信，未来AI将在学术研究、科技创新等领域扮演更加重要的角色。

总结

DeepMind与OpenAI的突破不仅是数学奥林匹克的一次奇迹，也是人工智能在科研领域进步的一个重要里程碑。随着AI技术的不断发展，未来数学、物理等领域的研究将越来越依赖于AI的强大推理能力和数据处理能力。AI的迅速发展不仅为学术界带来了创新机遇，也为相关市场带来了广阔的前景，推动着全球科技格局的变革。