证券日报网讯 先导智能8月18日在互动平台回答投资者提问时表示,公司将持续深耕平台化战略,在深化AI技术现有应用的基础上,积极探索其在更多智能制造场景...
2025-08-18 0
西风 发自 凹非寺
量子位 | 公众号 QbitAI
刚刚,OpenAI官宣:IOI金牌收入囊中!
其推理模型在今年IOI线上竞赛中成绩刷新纪录:
总分533.29,在全球330名人类选手中总排名位列第六;而在所有AI参赛者中,稳居第一。
PS:AI没比过的五个人里,有三个都是咱中国人,分别是刘恒熙(宁波市镇海中学)、范斯喆(浙江省诸暨市海亮高级中学)、陈昕阳(杭州第二中学)。
有意思的是,OpenAI表示,这次并未为IOI训练新的参赛模型,而是集成了多个通用推理模型参赛。
并且这个夺金系统和前不久OpenAI自称在IMO中夺金的,还是同一个。
从成绩上来说,此AI推理系统相比去年模型在IOI上的表现进步了不止一点半点。
IOI 2024 OpenAI还专门在o1基础上进行针对性训练,最终得到的o1-ioi,在严格的比赛规则下仅拿到213分。
今年靠通用模型直接夺金,排名大跃升,网友直呼震撼。
不过,前段时间OpenAI自称模型拿下IMO金牌一事引发不少争议,这次面对IOI的成绩,网友们明显谨慎了许多:
到底是真的很了不起的成就,还是又一个营销噱头……
与此同时,还有不少网友喊话“还我4o”。
更有意思的是,马斯克突然发布了IOI Benchmark排名,结果显示Grok 4在编码方面超越GPT-5获得第一(doge)。
来看这次OpenAI推理系统夺金细节。
IOI(国际信息学奥林匹克竞赛)作为是全球中学生计算机科学领域的最高级别赛事,有着严苛且标准化的赛制:
参赛学生需历经2天赛程,每天在5小时内独立解决3道高难度算法题,全程断网且无法借助外部资料,最终提交C++代码方案,由隐藏测试用例自动评分。
IOI 2025总共有来自84个国家的330名参赛者参赛。满分600分,金牌分数线是438.30分,最终只有28名参赛者获得金牌。
OpenAI表示他们正式参加了IOI的线上AI赛道,规则和人类参赛者一样,有5小时的时间限制和50次的提交次数限制。
并且AI系统在竞赛过程中全程未使用互联网或检索增强生成(RAG)技术,仅能使用基础的终端工具。
具体来说,他们整合了几个强大的推理模型,生成候选程序,运行这些程序,然后提交最优解。唯一的辅助工作是:挑选要提交的尝试内容,并与竞赛API交互。
在IOI线上AI赛道中,通过API获取题目并提交解答,不会接受竞赛组织者的直接监督。
OpenAI最新AI推理系统的表现超越98%的参赛者,不论是成绩还是方法上都和去年形成鲜明对比。
在IOI 2024中,OpenAI使用了o1-ioi模型,这是一个在o1基础上针对编程任务进行强化学习微调的专用模型。
o1-ioi严重依赖一套复杂且由人工设计的test-time推理策略(类似AlphaCode的人工设计的test-time推理策略),包括:
尽管投入了大量工程技巧,o1-ioi在IOI 2024中仅获得213分,排名第49百分位,与铜牌失之交臂。
谢赛宁团队前段时间推出了一个包含来自IOI、Codeforces和ICPC的竞赛级编程问题的实时基准测试——LiveCodeBench Pro。
GPT-5最新测试成绩出炉:
GPT-5 Thinking在2025年第一季度的测试组中完成了突破,是唯一一个解出难题分组的模型,而且这还不是更高级的“Thinking Pro”版本。
平均响应长度方面,GPT-5超过10万token,是o3的3倍。
参考链接:
[1]https://x.com/OpenAI/status/1954969035713687975
[2]https://x.com/rohanpaul_ai/status/1954992741101998099
[3]https://x.com/wenhaocha1/status/1954751124050989213
[4]https://x.com/elonmusk/status/1955047197487272362
— 完 —
量子位 QbitAI · 头条号签约
关注我们,第一时间获知前沿科技动态
相关文章
证券日报网讯 先导智能8月18日在互动平台回答投资者提问时表示,公司将持续深耕平台化战略,在深化AI技术现有应用的基础上,积极探索其在更多智能制造场景...
2025-08-18 0
中国科学院深空探测实验室宣布,天都一号卫星成功完成人类首次地月空间白昼卫星激光测距实验,在强烈太阳背景噪声干扰下获得精确测距数据。这一技术突破打破了激...
2025-08-18 0
Anthropic公司近日宣布一项引发广泛关注的技术更新:该公司的Claude Opus 4和4.1模型现在具备了主动终止令其感到"痛苦"或不适的对话...
2025-08-18 0
2025年8月15日,京东MALL、京东电器城市旗舰店以长江的碧水蓝天为幕,正式发布 “家庭微气候 唤醒好房子”家气候一站定制战略,以京东自营模式一站...
2025-08-18 0
近日,“俄罗斯外籍院士、苏辙后人”苏文的身份持续遭到质疑。8月17日,澎湃新闻从平顶山市郏县县委宣传部获悉,该县正在走程序注销郏县东坡书院。此外,原计...
2025-08-18 0
潮新闻客户端 记者 张云山8月18日,国际研究机构IDC发布《中国AI公有云服务市场份额,2024》,其中阿里云以24.6%的市场占比稳居全国第一,并...
2025-08-18 0
8月12日,腾讯音乐发布了截至2025年6月30日止的第二季度未经审计财务业绩报告。财报显示,腾讯音乐第二季度整体业绩坚实增长,总收入同比增长17.9...
2025-08-18 0
特普会会谈结束一天后在酒店发现美国国务院标识的机密文件,如此高规格的接待居然出现了文件泄露问题?果然,这次美俄峰会连午餐都没一起吃,其实就说明这场会谈...
2025-08-18 0
发表评论