OpenAI首席执行官Sam Altman转发了关于GPT-5模型的测试贴文,贴文称该模型在各领域均位居榜首:在文本、网页开发和视觉领域排名第一;在高...
2025-08-09 0
「满血版」斩获IMO 2025金牌,谷歌最强Gemini 2.5 Deep Think正式上线!
只需每月支付250美元,即可通过Gemini Ultra订阅计划使用。
Gemini 2.5 Deep Think主打「多智能体推理」,可生成多个智能体并发进行推理。
虽然这一方法会消耗更多计算资源,但能极大提升AI推理的精准性。
1. 多智能体系统首次公开:Gemini 2.5 Deep Think是谷歌首个对公众开放的多智能体模型。其核心机制是并行生成多个智能体思考路径,从中筛选最优答案,尽管耗能更大,但推理效果显著提升。
2. 数学奥赛金牌验证:谷歌曾使用Deep Think变体参加2025年国际数学奥林匹克(IMO),并获得金牌。
3. 发布版达到铜牌级别:发布版本速度更快,日常使用更加便捷,同时在内部评估中基于2025年IMO基准测试仍能达到铜牌水平的表现。
4. 学术版模型首次释放:谷歌也将当时用于IMO的版本开放给少数数学家和学者测试,该模型推理过程耗时数小时,目标是提升研究能力与反馈机制。
5. 性能全面领先:
· 在Humanity’s Last Exam(HLE)中,Gemini 2.5 Deep Think取得34.8%的高分,领先xAI的Grok 4(25.4%)和OpenAI的o3(20.3%)。
· 在代码挑战LiveCodeBench6上,Gemini也以87.6%超越Grok 4(79%)与o3(72%)。
6. 工具整合与响应增强:Gemini 2.5 Deep Think可自动配合代码执行和谷歌搜索等工具,谷歌表示其能够生成比传统AI模型「更长的回复」。
Gemini 2.5 Deep Think模型特点:
· 支持输入类型:文本(如问题、提示、待总结的文档)、图像、音频、视频
· 上下文窗口长度:最大可接受100万(1M)tokens长度的上下文。
· 输出类型与长度:输出文本形式内容、最大输出长度可达192Ktokens
此前,为了争夺「首个」拿下IMO金牌的模型,OpenAI「不讲武德」,在没有经过组委会同意的情况下「抢先发布」消息。
这次在GPT-5发布前夕,谷歌率先Gemini 2.5 Deep Think。
你觉得谷歌Gemini 2.5 Deep Think能截胡GPT-5吗?
相关文章
OpenAI首席执行官Sam Altman转发了关于GPT-5模型的测试贴文,贴文称该模型在各领域均位居榜首:在文本、网页开发和视觉领域排名第一;在高...
2025-08-09 0
南方财经8月8日电,科大智能(300222 8月8日在互动平台表示,公司智能机器人应用相关产品不涉及直接采购和应用稀土永磁材料。...
2025-08-09 0
斯迪克在互动平台表示,公司目前产品暂未在脑机接口电极、感知等方面进行应用,公司会持续关注行业前沿动态,结合自身业务规划拓展业务领域 。...
2025-08-09 1
天眼查显示,近日,中飞智能低空产业基地发展(深圳)有限公司成立,法定代表人为田青,注册资本5000万人民币,由中飞智能制造(深圳)有限公司全资持股。序...
2025-08-09 0
中信证券研报认为,机器人指数表现显著超越市场宽基指数,然而具身模型是本轮机器人浪潮的真正驱动力,其市场影响力仍然未得到充分反映。机器人使用的具身模型正...
2025-08-09 0
人民财讯8月8日电,企查查APP显示,近日,高校生物医药技术转移转化中心(广州)有限公司成立,注册资本5亿元,经营范围包含:人体基因诊断与治疗技术开发...
2025-08-09 0
人民财讯8月8日电,8月8日,2025世界机器人大会在北京开幕。会上,中国电科携最新款人形机器人、半人马机器人、四足巡检机器人和白虹轻量化助行外骨骼机...
2025-08-09 0
8月8日上午,第十八届国际地球科学奥林匹克竞赛2025年全球总决赛在济宁启动。来自全球31个国家和地区的210名师生齐聚一堂,将在为期10天的赛事中,...
2025-08-09 0
发表评论