...
2025-08-09 0
GPT-5 虽然不是 AGI 水平,但比起 GPT-4-20240314 还是进步巨大的吧(狗头)。
说正经的,大家之所以会觉得「GPT-4 到 5」没有当初「GPT-3 到 4」那种惊艳感,我觉得最主要的原因就是预期管理。当然,这怪不得别人,毕竟是 OpenAI 自己营销炒作在前,享受了前期营销的好处,就要承受不及预期的骂名。
核心观点:GPT-5 本身是优秀的,也确实是现在的 SOTA,但确实没有达到预期。
至于 GPT-5 vs GPT-4 算不算划代,具体来说:
GPT-4 在 2023 年 3 月的时间节点上,确实展现出了划时代的进步。但比较的对象是 GPT-3.5。
但要注意,大家现在比较 GPT-5 和 GPT-4 的时候,比的可不是 20240314 版的 GPT-4,那个版本的 GPT-4 做不对数学数不清 R。
在这两年多的时间里,GPT 经历了多次的小步迭代,就不说挂日期后缀的小版本,单说 GPT-4o、o1、o3、o4-mini、GPT-4.1、GPT-4.5。
所以大家现在对 ChatGPT 的认知已经是 o3 + GPT-4.5,那说实话,GPT-5 只是做了融合和增量更新,能力上限的提升幅度不大。
GPT-5 内置了模型选择的路由:
和前代模型的对应关系可以看作:
所以夸的人说 GPT-5 降低了用户挑选模型的心智,这也是没啥好吹的了…那我还说 GPT-4 和 o3 分开设置能让用户根据需求精确选择呢。
不过说到底,如果拿 GPT-5 和初代 GPT-4 相比,多了推理能力(Q* -> Strawberry -> o1 -> 能力融合进 GPT-5),多了多模态能力。
这是当前主流模型的「Elo 分数 - 价格」分布图:
可以看到,GPT-5 相较于 Gemini 几乎是在同等价格水平的前提下,提高了分数,向上平移了前沿模型的「帕累托曲线」。
GPT-5 能在所有细分领域刷分刷到第一,也证明肯定是有点东西的。
问题在于,GPT-3.5 到 GPT-4 时,市场没有竞品,自己打自己,甚至有种运动员自己是裁判员的感觉,整个市场都是由 OpenAI 来调教的,OpenAI 说要做 Chat,大家就都做 Chat,OpenAI 说要 RLFH,大家就都 RLFH。
现在用户选择多了,Gemini、Claude、Qwen、DeepSeek 都有一批自己的粉丝,即便 GPT-5 刷到了 SOTA,在优势不那么充分的情况下,并不足以让大家切换主力模型。
GPT-5 发布前,OpenAI 给大家营销出来的幻觉是「feel the AGI!」各路真假掺半的消息,Sam Altman 又是震惊又是吓得坐在椅子上,发出来以后大家不免觉得「就这?」
但现在,大众对模型已经审美疲劳,甚至对模型的炒作都已经极度厌倦,SOTA 模型的能力已经足以满足大多数人的需求。
所以我前几天说过这样的话:
包括我在内的很多人对 OpenAI 有过多不切实际的期待,内心里都会希望 OpenAI 真的掌握了天顶星科技,期待他们的 GPT-5 能直接拉爆所有 Benchmark,直接把人类带进 AGI 的硅基智能社会。 一切对模型的主观评价都是从个人预期出发的。 所以 OpenAI 发布的模型,你要说好不好,自然是好的;但你要说具体有多好,可能跟每个人的心理预期都会有出入。
但仔细想想,这也只是少数「硬核用户」以及自媒体渲染下的苛求。Sam Altman 有句话说的是对的,「在这个世界上,绝大多数人连 GPT-4o 级的模型都还没有体验过。」
GPT-5 有没有新范式,GPT-5 有没有划时代,都不会影响 ChatGPT 的用户继续飞速增长,继续改变很多人的生活。
话说回来,我之前还表达过:
GPT-5 如果真的不及预期,不如不发,藏着大家还有神秘感,发出来可就真是「关底 Boss 露血条了」。
所以我们可以想这么一件事:OpenAI 为什么要在 8 月 8 日发这么一个版本的 GPT-5?为什么发布会上会出现那么低级错误?OpenAI 自己不知道不及预期吗?
我觉得只有一个理由:不能再等了。我们甚至可以尝试还原一下过程:
OpenAI 出来混,很大程度上靠的就是 hype 炒作,靠的是维持话题热度,靠的就是先发优势带来的名声和用户增长。
但 OpenAI 今年的日子挺难的,年初的热度被 DeepSeek 抢完了,然后硬实力又被 Gemini 2.5 Pro 反超了,这也是 GPT 第一次丢掉闭源 SOTA 的地位。再加上 Meta 挖人,团队不稳,工作进度肯定是受影响的。
OpenAI 手里还有货吗?这次我感觉可能掏的差不多了,GPT-4 之后真正的范式只有 o 系列的推理模型,还是 Ilya 的遗产。
面对 Gemini 2.5 Pro 这样的六边形战士,OpenAI 的处境很尴尬。所以团队不停地训,不停地改,跟时间赛跑。终于训出一版 Benchmark 能压过 Gemini 和 Claude 的模型,赶紧发,必须发,一刻不停地发。
不能再拖了,再拖个几天,Gemini 3 发出来,GPT-5 就永远拿不出来了。就算这样发了会露出真实水平,但不发就没法接着忽悠融资,所以只能没活硬整搏一搏了。
当然,以上纯属臆测。说不定 OpenAI 手里还有能反过来狙 Gemini 3 的神秘技术……你信吗?
我觉得更有可能的是,Gemini 团队看到 GPT-5 的表现之后,觉得 Gemini 3 还能再打磨打磨。
至于现在很多人说的增长率、数据墙,也不过是阶段性的规律总结罢了。倒也不必因为 GPT-5 而悲观,也许下一个新范式很快会出现呢。
不管怎么说,GPT-5 发布后,现有的这批模型就要下架了。我还是挺怀念的。毕竟 GPT-4o 和 o1 给我带来过许多帮助。
说了这么多,你问我怎么选?我选择接着用 Claude Coder 和 Gemini 2.5 Pro,顺便再催更一下 Gemini 3 和 Qwen 3.5。(逃)
相关文章
8月8日消息,鸿蒙AI超级智能体即将上线。2025年是智能体产业化元年,国内各类智能体层出不穷。在所有智能体中,华为鸿蒙智能体最受市场关注。今年6月,...
2025-08-09 0
格隆汇8月8日丨映翰通(688080.SH 在投资者互动平台表示,公司的工业路由器、边缘计算网关等产品可以协助工业机器人设备制造商打造一整套工业机器人...
2025-08-09 0
8月8日,2025世界人形机器人运动会倒计时1周启动。当天,赛事阵容揭晓,赛程明确:本届运动会共26个赛项,487场比赛;全球280支队伍参赛,500...
2025-08-09 0
就在前两天,2025年8月4日晚上,中国从海南文昌那个商业航天发射场搞了一次长征十二号运载火箭的发射,任务是把卫星互联网低轨07组卫星送上天去。这火箭...
2025-08-09 0
8月7日的盒马十周年开放日上,盒马CEO严筱磊首次公开亮相,公布最新数据的同时回应市场关心的热点问题。她提到,2025财年,盒马不仅实现了全年盈利,还...
2025-08-09 0
8月8日,有消息称快手新增独立外卖入口,被指将在外卖业务上做进一步动作。记者检索相关页面发现,该外卖入口位于团购的二级页面,主要提供美团商家的兑换券业...
2025-08-09 0
东芬兰大学日前发布新闻公报说,该校科研人员参与的国际团队发现,一项“坐下-站起”的简单体能测试,能有效预测中老年人未来的死亡风险。这项研究基于20世纪...
2025-08-09 0
发表评论