2025世界人工智能大会正在举行,特斯拉携带智能电动车、人形机器人及智能辅助驾驶技术、V4超充桩等最新成果出席这一AI盛会。在现场,特斯拉以视频形式展...
2025-07-26 0
2025 年的 AI 确实越来越好用,甚至可选的大模型也越来越多,不管是 web chat 还是 ide coding,现在都提供了大量丰富的可选模型,但是这同样也带来了「选择困难症」,特别是对于用户而言,面对有限的「免费次数」或者「排队时间」,选错模型等于浪费生命,所以本篇意在简单介绍下这些模型和变体的区别,帮助你简单了解它们的适用情况 。
之所以会想写一篇这样的 水文 ,也是刚好看到这下面这张图,目前在 AI 近亲变体领域,Open AI 可以说是越来越离谱 ,当你以为下一个版本是 GPT-5 时,Open AI 开启了全新的变体时代:
所以我们最聊的就是 OpenAI,首先有一点我们肯定知道,那就是版本越新肯定结果越好 ,但是回到 OpenAI 上,那么多近亲模型又该怎么区分?其实从目前 OpenAI 的主流模型上,我们可以先简单区分为两种:GPT 和 o ,是的,准确来说,o 模型不叫 GPT o,它叫 OpenAI o 模型:
虽然上面有一堆模型和变体,但是从 GPT 和 o 的角度去区分就简单很多,类似 DeepSeek 有 V 模型和 R 模型,OpenAI 有 GPT 模型和 o 模型, #技术分享而 o 模型擅长推理能力 ,这样是不是就简单好理解了?
然后就是 mini,简单理解 mini 就是小模型的意思,可以做到更快,开销更少,但是不适合复杂任务。
那么这么一捋是不是就清晰很多了,虽然 OpenAI 的模型很多,但是我们可以根据需求进行类目选择,而按照当前文档里最新选择:
这么看 OpenAI 的模型版本是不是也没那么离谱?那么接下来我们开始讲离谱的 。
首先就是 GPT-4o ,这里的 o 表示 omni,也就是他是全能版的 GPT-4 版本 ,因为 GPT-4o 支持处理 输出 文本、音频和图像等各种格式,比如前段时间 GPT-4o 不错的出图能力让它一度红遍 x。
事实上也是 GPT-4o 的命名让 OpenAI 的大模型家族变得“混乱”,毕竟萌新一看:o3、o4 mini、GPT-4o、GPT-4o mini 谁不迷糊。
那么问题来了,GPT 4.1 也不是 omni ,也就是它就是个“普通”的模型 ,所以如果你需要图像和音频等处理,你需要继续用 GPT-4o ,也就是,虽然 GPT-4.1 出来了,但是 GPT-4o 依然稳如老狗 ,并且 GPT 4.1 目前只在 API 接口提供,在 ChatGPT 还暂不可用:
不过,GPT-4.1 在代码领域的表现还是相当出色,比起 4o 有了不少提升,而且 比凉了的 GPT-4.5 还好 :
没错,本来还有个 GPT-4.5 的,也许有人已经用过,但是现在它凉了,被 4.1 替代,所以在 OpenAI 的版本里,4.1 > 4.5 。
那么简单总结一下:
| 模型 | 场景 | | ---
| GPT-4.1 | 目前 OpenAI 最强模型,它也可以理解图片,适合代码开发,但是它不是全能模型,并且暂时只在 API 提供 | | GPT-4o | 目前 OpenAI 最强的全能模型,除了代码开发和文本,还支持音频、图片等领域,图片输出目前还挺不错 | | o3 | 目前 OpenAI 最强推理模型,支持 deep research,适合复杂代码理解和数学领域,实时性较差,适合调研报告场景 | | o4-mini | 速度更快的推理模型,适合中度复杂场景 |
所以,在 OpenAI 上 mini 代表着小,nano 代表着更小,而如果有 Turbo 则是更强的意思;另外在 o 模型里,比如 o3-mini ,还有 high、med、low 的区分:
谷歌的 AI 领域产品早期混乱程度比 OpenAI 更甚,比如一路走来 Tensorflow、Vertex AI、Bard 、Gemini、Google AI Studio、Firebase Studio ···· ,虽然它们不属于一个领域,但是作为 「AI 标签」出现在大家视野中时,相信不少人还是会觉得困惑。
当然,现在我们只要关注 Gemini ,目前在 Gemini 的变体不像 OpenAI 那么夸张,按照目前最新版本,简单区分可以分为 Pro 和 Flash,简单说就是 Pro 是最智能的完整体,而 Flash 则是更快更高效的场景 :
但是 Gemini 又和 OpenAI 不一样,比如从 Gemini 2 开始,你可以认为它们都具备推理能力,只是推理能力的深度和复杂性不同 ,比如:
其实你在 Gemini 官网使用 Gemini 的时候就可以直观看到它们的区别:
不过这里有点特殊的是,Gemini 的 Deep Research ,它是一个完全独立的选项 ,选择 Deep Research 之后,首先 Gemini 会让你确定方案,等待你确定后,Gemini 会开启一个 深度的研究 :
而 Gemini 的 Deep Research ,也是我目前见到资料最丰富,探索深度最深的 AI ,可以看到在深度搜索时,Gemini 的 Researching 网站数量十分丰富,并且探索步骤也十分详尽,最终生成的答案也是我目前能看到最全面的结果,当然也是耗时最久,整个产品更偏向调研报告的输出:
当然,这还是普通用户的 Deep Research ,如果是 Gemini Advance ,Deep Research 会是满血 2.5 Pro 版本,效果会更好,可惜,目前免费的情况下,Gemini 一个月只有 10 份报告的额度,事实上 Gemini 官方的 Free 数量都不高,所以每次用最好先理清楚你想要的问题:
Anthropic 家的 Claude 相信程序员都不会陌生,基本上它是程序员在 Copilot 、Trae、Cursor 等场景下的首选,目前主流就 3.5 和 3.7 ,要体验好的基本都是选 3.7 ,并且 3.7 也支持 Thinking ,而对于 Claude 我是不建议直连,基本容易黑,免费场景我更推荐使用 Github 的 Copilot ,目前我是「开源途径」下订阅的免费 Copilot Pro ,不管是在 IDEA 插件还是 Github 网页的 Chat ,基本上 Claude 的每日资源都没遇到过限制:
对比 Cursor 的 Free 和 Trae 的排队,虽然 Copilot 在产品级别体验不如,但是好在量大管够,而且 Copilot 也支持 Copilot Edits 场景了:
另外一个口粮款就是 Grok ,Grok 整体也没什么变体,基本上就是 Gork3,使用 Grok3 最大的好处就是额度够多,在结果还不差的情况下,每日可用额度非常可观,特别是 DeepSearch 的每日额度很充沛,虽然不及 Gemini 的报告,但是好在口粮充足:
另外最近随着 IntelliJ IDEA 2025.1 的发布(Android Studio 对应 Narwhal | 2025.1.1 Canary 7),JB 家也提供了免费 AI 可以白嫖 ,并且自带 Junie Agent :AI Free 套餐提供无限制的代码完成和对本地 AI 模型的访问 ,以及基于积分的使用基于云的 AI 协助和编码代理 Junie,可以说也算一个口粮款 :
不过有个特殊的的地方,那就是 JetBrains 的 AI 在国内正版支持的模型是 Qwen ,并且 agent 也不支持国内使用:
如果是这个角度,还不如直接用阿里的「通义灵码」插件?
最后,下面是截止 2025 年 4 月 20 日在网上可以看到的不同纬度和条件下的各大 AI 模型对比,大家可以酌情参考:
相关文章
2025世界人工智能大会正在举行,特斯拉携带智能电动车、人形机器人及智能辅助驾驶技术、V4超充桩等最新成果出席这一AI盛会。在现场,特斯拉以视频形式展...
2025-07-26 0
湖北日报全媒记者刘宇 实习生邢煜晨7月23日下午,2025“工业母机+“百行万企产需对接活动”制造翘楚湖北专场活动上,武重集团、华中数控、华工激光等3...
2025-07-26 0
你以为天上飞的铁疙瘩越大越危险?错了!国家发改委最近天天把“低空经济安全”挂嘴边,专家一句话戳破真相:1000米以下的低空飞行,比万米高空难搞10倍!...
2025-07-26 0
胶州湾第二隧道迎来新进展:成功穿越“海底天堑”日前成功穿越我国在建工程最长海底断层破碎带,在超长跨海隧道建造领域取得重要技术突破青岛日报社/观海新闻7...
2025-07-26 0
日本首相石破茂垮台。他上任不久,政权即将终结。两个强硬派人物等待接替。日本的未来路线面临重大改变。接替石破茂的热门人选有两位。高市早苗和河野太郎是焦点...
2025-07-26 0
在阅读此文之前,辛苦您点击一下“关注”既方便您进行讨论和分享,又能给您带来不一样的参与感,感谢您的支持!编辑|L.Y前言一想到自己第一届任期卸任后差点...
2025-07-26 0
2025年7月26日,作为2025世界人工智能大会的重要专题活动之一,由世界人工智能大会组委会办公室指导,上海市经济和信息化委员会、上海市交通委员会、...
2025-07-26 0
全球首个生命科学领域的综合性大科学装置——国家蛋白质科学研究(上海)设施,开放运行十年来取得丰硕成果。7月26日,“国家蛋白质科学研究(上海)设施开放...
2025-07-26 0
发表评论