首页 百科大全文章正文

OpenAI 六年首开源!双模型碾压 o4-mini,你的 MacBook 也能跑

百科大全 2025年08月10日 20:42 1 admin

请关注瓜田地里,第一时间收获最大的瓜


OpenAI 六年首开源!双模型碾压 o4-mini,你的 MacBook 也能跑

OpenAI 六年首开源!双模型碾压 o4-mini,你的 MacBook 也能跑

OpenAI开源大爆炸:GPT-OSS双模型全球首发,AI平民化时代真的来了?

2025年8月6日凌晨,OpenAI突然扔出两颗核弹:gpt-oss-120b与gpt-oss-20b两款开放权重大模型。这是自2019年GPT-2后,OpenAI时隔六年首次开源,连山姆·奥尔特曼都亲自站台:“这是全球最家开放模型,可在你电脑甚至手机上运行!”

一、技术解析:小而精的暴力美学

1. MoE架构封神,激活参数仅4.4%

• 120b总参数1170亿,但每个token仅激活5.1亿参数(占比4.4%),20b激活参数36亿,推理效率提升3倍

• 采用MXFP4原生量化技术,120b模型压缩至60.8GB,单张H100 GPU即可部署;20b仅需16GB内存,MacBook Pro流畅运行

2. 长上下文+工具链双杀

• 支持128K上下文(约300页小说),通过YaRN技术实现超长记忆

• 原生支持函数调用、CoT思维链、结构化输出,可构建复杂智能体工作流

二、性能实测:开源模型的“弑神时刻”

OpenAI 的 gpt-oss-120b 在纸面跑分上堪称“屠榜神器”:Codeforces 编程竞赛得分 2622(仅落后闭源标杆 o4-mini 1.7%),AIME 数学竞赛 96.6% 准确率甚至小幅反超对手,医疗健康对话测试(HealthBench)57.6% 的得分更是碾压同级闭源模型。官方数据俨然一副“开源之王”的姿态,但实测画风却急转直下——

代码实战惨遭“打脸”:

•基础题翻车:数“strawberrrry”中的字母“r”,gpt-oss-120b 竟错误输出“6个”(实际为5个),而国产 GLM-4.5-Air 轻松答对。

•高难度编程溃败:要求生成交互式“六边形弹球”物理引擎,gpt-oss-120b 耗时漫长且生成代码运行后一片空白;同一任务下 GLM-4.5-Air 仅用10秒完成,重力、碰撞效果流畅无漏动。

•游戏开发生涩:在“森林冰火人”双人游戏开发任务中,gpt-oss-120b 的界面简陋到“分不清出口”,而 GLM-4.5-Air 不仅功能完整,还复刻了经典像素风美术风格。

推理能力“冰火两重天”:

•物理知识亮眼:解释“月球上拧开瓶盖后水的状态”时,gpt-oss-120b 逻辑严谨,甚至主动绘制压力对比表格辅助说明。

•长链逻辑崩盘:面对“七个小矮人”职业/住址/交通工具的19项条件推理题,gpt-oss-120b 消耗 6144 tokens 仍答错“谁戴黑帽”,而 o4-mini 虽简洁却同样翻车——暴露了开源闭源模型共同的思维链漏动。

三、开放背后的暗战:中国开源逼宫成功?

• Altman罕见认错:2025年初公开承认“OpenAI在开源路上站错队”,被DeepSeek、Qwen等中国模型逼至墙角

• Apache 2.0许可的阳谋:允许商用闭源二次开发,直击Llama商业许可痛点,争夺开发者生态

• 数据隐私牌:本地运行不联网,金融、医疗、政府机构可私有部署,切中欧美合规需求

四、安全攻防:50万美金悬赏“黑客”

• 预训练数据阉割:过滤化学、生物、核能等敏感领域数据

• 红队模拟攻击:对模型恶意微调后,生物学风险仍低于高能力阈值

• 全球众包安检:启动50万美元奖金池,鼓励开发者提交安全漏洞

五、生态布局:微软亚马逊下场抢滩

• 微软:将GPU优化版植入Windows,通过VS Code工具链吸引开发者

• 亚马逊:破天荒在Bedrock平台接入OpenAI模型,结束六年AWS零合作历史

• 终端革命:20b模型可运行于骁龙8 Gen4手机,AI真·装进口袋

笔者感言:开源盛宴还是战略烟雾弹?

OpenAI此番开源,看似拥抱开放,实则以攻为守——用技术优势收割开源生态,同时为GPT-5商业化铺路。不过当120b模型在RTX 4090显卡跑出23 tokens/秒时,那个曾被诟病“精英主义”的OpenAI,终于把AI火种撒向人间。

只是别忘了:训练数据始终未开源,就像给了你发动机图纸,却藏起了燃油配方。


欢迎点赞、关注,一起当个生活有趣的吃瓜群众!

互动时间

你对此事情怎么看?


评论区等你讨论!

发表评论

泰日号Copyright Your WebSite.Some Rights Reserved. 网站地图 备案号:川ICP备66666666号 Z-BlogPHP强力驱动