如今AMD CPU的市场份额不断提升,其中一个重要的原因就是AMD的主板经久耐用,相比较英特尔一代主板用两代或者三代处理器,AMD的主板经常可以使用3...
2025-08-18 0
请关注瓜田地里,第一时间收获最大的瓜
OpenAI 六年首开源!双模型碾压 o4-mini,你的 MacBook 也能跑
2025年8月6日凌晨,OpenAI突然扔出两颗核弹:gpt-oss-120b与gpt-oss-20b两款开放权重大模型。这是自2019年GPT-2后,OpenAI时隔六年首次开源,连山姆·奥尔特曼都亲自站台:“这是全球最家开放模型,可在你电脑甚至手机上运行!”
1. MoE架构封神,激活参数仅4.4%
• 120b总参数1170亿,但每个token仅激活5.1亿参数(占比4.4%),20b激活参数36亿,推理效率提升3倍
• 采用MXFP4原生量化技术,120b模型压缩至60.8GB,单张H100 GPU即可部署;20b仅需16GB内存,MacBook Pro流畅运行
2. 长上下文+工具链双杀
• 支持128K上下文(约300页小说),通过YaRN技术实现超长记忆
• 原生支持函数调用、CoT思维链、结构化输出,可构建复杂智能体工作流
OpenAI 的 gpt-oss-120b 在纸面跑分上堪称“屠榜神器”:Codeforces 编程竞赛得分 2622(仅落后闭源标杆 o4-mini 1.7%),AIME 数学竞赛 96.6% 准确率甚至小幅反超对手,医疗健康对话测试(HealthBench)57.6% 的得分更是碾压同级闭源模型。官方数据俨然一副“开源之王”的姿态,但实测画风却急转直下——
代码实战惨遭“打脸”:
•基础题翻车:数“strawberrrry”中的字母“r”,gpt-oss-120b 竟错误输出“6个”(实际为5个),而国产 GLM-4.5-Air 轻松答对。
•高难度编程溃败:要求生成交互式“六边形弹球”物理引擎,gpt-oss-120b 耗时漫长且生成代码运行后一片空白;同一任务下 GLM-4.5-Air 仅用10秒完成,重力、碰撞效果流畅无漏动。
•游戏开发生涩:在“森林冰火人”双人游戏开发任务中,gpt-oss-120b 的界面简陋到“分不清出口”,而 GLM-4.5-Air 不仅功能完整,还复刻了经典像素风美术风格。
推理能力“冰火两重天”:
•物理知识亮眼:解释“月球上拧开瓶盖后水的状态”时,gpt-oss-120b 逻辑严谨,甚至主动绘制压力对比表格辅助说明。
•长链逻辑崩盘:面对“七个小矮人”职业/住址/交通工具的19项条件推理题,gpt-oss-120b 消耗 6144 tokens 仍答错“谁戴黑帽”,而 o4-mini 虽简洁却同样翻车——暴露了开源闭源模型共同的思维链漏动。
• Altman罕见认错:2025年初公开承认“OpenAI在开源路上站错队”,被DeepSeek、Qwen等中国模型逼至墙角
• Apache 2.0许可的阳谋:允许商用闭源二次开发,直击Llama商业许可痛点,争夺开发者生态
• 数据隐私牌:本地运行不联网,金融、医疗、政府机构可私有部署,切中欧美合规需求
• 预训练数据阉割:过滤化学、生物、核能等敏感领域数据
• 红队模拟攻击:对模型恶意微调后,生物学风险仍低于高能力阈值
• 全球众包安检:启动50万美元奖金池,鼓励开发者提交安全漏洞
• 微软:将GPU优化版植入Windows,通过VS Code工具链吸引开发者
• 亚马逊:破天荒在Bedrock平台接入OpenAI模型,结束六年AWS零合作历史
• 终端革命:20b模型可运行于骁龙8 Gen4手机,AI真·装进口袋
OpenAI此番开源,看似拥抱开放,实则以攻为守——用技术优势收割开源生态,同时为GPT-5商业化铺路。不过当120b模型在RTX 4090显卡跑出23 tokens/秒时,那个曾被诟病“精英主义”的OpenAI,终于把AI火种撒向人间。
只是别忘了:训练数据始终未开源,就像给了你发动机图纸,却藏起了燃油配方。
欢迎点赞、关注,一起当个生活有趣的吃瓜群众!
互动时间
你对此事情怎么看?
( 评论区等你讨论!)
相关文章
如今AMD CPU的市场份额不断提升,其中一个重要的原因就是AMD的主板经久耐用,相比较英特尔一代主板用两代或者三代处理器,AMD的主板经常可以使用3...
2025-08-18 0
来源:市场资讯(来源:中关村智慧城市信息化产业联盟)低空经济作为全球前瞻性布局的产业,拥有广阔的万亿级市场空间和远大的发展前景,已成为推动经济社会创新...
2025-08-18 0
IT之家 8 月 18 日消息,上周有报道称,苹果下一代 Vision Pro 头显将搭载 M5 芯片而非 M4 芯片。然而,这并非板上钉钉。消息人士...
2025-08-18 0
美国偷偷在 AI 芯片里装追踪器,欧盟跟着对中企下黑手,加拿大和日本拿着中国利益给美国当投名状。结果呢?中国两天内连续反制四国,用实际行动告诉全世界:...
2025-08-18 0
在今年暑期的外卖大战中,部分商家借助人工智能技术合成虚假门店图片,将藏身角落的“幽灵外卖”包装成生意火爆的实体店铺,致使消费者频频上当。面对AI技...
2025-08-18 0
近日,记者实测芒果TV、优酷、爱奇艺、腾讯视频、哔哩哔哩五款APP发现,即便开通不同级别的会员,所获得的“广告特权”也多仅限于去除“前贴片广告”,但暂...
2025-08-18 0
8月15日,第三个全国生态日,美团青山计划发布八周年进展。截至2025年7月底,超过260万商家拥有“商家青山档案”,累计有超过5.2亿美团外卖用户使...
2025-08-18 0
近期,快手在平台内上线独立“外卖”入口,采用“美团供应链+快手流量”的轻资产合作模式,标志着快手在本地生活赛道的战略布局迈入新阶段。随着更多平台扎堆入...
2025-08-18 0
发表评论