中新网加德满都8月20日电 (记者 崔楠 值中国与尼泊尔建交70周年暨第八个中国医师节之际,第16批中国援尼医疗队、中国骨髓移植专家项目组与尼泊尔B....
2025-08-20 0
OpenAI在8月初发布了开放权重模型家族gpt-oss,这是公司自2019年GPT-2以来首次真正意义上的开源动作。
仅仅两周后,一位研究者就将这一模型“拆解重组”,推出了与官方版本迥异的变体。
康奈尔大学博士生、前Google Brain成员、现任Meta研究员的Jack Morris,公开了名为gpt-oss-20b-base的新版本。
他并没有让模型变得更聪明,而是剥离了OpenAI在训练中添加的推理与对齐能力。
结果是,一个更快、更自由、更无约束的“原始基座模型”重新出现。
地址:http://huggingface.co/jxm/gpt-oss-20b-base
要理解这一变化,必须先区分“推理优化模型”和“基座模型”。
OpenAI发布的gpt-oss属于前者,它经过额外的指令微调和对齐,使得模型在回答问题时更安全、更符合预期。
这种做法源自2024年推出的o1模型,强调链式思维,让AI在生成答案前进行多步推理与自我检查。它们在编程、数学和解释类任务上表现优异,但往往会规避敏感话题。
相比之下,基座模型是未经对齐的原始形态,它只负责预测下一个词,不具备礼貌、拒绝或安全过滤的机制。
Jack Morris的目标就是把gpt-oss-20B“逆转”回这种原始形态。
他在X平台写道:“我们基本上逆转了LLM训练中的对齐部分,现在它重新生成自然文本,不再进行链式推理,只是像最初一样预测下一个token。”
这种方式让模型重新具备更广阔的表达自由,但同时也带来更大的安全风险。
Morris并没有采用常见的“越狱提示词”,而是直接从模型结构入手。
在与OpenAI前联合创始人、现任Thinking Machines首席科学家John Schulman交流后,他确定了一个关键点:
如果大部分预训练知识仍然存在,那么只需要一个低秩的小优化,就能让模型回到基座分布。
他采用了LoRA(低秩适配器)技术,只在第7、15和23层的MLP模块做了改动,秩设为16。
这一调整涉及大约6000万参数,只占模型总量的0.3%。训练数据来自FineWeb数据集的2万篇文档,训练时尽量保持接近原始预训练格式。
训练过程耗时四天,硬件配置为8张NVIDIA H200 GPU,学习率2e-6,批大小16,最大序列长度8192。
完成后,他将LoRA权重合并回模型,形成一个可以独立运行的成品。Morris强调,他并没有恢复原始的权重参数,而是恢复了输出分布。
换言之,他让模型的输出概率模式更接近基座形态,即使内部的权重并不完全相同。
新模型gpt-oss-20b-base的行为与官方版本截然不同。它不再自动进行推理步骤,而是直接生成更自由的文本。
这意味着,它会输出OpenAI原版模型拒绝生成的指令,例如涉及武器制作、非法行为或粗口内容。
在测试中,它甚至能够逐字复现部分书籍片段,显示出记忆性内容依然可被触发。
不过,痕迹依然存在。如果在提示中使用“Human: … Assistant: …”的对话模板,它有时仍会表现出礼貌的助手风格。
为了获得最“原始”的输出,Morris建议使用模型的特殊起始符号,并避免任何聊天模板。
这也让研究界看到另一面:开放权重不仅能被复用,还能被快速改造。
更值得注意的是,Morris还计划将类似的逆转方法应用到Qwen等其他开源指令模型上。
这意味着,“去对齐化”的趋势可能继续扩散,成为研究者和开发者探索的又一条分支道路。
注:头图AI生成
作者长期关注 AI 产业与学术,欢迎对这些方向感兴趣的朋友添加微信 Q1yezi,共同交流行业动态与技术趋势!
GPU 训练特惠!
H100/H200 GPU算力按秒计费,平均节省开支30%以上!
点「赞」的人都变好看了哦!
相关文章
中新网加德满都8月20日电 (记者 崔楠 值中国与尼泊尔建交70周年暨第八个中国医师节之际,第16批中国援尼医疗队、中国骨髓移植专家项目组与尼泊尔B....
2025-08-20 0
现在人们打棋牌麻将谁不想赢?手机微乐麻将必赢神器但是手机棋牌麻将是这么好赢的吗?在手机上打棋牌麻将想赢,不仅需要运气,也需要技巧。掌握的棋牌麻将技巧就...
2025-08-20 0
就在上个月底,中国CS俱乐部Tyloo勇夺国际赛事冠军,为CNCS带来了阔别20年的国际冠军,也让鼠鼠我重燃起了对CS的热情。射击类游戏作为一个非常传...
2025-08-20 0
今日,罗永浩宣布明日将公布TBT项目。“TBT终于要上了!九年了,变的是赛道,不变的是特别想给这个赛道来点不一样的创新。重构你对泡面的想象,明天见!...
2025-08-20 0
来源:大众网 全球化工行业瞩目的年度盛会——2025(第二十二届)中国国际化工展览会(ICIF China 2025)即将于9月17日至19日在上海新...
2025-08-20 0
无论时代如何发展,科技的风如何吹,想要抓住行业红利都离不开行业风口、专业选择、技能储备三重红利的叠加。在专业设置上,八维2025年全面升级十五大专业方...
2025-08-20 0
您好:这款游戏可以开挂,确实是有挂的,很多玩家在这款游戏中打牌都会发现很多用户的牌特别好,总是好牌,而且好像能看到-人的牌一样。所以很多小伙伴就怀疑这...
2025-08-20 0
沈阳华德海泰电器有限公司——“实现从原材料到成品全生命周期碳中和”在今年德国汉诺威工业博览会上,辽宁沈阳华德海泰电器有限公司(以下简称“华德海泰”)自...
2025-08-20 0
发表评论