有时候想想,那些在亮光里的人,他们最初的路,是不是也和咱们一样,都是一步一个脚印踩出来的。只是后来,有些人走着走着,眼前的路就变了样,变得不是自己想走...
2025-07-27 0
国内的AI大模型竞赛,再次被按下了加速键!
AI圈的小伙伴们可能还记得,几天前Kimi-K2的开源还在被津津乐道。然而,开源的王座,热度还没持续几天,就迎来了新的挑战者。
7月22日凌晨,阿里巴巴通义千问团队突然发布了旗舰模型Qwen3的重磅更新,推出 Qwen3-235B-A22B-FP8 非思考模式(Non-thinking)的更新版本,命名为Qwen3-235B-A22B-Instruct-2507-FP8。
新版本模型在多项核心能力上实现了惊人飞跃,不仅全面超越了Kimi-K2等顶级开源模型,甚至领先Claude-Opus4-Non-thinking等顶级闭源模型。
根据官方发布的数据,新模型的通用能力获得了全方位强化,在多个权威测评中表现极其亮眼:
包括指令遵循、逻辑推理、文本理解、数学、科学、编程及工具使用等方面,在GQPA(知识)、AIME25(数学)、LiveCodeBench(编程)、Arena-Hard(人类偏好对齐)、BFCL(Agent能力)等众多测评中表现出色,超过Kimi-K2、DeepSeek-V3等顶级开源模型以及Claude-Opus4-Non-thinking等领先闭源模型。
值得一提的是,本次更新的Qwen3模型在Agent能力尤其亮眼:在BFCL(Agent能力)测评中表现卓越。这意味着模型在理解复杂指令、自主规划、调用工具以完成任务的能力上,达到了一个新的高度。“主打Agent”,将是未来AI应用的核心竞争力。
除了硬核的跑分,这次更新还带来了三大“体感”升级:
-在多语言的长尾知识覆盖方面,模型取得显著进步。
-在主观及开放性任务中,模型显著增强了对用户偏好的契合能力,能够提供更有用的回复,生成更高质量的文本。
-长文本提升到256K,上下文理解能力进一步增强。
这次最核心的变化,是技术路线的革新。
通义千问团队宣布,正式告别此前的“混合思维模式”,迈向全新的“分离训练”时代。他们将用于直接回答的Instruct模型和用于复杂思考的Thinking模型进行独立训练。
简单来说,就是让“快思考”和“慢思考”各司其职,从而在各自的领域都做到极致。
本次发布的 Qwen3-235B-A22B-Instruct-2507-FP8 ,就是“快思考”路线下的最新成果。它主打非思考模式(Non-thinking),追求的是在指令遵循、文本理解和知识问答等任务上,做到更快、更准、更强~
从Kimi-K2,到今天的Qwen3新版,国内的开源AI竞赛已经进入白热化阶段。每一次更新都伴随着性能的飞跃和王座的更迭。
更让人激动的是,通义千问团队在发布更新的同时,还留下了一个悬念:
“还有大招,马上就要来了!”
这不禁让人猜想,分离训练的另一端——专注于复杂推理的“Thinking”模型是否也已在路上?
目前,最新的Qwen3模型已在魔搭社区(ModelScope)和HuggingFace全面开源更新。如果你是AI开发者或爱好者,现在就可以去亲身体验这个“开源新王”的威力了
本文来自华尔街见闻,欢迎下载APP查看更多
相关文章
有时候想想,那些在亮光里的人,他们最初的路,是不是也和咱们一样,都是一步一个脚印踩出来的。只是后来,有些人走着走着,眼前的路就变了样,变得不是自己想走...
2025-07-27 0
本内容来源于@什么值得买APP,观点仅代表作者本人 |作者:维修小能手-雷恩大家好我是维修小能手雷恩。今天是来给之前乐清人民安装的充电桩处理线头。特来...
2025-07-27 0
据外媒报道,OpenAI预计将于今年8月正式发布新一代语言模型GPT-5。据悉,该消息由多位知情人士向《The Verge》与其他媒体确认。此外,Op...
2025-07-27 0
7月26日,在2025年世界人工智能大会上,中国政府提出了一项具有前瞻性和战略意义的倡议——成立世界人工智能合作组织,并初步考虑将总部设在上海。这一倡...
2025-07-27 0
雅鲁藏布江下游水电工程(雅下水电站)开工建设,中国将再创工程奇迹,但无需从军事战略过度解读。雅鲁藏布江下游水电站开工建设,总投资高达1.2万亿元,这是...
2025-07-27 0
当同行们还在用“闪电扩张”堆人头时,Gamma 创始人 Grant Lee 用 30 人团队就服务了 5000 万用户。这篇文章浓缩了 Grant 的...
2025-07-27 0
【环球网科技综合报道】7月22日消息,三星日前正式分享了 Galaxy Z Fold7 的开发要点——这款折叠手机在铰链、屏幕和影像系统等方面进行了显...
2025-07-27 0
全球科技竞争进入 “深水区”,核心技术自主可控成为国家竞争力的关键锚点。当 5G 标准制定权争夺白热化、6G 布局加速、AI 与实体经济深度融合成为趋...
2025-07-27 0
发表评论