首页 游戏天地文章正文

DeepSeekV3.1——首个“中国芯”大模型诞生,AI芯模一体迎里程碑

游戏天地 2025年08月21日 20:16 1 admin

DeepSeek V3.1今天更新了!

DeepSeekV3.1——首个“中国芯”大模型诞生,AI芯模一体迎里程碑

具体来说,提升了这些方面:

  • 代码能力:在 Aider 编码测试中达到了 71.6% 的通过率,跟 Anthropic 的 Claude Opus 4 等闭源顶级模型同处顶级梯队!
  • 推理能力:多步推理任务的准确率从 32% 提升至 61%,提升了近一倍,还能一键切换 “思考模式” 深度推导,简单问题回答更快。
  • 幻觉减少:通过强化事实一致性训练,“胡说八道”的情况比之前减少了 38%,回答更可靠。
  • 长文本理解128K 的上下文长度意味着它可以一次性处理整本书、长篇学术论文或大型代码库,并保持很好的上下文理解能力。

这次DeepSeek宣布涨价了,但跟国外巨头相比,DeepSeek仍是最便宜的顶级AI模型之一。这是因为DeepSeek 发挥中国人数学好算法强的优势,通过算法优化把训练成本压到500多万美元,而GPT-4等模型的训练成本高达1亿美元!


结合一直以来的开源战略,DeepSeek V3.1 在全球AI巨头面前的姿态非常清晰:在核心能力(如编程)上不输,但在价格和开放性上碾压对手。这不仅让普通用户和开发者有了一个免费、强大且自由度高的新选择,模型成本大降后,还将很大程度上催动AI 应用爆发。DeepSeek不仅是拉着竞争对手开源、降价的鲶鱼,更在为整个行业搭梯子!

DeepSeekV3.1——首个“中国芯”大模型诞生,AI芯模一体迎里程碑

然而,这都不是重点!(这段看不懂可以直接跳过!)DeepSeek在其官宣“正式发布DeepSeek-V3.1”的文章里面提到,DeepSeek-V3.1使用了UE8M0FP8Scale的参数精度。另外,V3.1对分词器及chat template进行了较大调整,与DeepSeek-V3存在明显差异。DeepSeek官微在置顶留言里说,UE8M0FP8是针对即将发布的下一代国产芯片设计。


啥意思呢?DeepSeek 这套新模型用的 UE8M0 FP8 精度,是专门给咱们下一代国产新芯片量身定做的。这款国产芯片出自哪家、啥时候出还是个谜,但可以确定的是——中国“芯模一体”的全自主生态向前迈出了一大步!被美国芯片卡住的脖子松了一大块!大家都知道,今年特朗普上台后,对英伟达往中国卖阉割版芯片百般刁难。中国也并不是没有后手,早就开始尝试用国产芯片训练大模型。像华为的盘古模型和百度的文心一言,很早就一直在使用华为的昇腾芯片做训练和推理。但这次DeepSeek的做法之所以被关注,是因为它把这种合作推向了一个新阶段——过去主要是让大模型“能跑”在国产芯片上,而DeepSeek这次是“专为”下一代国产芯片设计了模型,从最底层的参数精度就开始进行适配和优化!除了这次壮举,其实DeepSeek从诞生之初,就是奔着减少美国芯片依赖来的。虽然DeepSeek 目前主要还跑在英伟达A100 / H100 集群上,但它采用特殊的的“混合架构”,简单活小模型干、复杂活大模型来,这就有了少用高端 GPU 的可能,让国产 GPU 有机会上场。国产卡虽然在峰值性能上不如 H100,但跑小模型、推理型任务已经够用,就算美国卡脖子,靠这架构和国产算力也能接着搞 AI 。DeepSeek的创始人和成长基因都很特殊,其创始人梁文峰很早就凭借AI搞金融(公司名字叫幻方量化)财富自由了,投资DeepSeek等于自己投自己,主打一个不差钱。


这也是为什么DeepSeek不像OpenAI一样急着向C端用户收费赚钱,而是重点服务于企业,向国内外AI巨头开放API。你会发现,即使是现在,DeepSeek也是没聊几句就显示系统繁忙,也不像豆包、OpenAI一样能语音对话,只能费力打字。人家的目标客群根本就不是C端用户!更鲜为人知的是,今年年初,DeepSeek 凭借开源模型 R1 一举爆火,其核心团队成员很多都是刚毕业的学生,成员平均年龄仅 28 岁,超 75% 为 90 后,50% 以上是 95 后,许多人刚从北大、清华等顶尖高校毕业。就硬生生靠好奇心和热忱拼过了国外巨头!这呼应了DeepSeek 在X上的签名,“用好奇心解开通用人工智能的奥秘,用长远眼光回答根本问题。”

DeepSeekV3.1——首个“中国芯”大模型诞生,AI芯模一体迎里程碑

梁文峰,这个几乎改变国运的男人,到底想做什么?他对商业化不感兴趣,一心要打造中国最强的大模型。DeepSeek的目标是先建立技术壁垒和开发者生态,在全球算力博弈和产业竞争里站住脚。这跟美国AI巨头的策略截然相反。OpenAI等美国巨头更追求商业闭环和利润,主打闭源模型和高收费,目的是守住“算力 + 资本” 的霸权。中国在国家领导下,以 DeepSeek 为先锋,通过算法优化 + 开源生态实现 “技术平权”,把 AI 当成“新基础设施”,倒逼全球定价体系重构。


中国这种模式无疑更符合发展中国家需求,例如印度、东南亚等市场对低价 AI 的接受度远高于 OpenAI 的高价方案。这也是为啥最近OpenAI要给印度开小灶!

DeepSeekV3.1——首个“中国芯”大模型诞生,AI芯模一体迎里程碑

AI竞争早就不是中美巨头的事了,而是两国科技战的巅峰赛场。而对其他国家来说,中美竞争正在将世界分裂为对立的人工智能阵营——你选美国大模型还是中国大模型?

在中东、东南亚等地,DeepSeek通过和当地资本合资(比如与阿联酋皇室资本合作)搞本地化布局,把技术、资本和本地数据绑在一起拓市场。

美国巨头见状也加紧动作,比如谷歌在东南亚推低价AI服务,Meta针对中东优化模型功能——中国靠开源低价和本地化扎根,美国靠资本优势和闭源壁垒抢地盘,AI阵营的全球较量正越演越烈。

DeepSeek-V3.1 的诞生,不仅是 “中国芯” 与大模型深度绑定的里程碑,更标志着中国在 AI 自主可控道路上迈出了决定性一步。

这不仅意味着一个完全由中国自己掌握的、从底层到应用的AI新时代正在加速到来,也给全世界其他国家提供了一个更自主、更便宜的新选择。

DeepSeek好样的!

发表评论

泰日号Copyright Your WebSite.Some Rights Reserved. 网站地图 备案号:川ICP备66666666号 Z-BlogPHP强力驱动