DeepSeekV3.1——首个“中国芯”大模型诞生，AI芯模一体迎里程碑

游戏天地 2025年08月21日 20:16 1 admin

DeepSeek V3.1今天更新了！

具体来说，提升了这些方面：

代码能力：在 Aider 编码测试中达到了 71.6% 的通过率，跟 Anthropic 的 Claude Opus 4 等闭源顶级模型同处顶级梯队！
推理能力：多步推理任务的准确率从 32% 提升至 61%，提升了近一倍，还能一键切换 “思考模式” 深度推导，简单问题回答更快。
幻觉减少：通过强化事实一致性训练，“胡说八道”的情况比之前减少了 38%，回答更可靠。
长文本理解：128K 的上下文长度意味着它可以一次性处理整本书、长篇学术论文或大型代码库，并保持很好的上下文理解能力。

这次DeepSeek宣布涨价了，但跟国外巨头相比，DeepSeek仍是最便宜的顶级AI模型之一。这是因为DeepSeek 发挥中国人数学好算法强的优势，通过算法优化把训练成本压到500多万美元，而GPT-4等模型的训练成本高达1亿美元！

结合一直以来的开源战略，DeepSeek V3.1 在全球AI巨头面前的姿态非常清晰：在核心能力（如编程）上不输，但在价格和开放性上碾压对手。这不仅让普通用户和开发者有了一个免费、强大且自由度高的新选择，模型成本大降后，还将很大程度上催动AI 应用爆发。DeepSeek不仅是拉着竞争对手开源、降价的鲶鱼，更在为整个行业搭梯子！

然而，这都不是重点！（这段看不懂可以直接跳过！）DeepSeek在其官宣“正式发布DeepSeek-V3.1”的文章里面提到，DeepSeek-V3.1使用了UE8M0FP8Scale的参数精度。另外，V3.1对分词器及chat template进行了较大调整，与DeepSeek-V3存在明显差异。DeepSeek官微在置顶留言里说，UE8M0FP8是针对即将发布的下一代国产芯片设计。

啥意思呢？DeepSeek 这套新模型用的 UE8M0 FP8 精度，是专门给咱们下一代国产新芯片量身定做的。这款国产芯片出自哪家、啥时候出还是个谜，但可以确定的是——中国“芯模一体”的全自主生态向前迈出了一大步！被美国芯片卡住的脖子松了一大块！大家都知道，今年特朗普上台后，对英伟达往中国卖阉割版芯片百般刁难。中国也并不是没有后手，早就开始尝试用国产芯片训练大模型。像华为的盘古模型和百度的文心一言，很早就一直在使用华为的昇腾芯片做训练和推理。但这次DeepSeek的做法之所以被关注，是因为它把这种合作推向了一个新阶段——过去主要是让大模型“能跑”在国产芯片上，而DeepSeek这次是“专为”下一代国产芯片设计了模型，从最底层的参数精度就开始进行适配和优化！除了这次壮举，其实DeepSeek从诞生之初，就是奔着减少美国芯片依赖来的。虽然DeepSeek 目前主要还跑在英伟达A100 / H100 集群上，但它采用特殊的的“混合架构”，简单活小模型干、复杂活大模型来，这就有了少用高端 GPU 的可能，让国产 GPU 有机会上场。国产卡虽然在峰值性能上不如 H100，但跑小模型、推理型任务已经够用，就算美国卡脖子，靠这架构和国产算力也能接着搞 AI 。DeepSeek的创始人和成长基因都很特殊，其创始人梁文峰很早就凭借AI搞金融（公司名字叫幻方量化）财富自由了，投资DeepSeek等于自己投自己，主打一个不差钱。

这也是为什么DeepSeek不像OpenAI一样急着向C端用户收费赚钱，而是重点服务于企业，向国内外AI巨头开放API。你会发现，即使是现在，DeepSeek也是没聊几句就显示系统繁忙，也不像豆包、OpenAI一样能语音对话，只能费力打字。人家的目标客群根本就不是C端用户！更鲜为人知的是，今年年初，DeepSeek 凭借开源模型 R1 一举爆火，其核心团队成员很多都是刚毕业的学生，成员平均年龄仅 28 岁，超 75% 为 90 后，50% 以上是 95 后，许多人刚从北大、清华等顶尖高校毕业。就硬生生靠好奇心和热忱拼过了国外巨头！这呼应了DeepSeek 在X上的签名，“用好奇心解开通用人工智能的奥秘，用长远眼光回答根本问题。”

梁文峰，这个几乎改变国运的男人，到底想做什么？他对商业化不感兴趣，一心要打造中国最强的大模型。DeepSeek的目标是先建立技术壁垒和开发者生态，在全球算力博弈和产业竞争里站住脚。这跟美国AI巨头的策略截然相反。OpenAI等美国巨头更追求商业闭环和利润，主打闭源模型和高收费，目的是守住“算力 + 资本” 的霸权。中国在国家领导下，以 DeepSeek 为先锋，通过算法优化 + 开源生态实现 “技术平权”，把 AI 当成“新基础设施”，倒逼全球定价体系重构。

中国这种模式无疑更符合发展中国家需求，例如印度、东南亚等市场对低价 AI 的接受度远高于 OpenAI 的高价方案。这也是为啥最近OpenAI要给印度开小灶！