我们可能再次低估了DeepSeek：DeepSeek V3.1的FP8打破英伟达垄断

百科大全 2025年08月25日 08:29 1 admin

DeepSeek团队在V3.1模型发布时，只说了一句话：“FP8是针对下一代国产芯片进行特定优化设计的参数精度”。

我们可能再次低估了DeepSeek：DeepSeek V3.1的FP8打破英伟达垄断

这句话看着简单，实则藏着大动作——他们已经不满足于再做一个和“AI大模型”同台竞技的产品了。现在市面上能做类似大模型的团队越来越多，拼参数、比性能早就没了突破性意义。

DeepSeek要干的，是从根上解决问题，彻底打破当前AI行业对英伟达的依赖，走一条釜底抽薪的路。要弄明白这件事的重要性，得先看清现在全球AI行业的真实处境。

自从人工智能成了全球科技行业的香饽饽，那些靠英伟达生态吃饭的公司，股票涨得离谱——将近二十倍，这还是分红之后的数字。

为啥能涨这么猛？核心原因就一个：全世界所有主流AI大模型，不管是美国的ChatGPT、马斯克的xAI，还是咱们国内的豆包、元宝、Kimi，全都是基于英伟达的指令集架构训练和推理的。换句话说，没有英伟达的芯片，这些大模型就像没油的汽车，根本跑不起来。

但对国内企业来说，这种依赖早变成了“卡脖子”的难题。美国一开始只是禁止英伟达把最顶配的芯片卖到中国，只留着自己用；后来管控越来越严，连中端型号也不让出口了。现在国内企业能买到的，只有H20这种“阉割版”——性能砍了一大截，还是专门给中国市场做的特供款，甚至有消息说这类芯片还带着后门，数据安全都没保障。

有人可能会说，性能不够，数量来凑？一块H20不行，就买一百块、一万块，拼起来不就能补上性能缺口了？对部分国内科技企业来说，只要多花钱能解决的问题，好像都不算问题。可他们为啥宁愿花大价钱买阉割版，也不愿意用国产AI芯片？不是不想用，是真的用不了——国产芯片性能和英伟达差得太远，根本撑不起大模型的训练和推理。

更关键的是，换芯片不是给汽车换轮胎那么简单。现在所有大模型都是基于英伟达的CUDA架构开发的，要是换成其他芯片，相当于要把整个优化适配工作推倒重来，就像开惯了手动挡突然换自动挡，还得重新回驾校考一遍驾照。

现在AI行业竞争多激烈？大模型天天比参数、拼功能，算力需求一天一个样，谁要是停下来适配国产芯片，进度肯定会慢下来，热度丢了，用户也会被其他产品抢走，最后很可能被市场遗忘。这种风险，没几家企业敢冒，所以大家只能继续忍气吞声，抱着英伟达的生态不放。

正因为这种困境，前段时间七月份，全网铺天盖地都是“DeepSeek已死”的文案，甚至有些文案可能还是用DeepSeek自己的模型写的。可DeepSeek真的没人用了吗？看它用的开源协议就知道答案了——DeepSeek在R1模型上采用的是MIT协议，这是目前全球最宽松、最友好的开源协议之一。

和那些“假开源”不同，MIT协议对使用者几乎没限制：代码随便拿过去用，自己改一改，就算宣称是自己开发的也没问题；甚至可以借着DeepSeek的名义宣传自己的产品，这些都不违反协议。程序员圈子里有个说法，MIT协议就像开发者放话：“我把东西放这了，你们随便搞，别来烦我，我只想安心写代码”。

这种宽松的开源模式，直接降低了搞AI的门槛。比如DeepSeek发布后没多久，印度突然宣布要搞自己的AI——不是他们技术突然突破了，而是靠着MIT协议，把DeepSeek的代码复制粘贴过去，稍微改改就能当成自己的AI基础，省时又省力。

对国内中小企业来说也是一样，不用从头搭建模型框架，拿DeepSeek的代码就能快速起步，这也是为啥看似“冷清”的DeepSeek，其实一直在默默渗透AI行业的底层。

当时很多人没看懂，觉得DeepSeek不拼参数、不抢热度，好像没了竞争力。现在回头看才明白，DeepSeek团队根本没把精力放在和其他大模型“打架”上，他们一直在做更长远的布局——从模型底层开始，为国产AI的未来铺路。

直到V3.1模型发布，大家才终于看清DeepSeek的真正动作——他们在这个模型里，特意用了为下一代国产AI芯片优化的FP8参数精度。这个选择，可不是随便改个参数那么简单，而是极有前瞻性的一步棋。

之前所有大模型的参数精度，都是按英伟达芯片的特性设计的，比如常用的FP16、FP32，都是为了适配英伟达的硬件架构。要是国产芯片出来，用这些精度格式，要么性能发挥不出来，要么得花大量时间做适配。而DeepSeek的FP8，是从模型底层开始，专门针对国产芯片的特性做优化——相当于提前给国产芯片留好了“无缝接口”。

等未来国产AI芯片真的量产，用了FP8优化的国产大模型，不用大改就能直接适配，马上就能发挥出“基础模型+底层算力”的最大性能。这和之前凑钱买英伟达阉割版的思路完全不一样，是从根上摆脱对英伟达的依赖：以前是“有什么样的芯片，做什么样的模型”，现在是“先做好适配国产芯片的模型，等芯片来了就能用”。

为啥DeepSeek敢走这条路？因为它的团队带头人梁文峰，本身就没把做AI当成纯赚钱的生意——赚钱有其他业务支撑，AI反而能放开手脚做长期布局。

以前没人敢走这条路，是怕投入大、见效慢，还可能被市场淘汰；但DeepSeek开了这个头之后，后面的企业就有了方向：只要模型和国产芯片能无缝衔接，就不用再怕英伟达卡脖子，也不用再忍受阉割版芯片的限制。