8月22日,粤港澳青少年在珠海留学文化馆内与机器人互动。 8月20日,湾区青少年“网络素养科创探秘营”研学行举行开营仪式。南都记者钟锐钧 摄 研学青少...
2025-08-25 0
DeepSeek团队在V3.1模型发布时,只说了一句话:“FP8是针对下一代国产芯片进行特定优化设计的参数精度”。
这句话看着简单,实则藏着大动作——他们已经不满足于再做一个和“AI大模型”同台竞技的产品了。现在市面上能做类似大模型的团队越来越多,拼参数、比性能早就没了突破性意义。
DeepSeek要干的,是从根上解决问题,彻底打破当前AI行业对英伟达的依赖,走一条釜底抽薪的路。要弄明白这件事的重要性,得先看清现在全球AI行业的真实处境。
自从人工智能成了全球科技行业的香饽饽,那些靠英伟达生态吃饭的公司,股票涨得离谱——将近二十倍,这还是分红之后的数字。
为啥能涨这么猛?核心原因就一个:全世界所有主流AI大模型,不管是美国的ChatGPT、马斯克的xAI,还是咱们国内的豆包、元宝、Kimi,全都是基于英伟达的指令集架构训练和推理的。换句话说,没有英伟达的芯片,这些大模型就像没油的汽车,根本跑不起来。
但对国内企业来说,这种依赖早变成了“卡脖子”的难题。美国一开始只是禁止英伟达把最顶配的芯片卖到中国,只留着自己用;后来管控越来越严,连中端型号也不让出口了。现在国内企业能买到的,只有H20这种“阉割版”——性能砍了一大截,还是专门给中国市场做的特供款,甚至有消息说这类芯片还带着后门,数据安全都没保障。
有人可能会说,性能不够,数量来凑?一块H20不行,就买一百块、一万块,拼起来不就能补上性能缺口了?对部分国内科技企业来说,只要多花钱能解决的问题,好像都不算问题。可他们为啥宁愿花大价钱买阉割版,也不愿意用国产AI芯片?不是不想用,是真的用不了——国产芯片性能和英伟达差得太远,根本撑不起大模型的训练和推理。
更关键的是,换芯片不是给汽车换轮胎那么简单。现在所有大模型都是基于英伟达的CUDA架构开发的,要是换成其他芯片,相当于要把整个优化适配工作推倒重来,就像开惯了手动挡突然换自动挡,还得重新回驾校考一遍驾照。
现在AI行业竞争多激烈?大模型天天比参数、拼功能,算力需求一天一个样,谁要是停下来适配国产芯片,进度肯定会慢下来,热度丢了,用户也会被其他产品抢走,最后很可能被市场遗忘。这种风险,没几家企业敢冒,所以大家只能继续忍气吞声,抱着英伟达的生态不放。
正因为这种困境,前段时间七月份,全网铺天盖地都是“DeepSeek已死”的文案,甚至有些文案可能还是用DeepSeek自己的模型写的。可DeepSeek真的没人用了吗?看它用的开源协议就知道答案了——DeepSeek在R1模型上采用的是MIT协议,这是目前全球最宽松、最友好的开源协议之一。
和那些“假开源”不同,MIT协议对使用者几乎没限制:代码随便拿过去用,自己改一改,就算宣称是自己开发的也没问题;甚至可以借着DeepSeek的名义宣传自己的产品,这些都不违反协议。程序员圈子里有个说法,MIT协议就像开发者放话:“我把东西放这了,你们随便搞,别来烦我,我只想安心写代码”。
这种宽松的开源模式,直接降低了搞AI的门槛。比如DeepSeek发布后没多久,印度突然宣布要搞自己的AI——不是他们技术突然突破了,而是靠着MIT协议,把DeepSeek的代码复制粘贴过去,稍微改改就能当成自己的AI基础,省时又省力。
对国内中小企业来说也是一样,不用从头搭建模型框架,拿DeepSeek的代码就能快速起步,这也是为啥看似“冷清”的DeepSeek,其实一直在默默渗透AI行业的底层。
当时很多人没看懂,觉得DeepSeek不拼参数、不抢热度,好像没了竞争力。现在回头看才明白,DeepSeek团队根本没把精力放在和其他大模型“打架”上,他们一直在做更长远的布局——从模型底层开始,为国产AI的未来铺路。
直到V3.1模型发布,大家才终于看清DeepSeek的真正动作——他们在这个模型里,特意用了为下一代国产AI芯片优化的FP8参数精度。这个选择,可不是随便改个参数那么简单,而是极有前瞻性的一步棋。
之前所有大模型的参数精度,都是按英伟达芯片的特性设计的,比如常用的FP16、FP32,都是为了适配英伟达的硬件架构。要是国产芯片出来,用这些精度格式,要么性能发挥不出来,要么得花大量时间做适配。而DeepSeek的FP8,是从模型底层开始,专门针对国产芯片的特性做优化——相当于提前给国产芯片留好了“无缝接口”。
等未来国产AI芯片真的量产,用了FP8优化的国产大模型,不用大改就能直接适配,马上就能发挥出“基础模型+底层算力”的最大性能。这和之前凑钱买英伟达阉割版的思路完全不一样,是从根上摆脱对英伟达的依赖:以前是“有什么样的芯片,做什么样的模型”,现在是“先做好适配国产芯片的模型,等芯片来了就能用”。
为啥DeepSeek敢走这条路?因为它的团队带头人梁文峰,本身就没把做AI当成纯赚钱的生意——赚钱有其他业务支撑,AI反而能放开手脚做长期布局。
以前没人敢走这条路,是怕投入大、见效慢,还可能被市场淘汰;但DeepSeek开了这个头之后,后面的企业就有了方向:只要模型和国产芯片能无缝衔接,就不用再怕英伟达卡脖子,也不用再忍受阉割版芯片的限制。
现在的AI行业,再在英伟达的基础上训练大模型、比参数,已经没了革命意义——再优秀的模型,也只是在别人的地基上盖房子。而DeepSeek做的,是自己打地基,为国产AI搭建“模型+芯片”的全自主链条。
他们用FP8优化证明,英伟达的芯片不是必需品,CUDA架构也不是不可替代。真正的突破,不是做出比别人更强的大模型,而是推动国产芯片爆发,实现从底层算力到上层应用的全链条国产替代。
这一步,看似慢,却是国产AI真正“站起来说话”的关键——只有打破垄断,掌握自己的核心技术,才能在全球AI竞争里有真正的话语权。
相关文章
8月22日,粤港澳青少年在珠海留学文化馆内与机器人互动。 8月20日,湾区青少年“网络素养科创探秘营”研学行举行开营仪式。南都记者钟锐钧 摄 研学青少...
2025-08-25 0
您好:这款游戏是可以开挂的,软件加微信【添加图中微信】确实是有挂的,很多玩家在这款游戏中打牌都会发现很多用户的牌特别好,总是好牌,而且好像能看到其他人...
2025-08-25 0
IT之家 8 月 25 日消息,联想来酷斗战者 BELLATOR 现已上架 2025 年款战 7000 锐龙版游戏本的英伟达 GeForce RTX...
2025-08-25 0
石头智能洗地机A30 Pro Ultra今天正式发布,售价2799元,国补到手价2379.15元。现在这款新品已经来到我们评测室,下面为大家带来图赏。...
2025-08-25 0
记者注意到,在社交平台上越来越多网友开始分享自己下班跑外卖的日常,其中有人是大厂员工、医务工作者等。27岁的策策是浙江杭州某互联网公司员工,他告诉记者...
2025-08-25 0
彭博社知名记者马克・古尔曼(Mark Gurman)在最新《Power On》通讯中,曝光了苹果折叠屏 iPhone 的一系列核心配置。这款代号为 V...
2025-08-25 0
全球晶圆代工企业围绕2nm制程的竞争愈演愈烈,据报道,台积电已将2nm制程晶圆价格定为每片约3万美元,并对所有客户实行统一价格。据半导体行业消息人士透...
2025-08-25 0
发表评论