首页 游戏天地文章正文

CPU是“3”,GPU是“3+2”,英伟达是3+2=1

游戏天地 2025年07月27日 17:26 1 admin

前言

英伟达成为地球最高价值的公司,凭借的是3+2=“1”,这个“1”即市值第一。

是多么巨大的力量才能把一家公司推上4万亿美元的体量?AMD曾经大幅度落后于英特尔,只用了七年就打败了英特尔酷睿14代,它能再创奇迹,用七年打败英伟达吗?

让我们从一个简单问题开始探索答案——电脑CPU为啥不安装驱动程序?

CPU是“3”,GPU是“3+2”,英伟达是3+2=1

正文

为啥我们使用电脑,要安装主板、显卡的驱动,怎么没看到安装CPU驱动呢?

CPU的基础功能(取指、解码、执行、访问内存/总线)是硬件电路固有的能力,CPU加电后先在BIOS的指挥下工作,BIOS进行硬件自检后加载操作系统,然后把控制权交给操作系统。BIOS 和 OS 内核中确实包含与 CPU 架构(如x86)紧密关联的代码,这些代码直接操作 CPU 的寄存器、使用CPU的指令、配置CPU的功能,但这些代码不能算作我们传统认为的驱动程序。

CPU的取指、解码、执行、访问内存/总线这些最底层的操作,是由CPU内部的物理电路设计在通电后自动实现的,相当于它的“本能”,不需要任何外部软件(驱动)来“教会”它如何做。它天生就知道怎么执行指令、读写内存。

CPU是“3”,GPU是“3+2”,英伟达是3+2=1

CPU有三条护城河(以X86为例)

第一条河:完整指令集授权

对外部企业来说,CPU的护城河非常宽阔,AMD能打败英特尔的关键有两点:第一是有完整的X86授权,这相当于拿到了比武的入场券。第二是架构创新,相当于练成了易筋经。两条缺一不可。没有完整的X86授权,即便练成绝世武功,你想上台比武,连擂台的大门都进不了。

拥有完整X86指令集授权仅有英特尔和AMD,这两家同时具备:指令集的所有权、无限制的设计权和永久全球销售权。威盛曾经通过Cyrix获得有限x86使用权,只能用老旧的指令集。国产X86领军企业海光,在2016年从AMD获得Zen1架构的使用权,限定在原有指令集范围。海光投入大量研发资金,通过微架构创新,目前最先进的型号是C86-5G,其单核IPC简单推算:

C86-4G主频2.8GHz,扣除频率差异,单核IPC大概相当于R5-5600的80%

C86-5G的IPC提升17%,相当于R5-5600的86%。

即:C86-5G的IPC大概相当于ZEN2(或酷睿十代)。

奋起直追,距离国际顶尖水平还落后三代,可见,在次级授权的限制下,要打败英特尔难如登天,CPU研发企业的第一道护城河就宽得看不到边。

CPU是“3”,GPU是“3+2”,英伟达是3+2=1

第二条河:设计壁垒

还是以海光为例分析。如果某天大风突然刮来1000亿现金,台积电也答应提供最先进制程,设计软件(EDA)和设计能力仍然难以短期突破。这是CPU企业最核心的壁垒之一。

现代高端CPU设计完全依赖先进的EDA工具。从架构探索、RTL编码、功能验证、逻辑综合、物理设计(布局布线)、时序分析、功耗分析、DFT到最终的流片数据生成,每一个环节都需要极其复杂、高度优化且相互集成的EDA软件,5nm/3nm及以下节点设计规则就数以千计,晶体管数量达到数百亿。没有强大的EDA工具,人类工程师根本无法手动完成如此巨大的工程。

全球EDA三巨头分别是:Synopsys(新思科技)、Cadence(楷登电子),Siemens EDA(西门子EDA) ,这三家在EDA 领域的多个关键环节占据了近乎 100% 的市场份额,这种垄断地位源于其全流程工具链整合能力和与代工厂的深度绑定。

以华大九天,概伦电子为代表的国内EDA,虽然在特定领域实现全流程覆盖,但集中在模拟/28nm制程以上的数字芯片, 要实现高端数字芯片的完全替代,还需要相当长的时间。

CPU是“3”,GPU是“3+2”,英伟达是3+2=1

第三条河:制造壁垒

台积电以达3nm量产,国产实现14nm量产,差距有4代。

GPU的护城河是3+2

与 CPU 指令集(特别是 x86 和 ARM)的开放性和标准化不同,GPU厂商的底层指令集通常高度私有化。英伟达的底层指令集被称为SASS,属于核弹级机密。为了平衡“技术封闭性”与“开发生态普及”,四万亿美刀帝国在SASS的基础上,抽象了一层PTX指令集,这是完全开放的。相应的,AMD和英特尔的GPU都有各自的指令集。

CPU是“3”,GPU是“3+2”,英伟达是3+2=1

PTX相当于英伟达CUDA GPU计算平台的汇编语言

GPU设计与CPU一样,高度依赖EDA软件。EDA贯穿从架构设计、逻辑实现、物理布局到制造验证的全流程。

随着晶体管物理尺度越来越小,芯片设计变得极其复杂。在3nm下,打造一款CPU或者GPU通常需要24个月甚至更长的时间。早在2021年8月,新思宣布开发出新一代人工智能EDA工具,在芯片设计中不需要去完整模拟10的9万次方种可能的布局,机器可以智能化筛选最优方案,降低开发时间和成本。

GPU除了指令集、设计和制造的壁垒外,还有软件生态和用户体验两层壁垒。

英伟达CUDA是一个涵盖开发工具、库、框架和硬件优化的全栈平台,积累近20年开发资源。全球87%的AI训练代码基于CUDA编写,全球有400万开发者。AMD在硬件性能上已经逼近,ROCm以开源吸引开发者,但生态完善度仍远落后CUDA。

和CPU显著不同的是,显卡要安装驱动程序,其优劣直接决定了用户体验。

国产GPU公司摩尔线程消费级顶级型号为MTT S80(7nm工艺,4096个MUSA核心,主频1.8GHz,16GB GDDR6显存,256bit位宽,带宽448GB/s,支持PCIe 5.0,单精度浮点算力14.4 TFLOPS),理论算力超过RTX3060(12.7 TFLOPS),但实际游戏表现较低(帧数和帧生成稳定性),其根本原因是驱动优化。

CPU是“3”,GPU是“3+2”,英伟达是3+2=1

生态黏性和玩家忠诚度

对AMD来说,打败英特尔易,撼动英伟达难。易,是因为它也有完整的X86指令集授权,也不会被禁用EDA。但在GPU领域,英伟达的护城河是”3+2“,开发生态和驱动优化不是有钱就能砸出来的,需要很长的时间。

N卡和A卡都有各自的优势游戏,如《绝地求生》《堡垒之夜》《最终幻想14》等对N卡友好,《战地》系列和《极品飞车:热度》等对A卡优化更好。但很多人都有这样的体会——N卡的驱动更稳。A卡则比较闹心,从RDNA到RDNA2都出现了掉驱动,黑屏事件。原因是英伟达坚持WHQL认证驱动为主,测试周期较长。AMD则较频繁发布未认证的Beta版本,能更快地对新游戏进行优化支持,但容易导致兼容性问题。

CPU是“3”,GPU是“3+2”,英伟达是3+2=1

总结

此文从“为啥CPU没有驱动”出发,探讨半导体设计公司的护城河,这是一个特殊的角度,并非鼓吹英伟达不败。在历史的长河中,别说一个企业,任何一个王朝都难以说“永远不败”。

假设世界上有一个能人,掌握了CPU和GPU的全部研发技术,但只能选择一个领域,他能想到前者是3,后者是3+2吗?

发表评论

泰日号Copyright Your WebSite.Some Rights Reserved. 网站地图 备案号:川ICP备66666666号 Z-BlogPHP强力驱动