CPU是“3”，GPU是“3+2”，英伟达是3+2=1

游戏天地 2025年07月27日 17:26 1 admin

前言

英伟达成为地球最高价值的公司，凭借的是3+2=“1”，这个“1”即市值第一。

是多么巨大的力量才能把一家公司推上4万亿美元的体量？AMD曾经大幅度落后于英特尔，只用了七年就打败了英特尔酷睿14代，它能再创奇迹，用七年打败英伟达吗？

让我们从一个简单问题开始探索答案——电脑CPU为啥不安装驱动程序？

正文

为啥我们使用电脑，要安装主板、显卡的驱动，怎么没看到安装CPU驱动呢？

CPU的基础功能（取指、解码、执行、访问内存/总线）是硬件电路固有的能力，CPU加电后先在BIOS的指挥下工作，BIOS进行硬件自检后加载操作系统，然后把控制权交给操作系统。BIOS 和 OS 内核中确实包含与 CPU 架构（如x86）紧密关联的代码，这些代码直接操作 CPU 的寄存器、使用CPU的指令、配置CPU的功能，但这些代码不能算作我们传统认为的驱动程序。

CPU的取指、解码、执行、访问内存/总线这些最底层的操作，是由CPU内部的物理电路设计在通电后自动实现的，相当于它的“本能”，不需要任何外部软件（驱动）来“教会”它如何做。它天生就知道怎么执行指令、读写内存。

CPU有三条护城河（以X86为例）

第一条河：完整指令集授权

对外部企业来说，CPU的护城河非常宽阔，AMD能打败英特尔的关键有两点：第一是有完整的X86授权，这相当于拿到了比武的入场券。第二是架构创新，相当于练成了易筋经。两条缺一不可。没有完整的X86授权，即便练成绝世武功，你想上台比武，连擂台的大门都进不了。

拥有完整X86指令集授权仅有英特尔和AMD，这两家同时具备：指令集的所有权、无限制的设计权和永久全球销售权。威盛曾经通过Cyrix获得有限x86使用权，只能用老旧的指令集。国产X86领军企业海光，在2016年从AMD获得Zen1架构的使用权，限定在原有指令集范围。海光投入大量研发资金，通过微架构创新，目前最先进的型号是C86-5G，其单核IPC简单推算：

C86-4G主频2.8GHz，扣除频率差异，单核IPC大概相当于R5-5600的80%

C86-5G的IPC提升17%，相当于R5-5600的86%。

即：C86-5G的IPC大概相当于ZEN2（或酷睿十代）。

奋起直追，距离国际顶尖水平还落后三代，可见，在次级授权的限制下，要打败英特尔难如登天，CPU研发企业的第一道护城河就宽得看不到边。

第二条河：设计壁垒

还是以海光为例分析。如果某天大风突然刮来1000亿现金，台积电也答应提供最先进制程，设计软件（EDA）和设计能力仍然难以短期突破。这是CPU企业最核心的壁垒之一。

现代高端CPU设计完全依赖先进的EDA工具。从架构探索、RTL编码、功能验证、逻辑综合、物理设计（布局布线）、时序分析、功耗分析、DFT到最终的流片数据生成，每一个环节都需要极其复杂、高度优化且相互集成的EDA软件，5nm/3nm及以下节点设计规则就数以千计，晶体管数量达到数百亿。没有强大的EDA工具，人类工程师根本无法手动完成如此巨大的工程。

全球EDA三巨头分别是：Synopsys（新思科技）、Cadence（楷登电子），Siemens EDA（西门子EDA），这三家在EDA 领域的多个关键环节占据了近乎 100% 的市场份额，这种垄断地位源于其全流程工具链整合能力和与代工厂的深度绑定。

以华大九天，概伦电子为代表的国内EDA，虽然在特定领域实现全流程覆盖，但集中在模拟/28nm制程以上的数字芯片，要实现高端数字芯片的完全替代，还需要相当长的时间。

第三条河：制造壁垒

台积电以达3nm量产，国产实现14nm量产，差距有4代。

GPU的护城河是3+2

与 CPU 指令集（特别是 x86 和 ARM）的开放性和标准化不同，GPU厂商的底层指令集通常高度私有化。英伟达的底层指令集被称为SASS，属于核弹级机密。为了平衡“技术封闭性”与“开发生态普及”，四万亿美刀帝国在SASS的基础上，抽象了一层PTX指令集，这是完全开放的。相应的，AMD和英特尔的GPU都有各自的指令集。

PTX相当于英伟达CUDA GPU计算平台的汇编语言

GPU设计与CPU一样，高度依赖EDA软件。EDA贯穿从架构设计、逻辑实现、物理布局到制造验证的全流程。

随着晶体管物理尺度越来越小，芯片设计变得极其复杂。在3nm下，打造一款CPU或者GPU通常需要24个月甚至更长的时间。早在2021年8月，新思宣布开发出新一代人工智能EDA工具，在芯片设计中不需要去完整模拟10的9万次方种可能的布局，机器可以智能化筛选最优方案，降低开发时间和成本。

GPU除了指令集、设计和制造的壁垒外，还有软件生态和用户体验两层壁垒。

英伟达CUDA是一个涵盖开发工具、库、框架和硬件优化的全栈平台，积累近20年开发资源。全球87%的AI训练代码基于CUDA编写，全球有400万开发者。AMD在硬件性能上已经逼近，ROCm以开源吸引开发者，但生态完善度仍远落后CUDA。

和CPU显著不同的是，显卡要安装驱动程序，其优劣直接决定了用户体验。

国产GPU公司摩尔线程消费级顶级型号为MTT S80（7nm工艺，4096个MUSA核心，主频1.8GHz，16GB GDDR6显存，256bit位宽，带宽448GB/s，支持PCIe 5.0，单精度浮点算力14.4 TFLOPS），理论算力超过RTX3060（12.7 TFLOPS），但实际游戏表现较低（帧数和帧生成稳定性），其根本原因是驱动优化。

生态黏性和玩家忠诚度

对AMD来说，打败英特尔易，撼动英伟达难。易，是因为它也有完整的X86指令集授权，也不会被禁用EDA。但在GPU领域，英伟达的护城河是”3+2“，开发生态和驱动优化不是有钱就能砸出来的，需要很长的时间。

N卡和A卡都有各自的优势游戏，如《绝地求生》《堡垒之夜》《最终幻想14》等对N卡友好，《战地》系列和《极品飞车：热度》等对A卡优化更好。但很多人都有这样的体会——N卡的驱动更稳。A卡则比较闹心，从RDNA到RDNA2都出现了掉驱动，黑屏事件。原因是英伟达坚持WHQL认证驱动为主，测试周期较长。AMD则较频繁发布未认证的Beta版本，能更快地对新游戏进行优化支持，但容易导致兼容性问题。