首页 抖音快讯文章正文

理想i8单芯片2000TOPS算力,是吹牛吗?| 前沿

抖音快讯 2025年08月18日 22:02 1 admin

这是一篇迟来的科普,但大家看完今天的文章,相信会对最近一个月的算力纷争,有更深刻的理解。


我们先回到半个月前的 i8 发布会。


发布会上理想汽车智能驾驶负责人郎咸朋表示,同样一颗 Thor 芯片,理想可以跑出 2000TOPS 的算力。


而自从 Thor 发布以来,标准版 Thor-U 一直以「700TOPS」的单芯片算力,出现在各种宣传口径中。


于是疑问随之而来:为什么理想说他们的 Thor-U 能跑 2000?到底是英伟达藏拙,还是理想「算错数」?


答案其实很简单:每一颗 Thor-U 都能跑到 2000TOPS,但又不是每一家车企的 Thor-U 都能马上跑到 2000TOPS。


进入 2025,辅助驾驶芯片竞争继续升温,而买车时除了车企之间纯粹的数字游戏,还有更多概念影响着辅助驾驶的理论能力。


我们今天要讲清楚的概念是:精度


理想i8单芯片2000TOPS算力,是吹牛吗?| 前沿

理想吹牛了?


聊英伟达和理想之前,我们要引入另外两个例子:高通和零跑。


今年 3 月份,零跑 B10 正式发布,它也是首批交付的,搭载高通 SA8650 辅助驾驶芯片的车型。

理想i8单芯片2000TOPS算力,是吹牛吗?| 前沿


有意思的地方在于,如果你去搜索 SA8650 的算力,会得到两个数字:


100TOPS(稠密 INT8)、200TOPS(稀疏 INT8)——比如零跑官方一开始,就是按照 100TOPS 稠密 INT8 算力宣传 SA8650 的。


稠密算力的本职是对所有连续存储数据进行无差别计算,可以理解为一味埋头苦干的老实人;稀疏算力则是基于条件判断的动态计算,可以理解为只在效率最高的时候干活的精明人


没错,芯片算力并不是固定的,在不同条件下,同一块芯片会跑出不一样的算力。


而理想号称 Thor-U 在他们手上能跑 2000TOPS 的原因,则在于「精度」这个条件。


精度可以简单理解为计算的详细程度,举个例子:


高精度计算,算出来我的身高 1.801234 米;

低精度计算,算出来我的身高 1.8 米。


在这个语境中,高低精度算出来的值,在应用层面(知道我身高如何)没有收益的区别,但却造成了计算过程的天差地别(一个用卷尺,另一个要用激光)。


理想i8单芯片2000TOPS算力,是吹牛吗?| 前沿


也正是因为标准不同算法就不同,所以除了稀疏/稠密,还要再加上「精度」的综合考量,我们才能算出一块芯片具体工况下的算力。


再回到 i8 发布会,郎咸朋展示的 PPT 里面,在业界通用的 FP16 精度计算中,可以释放的 Thor-U 算力为 500TOPS。


理想i8单芯片2000TOPS算力,是吹牛吗?| 前沿


FP16 是目前业界常用的高效率原始精度,而根据英伟达博客,Thor 更多程度上强调的是「FP8」精度。


在这个精度上,英伟达官方博客给的是 1000TOPS 算力,跟理想官方 PPT 相符。


理想i8单芯片2000TOPS算力,是吹牛吗?| 前沿


而李想本人在微博则表示,由于理想官方使用的是「INT8 和 FP8 混合推理」,所以最终得到的算力是单芯片 700TOPS——这就是过去一年来,各家车企们宣传的 Thor-U 实际算力。


理想i8单芯片2000TOPS算力,是吹牛吗?| 前沿

事实上,理想做双精度混合推理也是正常操作。


其实回看各家车企对 Thor 的宣传,数字其实对应的都是混合精度,或者应该说偏向 INT8 精度的 700TOPS 算力。


一位智驾相关人士向我们提供的内部文档显示,Thor 芯片的纯 INT8 精度算力正好是 700TOPS。


之所以同一块 Thor 还会有不同的精度同时计算,本质还是因为,Orin X 的官方参数就是「254TOPS INT8 算力」。


上一代主要用的还是 INT8 精度,到了 Thor 这一代,则同时兼容 FP8 和 INT8 精度。


这也就引出下一个结论:不同精度之间的混合推理,同样也会对最终算力造成影响,也就造成了我们看到各种各样的算力数字。


原理我们就不过分展开了,可以简单地给大家总结下:主流推理环境下,INT8 的算力消耗会比 FP8 更大,而两种精度混合推理,则会进一步增加格式转换的开销。


再回到数字上,到目前为止,500、700、1000TOPS,都与英伟达和车企们宣传的口径一致。


那 2000TOPS 是哪里来的?


理想i8单芯片2000TOPS算力,是吹牛吗?| 前沿

算力游戏与落地难度


答案很直白:精度都从 16 降到 8 了,那当然也可以从 8 降到 4 啊!


虽然用途不同(打游戏、辅助驾驶、AI 训练),但英伟达的芯片都会尽可能收敛到同一套架构中,比如 Thor 系列都基于 Blackwell 架构打造。


而 Blackwell 架构,是英伟达首次在架构层级兼容 FP4 精度


理想i8单芯片2000TOPS算力,是吹牛吗?| 前沿


在更低精度下,同一款芯片自然就可以跑出更高的算力。比如 Thor-U 就可以扶摇直上,跑出 2000TOPS 的惊人数字。


隔壁高通的 SA8650 其实也已经兼容 FP4 和 INT4 精度了,不过高通阵营各家宣传的,也还是 INT8 精度。


理论上,企业应该优先宣传最大参数,但算力层面,似乎大家都有点保守?


理想i8单芯片2000TOPS算力,是吹牛吗?| 前沿


比如理想在 i8 发布会上提到的 2000TOPS 算力,其实没有归纳进今年主推的 VLA 司机大模型中,VLA 主要用的依然是 INT8/FP8 精度去跑算力。


这里岔开一下,特斯拉一直用的都是稠密 FP16 以及 BF16(谷歌也在用这个),这一点和华为 MDC 类似,所以这两家的算力很难直接拉出来跟英伟达高通地平线们相比。


芯片公司可以兼容超低精度,但目前看来 OEM 落地还是需要一段时间。李想本人的回应也是「未来我们会将精度逐渐往 FP4 去优化」,并未透露具体时间。


理想i8单芯片2000TOPS算力,是吹牛吗?| 前沿


为什么?因为低精度很可能「出事」,特别是与安全息息相关的汽车。


事实上,FP4 和 FP8 看起来是等比缩小,但业界甚至还没有针对 FP4 制定出一个大家都接受的「标准格式」。


然后是训练阶段,目前业界甚至没有一个纯粹地用 FP4 训练出来的模型,因为这么低的精度非常容易造成崩溃


目前整个人工智能业界对于 FP4 的探索,还聚焦在用 FP8 给 FP4 做兜底的混合推理,想要再往前一步,就要看英伟达、高通、AMD 们的最新芯片能卖多少了。


也正是如此,尽管 FP4 让算力暴涨,但业界其实还没有打开 FP4「潘多拉魔盒」的能力。特别是 2025 年,辅助驾驶体验其实还还远谈不上超越人类,整「花活」就更难了。


聊到这里,结论已经很简单:


理想没有吹牛,因为 2000TOPS 是 Thor-U 天生就有的能力。


另一方面,我们还要很久才能看到 Thor-U 发挥出 2000TOPS 的潜能,甚至可能永远都无法实现,因为 FP4 落地极其困难。


你当然可以认为这是李想画的饼,但理论跟工程之间始终有鸿沟。


但无论如何,Thor 还是你目前能买到最新一代、算力最强之一的智能驾驶芯片,而算力本身,又还远不是衡量一台车有多智能的唯一标准。


大家买车的时候,算力是最重要的维度吗?


(完)

发表评论

泰日号Copyright Your WebSite.Some Rights Reserved. 网站地图 备案号:川ICP备66666666号 Z-BlogPHP强力驱动