算力2000TFLOPS,Orin 8倍性能,英伟达Thor智能芯片发布

2022-09-21
XCP伍卓彦

在昨晚的2022英伟达芯片发布会中,除了RTX40系显卡外,还带来了一款王炸产品,全新一代智能汽车芯片——NVIDIA DRIVE Thor(雷神索尔),单颗芯片算力达到2000TFLOPS,性能约是目前主流的英伟达Orin芯片的8倍。Thor芯片将于2024年量产,极氪汽车将会在2025年首发搭载这款芯片。

算力2000TFLOPS,Orin 8倍性能,英伟达Thor智能芯片发布

性能爆炸,一颗Thor管够

这颗芯片最大的亮点就是极高的算力,不过为方便理解,先解释一下这个“新”的算力单位——TFLOPS。据黄仁勋在发布会上介绍,这算是芯片性能的两一个参考维度,TFLOPS是描述传统GPU性能的指标,1 TFLOPS指每秒进行1012次浮点运算。TOPS和TFLOPS这两种单位分属两个不同的描述维度,一般没有绝对的换算关系,但在某些特定任务下,1 TFLOPS可以等于1TOPS。

算力2000TFLOPS,Orin 8倍性能,英伟达Thor智能芯片发布

单颗NVIDIA DRIVE Thor的算力达到了2000TFLOPS,下面拿现在已经装车量产的驾驶辅助和智能座舱的总算力需求进行比较。

算力2000TFLOPS,Orin 8倍性能,英伟达Thor智能芯片发布

驾驶辅助方面,目前主流的英伟达Orin单颗算力254TOPS,蔚来以ET7为代表的新车,单车装备4颗,总算力1016TOPS。智能座舱的主流芯片高通骁龙8155,单颗算力8TOPS,理想L9配备了两颗,也就是总共16TOPS。而只需一颗Thor芯片,在算力方面就能完全胜任“4颗Orin+2颗骁龙8155”的芯片组合了。

而且Thor芯片中2000 TFLOPS的算力资源,主机厂可以在各种不同AI任务间随意分配,英伟达提供相关开发工具。

高集成度

不知道大家有没有发现,关于这颗Thor芯片的“定语”不是驾驶辅助芯片了,而是变为智能汽车芯片。DRIVE Thor集成了一辆智能汽车上所需的一切AI功能的计算需求,包括高阶自动驾驶、车载操作系统、智能座舱、自主泊车等等。

算力2000TFLOPS,Orin 8倍性能,英伟达Thor智能芯片发布

智能汽车在车辆底层架构方面的变化,从原来几百个ECU控制不同功能,慢慢演变成几个集中式域控制器的电子电气架构。而这条进化道路的发展方面,应该演变成由一个平台或者一块芯片控制汽车上所有功能。目前虽然未知Thor能否实现“一颗带动整车”,但它的集成化程度肯定是比现在的“英伟达Orin+高通骁龙8155”方案要高得多。

而且这种提高控制芯片集成化的行为,除了能降低成本,减少芯片功耗外,还带来了另外一个好处,就是基于单一智能芯片供应商的智能系统软件调教适配优化。

NVIDIA技术集合体

在发布会上,黄仁勋介绍了Thor强大的原因:GraceHopperAda Lovelace

算力2000TFLOPS,Orin 8倍性能,英伟达Thor智能芯片发布

Grace是英伟达AI专用服务器CPU,基于ARM架构打造,是英伟达在CPU领域打造的第一款产品,适用于AI和高性能计算工作负荷。Grace在使用了第四代NVIDIA NVLink互联技术与GPU融合后,可以处理超过1万亿参数的AI模型训练任务。

算力2000TFLOPS,Orin 8倍性能,英伟达Thor智能芯片发布

NVIDIA Hopper架构是NVIDIA在今年3月推出的GPU架构,采用台积电4nm工艺制造,拥有超过800亿个晶体管,将其 GPU 计算引擎集中在神经网络转换器模型上,并将其 DGX 系统扩展为能够在机器学习训练运行中支持数万亿个参数。

算力2000TFLOPS,Orin 8倍性能,英伟达Thor智能芯片发布

Ada Lovelace就是昨晚发布的英伟达40系列显卡的新架构,同样采用台积电4nm工艺,流式多处理器具有高达83TFLOPS 的着色器能力,吞吐量超过上一代产品2倍。

这三项技术中,有两个都是基于台积电4nm工艺打造,那Thor会不会就是基于台积电4nm打造呢?这点英伟达官方还暂未明说。

算力2000TFLOPS,Orin 8倍性能,英伟达Thor智能芯片发布

除了上面这三个系统外,英伟达还为自动驾驶算法打造了专用引擎。

这两年的驾驶辅助/自动驾驶流行超大规模的Transformer(一种神经网络),最早由特斯拉将其应在在驾驶辅助任务中,现在几乎所有驾驶辅助/自动驾驶方面的“玩家”都跟进了这种做法。

算力2000TFLOPS,Orin 8倍性能,英伟达Thor智能芯片发布

在驾驶辅助/自动驾驶中,Transformer主要做两件事。

一、对投影像素平面的“刻画”;

二、对于投影平面和BEV平面之间的“转化”。

Transformer网络的参数规模,会从一开始百万级,到十亿级,再到现在万亿级,一直呈指数级增长。

英伟达则为Transformer开发了一款专用引擎,DRIVE Thor上的Transformer引擎,能够将视频数据作为一个单一的感知帧来处理,使计算平台能够在固定时间内处理更多的数据。

Thor是Orin的迭代吗?

从Orin的254TOPS,到Thor的2000TFLOPS,英伟达这次是把牙膏挤爆了吗?

牙膏是挤爆了,但也没一次性挤这么多。在Orin和Thor中间,还夹着一块Altan。

算力2000TFLOPS,Orin 8倍性能,英伟达Thor智能芯片发布

去年英伟达发布了Orin芯片的迭代升级产品NVIDIA DRIVE Altan,单颗芯片算力达到1000TOPS,相比Orin算力提升了4倍。原本预定Altan芯片将于2024年上市,2025年正式装车。但由于新品Thor芯片的推出,令这颗1000TOPS算力的Altan芯片顿时黯淡无光,Thor也将正式替代Altan在2025年正式装车,由极氪汽车首发。极氪汽车也是目前唯一一个官宣搭载Thor芯片的车企。

2025年这个时间点,距离现在是3年的时间。Thor芯片采用3年前的消费级架构和工艺,符合车规级的芯片可靠性方面的需求。

算力2000TFLOPS,Orin 8倍性能,英伟达Thor智能芯片发布

据工信部今日新发布的相关文件称,到2025年,系统形成能够支撑高级别自动驾驶的智能网联汽车标准体系。

而行业普遍认为,2025年是L3级驾驶辅助系统实现普及的时间点。而L3驾驶辅助需要的算力,大概是1000TOPS,今天部分主打高级驾驶辅助的新车,也在算力方面“未雨绸缪”,以便日后升级,例如蔚来NT2.0平台的车型(ET7、ES7等),装备4颗Orin,算力达到1016TOPS,具备L3驾驶辅助所需的基础算力。

总结

NVIDIA DRIVE Thor,除了要掀起驾驶辅助进化的风,还要推动汽车智能控制一体化的进程,到底各大主机厂能用这颗Thor玩出什么花样,2025年就能知道。

算力2000TFLOPS,Orin 8倍性能,英伟达Thor智能芯片发布

说起驾驶辅助,肯定离不开特斯拉。2022特斯拉AI DAY将会在今年10月1日正式举行,面对老黄这次放的大招,马斯克会如何出招应对呢,真令人期待。

0
推荐内容
#电车资讯 23
#电车资讯 32
#电车资讯 0