AMD发布”最强算力”Instinct MI300X：性能是英伟达H100的1.3倍！

AI行业资讯1年前 (2023)发布 AI怪兽导航网

222 0 0

12月7日消息，AMD于当地时间周三举行了“Advancing AI”发布会，正式推出了面向AI及HPC领域的GPU产品Instinct MI300A/MI300X加速器，直接与英伟达（NVIDIA）H100加速器竞争。同时AMD还发布了代号为Hawk Point的最新一代Ryzen 8000系列APU，可面向AI PC产品。大量AI产业的龙头公司也来到现场，为“英伟达挑战者”站台助威。

在开场发言中，苏姿丰博士就甩出了一组令股民们极为兴奋的数据：一年前AMD曾预期，数据中心加速器的市场规模，大概能从2023年的300亿美元倍增至2027年的1500亿美元。而到了今天，AMD将2027年的市场规模预期猛然上修至4000亿美元，对应70%的年化复合增长率。 AMD发布

MI300A：HPC性能达到NVIDIA H100的4倍

虽然在今年6月的“数据中心与人工智能技术发布会”，AMD就有发布MI300A和MI300X，只不过当时MI300X只是纸面上的发布，现在MI300A和MI300X已经开始批量量产了，AMD也公布了更多关于MI300A、MI300X的性能数据。

AMD MI300A采用了Chiplet设计，其内部拥有多达13个小芯片，均基于台积电5nm或6nm制程工艺（CPU/GPU计算核心为5nm，HBM内存和I/O等为6nm），其中许多是 3D 堆叠的，以便创建一个面积可控的单芯片封装，总共集成1460 亿个晶体管。

具体来说，MI300A与上一代的MI250X一脉相承，采用新一代的CDNA 3 GPU架构，拥有228个计算单元（14592个核心），并集成了24个Zen 4 CPU内核，配置了128GB的HBM3内存。MI300A的计算核心被 8 个HBM3内存包围，单个HBM3的带宽为6.3GB/s，八个16GB堆栈形成128GB统一内存，带宽高达5.3 TB/s。

在算力方面，MI300A提供了高达61 TFLOPS FP64算力，多达122 TFLOPS FP32算力。

AMD表示，MI300A GPU将HPC提升到一个新的水平，其性能是NVIDIA H100的4倍，能效是H100的两倍。

具体来说，在OpenFOAM中，MI300A APU提供了相比H100高达4倍的性能提升，这主要来自于统一的内存布局、GPU性能以及整体内存容量和带宽。与NVIDIA的Grace Hopper超级芯片相比，该系统每瓦的性能也提高了2倍。 AMD发布

MI300X：AI性能比英伟达H100高出30%！

MI300X采用了相比MI250X更简单的设计，MI300X内部集成了12个5/6nm工艺的小芯片（HMB和I/O为6nm），拥有1530亿个晶体管，放弃了 APU 的 24 个Zen4内核和 I/O 芯片，取而代之的是更多计算核心的 CDNA 3 GPU。

MI300X的每个基于CDNA 3 GPU架构的GCD总共有40个计算单元，相当于2560个内核。总共有八个计算芯片（GCD），因此总共有320个计算和20480个核心单元。不过，就目前的量产版而言，AMD缩减这些核心的一小部分，因此实际总共有304个计算单元（每个GPU小芯片38个CU）可用于19456个流处理器。

在内存带宽方面，MI300X也配备了更大的 192GB HBM3内存（8个HBM3封装，每个堆栈为12 Hi）相比MI250X提高了50%，带来高达5.2TB/s的带宽和896GB/s的Infinity Fabric带宽。相比之下，英伟达即将推出的H200 AI加速器提供141 GB的容量，而英特尔即将推出的Gaudi 3将提供144 GB的容量。大型内存池在LLM（大语言模型）中非常重要，LLM大多是与内存绑定的，AMD可以通过在HBM内存容量上的领先地位来提升器人工智能能力。

具体来说，AMD的MI300X与英伟达的H100加速器相比：

内存容量提高 2.4 倍

内存带宽提高 1.6 倍

1.3 倍 FP8 TFLOPS

1.3 倍 FP16 TFLOPS

在 1v1 比较中，速度比 H100 (Llama 2 70B) 快达 20%

在 1v1 比较中，速度比 H100 (FlashAttention 2) 快达 20%

8v8 服务器中的速度比 H100 (Llama 2 70B) 快达 40%

在 8v8 服务器中，速度比 H100 (Bloom 176B) 快达 60%

在具体的AI大模型加速性能对比当中，MI300X相比H100在 FlashAttention-2 和 Llama 2 70B 中提供了高达 20% 的性能提升。

苏姿丰也在周三宣布，Instinct MI300X加速器已经从今天开始发货，与此同时，Instinct MI300A加速器也已经进入了量产阶段。值得一提的是，AMD是唯一一家凭借Frontier超级计算机突破1 Exaflop大关的公司，也是地球上效率最高的系统。此外，惠普、Eviden、技嘉、超微等也将是MI300A加速器的OEM和解决方案合作伙伴。

正如开头所提，今天的发布会也有众多友商前来捧场，当然也都不是空手而来的。

微软CTO凯文·斯科特在现场宣布，从今天开始，Azure云将开放Instinct MI300X虚拟机的预览。OpenAI也宣布，该公司开发的GPU编程语言Triton，将从接下来的3.0版本开始支持MI300等AMD芯片。Meta、甲骨文的高管当场表示，将在自己的AI和数据中心服务中使用Instinct MI300X加速器。

此外，除了硬件规格的提升，AMD也在周三宣布了最新版本的ROCm 6开源软件平台。公司介绍称，ROCm 6在提升AI加速性能方面取得了显著进步，特别是在MI300系列加速器上运行Llama 2文本生成任务时，其AI加速性能比前一代硬件和软件提高了大约8倍。

AMD发布
AI PC也有新产品

除了数据中心级别的芯片外，AMD也在周三发布了锐龙8040系列移动处理器。AMD介绍称，与上一代同样搭载锐龙AI NPU的7040相比，8040系列在AI任务展现了进一步的提升。

AMD介绍称，整个系列总共有9款芯片，预计搭载该系列的电脑将从2024年一季度开始发售。

当然作为这两年苹果、AMD的保留节目，在与英特尔的旗舰移动处理器i9-13900H的对比中，AMD的8945HS在多项指标的比较中出现大幅领先的情况。

虽然发布会本身符合预期，但对AMD的股价并未构成提振作用。在周三科技股集体走弱的背景下，AMD发布会还没开完，股价就由涨转跌，最终收跌超1%。