NVIDIA A30 Data Center GPU

NVIDIA推出用于数据中心的GPU A30

在GTC 2021上,有很多与GPU相关的公告,我们的测评还没有涵盖最新的NVIDIA A30,我们发现A30是我们特别感兴趣的产品,本文我们来讨论一下NVIDIA A30。

NVIDIA A30数据中心GPU

使NVIDIA A30如此有趣的原因是它实际上是一个性能较低的NVIDIA A100的版本,NVIDIA A100是该公司的旗舰产品,但是,并非每个数据中心都可以处理好或者需要250-500W的GPU(从A100 PCIe到80GB的SXM4)。通过诸如NVIDIA A16等其他卡一样,该公司的目标是提供各式各样的GPU卡,有了NVIDIA A30,我们就拥有了一张与A100比较相似而没有那么多功能的一张显卡。

下面是NVIDIA A30 GPU的关键规格:

Peak FP645.2TF
Peak FP64 Tensor Core10.3 TF
Peak FP3210.3 TF
TF32 Tensor Core82 TF | 165 TF*
BFLOAT16 Tensor Core165 TF | 330 TF*
Peak FP16 Tensor Core165 TF | 330 TF*
Peak INT8 Tensor Core330 TOPS | 661 TOPS*
Peak INT4 Tensor Core661 TOPS | 1321 TOPS*
Media engines1 optical flow accelerator (OFA) 1 JPEG
decoder (NVJPEG)
4 Video decoders (NVDEC)
GPU Memory24GB HBM2
GPU Memory Bandwidth933GB/s
InterconnectPCIe Gen4: 64GB/s
Third-gen NVIDIA® NVLINK® 200GB/s**
Form Factor2-slot, full height, full length (FHFL)
Max thermal design power (TDP)165W
Multi-Instance GPU (MIG)4 MIGs @ 6GB each
2 MIGs @ 12GB each
1 MIGs @ 24GB
Virtual GPU (vGPU) software supportNVIDIA AI Enterprise for VMware
NVIDIA Virtual Compute Server
A30的规格

与新的A4000和A5000 GPU不同,NVIDIA A30卡没有显示输出;与A10不同,此卡是一张双插槽型号的卡,TDP只有165W,这意味着系统实际上仅需要提供每个插槽82.5W TDP的冷却方案。

就单插槽GPU的功耗而言,从T4至A10有了一个跃升,A30并不一张低配置的单插槽卡,其每个插槽的TDP都与T4那一代很相似。

此外,这是具有HBM2内存的Ampere这一代的部件,这让它在频谱上的性能会更高。对于那些想要用更新的一张卡来替换T4,或者用新的两张卡来进行渲染的用户,A30的另一个有趣的功能是我们获得了MIG或多实例GPU的支持,每个A30可以是单个24GB的GPU,也可以被配置成四个6GB GPU或两个12GB GPU。在我们最近的ASUS RS720A-E11-RS24U测评中,我们展示了MIG功能正在起作用,在这里,我们将A100分为两个20GB的实例。

ASUS 4x A100 Nvidia Smi Mig Instances 2
ASUS 4x A100 Nvidia Smi Mig Instances 2

较低的TDP有助于将这项技术以及带有HBM2的Ampere降低到较低的功耗水平。

小结

NVIDIA A30的主要影响在于,通过以较低的TDP级别提供许多高端功能,这样可以在更多的系统中使用。与250W TDP卡相比,在系统上为165W TDP的双插槽PCIe卡散热会更容易,因此,这扩展了潜在的市场,新的GPU可以在系统中使用,从而打开新的应用实例,从而将GPU推广到新的应用环境中。