NVIDIA Tesla A100 In HGX A100 Board

NVIDIA认证服务器增加了新的营收途径

本周,NVIDIA又向认证的服务器大家庭增加了新的合作伙伴系统。基本思想是服务器供应商可以在系统上运行脚本来满足某些测试标准,然后可以作为NVIDIA认证的服务器向市场推广。让我们更详细地探究一下这个产品计划,以了解NVIDIA正在做的事情。

NVIDIA认证服务器产品

NVIDIA认证服务器产品背后的基本思想是原始设备制造商(OEM:Original Equipment Manufacturer)可以在大量采用NVIDIA组件的系统配置上运行验证脚本,如果测试通过,OEM便可以宣称其系统是NVIDIA认证的,这样OEM就可以将该系统与NVIDIA的支持合同一起出售。以下是该支持模型的角色和职责:

NVIDIA Certified Systems Software Support Responsibility
NVIDIA Certified Systems Software Support Responsibility

我们将在下面的问答章节中提供更多的信息,但这儿关键是NVIDIA现在不仅仅维护驱动程序和CUDA堆栈,取而代之的是,NVIDIA现在是维护一个容器,该容器在其硬件上运行应用程序,并可以横向扩展使用由Mellanox衍生出来的光纤网络产品,因此,如果客户使用NVIDIA的堆栈构建了一个横向扩展的AI应用程序,则随着容器版本的变更,他们可能需要NVIDIA更新或修正某些内容。

如果你看过我们之前对“NVIDIA GeForce RTX 3090”的评测,那是一个很好的例子说明了容器的变化会导致某些故障。所以,我们需要等待容器的更新版本,NVIDIA并不专注以这种方式支持GeForce的计算卡,因为NVIDIA现在更多地专注于A100,但假设有这样的例子,如果我们是一个运行大型应用程序的大型组织,我们肯定希望获得具有服务等级协议(SLA)的支持,而不是只能等上几个礼拜的时间获得升级后的容器。

在主要合作伙伴方面,我们的Dell EMC,HPE,Inspur,Supermicro和Gigabyte都在第一轮中都有认证的系统,NVIDIA表示还会有更多的厂家进来。

NVIDIA Certified Systems Partners

小结

对于NVIDIA来说,这将具有很大的意义,现在,这是一种通过技术支持获利的方法。NVIDIA具有强大的软件工程引擎,在过去的几年里,该公司已经从底层的驱动程序和语言转移到了上层的应用程序和组件开发,这所有的努力,NVIDIA正试图将其转化成收益,这是有意义的。

对于合作伙伴来说,我们的假设涉及到一个市场营销计划。许多服务器供应商一直以来都在吹捧其服务器的AI集成和支持能力,但是对于绝大多数高价值服务器来说,NVIDIA认证计划推出后,不依靠NVIDIA而只依靠Dell来获得支持将变得困难。拥有Dell EMC和Supermicro提供的NVIDIA认证服务器,使得对某些组织而言,超越iDRAC管理,单独说明戴尔服务器在AI方面超越Supermicro服务器是很困难的。

在价格方面,我们所听到的指导价,还有下面“问答”中的内容,大约等于是$700-850/GPU/年。
我们怀疑这里面有很多水分,我们也没有得到与这些价格相关的任何折扣,所以可以视其为我们能拿到的最好的价格,但可能与街头定价有所不同。

总的来说,那些喜欢DIY对机器进行扩展的用户可能对这种方式没有太大的兴趣。对于那些希望获得这种类型技术支持的用户,或者需要建立这种厂商支持模式的用户,这种方式可能具有很大的吸引力。

NVIDIA关于产品的快速“问答”

NVIDIA回答了一些后续问题,这些问题不是最原始发布的一部分,而是通过电子邮件提供的。