HPC指的是在多台服务器上以高速并行方式执行复杂计算的能力。这些服务器的集合被称为集群,由数百甚至数千台计算服务器通过网络连接而成。
继续阅读标签: AI
关于AI训练和推理中存储扩展的一些提示
应该预先以整体性的方式来解决存储扩展问题。这包括容量、性能、网络硬件和数据传输协议。其中的关键点是确保充足的GPU资源,否则,训练和推理工作可能会失败。
继续阅读针对AI/ML的高性能文件系统
随着AI/ML解决方案在企业中崭露头角,我们的许多客户发现传统的存储系统和文件系统可能无法满足与新的AI/ML工作负载相关的新需求。
继续阅读为AI数据中心选择网络方案
RDMA技术涵盖了四种实现方式:InfiniBand、RoCEv1、RoCEv2以及iWARP。在这其中,RoCEv1已经过时,iWARP并不常见。目前,业界普遍采用的网络解决方案主要集中在InfiniBand和RoCEv2两个选项之间。
继续阅读埃级芯片将如何推动电子工业的发展
工程上的聪明才智一直是推动创新的一种方式,而半导体行业无疑处于前沿。
继续阅读2023年的高科技成像与数据存储
如今,到了2023年,我们可以看到这一预测在低温电子显微镜(cryo-EM)、低温电子断层扫描显微镜(cryo-ET)、扫描电子显微镜(SEM)以及透射电子显微镜(TEM)领域已经成为现实。
继续阅读生成式AI管道中的IO模式
在生成式AI(GenAI)领域存在一个鲜为人知的问题,它可能会阻碍许多用户实现其目标:其IO模式可能会对传统存储系统造成巨大压力。
继续阅读人工智能/机器学习/深度学习/神经网络的区别与联系
尽管人工智能(AI)、机器学习(ML)、深度学习以及神经网络等技术存在联系,然而在实际应用中,这些术语往往被交替使用,从而引发了人们对于它们之间区别的疑惑。
继续阅读AI时代的数据战略:跨越数据湖,迎接数据海洋
展望2023,企业AI应用蓬勃兴起,数据海洋正逐渐涌现而出
继续阅读DAOS存储性能可扩展性研究
摘要 高性能的可扩展存储系统在现代HPC和AI集群中具有关键地位。然而,对其性能进行准确的表征仍然具有一定挑战,因为不同
继续阅读