据外媒报道,11月17日,英伟达宣布将与微软合作,联手打造一款专注于人工智能的“巨型”云计算机,用于处理高密度云计算。
据介绍,英伟达将为这款 AI 超级计算机提供强大的GPU芯片和全套AI软件,并利用其Quantum-2 InfiniBand网络平台形成强大的集群。同时该超级计算机使用微软的Azure云基础设施以及ND和NC系列虚拟机,使得它可以在微软的Azure云上运行。微软Azure先进的超级计算基础设施,结合英伟达GPU、网络和全栈式AI软件,必然能使企业在训练、部署和扩展AI时获得更好的服务体验。
英伟达表示:“一旦英伟达和微软的云计算机上线,客户可以在单个集群中部署数千个GPU,通过训练最庞大的大型语言模型,大规模构建最复杂的推荐系统,并大规模实现生成AI。”
无独有偶,11月15日。Cerebras宣布,推出Andromeda AI超级计算机,它拥有1350万核心,部署于美国加利福尼亚州圣克拉拉的数据中心,现已用于商业和学术工作。其采用了16个Cerebras CS-2系统集群构建,并利用Cerebras MemoryX和SwarmX技术简化和协调跨系统的模型拆分,以16位半精度提供超过1 Exaflop的AI计算和120 Petaflops的密集计算。
Cerebras称,Andromeda基于AMD第三代EPYC服务器处理器,以及Cerebras的Wafer Scale Engine 2构建,是唯一一台仅依靠简单数据并行性在大型语言模型工作负载上展示近乎完美的线性扩展的AI超级计算机,在GPT类大型语言模型里几乎呈线性扩展,这效率是标准GPU集群所无法比拟的。
正如英伟达加速计算业务副总裁Ian Buck所说:“我们正处于一个 AI 进入企业的转折点。”专用的AI超级计算机平台的出现,预示着AI的研究工作将出现翻天覆地的变化,它会使AI的研发过程将会变得更加容易,当研究人员和公司拥有这些先进的人工智能基础设施和软件,必然能大大加快强人工智能的实现过程,涌现出更多新兴AI应用。