英伟达与亚马逊联手打造了一台拥有16384个超级芯片的超级计算机-EDN 电子技术设计

 该合作项目代号为Project Ceiba，共计搭载了16384颗英伟达H200超级芯片，能够处理65 exaflops速度等级的AI运算，这个超级计算机是配备了H200 NVL32与Amazon EFA互连技术的大规模系统，将部署在亚马逊云科技之上。

英伟达和亚马逊云科技宣布，将共同推出首款云AI超级计算机，将英伟达的H200 Grace Hopper超级芯片与亚马逊UltraCluster扩展功能融合。Sqhednc

据悉，该合作项目代号为Project Ceiba，共计搭载了16384颗英伟达H200超级芯片，能够处理65 exaflops速度等级的AI运算，这个超级计算机是配备了H200 NVL32与Amazon EFA互连技术的大规模系统，将部署在亚马逊云科技之上。Sqhednc

这一合作项目的重要性得到了双方高层的亲自站台，亚马逊云科技CEO Adam Selipsky和英伟达CEO黄仁勋纷纷表示，他们共同的目标是发展生成式AI，为各个领域提供成本效益和先进的生成式AI。Sqhednc

Sqhednc

亚马逊云科技首席执行官Adam Selipsky 表示：“今天，我们为图形、游戏、高性能计算、机器学习以及现在的生成式人工智能等工作负载提供最广泛的英伟达GPU 解决方案。我们继续与英伟达合作创新，将下一代英伟达Grace Hopper Superchips 与亚马逊云科技的 EFA 强大网络、EC2 UltraClusters 的超大规模集群以及 Nitro 的高级虚拟化功能相结合，使亚马逊云科技成为运行 GPU 的最佳场所。” Sqhednc

Ceiba项目是此次合作的基石，旨在创建世界上最快的 GPU 驱动的 AI 超级计算机，由亚马逊云科技托管，并专门为英伟达提供。这个雄心勃勃的项目将集成 16,384 个英伟达GH200 超级芯片（使用 GH200 NVL32 解决方案，包含 32 个 GH200 GPU 和 19.5 TB 统一内存），这些芯片将提供惊人的 65 个“AI ExaFLOPS”处理能力。这台超级计算机用于英伟达的生成式人工智能研发项目。 Sqhednc

亚马逊云科技上托管的英伟达DGX 云是此次合作的另一个主要组成部分。该人工智能培训即服务平台是第一个将 GH200 NVL32 机器与 19.5 TB 统一内存结合在一起的商用实例。该平台为开发人员提供了单个实例中可用的最大共享内存，显着加速了高级生成人工智能和大型语言模型的训练过程，可能超过 1 万亿个参数。Sqhednc

此外，亚马逊云科技将率先提供基于Nvidia GH200 Grace Hopper Superchips的基于云的AI超级计算机。这种独特的配置将使用 NVLink 连接每个实例 32 个 Grace Hopper Superchip。它将扩展到数千个 GH200 Superchips（和 4.5 TB HBM3e 内存），与 Amazon 的 EFA 网络连接，并得到高级虚拟化（亚马逊云科技 Nitro System）和超大规模集群（Amazon EC2 UltraClusters）的支持。Sqhednc

此次合作还将推出新的英伟达支持的Amazon EC2实例。这些实例将配备 H200 Tensor Core GPU，具有高达 141 GB 的 HBM3e 内存，适用于大规模生成式 AI 和高性能计算 (HPC) 工作负载。此外，G6 和 G6e 实例分别配备 NvidiaL4 和 L40S GPU，专为从 AI 微调到 3D 工作流程开发等广泛应用而设计，并利用英伟达Omniverse 创建支持 AI 的 3D 应用程序。Sqhednc

此次合作将引入英伟达的先进软件，以加速亚马逊云科技上的生成式 AI 开发。其中包括用于创建聊天机器人和摘要工具的 NeMo LLM 框架和 NeMo Retriever 以及用于加速药物发现流程的 BioNeMo。 Sqhednc

英伟达创始人兼首席执行官黄仁勋表示：“生成式 AI 正在改变云工作负载，并将加速计算作为多样化内容生成的基础。”在向每位客户提供经济高效的最先进的生成式人工智能这一共同使命的推动下，Nvidia和亚马逊云科技正在整个计算堆栈上进行合作，涵盖人工智能基础设施、加速库、基础模型和生成式人工智能服务。 ”Sqhednc

此外，亚马逊云科技还宣布了自家芯片的大升级，发布了Graviton4通用AI芯片。与上一代Graviton3相比，Graviton4的计算性能提高了30%，核心数量增加了50%，内存带宽增加了75%。这一芯片将应用于内存优化型的Amazon EC2 R8g实例，提升高性能数据库、内存缓存和大数据分析工作的效率。Sqhednc

另外，Trainum2芯片也亮相，主要用于拥有超大参数模型的训练。相比于上一代Trainium1，Trainum2在速度上提升了4倍，在能效方面也有2倍的提升。这一芯片将支持新的服务，为客户提供大规模的模型构建和训练能力。Sqhednc

亚马逊云科技不仅在硬件方面进行了升级，还发布了生成式AI应用搭建平台Bedrock。亚马逊云科技的Keynote演讲中，还展示了一款名为Amazon Q的工作版ChatGPT，专为企业用户设计，帮助员工利用公司的数据和专业知识获取答案、解决问题。Sqhednc

责编：Demi

阅读全文，请先

产业前沿人工智能处理器/DSP

上一篇： 可以计算光最佳形状的光子芯片？原理竟然这么简单 下一篇： 2G/3G退网是移动通信网更新换代的必然选择

微信扫一扫
一键转发
最前沿的电子设计资讯
请关注“电子技术设计微信公众号”

使用MSO 5/6内置AWG进行功率半导体器件的双脉冲测试在本文中，宽禁带功率器件供应商Qorvo与Tektronix合作，基于实际的SiC被测器件 (DUT)，描述了实用的解决方案···
嵌入式Rust：我们如今身处何方？ Rust对于一般应用开发来说很有意义，但对于嵌入式软件团队来说真的有意义吗？Rust如今的情况如何，它是否就是大家所鼓吹的最美好的解决方案？
631.2亿美元的市场，创新制造工艺将为柔性电子带来什么？柔性电子设备的新型制造技术正在迅速涌现。有些人可能想知道它们是否比传统方法更好，以及它们什么时候会商业化，它们会影响电子设计工程师未来的创新吗？
NFC防伪技术：削弱假货对奢侈品行业的影响打击假冒伪劣最终需要奢侈品行业改进其产品认证方法。但是，随着越来越多的假冒产品不断涌入市场，奢侈品品牌该如何保护自己的知识产权和实体产品呢？
PCI Express Gen5：自动化多通道测试本文将重点介绍用于x16测试的RF开关配置。这些开关型号最多支持18条通道（PCIe最大通常为x16），也可支持更低的通道数···
为什么紫外线固化对于高质量电子产品至关重要？粘合剂粘接是电子产品制造中一个小而关键的部分。紫外线固化可提高该工艺的效率、耐用性和可靠性。
深入拆解一个Godox相机闪光灯发射器，富士专用在2024年三月份，著名的二手影像设备零售商KEH就举行了一次定期的“库存清理”活动，这次活动对其部分仓库库存提供15%的折扣。其中吸引我注意的是一个“Godox X1T-F TTL无线闪光灯触发发射器···
通嘉PD快充适配器高效能及小型化之氮化镓集成方案随着消费者对便携性和高效充电的需求增加，手机厂商和充电器品牌纷纷推出小型化PD快充产品，以满足市场需求···
横向对比考毕兹振荡器和克拉泼振荡器我们之前在“一起来简单聊聊考毕兹振荡器”和“再来谈谈克拉泼振荡器，和考毕兹振荡器有何不同？”中分别研究过这两个振荡器。而对这两个振荡器进行横向对比也是十分有必要的···
拆解一个Geek Bar Pulse电子烟，拆到最后竟然还能亮？电子烟(又称“vape”)的使用量在迅速增长，无论是新用户还是现有的香烟、雪茄、烟斗和嚼烟用户都在使用···
基于SiC的高电压电池断开开关的设计注意事项在本文中，我们将讨论在选择功率半导体技术和定义高电压、高电流电池断开开关的半导体封装时的一些设计注意事项，以及表征系统的寄生电感和过流保护限值的重要性···
来看看在这个电源，能通过单个PWM输出进行计算机编程可变稳压电源是电子实验室工作台上的一种便捷工具，能产生极性相反的相等电压输出的对称型电源更是如此···

机器人所需要的传感器有哪些？随着机器人技术的迭代升级，传感器的重要性将持续提升，其功能性、精度和适配性也将得到显著改进，作为机器人不可
2024年墨西哥市场分析，中国品牌崛起 2024年，墨西哥汽车市场以近10%的增长率展现了强劲的复苏势头，中国品牌的崛起为市场注入了新活力，当然现在的政
2025，大众汽车集团在中国如何转型？ 2024 年，大众汽车集团（中国）在复杂多变的市场环境中成功达成销量目标，向客户交付超过 290 万辆汽车，新能源汽车领
国产射频芯片公司汇总对于射频芯片这项卡脖子技术，国内很多公司在这方面努力，而且也做出了不错的成绩。一些射频芯片公司无论从研发
拆解报告：松下电器1200W电吹风松下EH-NW90电吹风内置10万转高速无刷电机，并具备三档风速和四档风温可选。电吹风内置纳诺怡技术，为秀发提供
拆解报告：白牌电动工具电池多功能放电转换器这款白牌多功能放电转换器适配得伟电动工具电池使用，将电动工具电池和放电转换器组装起来，即可组成移动电源和
拆解报告：MOMA猛玛LARK M2无线麦克风 MOMA猛玛LARK M2无线麦克风在外观方面，采用了极富创新的设计，提供了轻盈舒适的佩戴使用体验。发射器采用了夹
阿根廷2024年：销量下滑，北汽增长240.1%。 2024年阿根廷汽车市场在整体销量下滑的背景下，依然展现出多元化的发展趋势···
2025年第3周：全球最快四足机器人发布 2025年将成为机器人产业的关键时间点，业内预期27年人形机器人出货量可达50~100万台。从技术进步到供应链成熟
欧洲2024年汽车市场：微弱复苏和电动化加速并存 2024年，欧盟新车注册量小幅增长0.8%，达到约1060万辆，欧盟+英国+北欧国家的销量为1296.4万台，同比增长0.9%，整个欧
射频微波领域有哪些高质量期刊？今天我们结合网络上的资料一起整理一份射频微波领域的期刊列表，以便同学们投稿时可以选择···
拆解报告：Portal智能屏幕24W电源适配器 Portal智能屏幕电源适配器采用黑色直板机身，外观整洁，配有2米长黑色输出线。适配器采用美规固定插脚，支持100-2

性能飞跃！升级电流传感器NSM201x-P系列赋能汽车三电和光伏逆变器纳芯微推出全新车规级集成电流路径霍尔传感器NSM201x-P系列。该系列产品是对纳芯微已量产的NSM201x系列的完
意法半导体推出STSPIN32G0新列电机驱动器，满足工业自动化和家电市意法半导体STSPIN32系列集成化电机驱动器新增八款产品，满足电动工具、家用电器、工业自动化等应用的低成本、
Melexis推出性能先进的温度传感器，以红外技术创新实现电磁炉智能全球微电子工程公司Melexis宣布，推出专为电磁炉设计的非接触式红外温度传感器芯片MLX90617···
康佳特SMARC模块更新: 全新英特尔酷睿3处理器低功耗 SMARC 模块AI 加速和图形处理性能再次提升···
康佳特针对要求苛刻的实时应用推出新型高性能COM-HPC模块基于英特尔酷睿 Bartlett Lake S处理器的模块性能全面提升···
为汽车安全保驾护航，纳芯微推出基于AMR技术的ABS轮速传感器纳芯微宣布推出全新基于AMR（各向异性磁阻技术）的轮速传感器NSM41xx系列。该系列产品通过集成先进的磁性传感敏
Microchip推出全新Switchtec™ PCIe® 4.0 16通道交换机系列 PCI100x系列器件可为任何需要加速或专用计算的应用提供高性能和成本效益···
RK3576有多强？实测三屏八摄像头轻松搞定-米尔米尔基于他们推出的MYD-LR3576开发板开发了一个3屏异显，8路摄像头输入的DEMO，实测下来，RK3576轻松搞定了该任
SynQor®推荐先进的军用级三相输入UPS（UPS-1500-S-1U-T） SynQor的三相输入UPS电源能使单相负载在电源端呈现出符合MIL-STD-1399-300B标准的清洁、表现良好且几乎零反
村田开发超小尺寸、超低功耗的Type 2GQ GNSS模块，以匠心品质助在几年前，定位系统充斥于生活方方面面的情节还仅见于各式的科幻影片，而今具备这一功能的产品已经以各种形态步
瑞萨推出性能卓越的新型MOSFET 瑞萨全新晶圆技术可以帮助MOSFET实现导通电阻降低30%、栅漏电荷减少40%、封装尺寸缩小50%的目标···
加特兰集成 Cadence Tensilica ConnX 220 DSP 全面升级汽 ConnX 220 DSP 集成至基于下一代 Andes SoC 的加特兰雷达解决方案后，将带来显著优势，包括提高灵活性、

热门评论
最新评论

换一换

杂志声明

英伟达与亚马逊联手打造了一台拥有16384个超级芯片的超级计算机