采用全球最大AI芯片，Lassen超算系统集成Cerebras 1.2万亿晶体管-EDN 电子技术设计

 劳伦斯利弗莫尔国家实验室（Lawrence Livermore National Laboratory，LLNL）今天表示，已经将美国国家核安全局（National Nuclear Security Administration）的Lassen超级计算机与1.2万亿芯片进行了集成。

劳伦斯·利弗莫尔国家实验室（LLNL）和AI公司Cerebras Systems今天宣布，将1.2万亿塞雷布拉斯的晶圆级引擎（WSE）芯片集成到国家核安全局（NNSA）的23 petaflop拉森超级计算机中。拉森的仿真能力与Cerebras的机器学习计算系统，以及容纳该芯片的CS-1加速器系统的结合，使LLNL“成为第一家将AI平台与大型超级计算机集成在一起并创建全新类型的架构"。bpTednc

超算Lassen

bpTednc

此次集成意味着Lassen系统（如图所示）成为全球第一台将人工智能技术与高性能计算建模和仿真功能相结合的超级计算机。bpTednc

劳伦斯利弗莫尔国家实验室表示，该系统旨在实现所谓的“认知模拟”，让研究人员可以研究用于预测建模的创新方法。该计划有几个目标，包括协助在美国国家点火设施进行融合内爆实验、材料科学、以及通过“医学治疗研发计划”快速开发用于治疗新冠病毒和癌症的新药。bpTednc

Lassen超级计算机是目前全球排名第14的超级计算机，每秒浮点运算性能超过23 petaflops。劳伦斯利弗莫尔国家实验室表示，该系统已经集成了Cerebras Systems的CS-1加速器硬件系统，后者基于Wafer Scale Engine专用AI芯片，尺寸是标准数据中心GPU的57倍，封装了1.2万亿多个晶体管。bpTednc

bpTednc

去年Cerebras宣布，配置了40万个处理核心的WSE芯片已经针对AI工作负载进行了优化，配备18 GB高速板载内存。bpTednc

该项目得到了美国国家核安全局（NNSA）的高级仿真和计算计划的资助，在该计划下，这款增强的系统将在未来十年内用于加速美国能源部和美国国家安全任务的一系列应用。bpTednc

劳伦斯利弗莫尔国家实验室首席技术官Bronis R. de Supinski表示，该计划是在对计算提出了更高需求的情况下孕育而生的。由于计算需求已经远远超过了摩尔定律（根据摩尔定律，芯片上的晶体管密度每两年翻一番），因此已经无法通过常规手段提升计算性能了。bpTednc

他说：“认知仿真是一种可以推动容量呈现指数级持续提升的方法，而像Cerebras CS-1这样系统级的异构方法，是实现这一提升的一个重要组成部分。”bpTednc

研究人员通过这种方法探索一种所谓“异构性”的新概念，在这个概念下，超级计算机的不同元素负责某个特定工作负载的不同方面。根据De Supinski的说法，这样就可以运行数据生成和纠错之类的操作，从而为各种科学问题提供了一种更高效、更具成本效益的解决方案。bpTednc

劳伦斯利弗莫尔国家实验室计算机科学家Ian Karlin表示：“异构的系统让我们能够确定，我们所使用的应用，其不同组成部分是可以同时执行各种任务的。对于我们的认知模拟工作负载来说，我们将在Cerebras硬件上运行机器学习负载，在GPU上运行高性能计算模拟负载，从而缩短了生成解决方案的时间。”bpTednc

这意味着，研究人员可以跳过工作流程中很多不必要的处理，加速深度学习神经网络，最大程度上减少了将某些问题“切片和切成小块”的需要。bpTednc

劳伦斯利弗莫尔国家实验室计算机科学家Brian Van Essen表示：“我们可以在更短的计算时间内进行科学探索，也可以在科学不确定性更高的领域进行更深入的研究，在有了更多计算时间的同时，得到更好的答案。”bpTednc

Van Essen正在领导一个研究小组，该小组选择在CS-1系统上运行两种AI模型，初步工作重点是从多达50亿张模拟激光内爆图像中进行学习，优化用于国家点火装置实验的聚变目标，最终实现高能量输出，以及更强大的核武器储备管理应用聚变内爆。bpTednc

与此同时，劳伦斯利弗莫尔国家实验室和Cerebras将合作建立一个人工智能卓越中心（Artificial Intelligence Center of Excellence），旨在确定认知模拟的最佳参数，这项研究可能会促使劳伦斯利弗莫尔国家实验室向Lassen及其他超级计算机平台中配置更多的CS-1。bpTednc

作为该中心的负责人，Van Essen表示：“我是一名受过培训的计算机架构师，因此有机会构建这样的系统，并成为大规模部署这些系统的第一人，令人非常兴奋。将其集成并耦合到像Lassen这样的系统中，给我们提供了一个独有的机会，让我们能够率先去探索这种框架。”bpTednc

简单粗暴的产品逻辑

去年EDN电子技术设计姐妹媒体《电子工程专辑》也报道指出，开发出 WSE 系列 AI 芯片的 Cerebras Systems 是一家2016年才成立的新创 AI 芯片公司。公司资历不长，但是却经历了三轮融资，分别是2016年5月份的2700万美元的A轮融资，2017年1月2500万美元的B轮融资，随后不到一年时间里，Cerebras Systems再次融资6000万美元，彼时估值达到8.6亿美元。bpTednc

因为人工智能产业也恰巧在那个时候开始盛行，Cerebras Systems也因此被许多人看好。而这家公司发展产品的逻辑不同于其他AI芯片公司，就是奉行一个路子：“简单，粗暴”。为了满足 AI 计算的高性能需求，放弃其他厂商芯片越小越好的思维，以尽可能生产大面积芯片为主。由于面积越大的芯片，其中能整合越多的核心与晶体管，其相对计算效能也越强，但同时也提升了生产成本。bpTednc

2019 年 11 月份，该公司正式推出了 WSE 系列芯片的第一代，采用台积电 16 纳米工艺，并以整个 12 吋晶圆来打造一个庞大的 AI 芯片。所以，WSE 系列芯片的第一代就整合了40 万个 AI 核心，1.2 万亿个晶体管，面积也高达 4.6 万平方毫米。bpTednc

当时其性能之强大，让其他以大著称的芯片甘拜下风。bpTednc

比如英伟达的GV100芯片号称最强GPU，211亿晶体管，核心面积815平方毫米，而WSE芯片晶体管数量是GV100的60倍，面积则是它的56倍多。WSE与当时的CPU芯片相比同样震撼，AMD 64核EPYC二代处理器才320亿晶体管，封装总面积也不过4410平方毫米，光是核心面积WSE就是EPYC二代处理器的10倍有余。bpTednc

从性能上来看，WES芯片带宽超过100Pb／s，一般的计算芯片以Tb／s级别的单位都难以跟起比较。bpTednc

除了贵，都挺好的

在关于WSE介绍的白皮书中，有这么一句话——“通过加速人工智能计算，WSE清除了阻碍人工智能进步的最大路障——时间。将训练时间从几个月缩减为几分钟，从几周减少到几秒。让深度学习实践者更快的验证自己的假设，从而不用去担心一些体系机构导致无法测试或者太大风险。WSE降低了好奇心的成本，加速了人工智能新思想和新技术的到来。”bpTednc

虽然堪称芯片工艺史上的一大“奇迹”的WSE 芯片第一代之后被顺利生产出来，但是其造价不斐，可以想见的是会采购的单位或企业更是少之又少。最后，还是美国劳伦斯利福摩尔国家实验室（LLNL）把WSE集成到美国国家核安全管理局的拉森超级计算机中，再由美国政府旗下的美国国家科学基金会（NSF）出手相助，购买了两套以 WSE芯片为主的超级计算机CS-1，总价约 500 万美元。bpTednc

bpTednc

第一代的WSE（有一套电力传输和冷却系统）bpTednc

从整机价格推算，每片 WSE芯片的价格约为 200 万美元（约合人民币1384万元），Cerebras创始人兼CEO 安德鲁 · 费尔德曼（Andrew Feldman）也曾透露称这种巨无霸芯片及系统的售价在几百万美元级别。bpTednc

Cerebras Systems公司透露，这款WSE芯片，他们已经接到了十几片的订单。bpTednc

bpTednc

Cerebras Systems的联合创始人兼首席执行官安德鲁 · 费尔德曼（Andrew Feldman）bpTednc

二代产品晶体管数翻倍

WSE 系列芯片第一代采用的是台积电 16 纳米工艺，现在新一代产品也问世。在日前举办的年度半导体盛会Hot Chips 2020 大会上，WSE2 AI 芯片正式发布。该公司表示，已经在实验室中运行了新款芯片。bpTednc

虽然具体细节还没公布，但受到晶圆尺寸的限制，会与第一代采用相同的芯片面积。但是因为采用了新一代的台积电 7 纳米工艺，AI 核心数翻倍成长到了 85 万个，而晶体管数量更是一口气增加至 2.6 万亿个，相比之前的规格增加了一倍有余，相信价格也会随之提高。bpTednc

bpTednc

此外，预计该公司还将增加芯片内置的内存容量并加强芯片互连速率，以提高芯片内数据传输的带宽。去年的第一代芯片具有9PB/s的内存带宽，并且这样一个芯片的TDP为15KW。bpTednc

目前 7 纳米工艺的最大芯片是英伟达（NVIDIA）的 GA100 GPU，芯片面积达到 826 平方毫米，拥有 540 亿个晶体管。比较之下，Cerebras Systems 新发布的 WSE2 AI 芯片无论从晶体管数，还是芯片面积都是庞然大物，预计售价也会非常高昂。bpTednc

bpTednc

WSE芯片尺寸达到了46225平方毫米，比最大的GPU核心要大56倍bpTednc

晶圆级晶片除了像Cerebras这样制作计算芯片的应用外，也有应用于存储方面的研究。铠侠（前东芝存储）正在进行的新研究就是——通过跳过传统闪存和SSD制造方法过程中所有切割，组装，封装等操作，直接生产晶圆级的SSD ，这样可以极大地降低制造成本和交货时间，并且得到高性能的大量数据存储解决方案。bpTednc

不过虽然铠侠提出了“晶圆级固态硬盘”的概念，但是还处在早期开发阶段，距离实际上市和应用还很早。目前受瞩目的晶圆级晶片还是Cerebras WSE，而关于第二代Cerebras WSE的更多信息，还是得到该公司宣布最终产品时才能知道。bpTednc

bpTednc

本文综合自Technews、超能网、电子工程专辑bpTednc

责编：ChalleybpTednc

Van Essen正在领导一个研究小组，该小组选择在CS-1系统上运行两种AI模型，初步工作重点是从多达50亿张模拟激光内爆图像中进行学习，优化用于国家点火装置实验的聚变目标，最终实现高能量输出，以及更强大的核武器储备管理应用聚变内爆。

除了贵，都挺好的
在关于WSE介绍的白皮书中，有这么一句话——“通过加速人工智能计算，WSE清除了阻碍人工智能进步的最大路障——时间。将训练时间从几个月缩减为几分钟，从几周减少到几秒。让深度学习实践者更快的验证自己的假设，从而不用去担心一些体系机构导致无法测试或者太大风险。WSE降低了好奇心的成本，加速了人工智能新思想和新技术的到来。”
虽然堪称芯片工艺史上的一大“奇迹”的WSE 芯片第一代之后被顺利生产出来，但是其造价不斐，可以想见的是会采购的单位或企业更是少之又少。最后，还是美国劳伦斯利福摩尔国家实验室（LLNL）把WSE集成到美国国家核安全管理局的拉森超级计算机中，再由美国政府旗下的美国国家科学基金会（NSF）（美国科学家都是国家发工资吗？）出手相助，购买了两套以 WSE芯片为主的超级计算机CS-1，总价约 500 万美元。

这是简单，粗暴吗？
个人觉得是简单，科学
想问一下，国内非美国技术的芯片，可以做到多少纳米。手机是否也可以这样设计，整个手机主板作为基板，把手机所有的功能都集成在一起，不要分成不同的芯片。整个手机主板就是一个大大的IC。

阅读全文，请先

模拟/混合信号/RF

上一篇： Intel推出神经拟态研究芯片“Loihi”，能效最高可达通用芯片的1000倍 下一篇： 安川Sigma-7伺服放大器拆解

微信扫一扫
一键转发
最前沿的电子设计资讯
请关注“电子技术设计微信公众号”

使用MSO 5/6内置AWG进行功率半导体器件的双脉冲测试在本文中，宽禁带功率器件供应商Qorvo与Tektronix合作，基于实际的SiC被测器件 (DUT)，描述了实用的解决方案···
嵌入式Rust：我们如今身处何方？ Rust对于一般应用开发来说很有意义，但对于嵌入式软件团队来说真的有意义吗？Rust如今的情况如何，它是否就是大家所鼓吹的最美好的解决方案？
毫米波雷达与音频技术重塑汽车驾乘新体验汽车行业的发展正由两大创新领域主导：更为精准可靠的车内感知系统和高质量音频系统。传统方法如增加传感器或音频设备数量，虽可提升性能但会带来成本上升和复杂性增加的问题。
康佳特SMARC模块更新: 全新英特尔酷睿3处理器低功耗 SMARC 模块AI 加速和图形处理性能再次提升···
康佳特针对要求苛刻的实时应用推出新型高性能COM-HPC 基于英特尔酷睿 Bartlett Lake S处理器的模块性能全面提升···
631.2亿美元的市场，创新制造工艺将为柔性电子带来什么？柔性电子设备的新型制造技术正在迅速涌现。有些人可能想知道它们是否比传统方法更好，以及它们什么时候会商业化，它们会影响电子设计工程师未来的创新吗？
创新的FPGA技术实现低功耗、模块化、小尺寸USB解决方本文总结了业界用于高性能 USB 3 设备的一些典型解决方案，并介绍了一种新的架构，这种架构既能节省功耗和面积，又能提高灵活性和易用性···
NFC防伪技术：削弱假货对奢侈品行业的影响打击假冒伪劣最终需要奢侈品行业改进其产品认证方法。但是，随着越来越多的假冒产品不断涌入市场，奢侈品品牌该如何保护自己的知识产权和实体产品呢？
盘点CES 2025上基于Arm架构的AI创新和技术亮点近期在美国拉斯维加斯举行的 CES 2025 再次彰显了其作为展示最新科技创新的重要平台。今年展会上所呈现的众多前沿产品和新的发布将推动各个行业的变革与发展···
PCI Express Gen5：自动化多通道测试本文将重点介绍用于x16测试的RF开关配置。这些开关型号最多支持18条通道（PCIe最大通常为x16），也可支持更低的通道数···
为什么紫外线固化对于高质量电子产品至关重要？粘合剂粘接是电子产品制造中一个小而关键的部分。紫外线固化可提高该工艺的效率、耐用性和可靠性。
深入拆解一个Godox相机闪光灯发射器，富士专用在2024年三月份，著名的二手影像设备零售商KEH就举行了一次定期的“库存清理”活动，这次活动对其部分仓库库存提供15%的折扣。其中吸引我注意的是一个“Godox X1T-F TTL无线闪光灯触发发射器···

机器人所需要的传感器有哪些？随着机器人技术的迭代升级，传感器的重要性将持续提升，其功能性、精度和适配性也将得到显著改进，作为机器人不可
2024年墨西哥市场分析，中国品牌崛起 2024年，墨西哥汽车市场以近10%的增长率展现了强劲的复苏势头，中国品牌的崛起为市场注入了新活力，当然现在的政
2025，大众汽车集团在中国如何转型？ 2024 年，大众汽车集团（中国）在复杂多变的市场环境中成功达成销量目标，向客户交付超过 290 万辆汽车，新能源汽车领
国产射频芯片公司汇总对于射频芯片这项卡脖子技术，国内很多公司在这方面努力，而且也做出了不错的成绩。一些射频芯片公司无论从研发
拆解报告：松下电器1200W电吹风松下EH-NW90电吹风内置10万转高速无刷电机，并具备三档风速和四档风温可选。电吹风内置纳诺怡技术，为秀发提供
拆解报告：白牌电动工具电池多功能放电转换器这款白牌多功能放电转换器适配得伟电动工具电池使用，将电动工具电池和放电转换器组装起来，即可组成移动电源和
拆解报告：MOMA猛玛LARK M2无线麦克风 MOMA猛玛LARK M2无线麦克风在外观方面，采用了极富创新的设计，提供了轻盈舒适的佩戴使用体验。发射器采用了夹
阿根廷2024年：销量下滑，北汽增长240.1%。 2024年阿根廷汽车市场在整体销量下滑的背景下，依然展现出多元化的发展趋势···
2025年第3周：全球最快四足机器人发布 2025年将成为机器人产业的关键时间点，业内预期27年人形机器人出货量可达50~100万台。从技术进步到供应链成熟
欧洲2024年汽车市场：微弱复苏和电动化加速并存 2024年，欧盟新车注册量小幅增长0.8%，达到约1060万辆，欧盟+英国+北欧国家的销量为1296.4万台，同比增长0.9%，整个欧
射频微波领域有哪些高质量期刊？今天我们结合网络上的资料一起整理一份射频微波领域的期刊列表，以便同学们投稿时可以选择···
拆解报告：Portal智能屏幕24W电源适配器 Portal智能屏幕电源适配器采用黑色直板机身，外观整洁，配有2米长黑色输出线。适配器采用美规固定插脚，支持100-2

性能飞跃！升级电流传感器NSM201x-P系列赋能汽车三电和光伏逆变器纳芯微推出全新车规级集成电流路径霍尔传感器NSM201x-P系列。该系列产品是对纳芯微已量产的NSM201x系列的完
意法半导体推出STSPIN32G0新列电机驱动器，满足工业自动化和家电市意法半导体STSPIN32系列集成化电机驱动器新增八款产品，满足电动工具、家用电器、工业自动化等应用的低成本、
Melexis推出性能先进的温度传感器，以红外技术创新实现电磁炉智能全球微电子工程公司Melexis宣布，推出专为电磁炉设计的非接触式红外温度传感器芯片MLX90617···
康佳特SMARC模块更新: 全新英特尔酷睿3处理器低功耗 SMARC 模块AI 加速和图形处理性能再次提升···
康佳特针对要求苛刻的实时应用推出新型高性能COM-HPC模块基于英特尔酷睿 Bartlett Lake S处理器的模块性能全面提升···
为汽车安全保驾护航，纳芯微推出基于AMR技术的ABS轮速传感器纳芯微宣布推出全新基于AMR（各向异性磁阻技术）的轮速传感器NSM41xx系列。该系列产品通过集成先进的磁性传感敏
Microchip推出全新Switchtec™ PCIe® 4.0 16通道交换机系列 PCI100x系列器件可为任何需要加速或专用计算的应用提供高性能和成本效益···
RK3576有多强？实测三屏八摄像头轻松搞定-米尔米尔基于他们推出的MYD-LR3576开发板开发了一个3屏异显，8路摄像头输入的DEMO，实测下来，RK3576轻松搞定了该任
SynQor®推荐先进的军用级三相输入UPS（UPS-1500-S-1U-T） SynQor的三相输入UPS电源能使单相负载在电源端呈现出符合MIL-STD-1399-300B标准的清洁、表现良好且几乎零反
村田开发超小尺寸、超低功耗的Type 2GQ GNSS模块，以匠心品质助在几年前，定位系统充斥于生活方方面面的情节还仅见于各式的科幻影片，而今具备这一功能的产品已经以各种形态步
瑞萨推出性能卓越的新型MOSFET 瑞萨全新晶圆技术可以帮助MOSFET实现导通电阻降低30%、栅漏电荷减少40%、封装尺寸缩小50%的目标···
加特兰集成 Cadence Tensilica ConnX 220 DSP 全面升级汽 ConnX 220 DSP 集成至基于下一代 Andes SoC 的加特兰雷达解决方案后，将带来显著优势，包括提高灵活性、

热门评论
最新评论

换一换

杂志声明

采用全球最大AI芯片，Lassen超算系统集成Cerebras 1.2万亿晶体管

超算Lassen

简单粗暴的产品逻辑

除了贵，都挺好的

二代产品晶体管数翻倍