广告

采用全球最大AI芯片,Lassen超算系统集成Cerebras 1.2万亿晶体管

2020-08-21 10:26:32 阅读:
劳伦斯利弗莫尔国家实验室(Lawrence Livermore National Laboratory,LLNL)今天表示,已经将美国国家核安全局(National Nuclear Security Administration)的Lassen超级计算机与1.2万亿芯片进行了集成。

劳伦斯·利弗莫尔国家实验室(LLNL)和AI公司Cerebras Systems今天宣布,将1.2万亿塞雷布拉斯的晶圆级引擎(WSE)芯片集成到国家核安全局(NNSA)的23 petaflop拉森超级计算机中。拉森的仿真能力与Cerebras的机器学习计算系统,以及容纳该芯片的CS-1加速器系统的结合,使LLNL“成为第一家将AI平台与大型超级计算机集成在一起并创建全新类型的架构"。Lq3ednc

超算Lassen

Lq3ednc

此次集成意味着Lassen系统(如图所示)成为全球第一台将人工智能技术与高性能计算建模和仿真功能相结合的超级计算机。Lq3ednc

劳伦斯利弗莫尔国家实验室表示,该系统旨在实现所谓的“认知模拟”,让研究人员可以研究用于预测建模的创新方法。该计划有几个目标,包括协助在美国国家点火设施进行融合内爆实验、材料科学、以及通过“医学治疗研发计划”快速开发用于治疗新冠病毒和癌症的新药。Lq3ednc

Lassen超级计算机是目前全球排名第14的超级计算机,每秒浮点运算性能超过23 petaflops。劳伦斯利弗莫尔国家实验室表示,该系统已经集成了Cerebras Systems的CS-1加速器硬件系统,后者基于Wafer Scale Engine专用AI芯片,尺寸是标准数据中心GPU的57倍,封装了1.2万亿多个晶体管。Lq3ednc

Lq3ednc

去年Cerebras宣布,配置了40万个处理核心的WSE芯片已经针对AI工作负载进行了优化,配备18 GB高速板载内存。Lq3ednc

该项目得到了美国国家核安全局(NNSA)的高级仿真和计算计划的资助,在该计划下,这款增强的系统将在未来十年内用于加速美国能源部和美国国家安全任务的一系列应用。Lq3ednc

劳伦斯利弗莫尔国家实验室首席技术官Bronis R. de Supinski表示,该计划是在对计算提出了更高需求的情况下孕育而生的。由于计算需求已经远远超过了摩尔定律(根据摩尔定律,芯片上的晶体管密度每两年翻一番),因此已经无法通过常规手段提升计算性能了。Lq3ednc

他说:“认知仿真是一种可以推动容量呈现指数级持续提升的方法,而像Cerebras CS-1这样系统级的异构方法,是实现这一提升的一个重要组成部分。”Lq3ednc

研究人员通过这种方法探索一种所谓“异构性”的新概念,在这个概念下,超级计算机的不同元素负责某个特定工作负载的不同方面。根据De Supinski的说法,这样就可以运行数据生成和纠错之类的操作,从而为各种科学问题提供了一种更高效、更具成本效益的解决方案。Lq3ednc

劳伦斯利弗莫尔国家实验室计算机科学家Ian Karlin表示:“异构的系统让我们能够确定,我们所使用的应用,其不同组成部分是可以同时执行各种任务的。对于我们的认知模拟工作负载来说,我们将在Cerebras硬件上运行机器学习负载,在GPU上运行高性能计算模拟负载,从而缩短了生成解决方案的时间。”Lq3ednc

这意味着,研究人员可以跳过工作流程中很多不必要的处理,加速深度学习神经网络,最大程度上减少了将某些问题“切片和切成小块”的需要。Lq3ednc

劳伦斯利弗莫尔国家实验室计算机科学家Brian Van Essen表示:“我们可以在更短的计算时间内进行科学探索,也可以在科学不确定性更高的领域进行更深入的研究,在有了更多计算时间的同时,得到更好的答案。”Lq3ednc

Van Essen正在领导一个研究小组,该小组选择在CS-1系统上运行两种AI模型,初步工作重点是从多达50亿张模拟激光内爆图像中进行学习,优化用于国家点火装置实验的聚变目标,最终实现高能量输出,以及更强大的核武器储备管理应用聚变内爆。Lq3ednc

与此同时,劳伦斯利弗莫尔国家实验室和Cerebras将合作建立一个人工智能卓越中心(Artificial Intelligence Center of Excellence),旨在确定认知模拟的最佳参数,这项研究可能会促使劳伦斯利弗莫尔国家实验室向Lassen及其他超级计算机平台中配置更多的CS-1。Lq3ednc

作为该中心的负责人,Van Essen表示:“我是一名受过培训的计算机架构师,因此有机会构建这样的系统,并成为大规模部署这些系统的第一人,令人非常兴奋。将其集成并耦合到像Lassen这样的系统中,给我们提供了一个独有的机会,让我们能够率先去探索这种框架。”Lq3ednc

简单粗暴的产品逻辑

去年EDN电子技术设计姐妹媒体《电子工程专辑》也报道指出,开发出 WSE 系列 AI 芯片的 Cerebras Systems 是一家2016年才成立的新创 AI 芯片公司。公司资历不长,但是却经历了三轮融资,分别是2016年5月份的2700万美元的A轮融资,2017年1月2500万美元的B轮融资,随后不到一年时间里,Cerebras Systems再次融资6000万美元,彼时估值达到8.6亿美元。Lq3ednc

因为人工智能产业也恰巧在那个时候开始盛行,Cerebras Systems也因此被许多人看好。而这家公司发展产品的逻辑不同于其他AI芯片公司,就是奉行一个路子:“简单,粗暴”。为了满足 AI 计算的高性能需求,放弃其他厂商芯片越小越好的思维,以尽可能生产大面积芯片为主。由于面积越大的芯片,其中能整合越多的核心与晶体管,其相对计算效能也越强,但同时也提升了生产成本。Lq3ednc

2019 年 11 月份,该公司正式推出了 WSE 系列芯片的第一代,采用台积电 16 纳米工艺,并以整个 12 吋晶圆来打造一个庞大的 AI 芯片。所以,WSE 系列芯片的第一代就整合了40 万个 AI 核心,1.2 万亿个晶体管,面积也高达 4.6 万平方毫米。Lq3ednc

当时其性能之强大,让其他以大著称的芯片甘拜下风。Lq3ednc

比如英伟达的GV100芯片号称最强GPU,211亿晶体管,核心面积815平方毫米,而WSE芯片晶体管数量是GV100的60倍,面积则是它的56倍多。WSE与当时的CPU芯片相比同样震撼,AMD 64核EPYC二代处理器才320亿晶体管,封装总面积也不过4410平方毫米,光是核心面积WSE就是EPYC二代处理器的10倍有余。Lq3ednc

从性能上来看,WES芯片带宽超过100Pb/s,一般的计算芯片以Tb/s级别的单位都难以跟起比较。Lq3ednc

除了贵,都挺好的

在关于WSE介绍的白皮书中,有这么一句话——“通过加速人工智能计算,WSE清除了阻碍人工智能进步的最大路障——时间。将训练时间从几个月缩减为几分钟,从几周减少到几秒。让深度学习实践者更快的验证自己的假设,从而不用去担心一些体系机构导致无法测试或者太大风险。WSE降低了好奇心的成本,加速了人工智能新思想和新技术的到来。”Lq3ednc

虽然 堪称芯片工艺史上的一大“奇迹”的WSE 芯片第一代之后被顺利生产出来,但是其造价不斐,可以想见的是会采购的单位或企业更是少之又少。最后,还是美国劳伦斯利福摩尔国家实验室(LLNL)把WSE集成到美国国家核安全管理局的拉森超级计算机中,再由美国政府旗下的美国国家科学基金会(NSF)出手相助,购买了两套以 WSE芯片为主的超级计算机CS-1,总价约 500 万美元。Lq3ednc

Lq3ednc

第一代的WSE(有一套电力传输和冷却系统)Lq3ednc

从整机价格推算,每片 WSE芯片的价格约为 200 万美元(约合人民币1384万元),Cerebras创始人兼CEO 安德鲁 · 费尔德曼(Andrew Feldman)也曾透露称这种巨无霸芯片及系统的售价在几百万美元级别。Lq3ednc

Cerebras Systems公司透露,这款WSE芯片,他们已经接到了十几片的订单。Lq3ednc

Lq3ednc

Cerebras Systems的联合创始人兼首席执行官安德鲁 · 费尔德曼(Andrew Feldman)Lq3ednc

二代产品晶体管数翻倍

WSE 系列芯片第一代采用的是台积电 16 纳米工艺,现在新一代产品也问世。在日前举办的年度半导体盛会Hot Chips 2020 大会上,WSE2 AI 芯片正式发布。该公司表示,已经在实验室中运行了新款芯片。Lq3ednc

虽然具体细节还没公布,但受到晶圆尺寸的限制,会与第一代采用相同的芯片面积。但是因为采用了新一代的台积电 7 纳米工艺,AI 核心数翻倍成长到了 85 万个,而晶体管数量更是一口气增加至 2.6 万亿个,相比之前的规格增加了一倍有余,相信价格也会随之提高。Lq3ednc

Lq3ednc

此外,预计该公司还将增加芯片内置的内存容量并加强芯片互连速率,以提高芯片内数据传输的带宽。去年的第一代芯片具有9PB/s的内存带宽,并且这样一个芯片的TDP为15KW。Lq3ednc

目前 7 纳米工艺的最大芯片是英伟达(NVIDIA) 的 GA100 GPU,芯片面积达到 826 平方毫米,拥有 540 亿个晶体管。比较之下,Cerebras Systems 新发布的 WSE2 AI 芯片无论从晶体管数,还是芯片面积都是庞然大物,预计售价也会非常高昂。Lq3ednc

Lq3ednc

WSE芯片尺寸达到了46225平方毫米,比最大的GPU核心要大56倍Lq3ednc

晶圆级晶片除了像Cerebras这样制作计算芯片的应用外,也有应用于存储方面的研究。铠侠(前东芝存储)正在进行的新研究就是——通过跳过传统闪存和SSD制造方法过程中所有切割,组装,封装等操作,直接生产晶圆级的SSD ,这样可以极大地降低制造成本和交货时间,并且得到高性能的大量数据存储解决方案。Lq3ednc

不过虽然铠侠提出了“晶圆级固态硬盘”的概念,但是还处在早期开发阶段,距离实际上市和应用还很早。目前受瞩目的晶圆级晶片还是Cerebras WSE,而关于第二代Cerebras WSE的更多信息,还是得到该公司宣布最终产品时才能知道。Lq3ednc

 Lq3ednc

本文综合自Technews、超能网、电子工程专辑Lq3ednc

责编:ChalleyLq3ednc

  • Van Essen正在领导一个研究小组,该小组选择在CS-1系统上运行两种AI模型,初步工作重点是从多达50亿张模拟激光内爆图像中进行学习,优化用于国家点火装置实验的聚变目标,最终实现高能量输出,以及更强大的核武器储备管理应用聚变内爆。

    除了贵,都挺好的
    在关于WSE介绍的白皮书中,有这么一句话——“通过加速人工智能计算,WSE清除了阻碍人工智能进步的最大路障——时间。将训练时间从几个月缩减为几分钟,从几周减少到几秒。让深度学习实践者更快的验证自己的假设,从而不用去担心一些体系机构导致无法测试或者太大风险。WSE降低了好奇心的成本,加速了人工智能新思想和新技术的到来。”
    虽然 堪称芯片工艺史上的一大“奇迹”的WSE 芯片第一代之后被顺利生产出来,但是其造价不斐,可以想见的是会采购的单位或企业更是少之又少。最后,还是美国劳伦斯利福摩尔国家实验室(LLNL)把WSE集成到美国国家核安全管理局的拉森超级计算机中,再由美国政府旗下的美国国家科学基金会(NSF)(美国科学家都是国家发工资吗?)出手相助,购买了两套以 WSE芯片为主的超级计算机CS-1,总价约 500 万美元。

    这是简单,粗暴吗?
    个人觉得是简单,科学
  • 想问一下,国内非美国技术的芯片,可以做到多少纳米。手机是否也可以这样设计,整个手机主板作为基板,把手机所有的功能都集成在一起,不要分成不同的芯片。整个手机主板就是一个大大的IC。
  • 微信扫一扫
    一键转发
  • 最前沿的电子设计资讯
    请关注“电子技术设计微信公众号”
广告
热门推荐
广告
广告
广告
EE直播间
在线研讨会
广告
面包芯语
广告
向右滑动:上一篇 向左滑动:下一篇 我知道了