Cerebras美国时间2021年4月20日推出了其基于台积电7nm的第二代产品Wafer Scale Engine,其内核数量增加了2倍多。
这款芯片如下图模特手中所示,尺寸是46225平方毫米,即462.25平方厘米——这和他们的一代产品一样大。EDN小编猜测在不违反广告法的情况下,它的裸片绝对是世界上尺寸最大的单颗裸片,因为12英寸的晶圆能做出来的做大的芯片就是这么大了。曾有人惊呼:“WSE 的晶体管数量已经超过人类大脑中的神经元了!”
新处理器是基于台积电(TSMC)的N7工艺打造的。这使得逻辑可以按比例缩小,并在一定程度上缩小了SRAM,现在新芯片上具有850,000个AI内核。
最值得注意的是,Cerebras还能够保持其系统的功耗不变(23 kW),同时增加了相当多的内存和结构带宽。
在表一中,EDN对比了两代芯片的参数性能。
EDN | Engine Gen1 | Engine Gen2 | 增加 |
AI核数量 | 400,000 | 850,000 | 2.13倍 |
制造业 | 台积电16nm | 台积电7nm | -- |
推出日期 | 2019年八月 | 2021年第三季度 | -- |
裸片尺寸 | 46225毫米2 | 46225毫米2 | -- |
晶体管 | 12000亿 | 26000亿 | 2.17倍 |
(密度) | 25.96 mTr/mm2 | 56.246 mTr/mm2 | 2.17倍 |
板上SRAM | 18 GB | 40 GB | 2.22倍 |
存储带宽 | 9 PB /秒 | 20 PB /秒 | 2.22倍 |
Fabric Bandwidth | 100 Pb /秒 | 220 Pb /秒 | 2.22倍 |
成本 | 200万美元以上 | 未知 | ‽ |
WSE的出现,是因为训练神经网络需要花费较多的时间,大型网络则需要数周。其中最大的瓶颈,是数据必须在处理器和外部 DRAM 存储器之间进行多次传输,既浪费时间又消耗能源。所以WSE研发团队的初衷是扩大芯片,使它与 AI 处理器内核一起容纳所需的所有数据。
Cerebras的第一代WSE作为CS-1的完整系统的一部分一起打包出售,该公司有数十个已部署并运行了已部署系统的客户,其中包括许多研究实验室,制药公司,生物技术研究,军事以及石油和天然气行业。天然气工业。
Lawrence Livermore将一台CS-1与其23 PFLOP“拉森”超级计算机配对。匹兹堡超级计算机中心以500万美元的价格购买了两个系统,并将这些系统连接到他们的Neocortex超级计算机上,以实现同步AI和增强的计算能力。
在Hot Chips 2020,该公司首席硬件架构师Sean Lie表示,Cerebras对客户的主要好处之一是能够简化工作负载,以前需要使用GPU / TPU机架,而是可以以计算相关的方式在单个WSE上运行。
Cerebras在多伦多,圣地亚哥,东京和旧金山拥有约300名员工。该公司首席执行官Andrew Feldman表示公司已经实现了盈利,已经部署了CS-1的客户很多,且已有更多的客户在远程试用CS-2。
CS-2的部署将于今年第三季度进行,价格已从2-3百万美元升至“数百万”美元。