美军一直致力于军队的信息化、数字化、智能化建设,并引领着军事装备向智能化方向发展。未来战争也必将是以智能化装备为主的高科技战争,从而大大增加了人工智能技术对更高阶处理能力的需求。
因此,集成度高、制程工艺先进,兼具更高性能与更低功耗,且更为安全的芯片已然成为美军的研究重点。
本文从国防系统定制ASIC微芯片、TrueNorth仿人脑芯片、碳基纳米3D芯片以及DNN芯片系统的研究情况入手,对美军工领域先进芯片研究的新进展进行了梳理。
2021年3月,英特尔公司宣称,将与美国国防部高级研究计划局(DARPA)共同实施“自动实现应用程序的结构化阵列硬件”(SAHARA)计划,研发并生产用于美国国防系统的定制安全微芯片(ASIC),项目周期约三年。
美国军方严重依赖现场可编程门阵列(FPGA),早在2017年DARPA已经提出将开发兼具更高性能与更低功耗的特制ASIC作为突破摩尔定律的方法之一,并将其作为满足美军对更高阶处理能力需求的对策之一。
此次所提出的SAHARA计划的目标在于与美国佛罗里达州、马里兰州和得克萨斯州农工大学合作,将与国防相关的FPGA设计自动且可扩展地转换为可量化安全的结构化专用集成电路,即定制化ASIC,同时将安全对策技术集成于其设计流程之中,以支持在零信任环境中的最终制造,实现将设计时间减少60%,工程成本减少10倍,功耗减少50%。
在项目的第一阶段,英特尔公司将开发构建该芯片的硬件和必要的软件,同时还将开展有关FHE的学术研究项目,旨在解决FHE技术开发需要大量计算能力的难题,并开发针对FHE进行优化的专用集成电路,将处理时间缩短达10万倍。
在项目的后期阶段,微软公司将与美国政府将共同测试英特尔公司所研发的芯片,将芯片整合到Azure云服务中,对其性能以及安全性进行严格的测试与验证。并由微软公司制定有关FHE的国际标准,以为该安全微芯片的技术最终实现商业化做准备。
未来,英特尔将在其10纳米工艺上建立结构化ASIC的国内制造能力,利用先进的接口总线管芯到管芯互连和嵌入式多管芯互连桥封装技术进行芯片制造,以将多个异构管芯集成到单个封装中;将在亚利桑那州与俄勒冈州的工厂为美国军方开发芯片原型,以将来自不同供应商的芯片进行集成封装,实现将更多功能集成到更小芯片中,并降低其能耗。
综上可知,SAHARA计划所致力于开发的结构化ASIC与方法,以及先进封装技术,将大大推进美国国防部更快、更经济地开发与部署对国防部现代化优先级至关重要的先进微电子系统的进程。
TrueNorth最早始于DARPA的自适应可塑可伸缩电子神经系统(Systems of Neuromorphic Adaptive Plastic Scalable Electronics,SyNapse)项目的最新成果。在2014年,美国空军研究实验室(ARFL)又授予IBM有关仿人脑芯片TrueNorth的研发合同。
IBM的研发人员基于神经科学、超级计算,采用全新的计算机架构与新的编程语言、算法和应用程序,历经约六年时间研发出了TrueNorth仿人脑芯片,并由此重新定义了包括体系架构、运行效率、可扩展性和芯片设计等在内的仿人脑技术。
与现阶段计算机所遵循的冯诺依曼架构不同,TrueNorth芯片模仿了人类大脑的神经元结构,拥有约54亿个晶体管,4平方厘米大小的芯片上具有100万个“神经元”基本单元,并通过2.56亿个“突触”进行通信,因此能够在快速、准确分类的同时保持超低功耗。
与早期神经网络芯片相比,True North神经形态芯片集计算、通信和存储于一体,计算效率更加优异,具有并行、分布式、模块化、可扩展性、可容错的灵活架构,更适合于深度学习。在此将IBM的TrueNorth芯片与传统计算机芯片的性能特点进行对比,如下表所示。
图表:TrueNorth芯片与传统计算机芯片的性能对比(资料来源:调研整理)
IBM的超级计算机Watson由于TrueNorth的加入而更具智能化性能。在未来,TrueNorth将有望用于超级计算机与云计算网络等。由于TrueNorth作为仿人脑芯片,在应对复杂问题时更为高效,因此美国空军计划未来利用TrueNorth在资源及空间匮乏的地区部署先进的机器视觉,从而提高对一些复杂问题的处理效率。而IBM的下一个研究目标则将通过建立一个改进的、缩小版的芯片的二维阵列,将芯片系统扩展到更多数量的神经元与突触。
ARFL早在于2017年1月就针对安装了IBM“神经形态仿人脑芯片”(TrueNorth)芯片的计算机与高性能Nvidia计算机Jetson Tx-1进行了竞赛测试,以提升汽车和机器人等的机器学习能力。二者利用不同的神经网络图像处理软件,在来自MSTAR公共数据库的由雷达生成的航空影像中均成功甄别出了10类军用车辆与民用车辆,精度约为95%,其中被甄别的目标中还包括俄罗斯T-72坦克。但IBM的TrueNorth芯片效率更高,功耗却仅为Nvidia芯片的二十到三十分之一。
TrueNorth芯片阵列
在此次测试之后,AFRL于2017年6月授予IBM公司的Carothers团队130万美元用于以True North作为神经形态处理器的基础,测试大规模集群配置,设计未来的百万兆级的系统,以及测试神经形态处理器在大规模的机器上作为协同处理器管理一些系统元素、预测组件故障的能力。其研究核心在于增加新的机器学习算法,通过大量的设备传感器跟踪潜在的神经形态处理器系统的组件问题,并研究学习故障发生的原因等。
ARFL与IBM于2021年3月宣称,将利用IBM的TrueNorth神经形态芯片设计64芯片阵列,打造仿人脑超级电脑系统,使其具有6400万个神经元和160亿个突触,不仅具备优异的进阶辨识与感知处理能力,还将具有优于传统晶片的处理效能,功率仅为10W。届时具有可扩展性的超级电脑系统将为AFRL提供一个端到端的软件生态系统,能够优化机器学习模型的效能,用于支持深度神经网络学习和信息发现。
此外,尽管目前该芯片技术的大规模计算应用仍在开发中,但其能够有效且实时地将多个分布式传感器的图像、视频、音频和文本等数据转换为符号,因此ARFL还计划利用TrueNorth所打造的超大规模电脑系统,结合该超级电脑系统的右脑感知能力以及传统超级电脑的左脑符号处理能力,实现数据并行性(多源数据可以针对相同的神经网络并行运行),以及模型并行性(独立的神经网络形成一个整体,可以在相同的数据上并行运行)。
加之,由于各种机器人、无人机和其他设备的大小、重量与功率限制,将TrueNorth芯片用于实现新的计算能力,并将所研发的超级电脑系统高效地应用于嵌入式、行动装置、自动化装置等程式上,对于美国空军能够保持在该领域的优越的技术优势将大有裨益。
硅基CMOS技术即将达到5纳米技术节点,芯片的性能提升已经接近其物理极限。在为数不多的几种可能的替代材料中,碳基纳米材料(尤其碳纳米管和石墨烯)由于相较于硅基器件具有更快的速度和更低的功耗,室温下电子和空穴具有极高的本征迁移率(大于100000cm2/(V•s)),超出了最好的半导体材料,而被公认为是最有希望替代硅的材料。因此,基于碳基纳米材料的芯片研究近年来备受各国重视,尤其美国在该领域的研究极具代表性。
其中,“三维单片系统芯片”(3DSoC)项目作为美国国防高级研究计划局(DARPA)“电子复兴计划”(ERI)的核心之一,已经在基于碳基纳米材料的3D芯片研究方面取得了很大进展。该项目始于2018年,总体目标在于利用3年半年时间开发出3D单片集成技术,实现逻辑、存储和输入/输出等组成单元的有效封装,使得以90nm生产的3D芯片的性能可与7纳米2D CMOS技术相媲美,甚至有望实现数量级的突破,同时功耗性能提升超过50倍。
作为入围3DSoC项目的两所高校之一,麻省理工学院(MIT)在近几年来针对碳基纳米材料3D芯片技术开展了诸多研究,其超大规模全纳米微处理器芯片以及基于碳纳米管与存储器集成堆叠的3D芯片技术极具前沿性。
超大规模全纳米管微处理器芯片
美国麻省理工学院于2019年8月宣称,已经制造出世界首个超大规模全碳纳米管互补性金属氧化物半导体(CMOS)微处理器芯片。
该芯片是基于多层垂直堆叠结构,由1.4万个碳纳米管构成的16位微处理器RV16X-NANO(基于RISC-V指令集,在16位数据和地址上运行标准的32位指令),能够与商用微处理器处理相同的任务,可以运行“Hello World”程序,由此证明了完全由碳纳米管场效应晶体管(CNFET)打造超越硅的微处理器的可能性。
RV16X-NANO微处理器
采用全新的碳纳米管芯片制造技术,是该项研究的最大亮点之一。这源于通常先进的集成电路要求碳纳米管的纯度需高达99.999999%,但目前的技术根本无法达到,而麻省理工学院所提出的创新型技术工艺则能够将纯度要求降低4个数量级,仅采用纯度为99.99%的碳纳米管制备的芯片即能成功实现高性能与低能耗。
以降低杂质的影响为主导思路,采用选择性机械剥离技术,可将CNT聚集体缺陷密度降低250倍以上,以解决芯片制造缺陷与质量一致性的问题;
采用静电杂合金属接口工程技术(MIXED)结合了金属接触功函数工程和静电掺杂,可实现稳健的晶圆级CNFET CMOS工艺;
采用对抗金属性的碳纳米管技术(DREAM),通过电路设计完全克服金属碳纳米管的存在所导致的问题。
麻省理工学院通过选择性机械剥离、静电杂合金属接口工程技术等多项创新性技术,实现了无需拘泥于攻克碳纳米管的纯度难关,而制造芯片的新思路。据称该新工艺不仅简单可行,还能够与主流硅基CMOS技术完全兼容,有助于实现实用化全碳纳米管CMOS微处理器的批量生产。
基于碳纳米管与存储器集成堆叠的3D芯片技术
麻省理工学院与斯坦福大学在利用碳基纳米材料制造芯片方面已经开展了诸多研究,在3DSoC项目立项之前,麻省理工学院与斯坦福大学的计算机科学家与电气工程师团队,就已经于2017年基于碳纳米管(CNT)共同开发了一款3D计算芯片,其架构为现阶段的硅基技术所无法实现。
研究团队通过超过100万个电阻式随机存取存储器(RRAM)单元与200万个由二维石墨烯片组成的碳纳米管场效应晶体管的垂直重合,构建了3D碳纳米管混合信号集成电路;
基于碳纳米管的3D芯片结构示意图
实现高达几十纳米的互联密度,CNT逻辑单元比硅基逻辑单元节能十几倍,且能量效率和运行速度提高了1000倍;
该型芯片的设计/制造与当前硅基结构均可兼容。
该研究团队还基于3D芯片制造了一台小规模CNT计算机,能够实现运行程序、简单的多任务操作系统以及执行MIPS指令。
在此之后,在3DSoC项目的支持下,麻省理工学院Max Shulaker团队进一步围绕碳纳米管开展了3D芯片的相关研究,相关进展如下表所示。
图表:麻省理工学院3D芯片的研究进展(资料来源:调研整理)
通过上述对麻省理工学院与斯坦福大学在碳纳米管3D芯片方面的研究情况梳理可知,
美国斯坦福大学与麻省理工学院合作研发了的CNT 3D逻辑单元,不仅在节能方面优于硅基逻辑单元十几倍,能量效率和运行速度也提高了1000倍,在设计与制造方面与当前硅基结构均可兼容;
基于麻省理工学院实验室研究成果,将基于CNFET的3DSoC技术转移到SkyWater公司的200毫米生产设施中,实现了由代工厂在200毫米晶圆上大量制造CNFETs,已经初步完成了3DSoC项目的第一阶段,将进一步推进CNFETs的商业化与实用化进程;
与传统的2D芯片相比,麻省理工大学的3D芯片技术,采用全新的计算架构,将多层CMOS逻辑与非易失性存储器采用垂直连接的方式进行堆叠,使得逻辑电路与存储器紧密相连,由此所实现的封装密集性将比其它任何3D技术高出几个数量级。
由此可知,3DSoC项目的第一阶段已经初步完成。然而,尽管麻省理工学院所研究的3D芯片架构技术具有用于替代脑启发系统与深层神经网络等基于学习的计算模式的潜力,但所研发的计算机芯片,仅仅进行了制造工艺的演示,所制备的碳纳米管晶体管的栅极长度仅为130nm,仅与2001年代的芯片工艺水平相当,新工艺也只实现了45CNT/μm的碳纳米管密度,仍然明显低于业界所提出的200CNT/μm的最佳密度值,距离进入实用阶段尚需时日。
据美国Skywater公司与麻省理工学院于2020年8月宣称,3DSoC项目已经进入第二阶段,将专注于提高制造质量、产量、性能和密度,从而具备商业可行性。
美国麻省理工学院在200mm晶圆上沉积碳纳米管场效应晶体管制成的工艺
DARPA意图通过3DSoC项目推动设计相关研究过程、工具和新计算架构的发展,并加速实现人工智能与先进计算在自主车辆、医疗/保健诊断、边缘计算、可穿戴设备和物联网领域的应用;希望能够于2021~2022年,成功生产具有5000万逻辑门电路、4G字节非易失性存储器、每平方毫米存在900万个互联通道的芯片。届时,互联通道之间的传输速度能达到每秒50太比特,每比特的功率消耗小于两个皮焦耳。
然而,麻省理工学院目前所研究的芯片尚且无法达到该目标,但将实验室3D芯片技术转化为可在美国商业晶圆厂中实施的技术已经表明美国在该领域的技术水平。
据2021年1月报道称,美国斯坦福大学计算机科学家Mary wooters与电气工程师Philip Wong等所组成的研究团队利用八块高效混合芯片设计了一个DNN推理系统,能够更高效地运行人工智能任务,并实现低能耗,所实现的能量和执行时间分别为不包含片外存储器的理想单片芯片的3.5%和2.5%。该项研究是美国“电子复兴计划”(ERI)的一部分,据称有可能于未来三到五年内投入使用。
该项工作建立在研究小组之前开发的新存储技术——RRAM的基础上,该技术可在断电的情况下存储数据,与闪存相似,但速度更快且能源效率更高。
用于深度神经网络(DNN)推理的硬件经常受到片上内存不足的困扰,因此需要访问单独的内存芯片,由此大大增加了能量与执行时间方面的成本,而片上存储器中安装整个DNNs是一个挑战,尤其体现在技术的物理尺寸限制方面。因此,该项研究正在致力于攻克难点,基于网络计算芯片构建DNN推理系统。
斯坦福大学的研究团队还在法国CEA-Leti实验室与新加坡南洋理工大学合作方的帮助下建造并测试了该DNN推理系统的原型。据称,八芯片系统仅仅是该团队研究的初始目标,该团队已经在模拟中将该系统扩展为64芯片系统,并展示了使用64块混合芯片的系统运行人工智能应用程序的速度,达到目前处理器的七倍,消耗的能量仅为目前处理器的七分之一。
此外,该研究团队还开发了新的算法,重新编译为当今处理器编写的现有人工智能程序,以便在新的多芯片系统上运行,并对人工智能程序进行了测试,未来该研究团队将针对提高单个混合芯片的处理和存储能力开展进一步的研究,并将演示低成本的批量生产能力。
国防系统定制ASIC微芯片、TrueNorth仿人脑芯片、碳基纳米3D芯片以及DNN芯片系统的研究理念与技术水平揭示了现阶段美军工领域先进芯片研究的重点与方向所在。即,美军正致力于将现有的FPGA自动转换为美军国防系统所需的定制化ASIC芯片;研发集计算、通信和存储于一体的True North神经形态芯片,并构建基于64芯片阵列的仿人脑超级电脑系统,构建端到端的软件生态系统,以优化机器学习模型的效能,用于支持深度神经网络学习和信息发现等;基于碳基纳米材料,研发比硅基逻辑单元更为节能,能量效率与运行速度更高的碳纳米管3D芯片,且实现设计和制造方面与当前硅基结构均可兼容,以加快实用化进程;基于网络计算芯片,进一步构建64芯片DNN推理系统,以大幅提高其运行人工智能应用程序的速度。
主要参考文献
(文章来源于微信公众号高端装备产业研究中心 ,作者太阳谷)
责编:Demi