在人工智能、云计算和大数据等前沿技术的驱动下,不论是普通消费者还是企业级客户,对于存储的需求是愈加强烈。而传统存储技术相对滞后的发展速度显然已经很难满足现实的需求,市场急需新一代存储技术的出现。
近日,专注于ReRAM技术的Crossbar公司宣布与中芯国际合作开发的40nm工艺的ReRAM(非易失性阻变式存储器)芯片正式出样,而更为先进的28nm工艺的ReRAM芯片也将在今年上半年问世。这意味着在存储领域即将迎来一场变革。
随着电子产品的愈加智能化,为了更快速的处理通信协议、身份认证、消息生成和数据累计等任务,应用程序的底层代码也是越写越长,从以前的几千字节发展到现如今的几兆字节。这也就自然而然地导致当前的存储手段已无法满足新一代技术对存储容量和存储性能的要求。
反观当前的闪存技术,信息的存储是基于电荷密度,丢失几个电子会导致严重的可靠性问题,一旦芯片尺寸低于25nm,闪存技术的耐久性、维持性和可靠性就会出现严重的不确定性。每当有新的单片机和晶片系统需要被设计时,设计人员在做结构设计时必须考虑到存储器容量、架构和集成等相关问题。但这种努力并非是一劳永逸,另一批系统架构师仍旧需要重新研究嵌入式存储模块与逻辑处理单元集成的方式。
根据分析公司Web-FeetResearch的预测,到2018年,消费类电子产品的存储器市场将达到28.8亿美元,庞大的需求已经迫使这个问题必须得到解决了!
改良性的解决方案是数据存储系统使用高端的存储控制芯片来管理复杂的架构和算法,例如,清华紫光就已经投入了数百亿美元到NAND、DRAM等存储器的开发之中,预计在明年将会推出国产3D NAND闪存,但无论是NAND还是DRAM都属于是当前水平的技术,而且在这些领域,中国与世界先进水平相比也已经落后了20多年,所以要想实现逆转,还是要寄希望于下一代存储技术上。
当前在下一代存储芯片的研发当中,除了Intel、镁光基于PCM相变存储技术研发的3DXPoint芯片之外,最知名的恐怕就是ReRAM芯片了。作为开发ReRAM最具代表性的企业,成立于2010年的Crossbar的实力也不可小觑,它的首席科学家和联合创始人卢伟(Dr. Wei D. Lu)博士在ReRAM领域有十二年的研究经验。自然这家公司的一举一动都会引起业界的广泛关注。为了进军中国市场,在2016年3月,Crossbar与中芯国际达成合作,基于中芯国际的40nm CMOS试产ReRAM芯片,而如今总算是成为现实。
据悉,这种芯片比上一代的NAND芯片性能更强,密度比DRAM内存高40倍,读取速度快100倍,写入速度快1000倍,耐久度高1000倍,200平方毫米左右的单芯片即可实现TB级存储,还具备结构简单、易于制造等优点。
在当今存储的所有数据中,有90%是在过去两年内生成的。数据生成及对数据的快速访问已经成为现代用户体验不可或缺的一部分,这也将在可预见的未来继续推动存储需求的迅猛增长。然而,当目前的平面NAND闪存被一步缩小光学尺寸时,就会达到物理和工程极限。而象Crossbar的ReRAM这样的下一代非易失性阻变式存储器,就不会有这些限制,它将可以提供高性能、大容量的新型存储器。
ReRAM代表电阻式RAM,是将DRAM的读写速度与SSD的非易失性结合于一身的新一代存储技术。换句话说,即便是在电源关闭的情况下存储器仍能记住数据。如果ReRAM有足够大的空间,一台配备ReRAM的计算机将几乎不再需要载入时间。这使得ReRAM在下一代众多高扩展性、高容量、高性能和高可靠性存储解决方案中最被看好。
一个典型的ReRAM单元具有一个转换材料,介于具有不同的电阻特性的两个金属电极之间。ReRAM的转换效应基于在电场或热力影响下的离子的运动以及转换材料存储离子的能力,而这反过来又会影响电阻测量的精度。
在众多不同的ReRAM实现方法中,它们采用不同的转换材料和内存单元结构。不同的材料所具有的不同特性也会导致显著的性能差异。ReRAM技术最大的难题在于克服温度灵敏度、与标准CMOS技术和制造工艺的整合以及每一个ReRAM单元的选择机制。
ReRAM已经成为大家竞相看好的项目,一些公司声称会在未来的1-2年实现ReRAM芯片的样片生产。
CrossbarReRAM技术的存储介质是包裹绝缘性非晶硅(a-Si)的金属丝。其基于电子场的转换机制使得Crossbar ReRAM单元能够在较广的温度范围内稳定工作。
CrossbarReRAM的单元结构简单,所采用的材料、工艺步骤和制造工具都是通用的,这使得任何一家半导体代工厂都能够通过得到Crossbar ReRAM技术授权的方式来开展内存业务,制造存储级内存芯片。
ReRAM内存的性能和比特/尺寸密度取决于内存单元的内联方式。嵌入式低延滞、高速内存可以通过用一个晶体管对每一个内存单元进行单独控制来实现。在1T1R(每1个ReRAM单元有一个晶体管)的阵列组织结构中,内存的总体积由每一个晶体管的体积所决定。高密度存储级内存则需要有一个密度高得多的内存阵列组织架构,并以此来实现成本效益最优化,这就要求能够用一个单一的晶体管来连接成千上万的内存单元。这种1TnR组织结构只有当ReRAM单元的内置的选择机制可以单独地或者不指定地选择ReRAM单元时才有可能实现。
Crossbar ReRAM I/V曲线(1T1R和1TnR)
与传统的NAND闪存相比,CrossbarReRAM速度快的多、位元可修改并且只需要更低的电压,这使得它可以被应用于嵌入式和SSD设备之中。Crossbar ReRAM技术的多面性使得内存单元在1T1R阵列中相联时能够实现非常低延滞的内存读取,或在交点1TnR阵列中实现面积最优(4F2单元),这都要归功于Crossbar已经申请专利的内置选择技术。
CrossbarReRAM技术的易制造性已经被在代工厂制造的工作阵列所证明。这一工作芯片是将单片CMOS控制器和内存阵列芯片整合在一起。公司目前正在完成这一器件的优化,并计划将第一个产品推向嵌入式SoC市场,同时还将继续在先进的制程工艺基础上推进高密度存储级内存阵列的研发。
到目前为止,还没有一个切实可行的NAND的替代技术,而Crossbar的ReRAM则有机会把握住这一市场价值超过400亿美元的机遇。Crossbar仍在研制中的ReRAM技术已经取得了显著的商业化进展,只要保持这一优势,他们将能够搭建一个具有成本效益的、多层级的ReRAM市场,从而超越3D NAND等竞争对手。——Alan Niebel Webfeet Research创始人兼CEO
Crossbar不声不响地带来了一个极具吸引力的、全新的替代性存储器技术。他们解决方案的关键是将ReRAM内置于存储单元之中,不像其它ReRAM技术还需要一个单独的外部设备,这无疑会带来噪音等诸多问题。而这也就会显示出Crossbar方案的极大优势。——Jim Handy Objective Analysis总监
CrossbarReRAM技术基于一个简单的结构,采用CMOS工艺常用的材料以及标准的制造工艺,无需任何特别的机器设备或者材料,就可以很容易地在现有的CMOS工厂进行制造。由于Crossbar ReRAM采用了低温后段制程工艺整合,所以多层Crossbar ReRAM阵列可以被整合到CMOS逻辑晶圆之上,从而创建出3D ReRAM存储芯片。
Crossbar ReRAM单元存储介质是包裹绝缘性非晶硅(a-Si)的金属丝,这与在闪存单元里电子存储的形式有很大不同,因为哪怕是少量的电子损耗都会引发可靠性问题,所以锁定电子就变成了一个艰巨的挑战。这也是为什么闪存的性能在较小的制程工艺尺寸上会有所降低的原因。而Crossbar ReRAM在不同尺寸上都不会影响设备的性能,并且有望被用于10纳米以下的尺寸。
闪存技术的扩展
Crossbar ReRAM技术的扩展
CrossbarReRAM技术具有众多特性,可以实现多种全新的存储解决方案类别。Crossbar ReRAM单元的内置选择特性允许不同的内存阵列配置,一个晶体管可以驱动一个或者成千上万个内存单元,从而实现了针对不同目标应用的灵活设计:嵌入式代码存储的快速读取和处理器的直接执行,或者对存储数据的高密度、低延滞读取。
Crossbar ReRAM技术相较于NAND闪存能够将读取延滞降低到1/100,将写入速度提升20倍,而且还可以不受限制地对数据进行反复擦除。CrossbarReRAM技术可以以小页模式建构,可以被独立地擦除或者重新编程。通过移除无用单元回收所要求的大量后台内存读取,这种全新的存储架构大大简化了存储控制器的复杂度。该技术的写入放大率为1,从而为用户带来低的读写延滞、更低功耗以及存储解决方案更长生命周期的好处。
凭借这些突破性的性能和可靠性、超高的容量、低功耗以及针对多种存储架构的可调性,Crossbar将为消费电子、企业存储、移动计算、工业/汽车/医疗、物联网以及可穿戴设备应用带来一波新的创新。
为了在用户端维持令人满意的性能指标,固态硬盘(SSDs)存储系统设计师们不得不开发复杂的架构和算法,以应对3D MLC/TLC NAND闪存所固有的设计局限。当NAND制造商试图通过缩减设计从而降低成本时,复杂的系统在实际的用户案例中对性能产生了影响,从而导致了SSD测试基准中出现的主要的系统瓶颈问题。
NAND闪存程序运作很缓慢,并且是在大型页面的粒度上完成的。当今的MLC/TLC NAND或者3D NAND闪存需要600微秒到1毫秒来对一个8-16K字节的页面进行编程。对于典型的用户案例来说,这个速度太慢了,所以每一个程序运作必须首先被重新导向到一个位于临时位置的写入缓存,比如一个SRAM或者DRAM缓存或者一个以SLC模式配置的NAND分区。
NAND闪存在进行编程前必须进行擦除。NAND的擦除操作非常慢,需时10毫秒左右,并且在一个非常大的4-8兆模块中进行。为了克服这一重要的设计局限,可以让SSD控制器来管理逻辑到物理(L2P)映射,对原始和校正数据位置进行追踪,并使得在必须进行模块擦除操作前推迟该操作成为可能。
释放单元回收代表了数据管理的另一个附加层面,它被要求用于在存储器处于空闲模式时正确释放模块中的无用数据。当释放单元回收在模块间转移数据时,新产生的请求可能产生问题。这是一种典型的惩罚,会导致长达数秒的冗长的、不确定的延滞。
因此,对于一次SSD的写入,通常会有几次SSD控制器、NAND闪存和DRAM部件之间的后台内存操作。这被称为写入放大(WA),它可以用来衡量控制器的效率。大部分系统的WA通常在3-4之间。更高的WA数值会直接影响存储设备的可靠性和性能,因为它放大了对设备写入的次数,使得一个单元处于速度快得多的最高周期。这点在相对更小的技术尺寸上显得更为相关,在这些技术尺寸上,NAND内存单元的最高周期降至3000程序周期以下。
这些复杂的问题很大程度影响了终端用户的体验,并解释了与SSD制造商所提供的SSD规格相比较,为什么SSD基准测出的性能会有所不同。在按此写入的情况下,假如用户想从网络上下载一部高清电影到本地存储器上,或者当企业存储广泛使用SSD时,这些问题将无法掩盖NAND闪存技术固有的设计局限。
CrossbarReRAM技术无需在编程前进行擦除操作。对ReRAM的单次写入可以在很小的页面颗粒上非常快地完成。下一代针对ReRAM进行优化的SSD控制器将能够以更快的速度更新更小的页面,并大幅降低NAND所需要的后台内存操作。基于ReRAM的SSD将提供更低、更确定的读取延滞(数十微秒)。
Crossbar拥有专利的转换器设备解决了高密度ReRAM开发人员面临的最大技术挑战之一,它被称为潜泄电流(或漏电流)。Crossbar的3D ReRAM存储解决方案是基于1TnR阵列(1个晶体管驱动n个电阻式内存单元),其选择率使得让一个晶体管管理很大数量的内联的内存单元成为可能,从而实现很大容量的固态存储。在1TnR模式下,1个晶体管能够以非常低的功耗驱动超过2000个内存单元,但也会遇到潜泄电流的漏电问题,对典型ReRAM阵列的性能和可靠性产生干扰。Crossbar拥有专利的电场辅助超线性阈值转换器设备解决了这一漏电问题,它采用了一个超线性阈值层,里面有一个在阈值电压值上形成的易变性传导通路。这样的电场辅助超线性阈值设备是业内第一个能够将泄露电流抑制在0.1纳安之下的转换器,并已在一个4 Mbit整合3D堆叠式被动Crossbar阵列中成功实现。
Crossbar的转换器在2014年年底的IEDM上进行了展示,它实现了有报告以来最高的选择率(10的10次方),低于5mV/dec的极锐斜率,超过100M周期的耐久性,以及低于300摄氏度的处理温度,解决了潜泄通路问题,从而解决了潜泄通道问题,体现了商用可行性。Crossbar的转换器是第一个解决了这一设计挑战的解决方案,为在单芯片上实现TB字节级别的存储成为现实铺平了道路,从而使得ReRAM成为领先的下一代NAND内存替代品。
CrossbarReRAM技术将简化掉多个数据存储部件和SSD或者其他类似数据存储解决方案中的控制器之间的数据读写管理。减少后台内存操作的数量有助于提高数据存储设备的性能和耐久性,但也降低了SSD控制器的功耗和对DRAM的使用,以及数据存储部件在进行读写时的功耗。
在内存单元层面,CrossbarReRAM提升了编程性能和功耗效率。它实现了64pJ/cell的编程功耗,与NAND闪存相比这是20倍的提升。
CrossbarReRAM包含简单的双端器件,能够被整合到后端金属层,从而成为替代NAND闪存的完美、低成本解决方案。毫无疑问,平面MLC/TLC NAND正面临扩展性的挑战,而其性能在10 纳米尺寸也将有所减损。当20纳米级别的3D NAND开始被考虑成为平面NAND的替代品时,3D NAND技术在进入10纳米尺寸级别时将面临同样的可扩展性挑战和性能减损。
从单元角度来看,电阻式内存元件在设备面积减小时仍会产生同样的导通电流,但是关闭电流会被降低。导通电流和关闭电流的比率通常从几百到超过1000。它也改善了传感范围,使得以更少的复杂CMOS外设电路进行传感以及在更小的技术尺寸实现MLC/TLC成为可能。Crossbar ReRAM丝基电阻式内存元件能把单元尺寸扩展到10纳米以下。
有两项工艺参数非常重要——转换材料的膜厚(TSL)和转换电极的关键尺寸(CD)。这些参数通过使用当今最尖端的制造设备可以很容易地得以控制,包括当今20-40纳米尺寸晶圆代工厂中所使用的光刻、PECVD薄膜沉积、以及金属刻蚀机台。
CrossbarReRAM能够使用与制造基于CMOS的外设电路一样的整套设备,内存元件可以在低温工艺下嵌入。ReRAM单元嵌入的热预算不会对CMOS器件性能产生影响。取决于内存的种类,ReRAM层通常可以在多达16个堆栈的热预算下正常工作,而不会给器件性能带来显著的改变。3D ReRAM堆栈与3D NAND堆栈截然不同,它可以非常容易地使用后端整合来实现。
包括脸书、亚马逊、微软、谷歌、阿里巴巴、腾讯、百度等,都在产生大量的数据,包括人脸、位置、行为习惯、社交照片等。物联网已经到来,而且正在指数级的增长;自动驾驶汽车已经进入市场,云计算已经无处不在。我们刚开始想象如何借助于这些创新来开创一个人工智能的新时代,创建新的商业模式、新的生产率典范和新的大众娱乐方式,这些不仅对人类带来意义深远的影响,而且也为通过数据盈利的创新者带来巨大的财富。
收集与存储这些“大”数据是当务之急。但是,比数据有多“大”更为重要的是,如何驱动下一波的创新。在人工智能竞赛中的胜出者需要做四件事:1、访问大量的数据;2、访问正确的数据;3、把数据变为具有可行动性的洞察力的强大算法;4、超越竞争对手的速度和规模。今天,通过训练人工智能算法与创建新的应用,数据有机会成为利润中心。更多的数据训练,就会让人工智能算法更聪明。
应用ReRAM这样新的存储技术,能够发挥人工智能真实的潜能,实现速度、低功耗/高能效、存储容量与可制造性的完美结合。
当目标从简单的代码行的抓取,转变成对从外部传感器获取的大量数据进行实时处理、分析、执行时,大数据到人工智能的根本转变就来临了。从传感器来的数据可以存储在芯片上,直接输送给深度神经网络,以便采取直接的行动。非易失性的存储技术,比如ReRAM存储技术,通过低功耗、快速读取、基于字节寻址的写操作,来帮助应对性能与功耗的挑战。
ReRAM存储技术能够直接集成在芯片内部,产生一个新的以存储为中心的片上系统架构。通过与处理器核集成在同一颗芯片中的片上系统方案,ReRAM充分地加速了深度神经网络算法。ReRAM技术是一个重要的创新,它加速人工智能的潜能,实现多种应用,加速性能,极大地提高能效,实现更高级的安全性,减少芯片的数量和芯片的面积。
高性能计算,比如人工智能,需要在处理器、存储与输入输出之间进行高带宽、低时延的数据访问。ReRAM存储技术通过减少计算与存储之间的性能差距,可显著提升高性能计算应用的性能。
ReRAM的应用前景