广告

存算一体技术有何优势?为何能成就芯片创新创业浪潮?

2022-08-31 15:03:51 综合报道 阅读:
一种新型计算架构——存算一体,正驱动新一波芯片创新创业浪潮。为何这种“刚走出实验室不久、国内外均未实现大规模量产”的技术能吸引诸多业内大佬纷纷入场呢? 存算一体芯片发展现状如何?国内有哪些比较受关注的存算一体创业公司?

 一种新型计算架构——存算一体,正驱动新一波芯片创新创业浪潮。MPiednc

梳理存算一体技术的发展时间线:MPiednc

2010-2017年是这一新技术潮流的探索期MPiednc

2011年,存算一体芯片开始受到学界关注;MPiednc

2016-2017年成为学界热议话题;MPiednc

随后,业内开始对其进行商业化探索:MPiednc

2017年,知存科技在北京成立。MPiednc

2018年,九天睿芯在深圳拉起团队。MPiednc

2020年,苹芯科技团队和后摩智能团队先后组建完成。MPiednc

为何这种新技术能吸引诸多业内大佬纷纷入场呢? 存算一体芯片发展现状如何?国内有哪些比较受关注的存算一体创业公司?MPiednc

冯诺依曼架构的局限

随着人工智能技术的发展,各个领域的智能化程度都在不断提高,智能化升级给芯片在大算力和低功耗方面均提出了更高的要求。MPiednc

据统计,自2012年开始,AI训练需要的算力每3.5个月就会翻倍,这个速度已远超过摩尔定律的18个月。MPiednc

目前,主流芯片主要依靠不断迭代先进工艺制程,来提升芯片性能,应对AI算力需求。MPiednc

但当制程越来越小,尤其是走到7nm之下后,出现的问题越来越多,如成本持续走高、由物理限制引发的芯片性能问题越发突显等。MPiednc

但芯片运行所依托的冯·诺依曼架构下,数据的存储和计算是分开的,处理器CPU存储器之间通过数据总线进行数据交换。由于处理器和存储器的内部结构、工艺和封装不同,二者的性能也存在很大的差别。MPiednc

从1980年开始,处理器和存储器的性能差距不断拉大,存储器的访问速度远远跟不上CPU的数据处理速度,这就在存储器和处理器之间行程了一道“存储墙”,严重制约了芯片的整体性能提升。MPiednc

MPiednc

其次是功耗。MPiednc

如前所述,由于处理器和存储器的分离,在处理数据的过程中,首先需要将数据从存储器通过总线搬运到处理器,处理完成后,再将数据搬运回存储器进行存储。数据在搬运过程中的能耗是浮点运算的4~1000倍。随着半导体工艺的进步,虽然总体功耗下降,但是数据搬运所占的功耗比越来越大。据研究显示,在7nm时代,访存功耗和通信功耗之和占据芯片总功耗的63%以上。MPiednc

MPiednc

由于以上存储墙和功耗墙两种瓶颈的存在,传统的冯诺依曼架构已经不再适应以大数据计算为主的AIoT场景,对于新型计算架构的需求因此应运而生。MPiednc

存算一体的概念由此再度被提及,并很快成为产学研各界破解AI算力困境的“希望之星”。MPiednc

存算一体,即存储器本身的算法嵌入

存算一体的概念诞生于1969年,最早由斯坦福研究所的Kautz等人提出。MPiednc

存算一体的核心思想,是通过在存储单元本身进行算法嵌入,具体来说,主要就是将AI模型的权重数据存储在内存单元中,然后对内存的核心电路进行设计,使得数据流动的过程就是输入数据和权重在模拟域做点乘的过程,相当于实现输入的带权重累加,也就是卷积运算。由于卷积运算是深度学习算法的核心组成单元,因此存算一体非常适合深度学习。该架构彻底消除了访存延迟,并极大降低了功耗,是一种真正意义上的存储和计算的融合。同时,由于计算完全耦合于存储,因此可以开发更细粒度的并行性,获得更高的性能和能效。MPiednc

这一设计可以从根本上解决冯·诺伊曼瓶颈,在做到低成本、大算力的同时,保持低功耗。MPiednc

MPiednc

存算一体芯片的关键在于存算一体架构,其核心是电路设计革新。MPiednc

主要有两种计算方式:数字计算和模拟计算。MPiednc

这两种计算方式采取的存储器不同,前者以SRAM等易失性存储器为主,后者采用Flash和RRAM等优势更大的非易失性存储器。MPiednc

而依照计算单元与存储单元的关系(距离)划分,目前存算一体的技术路线大致可分:MPiednc

  • 近存计算
  • 存内计算

近存计算是通过将计算资源和存储资源拉近,来实现能效和性能的提升,在广义概念上也被归入存算一体架构。MPiednc

现阶段,近存计算是行业中最容易实现的路线,主要考验的就是先进封装技术。MPiednc

存内计算则包含两种形式,其计算效率提升已经得到业内的充分认可:MPiednc

  • 一种计算操作由位于存储器内部的独立计算单元完成,存储单元和计算单元相互独立存在。
  • 另一种是在内部存储中添加计算逻辑直接执行数据计算,这种架构数据传输路径最短, 能同时满足大模型的计算精度要求。

MPiednc

△图源:量子位智库MPiednc

竞争格局

近几年,国内外涌现了多家存算一体初创企业。MPiednc

国内的企业更是百花齐放,包括苹芯科技(基于 SRAM 做存内计算加速器)、知存科技(基于Flash)、闪亿半导体(基于忆阻器PLRAM)、新忆科技(基于RRAM)、恒烁半导体(基于NOR Flash)、后摩智能(研究方向包括SRAM/MRAM/RRAM)、九天睿芯(基于SRAM)、千芯科技(基于 SRAM/RRAM/MARM 存储单元)、亿铸科技(基于 ReRAM)等。另外,还有阿里平头哥(基于DRAM的3D键合堆叠)。MPiednc

从融资轮次来看,国内的头部初创公司(10 家左右),知存目前到了 B1 轮,其余均在 A 轮前后。MPiednc

由此可见,国内存算一体处于行业较为早期的阶段,投资机会较多。MPiednc

做存算一体的公司之间尚未出现相互竞争的状况,各家之间对如何运用存算一体技术有各自的判断,并且在选定的技术路线和应用场景中都有自己的独特优势。MPiednc

国外方面比较有名的存算一体初创企业包括Mythic、Syntiant。另外,老牌巨头三星也基于HBM2 DRAM开发了其存算一体技术。MPiednc

大多公司的融资已进入C/D轮,几家头部企业如STT、Syntiant和Mythic走在全球商业化前列,芯片出货量最高达2000万级别(国内最高百万级),并有约15家公司实现了超100亿美元的营收(我国仅1-2家)。MPiednc

MPiednc

需要承认的是,目前,国内存算一体的商业化进展与国外存在一定差距。MPiednc

责编:Demi
  • 微信扫一扫
    一键转发
  • 最前沿的电子设计资讯
    请关注“电子技术设计微信公众号”
广告
热门推荐
广告
广告
广告
EE直播间
在线研讨会
广告
面包芯语
广告
向右滑动:上一篇 向左滑动:下一篇 我知道了