广告

IBM开发类脑AI芯片NorthPole,速度是前代芯片的4000倍

2023-10-23 17:35:24 综合报道 阅读:
美国IBM的研究团队开发了一种以大脑的计算方式为灵感的计算机芯片,这款名为北极(NorthPole) 的数字人工智能芯片消除了频繁访问外部存储器的需要,在图像识别任务中比现有架构更快,能源消耗更少···

长期以来,计算机芯片主要遵循着一种相同的架构——冯·诺依曼架构,在这种架构中处理器单元和存储器是分离的。2x6ednc

虽然这种架构让计算机的设计变得更加简单,但随着几十年的不断发展,冯·诺伊曼架构的“存储墙”和“功耗墙”愈加明显,因为无论处理器性能怎样提高,每次计算仍旧需要与外部存储器进行数据交换,这会消耗能量也会浪费时间,计算量越大这种浪费也就越多。而当面对需要海量计算资源的AI计算时,冯·诺依曼架构的弊端显现无疑,半导体行业正在不断寻求新的方法来突破这种限制。2x6ednc

美国IBM的研究团队开发了一种以大脑的计算方式为灵感的计算机芯片,这款名为北极(NorthPole) 的数字人工智能芯片消除了频繁访问外部存储器的需要,在图像识别任务中比现有架构更快,能源消耗更少。相关研究成果以“Neural inference at the frontier of energy, space, and time”为题发表在《科学》杂志上。2x6ednc

2x6ednc

据了解, TrueNorth(真北)芯片是该研究团队在2014年之前开发的一款类脑芯片,而北极是它的扩展。在ResNet-50图像识别和YOLOv4物体检测模型的测试中,相对于使用12纳米技术工艺的GPU,北极实现了每瓦FPS(每秒传输帧数)的能量度量高25倍,每个晶体管FPS的空间度量高5倍,延迟时间度量低22倍,速度上要比真北快大约4,000倍。2x6ednc

据悉,北极芯片采用了12纳米节点工艺制造,在800平方毫米的面积内包含有220亿个晶体管,它具有256个内核,每个内核每个周期可以以8位精度执行2,048次运算。其最大的特点就是将所有内存都放在了芯片本身上,而不是单独连接,北极的每个内核都有内存,然后将这些内核以一种类似于人类大脑皮层之间白质连接的连接网络连接在一起,从而实现了更加高效、节能的计算。2x6ednc

IBM_NP_PCIe-PCB-后.png2x6ednc

该研究团队表示,在不使用最先进工艺的情况下,北极芯片能耗是使用最先进技术的人工智能芯片的1/5,而如果北极芯片设计采用最先进的制造工艺,其效率将是目前设计的25倍。2x6ednc

不过可惜的是其最大的优势同时也是其最大的限制,因为内存和计算单元的距离很近,所以对于从板载内存中提取数据的场景该芯片可以处理的很好,但如果必须从其他地方访问信息,那么芯片的速度就会受到限制。虽然北极芯片自身的内存有224兆,但对于目前流行的生成式AI模型来说还是杯水车薪,其主要应用场景还是在一些空间受限应用,以及自动驾驶这类速度关键型应用。2x6ednc

责编:Ricardo
  • 微信扫一扫
    一键转发
  • 最前沿的电子设计资讯
    请关注“电子技术设计微信公众号”
广告
热门推荐
广告
广告
广告
EE直播间
在线研讨会
广告
面包芯语
广告
向右滑动:上一篇 向左滑动:下一篇 我知道了