广告

从ISSCC 2017看AI芯片的四大趋势

时间：2017-03-06 作者：痴笑

 在标准SIMD的基础上，CNN由于其特殊的复用机制，可以进一步减少总线上的数据通信。而复用的这一概念，在超大型神经网络中的显得格外重要。

身处人工智能的风口，ISSCC也不能幸免地将本次大会主题定为“Intelligent chips for a smarter world”。LOWednc

001ISSCC20170306 LOWednc

同时，大会还在研究论文报告中设立了专门讨论深度学习处理芯片的论文session，在SPR海报session中，也有两篇来自复旦大学（与华盛顿大学合作）和清华大学的研究，分别针对RNN和CNN的处理器芯片设计。除此之外，大会也安排了探讨神经网络相关课题的tutorialsession（面向初学者）和forum session（面向专业人士）。LOWednc

作为有深度的专业人工智能公众号，矽说将从各个技术报告中进行深度归纳、刨析在这些论文引导下的AI芯片发展趋势。LOWednc

趋势一：更高效的大卷积解构/复用

在标准SIMD的基础上，CNN由于其特殊的复用机制，可以进一步减少总线上的数据通信。而复用的这一概念，在超大型神经网络中的显得格外重要。对于AlexNet/VGG这些模型中的中后级卷积核，卷积核的参数量可以达3x3x512之巨大，合理地分解这些超大卷积到有效的硬件上成为了一个值得研究的问题。LOWednc

003ISSCC20170306 LOWednc

在14.2 中，韩国KAIST学院分析了集中不同的分解方法，包括输入图像/卷积核分解，及其混合模式，得到了最终的方案。LOWednc

004ISSCC20170306 LOWednc

而来自比利时的IMEC在报告14.5中对该问题也有涉及。其方案在Eyeriss的基础上，沿用了其在2016年VLSI提出的2D SIMD方案。轮流复用输入与参数，达到高效的数据分解。LOWednc

趋势二：更低的Inference计算/存储位宽

在过去的一年，对AI芯片最大的演进可能就是位宽的迅速衰减。从32位fixed point，16位fixed point，8位fixedpoint，甚至4位fixed point的位宽。在CS的理论计算领域，2位甚至2进制的参数位宽。在ISSCC上，这些“传说”都已经逐渐进入实践领域。LOWednc

005ISSCC20170306 LOWednc

KAIST采用了类似传说中Nervana的flexpoint方案，在定点系统中采用可浮动的定点进制方案。该方案的前提是在某一固定层的前提下，所有该层的卷积核均服从一个由训练确定的进制方案，但是在层和层之间是可以变化的。LOWednc

006ISSCC20170306 LOWednc

其实，这类方法也不是近年来的创举，在《脑心编（四）》中我们提到的ARM SIMD指令集——NEON就已经采取了这些办法，只是最小位宽没有到达4位罢了。而报告14.5中IMEC的方案在变化进制的基础上，进一步采用的通过改变电压和频率的方法得到更优的能效值。LOWednc

另外，指的一提的是参数的非线性映射以减少参数读取时的位宽也成为了一个新的关注点。其理论基础由Stanford 大学Bill Dally课题组提出，目前已经出现了类似的芯片实现，详见14.2。LOWednc

007ISSCC20170306 LOWednc

趋势三：更多样的存储器定制设计

当乘加计算（MAC，Multiplier and accumulation）不再成为神经网络加速器的设计瓶颈时，一个新的研究方向就冉冉而生——如何减少存储器的访问延时。在《脑心编（六）》里，我们提到过，离计算越近的存储器越值钱。于是新型的存储结构也应运而生。LOWednc

首先是密歇根大学提出了面向深度学习优化的协处理器多层高速缓存机制，通过数据的重要性对数据位置进行定义。LOWednc

008ISSCC20170306 LOWednc

在KAIST的另外一篇文章14.6里，作者提出了一种可转置（transpose）的SRAM架构，即数据的写入与读出可以是通向的，也可以是垂直的。该方法能省去卷积网络中额外的数据整理，并且就大卷积的解构提供了芯思路。LOWednc

009ISSCC20170306 LOWednc

趋势四：更稀疏的大规模向量乘实现

神经网络虽然大，但是，实际上的有非常多以零为输入的情况（Relu输出或者系数为0）此时稀疏计算可以高校地减少无用能效。来自哈佛大学的团队就该问题优化的五级流水线结构，在最后一级输出了触发信号，见14.3。LOWednc

在Activation层后对下一次计算的必要性进行预先判断，如果发现这是一个稀疏节点，则触发SKIP信号，避免乘法运算的功耗，以达到减少无用功耗的问题。LOWednc

010ISSCC20170306 LOWednc

Stanford的Bill Dally老人家对于高效稀疏运算也关注已久，在其Forum的演讲中提到了它们尚未发表的稀疏加速架构。LOWednc

011ISSCC20170306 LOWednc

只可惜，我们要直到九月份才能读到paper。LOWednc

最后，我们来总结下这四个趋势的关键词——LOWednc

复用LOWednc

位宽LOWednc

存储LOWednc

稀疏LOWednc

要做AI芯片的你，有关注到么？LOWednc

注：本次ISSCC中关于深度学习的论文集中出现在session 14。论文的具体内容可以通过坚果云下载（该信息转载自ReConfigure）。LOWednc

（原文授权自公众号矽说）LOWednc

20160630000123 LOWednc

阅读全文，请先

本文为EDN电子技术设计原创文章，禁止转载。请尊重知识产权，违者本司保留追究责任的权利。

处理器/DSP 产业前沿人工智能矽说

上一篇： 手机网速慢信号差？也许是你的手机基带不够好 下一篇： 小米澎湃S1为什么要选择28nm制程？

微信扫一扫
一键转发
最前沿的电子设计资讯
请关注“电子技术设计微信公众号”

您可能感兴趣的文章

相关推荐

广告

热门评论
最新评论

近期热点

技术实例雷击之后加强我的NAS备份，谨慎遵循3-2-1备份规则？

产业前沿 CES 2025：Edge AI硬件加速再掀热潮

广告

汽车电子 CES 2025：洞察汽车创新未来

拆解拆解一个Geek Bar Pulse电子烟，拆到最后竟然还能亮？

广告

技术实例该如何设计PCB以保证恶劣环境下的信号完整性

技术实例基于SiC的高电压电池断开开关的设计注意事项

广告

拆解深入拆解一个Godox相机闪光灯发射器，富士专用

技术实例通嘉PD快充适配器高效能及小型化之氮化镓集成方案

广告

产业前沿盘点CES 2025上基于Arm架构的AI创新和技术亮点

产业前沿 Arm 技术预测：2025 年及未来的技术趋势

广告

制造/工艺/封装超薄硅晶圆的演进史

技术实例用一种简单的方法进行三进制增益切换

广告

无线技术 NFC防伪技术：削弱假货对奢侈品行业的影响

技术实例横向对比考毕兹振荡器和克拉泼振荡器

可能感兴趣的话题

热门TAGS

产业前沿消费电子技术实例 EDN原创电源管理新品汽车电子处理器/DSP 通信传感器/MEMS 模拟/混合信号/RF 工业电子无线技术人工智能制造/工艺/封装 EDA/IP/IC设计安全与可靠性测试与测量

查看更多TAGS

广告

