新芯片技术全面靠拢AI！-EDN 电子技术设计

 从Google TensorFlow、APU、NPU到BPU等专为AI而生的新型处理器，到小芯片以及多芯片封装，甚至是量子运算，在日前于ISSCC上揭露的先进芯片技术，无论对于电路设计还是AI都同样重要...

Google开始尝试以机器学习(ML)在IC设计中执行布局与绕线(place-and-route)，并正逐渐取得不错的成果。在日前于美国加州举行的国际固态电路研讨会(ISSCC)上揭露的这一事实，无论对于电路设计还是人工智能(AI)都是同样重要的。Ayaednc

多年来，AI一直是电子产业中的头号大事，这一发展方向(伴随创投与头条新闻)也不断吸引着大量的半导体研究。因此，今年的ISSCC主题很自然的就订为“IC技术启动AI时代”(Integrated Circuits Powering the AI Era)，而一开幕的大会议程也在致力于描绘AI如何改写整个半导体样貌。Ayaednc

开场会议的几位发言人解释了AI的具体需求，例如，驱动专为AI应用而设计的新型处理器(以及CPU和GPU)；促进结构创新，包括小芯片(chiplets)、多芯片封装与中介层；甚至是影响着量子运算的发展。Ayaednc

大会的第一位发言人是Google AI负责人Jeff Dean，他简介了机器学习的最新内容。过去一年多以来，Dean持续以各种形式发表演讲，引导产业针对ML布局与绕线工具的更多讨论。Ayaednc

Ayaednc

比较针对布局与绕线ASIC设计的专家经验与低功耗ML加速芯片的结果。但Google故意遮掉了部分影像…（来源：Google Research/ISSCC）Ayaednc

他首先简要介绍AI和ML的历史，从1995年机器如何学习玩西洋棋开始，到让机器学会在棋赛中脱颖而出，现在已经可以在《星海争霸》(StarCraft)等复杂的视讯游戏取得斐然成绩。ML还被用于医学成像、机器人技术、计算机视觉、自动驾驶车、神经科学、农业以及天气预报等领域。Ayaednc

数十年来推动运算发展的基本思维是，问题越大，需要的处理能力就越强大，而拥有的处理能力越强，所能解决的问题就越重大。长久以来，这一概念都适用于以AI解决种种问题。Ayaednc

而当问题的领域日益扩展到过于广泛而无法解决时，根本就不可能再光靠聚集更多CPU(和/或GPU)的能力来解决。Ayaednc

而AI/ML则不需要典型的CPU/GPU能力。其所需的数学运算可能更简单，而所要求的精度则要低得多。对于这一类应用的了解带来了实际的影响：专用于AI/ML的处理器并不必像CPU/GPU那样复杂。Ayaednc

这是导致专用处理器为推论而生的看法之一。例如Google TensorFlow，如今已发展到第三代了。尽管普遍预期Google不久将推出第四代TensorFlow，但如果您指望在今年ISSCC上透露任何相关信息的话，希望可就破灭了。Ayaednc

除了推论所需的精度较低之外，业界也发现“训练”(training)的精度要求也较低些——这是相对较新的发现。AI/ML处理器可能相对较简单，因而也较便宜，而且，目前的AI/ML处理器即使用于大量数据集上，也有足够强大的能力进行快速训练。Dean解释，这些都让ML更易于进一步推向网络边缘，例如语音识别应用。2019年，Google曾为此开发一款可执行于智能型手机上的小型产品。Ayaednc

每一种AI应用(自动驾驶、医疗成像、棋奕游戏)都是调整一款专用AI/ML系统而学习来的结果。每一种应用基本上都有一个AI。因此，下一个问题是：是否可能让AI在学会一件事后，看看它是否能将学到的东西应用于其他类似任务？Ayaednc

Dean说：“提出这个问题是因为我们开始考虑将其用于ASIC设计中的布局与绕线。布局和绕线的规模远远大于下棋游戏。虽然问题的规模更大，但却没有像下围棋时一样清楚的目标。”Ayaednc

Google为布局与绕线建立了一个学习模型，然后着手确定该工具是否可以通用化推广。它能从一个设计上学到知识并应用于前所未有的新设计中吗？答案很明确是肯定的。Ayaednc

Dean说：“此外，至今的各种尝试都获得了超前的成果。它的成果比人为的好一点，有时甚至更好得多。”Ayaednc

Ayaednc

Google采用几个不同模块的测试电路，比较使用ML教自己布局和绕线ASIC设计的AI性能。此外，并在渐进式间隔的额外调整后，比较相同ML与商用工具的性能。（来源：Google Research/ISSCC）Ayaednc

其优点包括在极短的时间内执行布局与绕线。完成这项任务可能需要花费人类专家数周的时间，但ML布局与绕线通常可在24小时内完成相同的工作，而且其布局时的线长通常较短。ML绕线器在自动布局绕线工具方面的表现也十分出色。Ayaednc

Dean说，ML还可扩展到IC设计过程中的其他部份，包括使用ML协助产生测试用例，以更充份地利用ASIC设计验证中的状态空间，也许还可以用ML来改进高层级的综合以达到优化设计。Ayaednc

然而，这对于ML的意义与加速IC设计进度的意义一样重要。如果一个ML可以在一个类别中进行概括(gernralize)，那么可以在其他类别中进行概括吗？Ayaednc

“未来的ML模型会是什么样子？”Dean问：“我们可以训练一种模型来概推至相似的任务吗？理想情况下，我们需要一种可以学习完成数千或数百万项任务的模型。”Ayaednc

人工智能物联网(AIoT)

联发科技(MediaTek)资深副总经理陆国宏谈到了AI如何改变几乎与Internet连接的有事物，同时，人工智能物联网(AIoT)将从数十亿台装置迅速发展，预计到2030年，全球将有3,500亿台连网装置。Ayaednc

AI之所以走向边缘，部份原因在于其能力所及，其他原因还包括为了减轻数据中心日益增加的处理负载、让网络流量最小化等需求，以及某些应用需要使用本地处理或最适合于与本地处理搭配使用。Ayaednc

本地处理必须快速、专为AI运算而设计，而且还必须极其节能。Ayaednc

这些本质上是新的处理器类别。陆国宏称其为AI处理单元(APU)，有的人则称其为神经处理单元(NPU)、大脑处理单元(BPU)等名称。他说，例如，一个APU可能不如CPU灵活，但由于是专用的，所以APU能以更低55倍的功率加速20倍之多。Ayaednc

陆国宏表示，APU开发人员正开发以3TOPS/Watt实现1TOPS性能的装置。他相信以10TOPS/W达到10TOPS性能是可以实现的，而且最终可能以30TOPS/W的速度达到100TOPS运算效能。Ayaednc

联发科研究人员也在ISSCC上发表另一篇论文，提出“以7奈米5G智能型手机SoC为多功能AI应用实现3.4～13.3TOPS/W 3.6TOPS双核心深度学习加速器”(3.4 to 13.3TOPS/W 3.6 TOPS Dual-Core Deep Learning Accelerator for Versatile AI Applications in a 7nm 5G Smartphone SoC.)Ayaednc

这毕竟是7奈米(nm)技术。随着摩尔定律(Moore’s Law)的曲线进展到较小的制程节点，至少要再前进一步，例如从目前的7nm到5nm，才可能提高性能。陆国宏认为摩尔定律仍然适用。Ayaednc

然而，也不是没有限制。晶体管的数量随着整合度的增加而增加，并继续遵循经典的摩尔定律曲线，“但每晶体管成本却并未遵循这一规则。”。此外，由于芯片设计的复杂性以及制程步骤变得越来越复杂，导致先进装置的成本飞涨，从而使较小的公司无法导入新技术制程，更别提还有产量问题了。Ayaednc

陆国宏说，解决其中许多问题的常见方案是采用像小芯片之类的技术。他说：“这可能比摩尔定律的表现更好。”但无论是小芯片还是其他架构方法，都意味着在互连方面的挑战。Ayaednc

系统技术“协同优化”

Imec高速模拟RF计划经理Nadine Collaert更进一步探讨这场会议的主题，包括如何解决分离裸晶的必要，以及为未来的芯片找到可替代的结构和架构。她称此为系统技术协同优化(system technology co-optimization或STOC)。Ayaednc

她解释说，摩尔定律可能持续多年，但是微缩CMOS越来越困难。她用FinFET、奈米片等越来越复杂的组件结构示例来说明，这些组件确实都有助于在芯片级进一步实现CMOS微缩。Ayaednc

Ayaednc

Imec展示可在SOI基底上以奈米脊形生长III-V材料的能力。（来源：Imec/ISSCC）Ayaednc

然而，最终业界还是需要一种新方法。她解释说，“我们相信3D技术是最好的方法。这包括使用线接合的多芯片封装，甚至是在组件级，也可以与其他标准单元进行精细连接。”Ayaednc

如果要搞清楚哪一种技术可用，必须根据可用选件的属性来匹配系统要求。 “这将是一个复杂的过程，”Collaert说，而且将会对于EDA供货商带来压力，要求其提供可让设计人员能够权衡其选择的工具。Ayaednc

特别是无线通信系统的前端模块挑战更大。“通常，这些都是最多样化的系统——许多不同组件各自采用不同技术，而且随着使用更多的天线、功率放大器(PA)和滤波器，还会变得更复杂。”Ayaednc

业界正朝着更高的频率和更高的效率迈进。选择之一是将III-V材料(例如GaN和SiC)与CMOS结合使用，以获得两种材料的优势。这可以透过3D整合来完成，她举例说像是在绝缘上覆硅(SOI)基底上生长具有III-V材料的3D奈米脊等，“但这还有待执行很多工作才能实现。”Ayaednc

至于内存？Collaert说：“诸如AI和ML等新应用正推动开发蓝图进展。”这些应用需要快速存取内存。“目前业界开始关注于内存中运算，但随着逻辑和内存之间的距离越来越近，当然更重要的就是采用3D封装。”Ayaednc

未来，在先进应用中采用快闪记体(Flash)将可堆栈更多层。此外，还必须改善在这些内存中的信道电流。“为此，我们必须研究通道迁移性，这又意味着必须研究III-V材料。”同时，透过扩展来研究将硅层与III-V材料层堆栈在一起的3D架构。Ayaednc

而在DRAM方面，电容正从圆柱状逐渐成长为支柱状，这是迈向3D之路的另一种改变。其他内存选项包括用于替代快取的磁性内存和3D储存级内存。Collaert指出，Imec展示了一种垂直铁电场效晶体管(FeFET)，但目前正进行更多研究中。Ayaednc

她说，这些内存的发展都是在ML架构下进行的。AI正在蓬勃发展，其中许多都在云端，但由种种原因正准备将其移到边缘，从而节省部份能耗。”Imec认为可能达到10,000 TOPS/W的效能。Ayaednc

“微缩仍在持续中。一切都还没结束呢！”她总结说：“新的内存可能还不在开发蓝图的规划中，但可能会在ML中扩展应用。”Ayaednc

量子运算

IBM Research总监Dario Gil为此次大会总结了“下一步路在何方”，他说这正是广义的AI之路，而且几乎可以肯定将在量子计算机上实现。此外，他并强调最大的好处可能来自于搭配位(数字处理)、神经元(AI)和量子位(量子运算)的互补使用。Ayaednc

他指出，IBM在2016年开放了第一台量子计算机的云端访问权限，现在可以存取15台量子计算机了，包括其最新的53量子位的量子计算机。Ayaednc

(原文发表于ASPENCORE旗下EDN姐妹媒体EETimes，参考链接：All Processing Bends Toward AI ，编译：Susan Hong)Ayaednc

本文为电子技术设计原创文章，未经授权禁止转载。请尊重知识产权，违者本司保留追究责任的权利。

阅读全文，请先

Brian Santo

EETimes美国版主编。Brian Santo已经为多家出版物撰写技术文章达30年，包括Electronic News、EE Times、IEEE Spectrum以及其最近担任CED主编的一些出版物。他文章涉及的主题包括测试与测量、半导体生产、消费电子、军事电子、有线网络、宽带、无线技术等等。他在俄勒冈州波特兰的住所外工作，所以请忽略他办公室外嘎嘎叫的鸡。

进入专栏

EDA/IP/IC设计人工智能制造/工艺/封装产业前沿

上一篇： 小米GaN氮化镓充电器实用吗？我们对比了五款65W PD充电器 下一篇： 钾电池或成锂电池最佳替代方案

微信扫一扫
一键转发
最前沿的电子设计资讯
请关注“电子技术设计微信公众号”

超薄硅晶圆的演进史让我们一起了解一下历史上是如何通过技术进步和制造工艺的改进，开发出高精度的超薄硅晶圆的···
盘点CES 2025上基于Arm架构的AI创新和技术亮点近期在美国拉斯维加斯举行的 CES 2025 再次彰显了其作为展示最新科技创新的重要平台。今年展会上所呈现的众多前沿产品和新的发布将推动各个行业的变革与发展···
PCI Express Gen5：自动化多通道测试本文将重点介绍用于x16测试的RF开关配置。这些开关型号最多支持18条通道（PCIe最大通常为x16），也可支持更低的通道数···
芯耀辉：从传统IP到IP2.0，AI时代国产IP机遇与挑战齐飞 2024年，集成电路行业在变革与机遇中持续发展。面对全球经济的新常态、技术创新的加速以及市场需求的不断变化，集成电路企业如何在新的一年里保持竞争力并实现可持续发展？
Ceva 推出具有下一代蓝牙高数据吞吐量和 IEEE 802. 交钥匙集成式硬件和软件平台 IP 结合了功能齐全的蓝牙双模和下一代高数据吞吐量，以及适用于 Thread/Zigbee/Matter 的 IEEE 802.15.4标准，并包含了Ceva采用台积电 12nm 技术实现的最先进无线电···
用于电路分析和设计的Spice仿真指南–第14部分：评估用在电子仿真软件提供的众多功能中，.MEAS指令是分析和量化仿真电路行为的一个相当强大的工具···
用于电路分析和设计的Spice仿真指南–第13部分：温度管在本文中，我们将探讨SPICE如何管理温度以及仿真其影响的主要技术···
用LM337改造，让PWM DAC获得1.5 A输出能力 DAC是一种低功耗设备，其功率和电流输出能力仅限于毫瓦和毫安范围。当然，从根本上讲，它们没有理由不与合适的功率输出级配合使用，这确实也是常见的实际做法。不过，为了好玩，这个设计实例采用了不同的供电方式···
帕特·基辛格退休：工程师CEO的回归也救不回英特尔？在执掌英特尔三年多之后，魅力十足、雄心勃勃的英特尔首席执行官Pat Gelsinger下台了，这家摇摇欲坠的美国半导体巨头开始寻找继任者···
Arm年度技术大会：2025年底预计将有1,000亿台具备AI能力近日，作为 Arm 一年一度的技术盛会，2024 年度技术大会（Arm Tech Symposia 2024）在上海和深圳成功举办。这次的大会十分特殊，以往 Arm 年度技术大会往往会专注于特定的应用市场，而今年的大会只聚焦于一个领域——AI···
瑞萨推出包括先进可编程14位SAR ADC在内的全新Analog 全新产品几乎适用于任何应用，大幅减少元件数量、BOM成本和占板空间···
EDA/IP与IC设计：引领芯片产业变革的未来引擎（下午场）国际集成电路展览会暨研讨会(IIC Shenzhen 2024)期间举办的“EDA/IP与IC 设计论坛”汇聚了全球行业专家，共同探讨未来发展趋势、挑战与最佳实践，为推动行业创新与发展贡献力量。

机器人所需要的传感器有哪些？随着机器人技术的迭代升级，传感器的重要性将持续提升，其功能性、精度和适配性也将得到显著改进，作为机器人不可
2024年墨西哥市场分析，中国品牌崛起 2024年，墨西哥汽车市场以近10%的增长率展现了强劲的复苏势头，中国品牌的崛起为市场注入了新活力，当然现在的政
2025，大众汽车集团在中国如何转型？ 2024 年，大众汽车集团（中国）在复杂多变的市场环境中成功达成销量目标，向客户交付超过 290 万辆汽车，新能源汽车领
国产射频芯片公司汇总对于射频芯片这项卡脖子技术，国内很多公司在这方面努力，而且也做出了不错的成绩。一些射频芯片公司无论从研发
拆解报告：松下电器1200W电吹风松下EH-NW90电吹风内置10万转高速无刷电机，并具备三档风速和四档风温可选。电吹风内置纳诺怡技术，为秀发提供
拆解报告：白牌电动工具电池多功能放电转换器这款白牌多功能放电转换器适配得伟电动工具电池使用，将电动工具电池和放电转换器组装起来，即可组成移动电源和
拆解报告：MOMA猛玛LARK M2无线麦克风 MOMA猛玛LARK M2无线麦克风在外观方面，采用了极富创新的设计，提供了轻盈舒适的佩戴使用体验。发射器采用了夹
阿根廷2024年：销量下滑，北汽增长240.1%。 2024年阿根廷汽车市场在整体销量下滑的背景下，依然展现出多元化的发展趋势···
2025年第3周：全球最快四足机器人发布 2025年将成为机器人产业的关键时间点，业内预期27年人形机器人出货量可达50~100万台。从技术进步到供应链成熟
欧洲2024年汽车市场：微弱复苏和电动化加速并存 2024年，欧盟新车注册量小幅增长0.8%，达到约1060万辆，欧盟+英国+北欧国家的销量为1296.4万台，同比增长0.9%，整个欧
射频微波领域有哪些高质量期刊？今天我们结合网络上的资料一起整理一份射频微波领域的期刊列表，以便同学们投稿时可以选择···
拆解报告：Portal智能屏幕24W电源适配器 Portal智能屏幕电源适配器采用黑色直板机身，外观整洁，配有2米长黑色输出线。适配器采用美规固定插脚，支持100-2

性能飞跃！升级电流传感器NSM201x-P系列赋能汽车三电和光伏逆变器纳芯微推出全新车规级集成电流路径霍尔传感器NSM201x-P系列。该系列产品是对纳芯微已量产的NSM201x系列的完
意法半导体推出STSPIN32G0新列电机驱动器，满足工业自动化和家电市意法半导体STSPIN32系列集成化电机驱动器新增八款产品，满足电动工具、家用电器、工业自动化等应用的低成本、
Melexis推出性能先进的温度传感器，以红外技术创新实现电磁炉智能全球微电子工程公司Melexis宣布，推出专为电磁炉设计的非接触式红外温度传感器芯片MLX90617···
康佳特SMARC模块更新: 全新英特尔酷睿3处理器低功耗 SMARC 模块AI 加速和图形处理性能再次提升···
康佳特针对要求苛刻的实时应用推出新型高性能COM-HPC模块基于英特尔酷睿 Bartlett Lake S处理器的模块性能全面提升···
为汽车安全保驾护航，纳芯微推出基于AMR技术的ABS轮速传感器纳芯微宣布推出全新基于AMR（各向异性磁阻技术）的轮速传感器NSM41xx系列。该系列产品通过集成先进的磁性传感敏
Microchip推出全新Switchtec™ PCIe® 4.0 16通道交换机系列 PCI100x系列器件可为任何需要加速或专用计算的应用提供高性能和成本效益···
RK3576有多强？实测三屏八摄像头轻松搞定-米尔米尔基于他们推出的MYD-LR3576开发板开发了一个3屏异显，8路摄像头输入的DEMO，实测下来，RK3576轻松搞定了该任
SynQor®推荐先进的军用级三相输入UPS（UPS-1500-S-1U-T） SynQor的三相输入UPS电源能使单相负载在电源端呈现出符合MIL-STD-1399-300B标准的清洁、表现良好且几乎零反
村田开发超小尺寸、超低功耗的Type 2GQ GNSS模块，以匠心品质助在几年前，定位系统充斥于生活方方面面的情节还仅见于各式的科幻影片，而今具备这一功能的产品已经以各种形态步
瑞萨推出性能卓越的新型MOSFET 瑞萨全新晶圆技术可以帮助MOSFET实现导通电阻降低30%、栅漏电荷减少40%、封装尺寸缩小50%的目标···
加特兰集成 Cadence Tensilica ConnX 220 DSP 全面升级汽 ConnX 220 DSP 集成至基于下一代 Andes SoC 的加特兰雷达解决方案后，将带来显著优势，包括提高灵活性、

热门评论
最新评论

换一换

杂志声明

新芯片技术全面靠拢AI！

人工智能物联网(AIoT)

系统技术“协同优化”

量子运算