AI算法的进步超越了摩尔定律-EDN 电子技术设计

 摩尔定律将继续改变世界，但算法的进步对推动电子技术的发展越来越重要。

现有的半导体芯片或正在开发的新计算架构仍然适合未来的算法，我们对此有多大信心？随着算法的进步超过硬件的发展，即使是最先进的深度学习模型都可以部署在小到5美元的Raspberry Pi上。PEgednc

在20世纪80年代的处理器上运行最先进的现代算法，和在最先进的处理器上运行20世纪80年代的算法，哪个算得更快？答案令人惊讶，通常都是在旧处理器上跑新算法更快些。PEgednc

虽然摩尔定律作为电子行业快速发展的驱动力而备受关注，但它只是一个驱动因素而已。我们经常忘记算法的进步其实在很多情况下超过了摩尔定律。PEgednc

Martin Groetschel教授观察到，在1988年需要花费82年才能解算的一个线性编程问题，在2003年只需要一分钟。其中硬件加速占1000倍，而算法进步占43,000倍。同样，麻省理工学院教授Dimitris Bertsimas的研究表明，1991年至2013年间，混合整数求解器的算法加速是58万倍，而峰值超级计算机的硬件加速仅增加了32万倍。据说，类似的结果也发生在其他类型的约束优化问题和素数因子分解中。PEgednc

这对AI意味着什么？

过去五年来，无论学术界、工业界还是创业界，都见证了人工智能（AI）的爆发。可能最大的拐点发生在2012年，当时来自多伦多大学的AlexNet团队，使用深度学习一举赢得了ImageNet大规模视觉识别挑战赛（ILSVRC）的冠军。从那以后，深度学习成为了人工智能实现的关键配方。PEgednc

计算机视觉的进步开始蔓延到自然语言处理和其他AI领域。智能音箱、实时计算机翻译、机器人对冲基金，以及网络参考引擎，不再让我们感到惊讶了。PEgednc

AI也成为了交通运输行业的驱动力（这也是Autotech Ventures公司的投资领域）。我们预见到，高级驾驶辅助系统（ADAS）、自动驾驶、车队检查、制造质量控制，以及车载人机界面等细分市场，具有巨大的发展潜力。到目前为止，Autotech Ventures已经对几家专注于开发该领域AI解决方案的初创公司进行了投资，包括ADAS和自动驾驶、视觉检测和边缘计算。在分析这些商业机会时，算法和硬件之间的相互作用是其投资决策中的一个关键考虑因素。PEgednc

公众对AI硬件的关注

基于深度学习的AI在其拐点之后出现了对图形处理单元（GPU）的强劲需求。由于具有很强的并行计算能力，GPU对于深度学习算法所采用的逻辑恰好具有惊人的运行效率。GPU的主要供应商英伟达（NVIDIA)从竞争中脱颖而出，其股价从2013年到2018年上涨了20倍。PEgednc

当然，英伟达的竞争对手正在努力追赶。高通、Arm和其他公司将注意力集中在了AI芯片的设计上，而英特尔则收购了AI芯片初创公司Nervana Systems。谷歌、Facebook、苹果和亚马逊都已纷纷为各自的数据中心及其他项目开发他们的AI处理器。也有一些初创公司（例如Graphcore、Mythic、Wave Computing、Cerebras和SambaNova）看到机会加入进来，试图搭建设计得更好的图灵机系统。像D-wave Systems和IBM等其他一些公司也在积极探索后图灵时代的架构。大多数芯片开发的目标是赶上或超过英伟达。然而，据我们所知，大多数处理器都是针对今天的AI算法而设计的。PEgednc

尽管需要巨大的前期开发成本，各种AI芯片设计的发展仍会进入寒武纪式的大爆炸。人工智能的前景是如此诱人，行业玩家愿意投入巨资开发硬件，以便与基础数学算法相匹配。但是，现有的半导体芯片或正在开发的新计算架构仍然适合未来的算法，我们对此有多大信心？PEgednc

考虑到算法演变的速度和幅度变化是如此之快，许多替代AI芯片设计可能还没有正式投放市场就已经过时了。我们推测明天的AI算法可能需要不同的计算架构、内存资源，以及数据传输能力等。PEgednc

尽管深度学习框架已经出现很长时间了，但直到最近才真正付诸实践，这要感谢摩尔定律所预测的硬件的快速发展。最初的数学不一定是为工程实践而设计的，因为早期的研究人员无法想象今天用1000美元就可以得到那么大的算力。现今的许多AI实现都是使用最初的数学模型，朝着更加准确、简单且更深层的方向发展，或者添加更多数据。这样做很快就会消耗掉GPU的计算容量。只有一小部分研究人员专注于改进基础数学和算法框架的难题。PEgednc

还是有很多机会认识并利用这些创新的的数学进步的。我们了解到的方法包括精简冗余的数学运算而减少计算时间，将卷积压缩到较小的矩阵而减少内存需求，或者对加权矩阵进行二值化而简化数学运算。这些是进入算法进步的第一次尝试，其发展之快已经开始超过硬件的进步。PEgednc

例如，从加州大学伯克利分校的研究项目剥离出来的DeepScale 就是将用于高级驾驶辅助系统（ADAS）和自动驾驶的AI“挤压”到汽车级芯片中（而不是GPU）。与仅使用算法的物体检测模型相比，他们的神经网络模型的运算速度要快30倍，同时在能耗和内存占用方面也有很大的提升，足以在现有硬件上运行。PEgednc

另一个算法跨越式进步的例子来自艾伦人工智能研究所（Allen Institute of Artificial Intelligence）的研究人员。他们使用一种采用神经网络二值化的新颖数学方法，已经证明可以大幅提高速度，同时降低功耗和内存要求。这样就可能让最先进的深度学习模型部署在售价仅5美元的Raspberry Pi上。其研究人员最近将这种算法和处理工具独立出来成立专门的公司XNOR.ai，以便在边缘设备上部署AI，并进一步推动AI算法的进步。PEgednc

有趣的是，新的二值化框架从根本上改变了最佳处理逻辑的类型。它们不再需要解决神经网络所需的32位浮点卷积，而只需要进行位计数操作——将功率平衡从GPU移开。此外，如果这些算法与专门设计的芯片相匹配，则可以进一步降低计算资源需求。PEgednc

算法的进步不会停止。有时需要数年甚至数十年才能发明（或者可能发现）新的算法。这些突破无法以与摩尔定律推动的计算进步所相同的方式来预测。它们本质上是非确定性的。但是当它们发生时，整个格局的变化往往会使现有的主导者变成脆弱的猎物。PEgednc

黑天鹅

Nassim Nicolas Taleb在他的畅销书《The Black Swan: The Impact of the Highly Improbable（黑天鹅：如何应对不可预知的未来）》中阐明说，最佳决策在很大程度上取决于分析过程是不可预测还是不确定。换句话说，我们是在处理“已知的未知数”还是“未知的未知数”？算法创新从根本上是未知的未知数。投注到这些发展上需要持续关注，因为它们具有不确定的发现时间和不可预测的影响。PEgednc

然而，在过去的二十年中，在应用数学领域，尤其是人工智能方面，出现了几个颠覆性的算法发现。它们与GPU一起，将AI从一个不起眼的研究领域带到了商业化的最前沿。PEgednc

我们认识到这些计算领域“黑天鹅”的潜力，它们将使现有芯片架构成为过去，或者一夜之间重新洗牌。对我们来说，这些黑天鹅可能会带来更为安全的自动驾驶汽车，以及许多其他未知的应用。PEgednc

- Alexei Andreev博士是Autotech Ventures投资公司的执行董事，Jeff Peters博士是公司首席研究员，Autotech Ventures是一家专注于交通相关技术的风险投资公司。（声明：DeepScale和XNOR.ai是Autotech Ventures投资的初创公司）PEgednc

本文为电子技术设计原创文章，未经授权禁止转载。请尊重知识产权，违者本司保留追究责任的权利。

阅读全文，请先

人工智能处理器/DSP 创新/创客/DIY 自动驾驶制造/工艺/封装 EDN原创产业前沿

上一篇： Bell X-2速度首超3倍音速 下一篇： 基于物联网的拼车如何改变我们的驾驶方式

微信扫一扫
一键转发
最前沿的电子设计资讯
请关注“电子技术设计微信公众号”

英伟达50系列显卡发布，RTX 5090D近乎“零提升”？ 1月6日的CES展会上，英伟达正式发布了备受期待的RTX 50系列显卡···
以极致能效破解人工智能背后的“能源危机” 电力正在成为威胁人工智能（AI）进步的最新瓶颈，而人工智能迅猛增长的算力背后，攀升的能源占用也正在大量挤占正常的社会用能需求···
莱迪思聚焦低功耗中小型FPGA创新，并计划发展大规模FPGA 在最新的开发者大会上，莱迪思展示了其FPGA产品在广泛市场中的应用及未来发展的宏伟蓝图。据莱迪思亚太地区应用工程高级总监谢征帆介绍，随着莱迪思FPGA技术的广泛应用和产品差异化的推进，全球已有超过1万客户选择使用莱迪思的FPGA产品，部署的许可证数量也已超过3.5万。
新一代MCU向着边缘AI和实时控制发展在工业和汽车领域，电机驱动和数字电源转换是典型的实时控制系统，要求处理器具有高实时性和强大的数学计算与处理能力。这些应用需要优质的ADC和PWM功能，并通过联动机制，形成高效、有机的实时控制系统。
帕特·基辛格退休：工程师CEO的回归也救不回英特尔？在执掌英特尔三年多之后，魅力十足、雄心勃勃的英特尔首席执行官Pat Gelsinger下台了，这家摇摇欲坠的美国半导体巨头开始寻找继任者···
英伟达或推中国特供RTX 5090 D，硬件与5090完全相同？据外媒曝光的消息，英伟达即将推出的50系显卡也会推出专门的中国特供版本，名称为GeForce RTX 5090 D···
Arm Tech Symposia 年度技术大会顺利收官，继续构建作为当今时代最重大的技术变革之一，AI 极有潜力成为人类毕生最重要的技术。Arm 不仅提供了应用广泛的通用计算平台，还通过将 IP 与开源软件和工具乃至广泛的行业领先生态系统相结合，让全球 2,000 万开发者都能够使用 Arm 计算平台作为 AI 创新基础···
第二代Versal Premium系列问世，AMD如何突破数据密集型继第一代Versal Premium系列自适应SoC之后，AMD于2024年11月12日发布了第二代Versal Premium系列产品，这是业界首款采用 CXL 3.1 及 PCIe Gen6 并支持 LPDDR5 的 FPGA 器件···
利用运动唤醒功能优化视觉系统的功耗此文中我们将深入探讨运动唤醒功能，详细介绍其优势以及适合的应用场景···
活动预告|第三届南渡江智慧医疗与康复产业高峰论坛即第三届南渡江智慧医疗与康复产业高峰论坛将于2024年11月22日在海南省海口市召开。本届论坛由海南省工业和信息化厅、海南省商务厅、海口市人民政府、海南博鳌乐城国际医疗旅游先行区指导，海口市科学技术工业信息化局和芯原微电子（上海）股份有限公司主办，芯原微电子（海南）有限公司承办，将深度探讨数字疗法、脑机接口和康复机器人的发展现状和机遇，以期推动智慧医疗与康复，以及大健康产业的发展···
优傲推出UR AI加速器，为协作机器人注入人工智能新动力 UR AI加速器。这是一套即插即用的硬件与软件解决方案，旨在促进AI赋能型协作机器人应用的创新进程···
“芯”之所向，音之所至：泰凌无线音频SoC助力万物互联新在国际集成电路展览会暨研讨会(IIC Shenzhen 2024)同期举办的“芯”品发布会上，泰凌微电子正式推出两款全新音频SoC产品：TL751X 和 TL721X···

机器人所需要的传感器有哪些？随着机器人技术的迭代升级，传感器的重要性将持续提升，其功能性、精度和适配性也将得到显著改进，作为机器人不可
2024年墨西哥市场分析，中国品牌崛起 2024年，墨西哥汽车市场以近10%的增长率展现了强劲的复苏势头，中国品牌的崛起为市场注入了新活力，当然现在的政
2025，大众汽车集团在中国如何转型？ 2024 年，大众汽车集团（中国）在复杂多变的市场环境中成功达成销量目标，向客户交付超过 290 万辆汽车，新能源汽车领
国产射频芯片公司汇总对于射频芯片这项卡脖子技术，国内很多公司在这方面努力，而且也做出了不错的成绩。一些射频芯片公司无论从研发
拆解报告：松下电器1200W电吹风松下EH-NW90电吹风内置10万转高速无刷电机，并具备三档风速和四档风温可选。电吹风内置纳诺怡技术，为秀发提供
拆解报告：白牌电动工具电池多功能放电转换器这款白牌多功能放电转换器适配得伟电动工具电池使用，将电动工具电池和放电转换器组装起来，即可组成移动电源和
拆解报告：MOMA猛玛LARK M2无线麦克风 MOMA猛玛LARK M2无线麦克风在外观方面，采用了极富创新的设计，提供了轻盈舒适的佩戴使用体验。发射器采用了夹
阿根廷2024年：销量下滑，北汽增长240.1%。 2024年阿根廷汽车市场在整体销量下滑的背景下，依然展现出多元化的发展趋势···
2025年第3周：全球最快四足机器人发布 2025年将成为机器人产业的关键时间点，业内预期27年人形机器人出货量可达50~100万台。从技术进步到供应链成熟
欧洲2024年汽车市场：微弱复苏和电动化加速并存 2024年，欧盟新车注册量小幅增长0.8%，达到约1060万辆，欧盟+英国+北欧国家的销量为1296.4万台，同比增长0.9%，整个欧
射频微波领域有哪些高质量期刊？今天我们结合网络上的资料一起整理一份射频微波领域的期刊列表，以便同学们投稿时可以选择···
拆解报告：Portal智能屏幕24W电源适配器 Portal智能屏幕电源适配器采用黑色直板机身，外观整洁，配有2米长黑色输出线。适配器采用美规固定插脚，支持100-2

性能飞跃！升级电流传感器NSM201x-P系列赋能汽车三电和光伏逆变器纳芯微推出全新车规级集成电流路径霍尔传感器NSM201x-P系列。该系列产品是对纳芯微已量产的NSM201x系列的完
意法半导体推出STSPIN32G0新列电机驱动器，满足工业自动化和家电市意法半导体STSPIN32系列集成化电机驱动器新增八款产品，满足电动工具、家用电器、工业自动化等应用的低成本、
Melexis推出性能先进的温度传感器，以红外技术创新实现电磁炉智能全球微电子工程公司Melexis宣布，推出专为电磁炉设计的非接触式红外温度传感器芯片MLX90617···
康佳特SMARC模块更新: 全新英特尔酷睿3处理器低功耗 SMARC 模块AI 加速和图形处理性能再次提升···
康佳特针对要求苛刻的实时应用推出新型高性能COM-HPC模块基于英特尔酷睿 Bartlett Lake S处理器的模块性能全面提升···
为汽车安全保驾护航，纳芯微推出基于AMR技术的ABS轮速传感器纳芯微宣布推出全新基于AMR（各向异性磁阻技术）的轮速传感器NSM41xx系列。该系列产品通过集成先进的磁性传感敏
Microchip推出全新Switchtec™ PCIe® 4.0 16通道交换机系列 PCI100x系列器件可为任何需要加速或专用计算的应用提供高性能和成本效益···
RK3576有多强？实测三屏八摄像头轻松搞定-米尔米尔基于他们推出的MYD-LR3576开发板开发了一个3屏异显，8路摄像头输入的DEMO，实测下来，RK3576轻松搞定了该任
SynQor®推荐先进的军用级三相输入UPS（UPS-1500-S-1U-T） SynQor的三相输入UPS电源能使单相负载在电源端呈现出符合MIL-STD-1399-300B标准的清洁、表现良好且几乎零反
村田开发超小尺寸、超低功耗的Type 2GQ GNSS模块，以匠心品质助在几年前，定位系统充斥于生活方方面面的情节还仅见于各式的科幻影片，而今具备这一功能的产品已经以各种形态步
瑞萨推出性能卓越的新型MOSFET 瑞萨全新晶圆技术可以帮助MOSFET实现导通电阻降低30%、栅漏电荷减少40%、封装尺寸缩小50%的目标···
加特兰集成 Cadence Tensilica ConnX 220 DSP 全面升级汽 ConnX 220 DSP 集成至基于下一代 Andes SoC 的加特兰雷达解决方案后，将带来显著优势，包括提高灵活性、

热门评论
最新评论

换一换

杂志声明

AI算法的进步超越了摩尔定律

这对AI意味着什么？

公众对AI硬件的关注

黑天鹅