英伟达公司Michael Kagan：以AI的“iPhone时刻”为基础，构建数据处理的未来-EDN 电子技术设计

 Kagan拥有40年的行业经验，他的职业生涯始于英特尔，参与了从i860到Pentium MMX的架构设计。

Michael Kagan自2020年5月起担任Nvidia首席技术官，当时Nvidia收购了他在以色列共同创立的Mellanox公司。Mellanox为这家半导体制造商带来了加速网络技术，有助于支持“数据中心就是一台计算机”的概念，并有助于Nvidia构建数据中心的架构——从芯片和框架到支持应用高效执行的软件的方方面面。4zfednc

Kagan拥有40年的行业经验，他的职业生涯始于英特尔，参与了从i860到Pentium MMX的架构设计。4zfednc

4zfednc

对软件的投资将永久延续，Michael Kagan认为。4zfednc

Brans：您的职业生涯相当辉煌，从20世纪80年代初就开始在英特尔工作。您在那里的第一份工作是什么，后来又是如何发展的？

Kagan：我于1983年夏天开始在英特尔以色列工厂工作。我的第一个项目是N3矢量处理器，但这个项目最终作废了。然后，我被调到俄勒冈州，从事浮点单元的开发，这是英特尔80387SX数学协处理器的基础模块。一年后，我回到以色列，开始研究高性能矢量处理器，也即第二代Intel 860架构。4zfednc

我是i860XP的架构师，它在硅片设计方面取得了巨大的成功。它是第一个能在第一块硅片上启动Linux的CPU，并在计算密集型工作负载上的性能比i486高出50倍。遗憾的是，英特尔没有开发软件和生态系统支持，因此该CPU最终停产了。i860的经历给了我一个基本的教训：如果没有软件，芯片只是昂贵的沙子。4zfednc

我在英特尔的最后一个项目是奔腾MMX处理器，这是第一个在美国以外设计的主流英特尔CPU。在其成功推出后不久，我离开英特尔，与其他八位创始人一起创办了Mellanox公司，其中大多数人都是前英特尔工程师。4zfednc

我们在创建Mellanox的过程中取得了巨大成功，在新冠疫情前一年，Nvidia宣布了收购我们的计划。因此，在了解到软件的重要性30年后，我加入了Nvidia。该公司生产最先进的矢量处理器或GPU(图形处理单元)，同时也倡导软件的作用。Nvidia开发软件，在标准应用程序接口(API)上展现Nvidia GPU的性能和功能。此外，Nvidia还为高级工作负载开发了新的API，并在多代硅片上进行维护。一旦软件在Nvidia产品上开发完成，就能在未来几代产品上完整运行。对软件的投资将永久延续。4zfednc

Brans：当您刚开始职业生涯时，您是否想到过这个行业会发展成现在这样？

Kagan：计算机一直让我着迷。我那时还是个好奇的孩子，就对新技术和对这种能够加速人类处理数据的能力的机器非常着迷。从很小的时候起，我就想了解计算机的构造和工作原理。它能将人的能力加速到百万倍，令人叹为观止。Steve Jobs曾经说过，人类是工具制造者：人类制造工具，放大我们的能力。我无法想象计算改变世界的程度。我认为，80年代初的任何人都无法想象，几十年后计算机年销量将达到300亿台。4zfednc

Brans：您是如何进入Mellanox的？

Kagan：1999年是互联网泡沫的顶峰。我经常拒绝各种初创公司的邀请。有一天，我接到了Eyal Waldman的电话，他是我在英特尔的同事。他为我提供了成为Mellanox联合创始人的机会。我知道，基于我从小养成的核心价值观——承诺、团队合作和卓越——我们可以一起创建一家伟大的公司。我接受了他的邀请，并于第二天向英特尔递交了辞呈。4zfednc

Brans：您在Mellanox工作期间有哪些亮点？

Kagan：Mellanox的发展历程就像过山车。我们的愿景是建立一种技术，使计算和存储成为一种服务，就像电力一样。今天，这就是所谓的云。4zfednc

在英特尔，我们学会了如何制造快速计算机并作为服务器和个人电脑出售。让数千台计算机成为一个无定形的计算资源池是一项挑战，而实现这一目标的关键技术是高效通信和快速网络。我们开始研究当时新制定的高性能网络行业标准InfiniBand，并开始开发基于InfiniBand网络标准的产品。4zfednc

第一个亮点，也是真正的亮点，是我们的第二代网络产品。我们开发了最先进的网络解决方案，令所有竞争对手望尘莫及。从2003年开始，我们的Infini-Band网络使超级计算机大众化，弗吉尼亚理工大学团队利用我们的网络连接了1,000台苹果个人电脑，制造出了世界上第三快的计算机。随着时间的推移，我们的网络在超级计算机中变得越来越普遍，如今，它已成为高性能计算的事实标准。4zfednc

随后，甲骨文公司(Oracle)基于Mellanox网络构建了自己的数据库机。这是我们在比超级计算机更广阔的市场上首次亮相，也是我们进入企业和云的切入点。4zfednc

另一个亮点是利用InfiniBand技术并在标准以太网之上提供其价值。这为我们带来了新的机遇，因为几乎所有的云提供商都开始使用我们的网络。无论你去到互联网上的任何地方，都会经过我们的网络产品。4zfednc

Brans：您第一次听说Nvidia是什么时候？第一印象如何？

Kagan：Nvidia成立于1993年，是一家设计图形加速芯片的公司。我不确定“加速计算”这个词是什么时候创造出来的，但这正是Nvidia从一开始就做的事情。Nvidia开发了世界一流的可编程技术，用于高度并行处理。这种可编程性通过易于使用的接口CUDA展现出来，并在各代产品中保持稳定。4zfednc

速度更快的处理器、移动性和移动设备生成的数据量共同激发了新数据处理技术的发展：人工智能。这种新的数据处理方式需要高度并行的计算技术。Nvidia将图像处理技术应用于人工智能。20多年前，GPU一词代表图形处理单元。在人工智能时代，GPU实际上是一个通用处理单元，在所有人工智能工作负载中都承担着繁重的数据处理任务。4zfednc

为AI工作负载构建计算机需要高性能网络，因此Mellanox在15年前开始与Nvidia合作。我们密切合作，共同打造了世界上最快的超级计算机。Nvidia GPU正在处理海量数据，而Mellanox网络则为超级计算机提供数据。4zfednc

Brans：是否很早以前就有迹象，GPU将在某天为超级计算机赋能呢？

Kagan：超级计算机工作负载是高度并行的工作负载。从早期开始，评估超级计算机性能的主要基准是LINPACK，这是一个用于执行数值线性代数的软件库，基本上是对巨大矩阵进行运算。这种类型的操作需要加速器来实现更高的性能和能效，而GPU天然适合这些工作负载。随着人工智能的发展，线性代数成为主流计算。Nvidia发现了这一机遇，并将GPU重塑为线性代数加速器，即没有显示端口的GPU。所有的硅片预算都用于线性代数。4zfednc

随着摩尔定律逐渐失效，人工智能工作负载以每年10倍的速度推动计算需求，只有加速计算才能满足这一需求。这正是GPU的优势所在。4zfednc

Brans：Nvidia收购Mellanox的原因是什么？结果如何？

Kagan：今天的计算需求只能通过新的计算单元来满足。整个数据中心成为一个新的计算单元，运行的工作负载跨越数以万计的计算节点，每个节点包含多个GPU和CPU。这些GPU和CPU需要加速联网。这些计算节点运行分布式应用程序，即使数据传输延迟几纳秒，也会影响整个应用程序，造成计算资源浪费和功耗超标。Nvidia制造了世界上最大的计算机，而高性能网络是确保可预测的执行时间和功效以及改善TCO(总体拥有成本)的关键要素之一。4zfednc

在收购之前，Mellanox已经与Nvidia紧密合作了10多年。在某些时候，成为一家公司更有意义。自收购以来，市场的发展证明这对各方来说都是一个极好的举措。4zfednc

Brans：现在，作为Nvidia的CTO，您如何看待未来10年的行业发展？

Kagan：这个问题提出的时机非常好！我们现在正在经历人工智能的“iPhone时刻”，因为ChatGPT将全世界的注意力都集中到了这项变革性技术上。生成式人工智能将产生巨大的影响——可能超过iPhone或互联网。4zfednc

作为Nvidia的CTO，我的职责是通过丰富的Nvidia技术来构建未来的人工智能工厂。我们正在为21世纪的数据处理打造一个加速计算平台。基于人工智能的计算将作为云服务从数据中心、边缘设备、企业和移动设备等任何地方接入。人工智能和LLM(大型语言模型)将很快成为主流计算平台。4zfednc

Brans：您是否记得受到Grace Hopper这个人的启发？能谈谈她以及她对计算的意义吗？

Kagan：Grace Hopper是一位令人印象深刻的女性。她是第一个编译器的创建者，是计算机编程领域的开拓者。她甚至创造了“bug”一词，用来指软件故障。为了纪念她对编程和软件开发的贡献，我们以她的名字命名了GH200 Grace Hopper超级芯片。4zfednc

Brans：Grace Hopper系列芯片的主要特点是什么？它是如何突破传统计算的？

Kagan：Nvidia GH200 Grace Hopper超级芯片将Nvidia Hopper GPU的突破性性能与高能效、高性能的Nvidia Grace CPU相结合，并通过高带宽、内存相干的NVLink Chip-2-Chip(C2C)互连实现连接。这可提供高达900GB/s的总带宽，比加速系统中常用的标准PCIe Gen5通道高7倍，而且NVLink-C2C的功耗低5倍。GH200是要求最苛刻的生成式AI和高性能计算(HPC)应用的理想选择。4zfednc

Brans：Grace Hopper最适合哪些应用？气候建模？大型语言模型？

Kagan：客户需要一个多功能系统来处理最大的人工智能模型，并充分发挥其基础设施的潜力。GH200可处理最复杂的生成式人工智能和加速计算工作负载，涵盖大型语言模型、推荐系统、矢量数据库和高性能计算。4zfednc

查看专题文章——与英特尔、英伟达和AMD三位CTO的独家对话4zfednc

（原文刊登于EDN姊妹网站EE Times欧洲版，参考链接：Nvidia's Michael Kagan: Building on AI's "iPhone Moment" to Architect Data Processing's Future，由Franklin Zhao编译。）4zfednc

责编：Franklin

阅读全文，请先

精英访谈处理器/DSP 数据中心 EDN原创

上一篇： 英特尔公司Greg Lavender：“我们要让人工智能大众化” 下一篇： AMD公司Mark Papermaster：“我们重新设计了工程流程”，以实现模块化设计

微信扫一扫
一键转发
最前沿的电子设计资讯
请关注“电子技术设计微信公众号”

意法半导体：让可持续世界从概念变为现实最近，意法半导体人力资源和企业社会责任总裁Rajita D’Souza分享了意法半导体的可持续发展战略和近期工作重点···
Arm Tech Symposia 年度技术大会顺利收官，继续构建作为当今时代最重大的技术变革之一，AI 极有潜力成为人类毕生最重要的技术。Arm 不仅提供了应用广泛的通用计算平台，还通过将 IP 与开源软件和工具乃至广泛的行业领先生态系统相结合，让全球 2,000 万开发者都能够使用 Arm 计算平台作为 AI 创新基础···
基于铁电晶体管科研，共探集成电路的创新之路后摩尔时代专题，泰克张欣与北大集成电路学院唐克超老师共话铁电晶体管、存储计算科研进展···
AI、汽车与RISC-V，一场双向奔赴的相互成就在日前举办的“第四届滴水湖中国RISC-V产业论坛”上，多位专家围绕“RISC-V在边缘计算领域的发展机遇”主题展开了深入讨论···
We Do——用特色创造价值，英能电子的创新电机方案汇总 7月25日，由AspenCore主办的2024电机驱动与控制论坛，邀请到了浙江英能电子科技有限公司CEO吕一松来分享英能在电机驱动与控制芯片上的创新与发展，其发表了“做智能世界的左膀右臂”的主题演讲···
2024电机驱动与控制论坛：AI时代下的电机会走向何方？ 7月25日，由专业电子机构媒体AspenCore主办的2024电机驱动与控制论坛，邀请到了元能芯、芯易荟、英能电子、兆易创新、赛元微电子、峰岹科技等知名企业和众多专家学者与会，一同探讨电机未来的无限可能···
探索创新共生发展|2024全球MCU及嵌入式生态发展大会【深圳，2024年7月25日讯】在全球微控制器（MCU）及嵌入式系统领域享有盛誉的2024年全球MCU及嵌入式生态发展大会，于2024年7月25日在深圳君悦酒店隆重举行。本届大会由AspenCore主办，汇聚众多国际和本土知名MCU厂商的技术和应用专家，为与会者带来了一场关于MCU技术趋势和应用解决方案的行业盛会。
智能融合，生态共赢| 2024国际AIoT生态发展大会隆重开【2024年7月25日－中国深圳讯】为了帮助产业链上下游企业更好地把握AIoT市场发展商机，由全球领先的专业电子机构媒体AspenCore携手深圳市新一代信息通信产业集群联合主办的【2024国际AIoT生态发展大会】于7月25日在深圳君悦酒店隆重举办。
超越摩尔：当汽车电子遇见3D-IC 在IIC Shanghai 2024国际集成电路展览会暨研讨会同期举办的“2024中国IC领袖峰会”上，Cadence数字产品资深高级总监刘淼进行了“当汽车电子遇见3D-IC”的主题演讲，分享了Cadence在汽车电子与3D-IC发展方面的独到见解。
SiC功率半导体技术：赋能绿色能源发展的未来中国的绿色能源产业正迎来前所未有的发展机遇。在IIC Shanghai 2024国际集成电路展览会暨研讨会同期举办的“2024国际绿色能源生态发展峰会”上蓉矽半导体副总裁、研发中心总经理高巍先生分享了有关于“SiC功率半导体技术对绿色能源发展的贡献”的主题演讲……
人大代表雷军的4份提案：聚焦低碳、AI、智能驾驶和智能 3月4日，第十四届全国人民代表大会第二次会议开幕前，全国人大代表，小米集团创始人、董事长兼CEO雷军在微博中透露，今年他将提交四份建议提案，分别涉及绿色低碳、人工智能、智能驾驶和智能制造等领域···
Arm Neoverse CSS新品解析，Arm全面设计助力AI时代的在2月22日Arm举办的技术媒体沟通会上，Arm推出了两款基于全新第三代Neoverse IP构建的新的Neoverse CSS产品——Neoverse CSS N3和Neoverse CSS V3···

机器人所需要的传感器有哪些？随着机器人技术的迭代升级，传感器的重要性将持续提升，其功能性、精度和适配性也将得到显著改进，作为机器人不可
2024年墨西哥市场分析，中国品牌崛起 2024年，墨西哥汽车市场以近10%的增长率展现了强劲的复苏势头，中国品牌的崛起为市场注入了新活力，当然现在的政
2025，大众汽车集团在中国如何转型？ 2024 年，大众汽车集团（中国）在复杂多变的市场环境中成功达成销量目标，向客户交付超过 290 万辆汽车，新能源汽车领
国产射频芯片公司汇总对于射频芯片这项卡脖子技术，国内很多公司在这方面努力，而且也做出了不错的成绩。一些射频芯片公司无论从研发
拆解报告：松下电器1200W电吹风松下EH-NW90电吹风内置10万转高速无刷电机，并具备三档风速和四档风温可选。电吹风内置纳诺怡技术，为秀发提供
拆解报告：白牌电动工具电池多功能放电转换器这款白牌多功能放电转换器适配得伟电动工具电池使用，将电动工具电池和放电转换器组装起来，即可组成移动电源和
拆解报告：MOMA猛玛LARK M2无线麦克风 MOMA猛玛LARK M2无线麦克风在外观方面，采用了极富创新的设计，提供了轻盈舒适的佩戴使用体验。发射器采用了夹
阿根廷2024年：销量下滑，北汽增长240.1%。 2024年阿根廷汽车市场在整体销量下滑的背景下，依然展现出多元化的发展趋势···
2025年第3周：全球最快四足机器人发布 2025年将成为机器人产业的关键时间点，业内预期27年人形机器人出货量可达50~100万台。从技术进步到供应链成熟
欧洲2024年汽车市场：微弱复苏和电动化加速并存 2024年，欧盟新车注册量小幅增长0.8%，达到约1060万辆，欧盟+英国+北欧国家的销量为1296.4万台，同比增长0.9%，整个欧
射频微波领域有哪些高质量期刊？今天我们结合网络上的资料一起整理一份射频微波领域的期刊列表，以便同学们投稿时可以选择···
拆解报告：Portal智能屏幕24W电源适配器 Portal智能屏幕电源适配器采用黑色直板机身，外观整洁，配有2米长黑色输出线。适配器采用美规固定插脚，支持100-2

性能飞跃！升级电流传感器NSM201x-P系列赋能汽车三电和光伏逆变器纳芯微推出全新车规级集成电流路径霍尔传感器NSM201x-P系列。该系列产品是对纳芯微已量产的NSM201x系列的完
意法半导体推出STSPIN32G0新列电机驱动器，满足工业自动化和家电市意法半导体STSPIN32系列集成化电机驱动器新增八款产品，满足电动工具、家用电器、工业自动化等应用的低成本、
Melexis推出性能先进的温度传感器，以红外技术创新实现电磁炉智能全球微电子工程公司Melexis宣布，推出专为电磁炉设计的非接触式红外温度传感器芯片MLX90617···
康佳特SMARC模块更新: 全新英特尔酷睿3处理器低功耗 SMARC 模块AI 加速和图形处理性能再次提升···
康佳特针对要求苛刻的实时应用推出新型高性能COM-HPC模块基于英特尔酷睿 Bartlett Lake S处理器的模块性能全面提升···
为汽车安全保驾护航，纳芯微推出基于AMR技术的ABS轮速传感器纳芯微宣布推出全新基于AMR（各向异性磁阻技术）的轮速传感器NSM41xx系列。该系列产品通过集成先进的磁性传感敏
Microchip推出全新Switchtec™ PCIe® 4.0 16通道交换机系列 PCI100x系列器件可为任何需要加速或专用计算的应用提供高性能和成本效益···
RK3576有多强？实测三屏八摄像头轻松搞定-米尔米尔基于他们推出的MYD-LR3576开发板开发了一个3屏异显，8路摄像头输入的DEMO，实测下来，RK3576轻松搞定了该任
SynQor®推荐先进的军用级三相输入UPS（UPS-1500-S-1U-T） SynQor的三相输入UPS电源能使单相负载在电源端呈现出符合MIL-STD-1399-300B标准的清洁、表现良好且几乎零反
村田开发超小尺寸、超低功耗的Type 2GQ GNSS模块，以匠心品质助在几年前，定位系统充斥于生活方方面面的情节还仅见于各式的科幻影片，而今具备这一功能的产品已经以各种形态步
瑞萨推出性能卓越的新型MOSFET 瑞萨全新晶圆技术可以帮助MOSFET实现导通电阻降低30%、栅漏电荷减少40%、封装尺寸缩小50%的目标···
加特兰集成 Cadence Tensilica ConnX 220 DSP 全面升级汽 ConnX 220 DSP 集成至基于下一代 Andes SoC 的加特兰雷达解决方案后，将带来显著优势，包括提高灵活性、

热门评论
最新评论

换一换

杂志声明

英伟达公司Michael Kagan：以AI的“iPhone时刻”为基础，构建数据处理的未来