AMD公司Mark Papermaster：“我们重新设计了工程流程”，以实现模块化设计-EDN 电子技术设计

 在AMD，Papermaster领导了工程流程的重新设计以及屡获殊荣的Zen高性能x86 CPU系列和高性能GPU的开发。

Mark Papermaster于2011年10月加入AMD，现任首席技术官兼执行副总裁。他负责微处理器设计、I/O和存储器、片上系统方法和高级研究等领域的产品开发和技术指导。他还负责监管IT部门，该部门负责提供公司的计算基础设施和服务。VE2ednc

在Papermaster 40多年的从业生涯中，他曾在思科(Cisco)和苹果担任领导职务——在前者领导硅片工程小组，在后者担任设备硬件工程高级副总裁。他还在IBM工作过26年，在技术和服务器开发方面担任过多个职务。VE2ednc

在AMD，Papermaster领导了工程流程的重新设计以及屡获殊荣的Zen高性能x86 CPU系列和高性能GPU的开发。VE2ednc

VE2ednc

超级计算就是异构计算，Mark Papermaster指出。VE2ednc

Brans：AMD在超级计算机市场上取得了成功。能谈谈这方面的情况吗？

Papermaster：超级计算一直是AMD的重点。大约十年前，我们就开始恢复我们的CPU路线图。我们重新设计了我们的工程流程，其中之一就是采用更加模块化的设计方法，即我们开发可重复使用的部件，然后根据应用需求将其组合在一起。VE2ednc

我们投资开发了一系列新的高性能CPU，同时还努力将GPU提升到更高性能。这两种类型的处理单元都很重要，因为超级计算就是异构计算。它需要CPU和GPU协调工作，共同完成最繁重的任务。VE2ednc

我们与美国能源部合作，首次大规模展示了我们的正确战略，我们在那里介绍了能够满足他们需求的基本概念。他们非常喜欢，我们最终赢得了现在世界上最大的超级计算机的竞标。这就是美国橡树岭国家实验室的“前沿”(Frontier)计算机。它的计算量超过了1exaFLOPS，也就是1000FLOPS一千倍的计算量。这真的是一个怪物。你需要这种计算能力来进行最困难的模拟，例如高精度天气预报和计算流体动力学。VE2ednc

我们现在提供这种商业技术，并在市场上取得了巨大成功。事实上，我们在超级计算机TOP500榜单上的排名同比增长了29%，并在绿色超级计算机TOP500榜单的前10位超级计算机中，为其中的7台提供支持。这是因为我们在提供最高的计算机性能的同时，还非常注重节能。VE2ednc

这是大家近年来目睹的AMD扭转乾坤的故事，我们不打算放慢脚步。我们有一个路线图，它将引领我们走向更大、更好的目标。VE2ednc

Brans：您提到了绿色计算，这在欧洲尤其重要。您能给我们介绍一下你们是如何提高能效的吗？

Papermaster：首先，能源效率是我们设计过程的重要组成部分——这是一种不同的思维方式。大家应该还记得，摩尔定律认为晶体管密度每24个月就会翻一番，因此使用晶体管的设备性能也会随之提高。能效也会相应提高。VE2ednc

出于物理原因，这一速度放缓了——晶体管正在达到分子极限，这意味着将晶体管组合在一起的旧方法无法像以前那样扩展。这就要求在能源使用方式上进行更多创新。我们认为，正确的方法就是我们所说的整体设计——将能效和高性能结合起来考虑。VE2ednc

当你设计一款新的计算机芯片时，您需要考虑从制造工艺到应用开发和部署的方方面面。在设计阶段，你就需要与制造商密切合作——例如，在设计控制时，当你正在运行的任务不需要晶体管时，它就会关闭并停止消耗能量。VE2ednc

在设计阶段，你还需要考虑应用，以便开发它们所需的电路。而一旦你交付了硬件，就必须帮助应用开发人员充分利用它。就人工智能而言，我们拥有先进的算法和数学格式，可以运行近似值，从而提高人工智能的能效——这在整个堆栈中都如此。因此，整体设计意味着在设计过程的各个方面，从性能到能效，一直至应用，都要考虑到。VE2ednc

芬兰的LUMI就是我刚才描述的一个例子，根据最新的TOP500榜单，它是欧洲最强大的超级计算机，世界排名第三。LUMI是一台基于AMD CPU和AMD GPU的超级计算机。我们与LUMI、图尔库大学和艾伦研究所建立了良好的合作伙伴关系。通过与这些合作伙伴合作，我们能够为LUMI升级，使其能够高效地运行AI工作负载。目前，他们正在使用LUMI对芬兰语和其他语言的大型语言模型进行训练。VE2ednc

Brans：随着人工智能算法的规模逐年扩大，它们需要更多的计算能力。您认为这种趋势会持续下去，还是说算法会变得更加高效？

Papermaster：支持最复杂、最精确的人工智能模型对越来越大的计算机的需求确实在增长。大型语言模型和其他类型的生成人工智能确实推动了超级计算机的大规模扩展。VE2ednc

一方面，大型语言模型的运行参数多达数千亿个，而且正在向万亿个参数迈进。随着它们的成长，它们所创建的内容和回答的问题之多令人叹为观止。但是，这种惊人的能力是有代价的。VE2ednc

大型语言模型需要摄取大量的训练数据，这就需要超级计算机级的计算能力。由于这种需求将持续增长，我们必须拥有更先进的节能超级计算技术。我所描述的整体设计是实现这一目标的最佳途径。VE2ednc

另一方面，人工智能模型的使用方式也将不断创新。你不需要一个通用语言模型来完成特定任务。相反，如果将数据集限制在公司或行业所需的范围内，就可以使用缩小范围的模型。缩小范围可以缩小模型大小，这也是提高人工智能计算能效的另一种方式。VE2ednc

Brans：我们谈到了支持人工智能的大型超级计算机。但我们不能忘记那些为不那么雄心勃勃的应用服务的数据中心——我们每天都要依赖的普通数据中心。您是如何切入这一市场的？

Papermaster：对于AMD来说，这是一个非常强大的市场，而且AMD在这个市场上一直稳步前进。事实上，我们在运行商业应用的超大规模CPU集群中占据了大部分份额。目前，我们已经推出了第四代Zen系列高性能CPU，并在用于通用计算的第四代EPYC服务器中投入使用。VE2ednc

我们基于CPU的四代计算产品表现非常出色。我们每一代都增加了更多的CPU，最新一代EPYC服务器的每个芯片上都有96个CPU内核，并且每个内核上都运行两个工作线程。这意味着数据中心运营商通过每个芯片运行的工作线程数量立即翻了一番。最近，我们非常高兴地宣布了一个更加紧凑的版本，称为Zen 4c。我们让它在执行云原生任务时更加节能。VE2ednc

如果你在超大规模运行云原生应用，需要大量工作线程，那你就需要它们以非常节能的方式运行。我们的第四代处理器代号为贝加莫(Bergamo)，CPU数量增至128个，并且每个芯片上的线程数量翻了一番。它非常高效，性能是竞争对手(例如同样为云原生工作负载设计的Ampere)的3.7倍。VE2ednc

回到我们如何根据应用领域的需求量身定制的问题上，针对科学计算，我们发布了AMD 3D V-Cache——我们采用了第四代x86内核并增加了额外的高速缓存。请记住，艰巨的科学任务需要数据非常接近处理核心。因此，我们垂直堆叠缓存，就在缓存在顶部。这极大地提高了电子设计自动化或计算机辅助设计工作负载的吞吐量。我们实现了显著的加速，这对Ansys等应用程序大有裨益。VE2ednc

附——Mark Papermaster采访视频：VE2ednc

VE2ednc

查看专题文章——与英特尔、英伟达和AMD三位CTO的独家对话VE2ednc

（原文刊登于EDN姊妹网站EE Times欧洲版，参考链接：AMD's Mark Papermaster: "We Reengineered Our Engineering Processes" to Enable Modular Design，由Franklin Zhao编译。）VE2ednc

责编：Franklin

本文为电子技术设计原创文章，未经授权禁止转载。请尊重知识产权，违者本司保留追究责任的权利。

阅读全文，请先

精英访谈处理器/DSP 缓存/存储技术人工智能 EDN原创

上一篇： 英伟达公司Michael Kagan：以AI的“iPhone时刻”为基础，构建数据处理的未来 下一篇： 嵌入式工程师的2024：从养成这3个关键习惯开始

微信扫一扫
一键转发
最前沿的电子设计资讯
请关注“电子技术设计微信公众号”

意法半导体：让可持续世界从概念变为现实最近，意法半导体人力资源和企业社会责任总裁Rajita D’Souza分享了意法半导体的可持续发展战略和近期工作重点···
基于铁电晶体管科研，共探集成电路的创新之路后摩尔时代专题，泰克张欣与北大集成电路学院唐克超老师共话铁电晶体管、存储计算科研进展···
AI、汽车与RISC-V，一场双向奔赴的相互成就在日前举办的“第四届滴水湖中国RISC-V产业论坛”上，多位专家围绕“RISC-V在边缘计算领域的发展机遇”主题展开了深入讨论···
探索创新共生发展|2024全球MCU及嵌入式生态发展大会【深圳，2024年7月25日讯】在全球微控制器（MCU）及嵌入式系统领域享有盛誉的2024年全球MCU及嵌入式生态发展大会，于2024年7月25日在深圳君悦酒店隆重举行。本届大会由AspenCore主办，汇聚众多国际和本土知名MCU厂商的技术和应用专家，为与会者带来了一场关于MCU技术趋势和应用解决方案的行业盛会。
SiC功率半导体技术：赋能绿色能源发展的未来中国的绿色能源产业正迎来前所未有的发展机遇。在IIC Shanghai 2024国际集成电路展览会暨研讨会同期举办的“2024国际绿色能源生态发展峰会”上蓉矽半导体副总裁、研发中心总经理高巍先生分享了有关于“SiC功率半导体技术对绿色能源发展的贡献”的主题演讲……
像素不是越高越好？2023年十大“科学”流言你中招了几条 “身份证会被手机消磁”、“相机像素越高，拍出的照片越清晰”、“食用含碘盐可预防核辐射”……这些说法一直在网络上广为流传，但事实上它们都是流言，你中招了几条？
英伟达公司Michael Kagan：以AI的“iPhone时刻”为基础 Kagan拥有40年的行业经验，他的职业生涯始于英特尔，参与了从i860到Pentium MMX的架构设计。
英特尔公司Greg Lavender：“我们要让人工智能大众化” Lavender认为自己的使命是“让英特尔重新焕发活力”。
与英特尔、英伟达和AMD三位CTO的独家对话笔者采访了英特尔、英伟达和AMD三家公司的CTO，请他们就行业的演变和发展方向发表了见解。
全面解析，2023小华半导体全新动&静系列方案在2023年度小华半导体产品&技术交流会上，小华半导体技术支持总监钟升分享了“2023小华全新推出的动&静系列方案全面剖析”的主题演讲，本文也将以此为基础展开，共同探秘小华在MCU解决方案上的创新···
创芯未来共筑生态 2023中国临港国际半导体大会暨司南司南科技奖由全球科技领先媒体机构AspenCore分析师团队与业界最具专业性的专家组成的司南科技奖评委会，并邀请EETimes、EDN、ESMChina广泛的用户进行投票，综合评选出半导体领域的各项奖项，期望逐渐成为最具风向标价值的科技奖之一，作为科技领域的指南针，引导科技行业参与者乘风破浪，是司南科技奖期望传递的态度与坚持。
“创芯未来共筑生态” 2023中国临港国际半导体大本届半导体大会的下午议程还有国际汽车半导体峰会、AI芯片与高性能计算论坛、Chiplet与先进封装技术论坛，以及汽车电子与半导体产业生态闭门会议、光电子芯片制造与高端应用论坛等系列活动。此外，晚上还将举行司南科技奖颁奖盛典。

机器人所需要的传感器有哪些？随着机器人技术的迭代升级，传感器的重要性将持续提升，其功能性、精度和适配性也将得到显著改进，作为机器人不可
2024年墨西哥市场分析，中国品牌崛起 2024年，墨西哥汽车市场以近10%的增长率展现了强劲的复苏势头，中国品牌的崛起为市场注入了新活力，当然现在的政
2025，大众汽车集团在中国如何转型？ 2024 年，大众汽车集团（中国）在复杂多变的市场环境中成功达成销量目标，向客户交付超过 290 万辆汽车，新能源汽车领
国产射频芯片公司汇总对于射频芯片这项卡脖子技术，国内很多公司在这方面努力，而且也做出了不错的成绩。一些射频芯片公司无论从研发
拆解报告：松下电器1200W电吹风松下EH-NW90电吹风内置10万转高速无刷电机，并具备三档风速和四档风温可选。电吹风内置纳诺怡技术，为秀发提供
拆解报告：白牌电动工具电池多功能放电转换器这款白牌多功能放电转换器适配得伟电动工具电池使用，将电动工具电池和放电转换器组装起来，即可组成移动电源和
拆解报告：MOMA猛玛LARK M2无线麦克风 MOMA猛玛LARK M2无线麦克风在外观方面，采用了极富创新的设计，提供了轻盈舒适的佩戴使用体验。发射器采用了夹
阿根廷2024年：销量下滑，北汽增长240.1%。 2024年阿根廷汽车市场在整体销量下滑的背景下，依然展现出多元化的发展趋势···
2025年第3周：全球最快四足机器人发布 2025年将成为机器人产业的关键时间点，业内预期27年人形机器人出货量可达50~100万台。从技术进步到供应链成熟
欧洲2024年汽车市场：微弱复苏和电动化加速并存 2024年，欧盟新车注册量小幅增长0.8%，达到约1060万辆，欧盟+英国+北欧国家的销量为1296.4万台，同比增长0.9%，整个欧
射频微波领域有哪些高质量期刊？今天我们结合网络上的资料一起整理一份射频微波领域的期刊列表，以便同学们投稿时可以选择···
拆解报告：Portal智能屏幕24W电源适配器 Portal智能屏幕电源适配器采用黑色直板机身，外观整洁，配有2米长黑色输出线。适配器采用美规固定插脚，支持100-2

性能飞跃！升级电流传感器NSM201x-P系列赋能汽车三电和光伏逆变器纳芯微推出全新车规级集成电流路径霍尔传感器NSM201x-P系列。该系列产品是对纳芯微已量产的NSM201x系列的完
意法半导体推出STSPIN32G0新列电机驱动器，满足工业自动化和家电市意法半导体STSPIN32系列集成化电机驱动器新增八款产品，满足电动工具、家用电器、工业自动化等应用的低成本、
Melexis推出性能先进的温度传感器，以红外技术创新实现电磁炉智能全球微电子工程公司Melexis宣布，推出专为电磁炉设计的非接触式红外温度传感器芯片MLX90617···
康佳特SMARC模块更新: 全新英特尔酷睿3处理器低功耗 SMARC 模块AI 加速和图形处理性能再次提升···
康佳特针对要求苛刻的实时应用推出新型高性能COM-HPC模块基于英特尔酷睿 Bartlett Lake S处理器的模块性能全面提升···
为汽车安全保驾护航，纳芯微推出基于AMR技术的ABS轮速传感器纳芯微宣布推出全新基于AMR（各向异性磁阻技术）的轮速传感器NSM41xx系列。该系列产品通过集成先进的磁性传感敏
Microchip推出全新Switchtec™ PCIe® 4.0 16通道交换机系列 PCI100x系列器件可为任何需要加速或专用计算的应用提供高性能和成本效益···
RK3576有多强？实测三屏八摄像头轻松搞定-米尔米尔基于他们推出的MYD-LR3576开发板开发了一个3屏异显，8路摄像头输入的DEMO，实测下来，RK3576轻松搞定了该任
SynQor®推荐先进的军用级三相输入UPS（UPS-1500-S-1U-T） SynQor的三相输入UPS电源能使单相负载在电源端呈现出符合MIL-STD-1399-300B标准的清洁、表现良好且几乎零反
村田开发超小尺寸、超低功耗的Type 2GQ GNSS模块，以匠心品质助在几年前，定位系统充斥于生活方方面面的情节还仅见于各式的科幻影片，而今具备这一功能的产品已经以各种形态步
瑞萨推出性能卓越的新型MOSFET 瑞萨全新晶圆技术可以帮助MOSFET实现导通电阻降低30%、栅漏电荷减少40%、封装尺寸缩小50%的目标···
加特兰集成 Cadence Tensilica ConnX 220 DSP 全面升级汽 ConnX 220 DSP 集成至基于下一代 Andes SoC 的加特兰雷达解决方案后，将带来显著优势，包括提高灵活性、

热门评论
最新评论

换一换

杂志声明

AMD公司Mark Papermaster：“我们重新设计了工程流程”，以实现模块化设计

Brans：AMD在超级计算机市场上取得了成功。能谈谈这方面的情况吗？

Brans：您提到了绿色计算，这在欧洲尤其重要。您能给我们介绍一下你们是如何提高能效的吗？

Brans：随着人工智能算法的规模逐年扩大，它们需要更多的计算能力。您认为这种趋势会持续下去，还是说算法会变得更加高效？

Brans：我们谈到了支持人工智能的大型超级计算机。但我们不能忘记那些为不那么雄心勃勃的应用服务的数据中心——我们每天都要依赖的普通数据中心。您是如何切入这一市场的？