在Hot Chips 2018的25场会议中，我们发现了13款热门芯片-EDN 电子技术设计

 随着机器学习的崛起，Hot Chips再度成为专注于芯片架构的工程师热烈参与的年度盛会。今年夏天，在第30届的Hot Chips 2018大会上有哪些值得关注的「热门芯片」？

今年夏天，全球芯片领域的年度大事——Hot Chips大会，一共举办了25场会议，其中有16场或多或少都聚焦于处理人工智能(AI)任务的芯片上。这些芯片应用涉及范围广泛，从瞄准物联网(IoT)和智能型手机的超低功耗组件，到数据中心所需的高耗电芯片等。aQPednc

曾经围绕着x86架构的产业整并，使得这一微处理器年度盛事有好几年变得不那么有趣。而今，随着机器学习的崛起，Hot Chips再度成为专注于芯片架构的工程师热烈参与的年度盛会。aQPednc

不管你相不相信，芯片业近来关注的重点并不只是深度学习。例如，大会中的一位发言人还介绍了可能取代DRAM的竞争方案，并呼吁探讨更多关于内存技术的话题。aQPednc

赛灵思(Xilinx)展示了一款针对AI打造的全新FPGA变化版本，并邀请与会者针对基于安全的全新运算架构展开设计行动。aQPednc

Alphabet董事长John Hennessey在发表专题演讲时指出，在Google计算机架构师发现安全漏洞之前，业界广泛使用的推测执行(speculative execution)技术易于遭受旁路攻击(side-channel attack)的情况已经存在长达20年了。aQPednc

Insight64分析师Nathan Brookwood说：「这不禁令人怀疑还有什么是我们以往没有注意到的......鉴于这些产品如此复杂却仍能有效作业，这一点真的令人惊讶。」。aQPednc

接下来，我们将重点介绍在今年Hot Chips大会上的一些有趣的讨论。我们将从其中一些令人印象深刻的创新想法和目标设计开始谈起。aQPednc

新创公司Tachyum挑战Xeon

新创公司Tachyum无疑是其中最具有胆识的，但却并不被看好。该公司的目标在于透过其Prodigy芯片，从而在主流服务器(server)用处理器和AI加速器市场分一杯羹。Tachyum宣称其Prodigy芯片的核心「比英特尔(Intel)的Xeon更快，也比Arm核心更小」。aQPednc

该公司表示，这款7奈米(nm) 290 mm2芯片支持多达64个核心，可在4GHz执行频率下提供高达2TFlops的运算效能，预计明年出样。aQPednc

事实上，如果没有重大的性能升级以及经过多方测试，数据中心营运商不太可能在其x86架构中采用新创公司的芯片和软件。因此，分析师Brookwood对于Tachyum采用超长指令字(VLIW)架构抱持怀疑态度，毕竟这是英特尔在其Itanium中未能完美掌握的技术。他补充说，如果该芯片能取得任何市场吸引力，Tachyum很可能面临来自英特尔等巨擘的专利诉讼。aQPednc

aQPednc

Tachyum的Prodigy芯片支持九阶整数和14阶浮点运算管线架构（本文图片来源：Hot Chips）aQPednc

Optane引发法规争议？

英特尔描述其最新的14nm Xeon服务器处理器Cascade Lake。该公司在不久前的一场活动中才发布这款芯片，但在Hot Chips大会上提供了更多细节，但也引发一些争议。aQPednc

Cascade Lake采用与英特尔现有14nm Xeon相同的机制、散热和插槽接口，也支持相同的核心数、快取结构以及I/O速度。新增部份包括微调14nm制程，以提高一点性能和降低一些功耗。此外，该芯片还支持新的AI指令和硬件，以避免暴露于Meltdown/Spectre的旁路通道攻击。aQPednc

但其重点在于，Cascade Lakes是第一款带有内存控制器的Xeon，可支持Intel Optane (即3D XPoint内存)，可为每插槽提供高达3TB主存储器以及带来超越DRAM的读/写速度。aQPednc

介绍该新产品的英特尔工程师并未评论Optane的耐用性。然而，他表示，这些主板使用的Jedec DDR4电气总线采用英特尔的专有协议，这已能让竞争对手近期内都望尘莫及。aQPednc

Brookwood说：「我认为这并不至于构成法律挑战。」aQPednc

「如果我是IBM或AMD，当Optane DIMM普及于数据中心而我却无法取得时，那么我可能会要大发牢骚了！英特尔占据了98%的服务器市场，在我看来，这就是一种垄断。」aQPednc

aQPednc

英特尔目前正主导储存网络产业协会(SNIA)，为Optane等替代主流内存打造软件平台aQPednc

NEC加速器低价挑战Nvidia V100

NEC描述一款新的向量引擎，可搭载PCIe Gen 3板卡，而功耗还不到200W。该芯片专为搭配SX-Aurora超级计算机与Linux服务器中的x86主机而设计，据称其价格要比Nvidia V100更低得多。aQPednc

NEC声称其向量芯片可提供高达307GFlops的双精度性能。在大多数基准检验下，其性能可介于Xeon和V100二者之间。该公司还指出，NEC芯片的内存带宽略高，而且在一些工作负载上的性能功耗比几乎相当于Nvidia GPU。aQPednc

相较于Nvidia V100芯片尺寸约840 mm2，NEC的1.6GHz、16nm向量芯片尺寸相对较小——480-mm2。此外，NEC的芯片支持多达6个Hi8或Hi4 HBM2内存堆栈，可提供高达48GB的总内存容量。aQPednc

为IoT打造超低功耗AI加速器

美国哈佛大学(Harvard University)和Arm的研究人员连手发表一种用于物联网中执行深度学习任务的超低功耗加速器。这款所谓的SMIV芯片采用台积电(TSMC) 16-nm FFC制程打造，芯片尺寸约为25 mm2。aQPednc

SMIV可说是使用Arm Cortex-A核心的首款学术界开发芯片。它在always-on的加速器丛集中使用近阈值操作，并透过嵌入式FPGA模块提供大约80个硬件MAC和44Kbits RAM。aQPednc

因此，该芯片能以低功率提供更高精确度。同时，相较于竞争方案，它的功率和面积效率都提高了近10倍。aQPednc

MIT打造更低功耗导航芯片

美国麻省理工学院(MIT)的研究人员则为机器人和无人机打造了一款客制设计的导航芯片，据称该芯片的功耗较Arm CPU核心更低。这款Navion导航芯片采用65nm CMOS制造，在20-mm2芯片面积上打造视觉惯性测距引擎。aQPednc

研究人员称，该芯片的性能是标准CPU的2倍至3倍，并可缩减多达5.4倍的内存占用空间。它在最大配置下的功耗为24mW，而在优化配置时的功耗仅2mW，而仍能实现实时导航。aQPednc

在Hot Chips大会的多场会议中只针对已发布的组件(有的甚至都已经出货)提供较多细节。接下来我们将先介绍用于客户端系统的AI加速器和CPU，并将关注焦点转向服务器处理器和加速器。aQPednc

Arm展示新款机器学习核心实力

Arm深入探讨其预计将在年底出现在芯片中的机器学习核心。新款机器学习核心可在1GHz提供约4TOPS运算性能，以及在以7nm制造的2.5-mm2核心上提供超过3TOPS/W性能。其乘法累加单元支持8个16位宽点乘积。aQPednc

aQPednc

Arm介绍其机器学习核心上的8 x 8区块压缩aQPednc

三星提升智能型手机性能

三星举例说明聪明的工程师如何在制程技术进展趋缓时显著提升性能。因此，从一系列基准检验来看，目前在其智能型手机中使用的2.7GHz M3应用处理器，轻轻松松地就能超越前一代M2至少50%以上。aQPednc

这项进展来自于在其分支预测器中使用神经网络，以及利用德州农工大学(Texas A&M )教授Daniel A. Jiménez的学术研究成果。不过，M3应用处理器的芯片尺寸是M2的2倍以上，但采用了10 LPP制程——这是三星10 LPE制程的微幅升级。aQPednc

Mythic展示内存处理器最新进展

Mythic描述其内存处理器(PIM)设计细节，它可用于处理具有0.5 picojoules/MAC的深度学习影像。该芯片设计针对监控和工厂相机，功耗约为5W，包括所有数字控制逻辑。aQPednc

PIM概念已出现多年了，但一直到最近才被应用于AI。Mythic打造基于NOR单元的可变电阻器数组，但并不在内存单元写入和读取深度学习权重。相反地，它将电压施加到数组线，以求和并读取电流级，进一步达到省电的效果。aQPednc

初始芯片可处理有限数量的权重，但基于砖式(tile)的设计可为全标线芯片扩展多达5倍权重。此外，还可以添加Arm核心以创建可编程组件，而且多个芯片间可以协同工作以执行更大的应用程序(app)或更快地执行。但缺点之一在于无法利用神经网络的稀疏特性。aQPednc

Mythic声称，这款40nm芯片的功耗只有GPU的一小部份。该公司预计明年年中提供样片，并预计于2019年底量产。aQPednc

aQPednc

Mythic的PIM目的在于以MCU功率提供GPU性能，而不至于影响稀疏神经网络aQPednc

Google侧写Pixel Visual Core

Google介绍在其最新智能型手机中的Pixel Visual Core。这款基于A53的可编程引擎，专为手机摄影机执行目前仍在发展中的最新版HDR +算法。一位Google工程师打趣地说：「它能让你的社交媒体图片看来不会太糟糕。」aQPednc

有趣的是，三星内存部门的一位工程师问道，未来世代是否会放弃典型的图像处理管线，转而采用新兴的深度学习技术？Google工程师回复说：「但我们还没在这个领域发布太多AI算法啊！」”aQPednc

aQPednc

Google声称其28nm Pixel核心执行HDR+作业的速度比10nm行动应用处理器的CPU快至少2.8倍aQPednc

IBM强化Power 9服务器系统

针对服务器领域，IBM与英特尔似乎都在14nm节点停摆一段时间了。IBM这次在Hot Chips介绍其最新的计划，为基于其Power 9处理器的系统强化I/O和内存带宽，不过，至少要到2020年或之后才会针对新制程提供新设计了。aQPednc

aQPednc

IBM的目标是在其Power 9服务器上发掘更多内存带宽，同时为基于7-nm处理器的设计做好准备aQPednc

富士通将Arm核心带入超级计算机

富士通(Fujitsu)描述了7-nm A64FX，其设计目标在于成为超级计算机中的首批Arm核心之一。该512位SIMD芯片为Arm架构带来向量扩展，以执行传统的超级运算和新的AI任务。52核心的芯片使用32GB HBM2内存，可提供2.7TFlops性能和1,024GB/s的内存带宽。aQPednc

aQPednc

富士通的首款post-Sparc设计A64FX，瞄准用于将在2021年发表的日本新一代Post-K超级计算机aQPednc

Nvidia展示其GPU服务器实力

Nvidia透过其DGX-2及其内部NVLink互连，从芯片进一步扩展到系统。该公司展示了几项基准检验，包括以DGX-2展现超越标准双GPU系统的性能。aQPednc

英特尔、AMD以及…中东和平？

英特尔介绍如何使用其嵌入式多芯片互连桥接(EMIB)技术，将其Kaby Lake桌上型x86 CPU与AMD Radeon RX Vega M GPU连接在一个模块(下图)中，以用于轻薄型笔记本电脑。aQPednc

分析师Brookwood还与英特尔主讲人开玩笑说，「不管是谁来谈成这项协议的，接下来应该可以派他去进行中东和平的任务。」aQPednc

aQPednc

（原文发表于ASPENCORE旗下EDN姐妹网站EETimes，参考链接：13 Hot Chips from Summer 2018；Susan Hong编译）aQPednc

aQPednc

本文为电子技术设计原创文章，未经授权禁止转载。请尊重知识产权，违者本司保留追究责任的权利。

阅读全文，请先

Rick Merritt

EE Times硅谷采访中心主任。Rick的工作地点位于圣何塞，他为EE Times撰写有关电子行业和工程专业的新闻和分析。他关注Android，物联网，无线/网络和医疗设计行业。他于1992年加入EE Times，担任香港记者，并担任EE Times和OEM Magazine的主编。

进入专栏

EDA/IP/IC设计产业前沿人工智能

上一篇： 苹果自动驾驶车原型曝光 下一篇： 华为麒麟980工程演示板细节解析

微信扫一扫
一键转发
最前沿的电子设计资讯
请关注“电子技术设计微信公众号”

超薄硅晶圆的演进史让我们一起了解一下历史上是如何通过技术进步和制造工艺的改进，开发出高精度的超薄硅晶圆的···
盘点CES 2025上基于Arm架构的AI创新和技术亮点近期在美国拉斯维加斯举行的 CES 2025 再次彰显了其作为展示最新科技创新的重要平台。今年展会上所呈现的众多前沿产品和新的发布将推动各个行业的变革与发展···
PCI Express Gen5：自动化多通道测试本文将重点介绍用于x16测试的RF开关配置。这些开关型号最多支持18条通道（PCIe最大通常为x16），也可支持更低的通道数···
芯耀辉：从传统IP到IP2.0，AI时代国产IP机遇与挑战齐飞 2024年，集成电路行业在变革与机遇中持续发展。面对全球经济的新常态、技术创新的加速以及市场需求的不断变化，集成电路企业如何在新的一年里保持竞争力并实现可持续发展？
Ceva 推出具有下一代蓝牙高数据吞吐量和 IEEE 802. 交钥匙集成式硬件和软件平台 IP 结合了功能齐全的蓝牙双模和下一代高数据吞吐量，以及适用于 Thread/Zigbee/Matter 的 IEEE 802.15.4标准，并包含了Ceva采用台积电 12nm 技术实现的最先进无线电···
用于电路分析和设计的Spice仿真指南–第14部分：评估用在电子仿真软件提供的众多功能中，.MEAS指令是分析和量化仿真电路行为的一个相当强大的工具···
用于电路分析和设计的Spice仿真指南–第13部分：温度管在本文中，我们将探讨SPICE如何管理温度以及仿真其影响的主要技术···
用LM337改造，让PWM DAC获得1.5 A输出能力 DAC是一种低功耗设备，其功率和电流输出能力仅限于毫瓦和毫安范围。当然，从根本上讲，它们没有理由不与合适的功率输出级配合使用，这确实也是常见的实际做法。不过，为了好玩，这个设计实例采用了不同的供电方式···
帕特·基辛格退休：工程师CEO的回归也救不回英特尔？在执掌英特尔三年多之后，魅力十足、雄心勃勃的英特尔首席执行官Pat Gelsinger下台了，这家摇摇欲坠的美国半导体巨头开始寻找继任者···
Arm年度技术大会：2025年底预计将有1,000亿台具备AI能力近日，作为 Arm 一年一度的技术盛会，2024 年度技术大会（Arm Tech Symposia 2024）在上海和深圳成功举办。这次的大会十分特殊，以往 Arm 年度技术大会往往会专注于特定的应用市场，而今年的大会只聚焦于一个领域——AI···
瑞萨推出包括先进可编程14位SAR ADC在内的全新Analog 全新产品几乎适用于任何应用，大幅减少元件数量、BOM成本和占板空间···
EDA/IP与IC设计：引领芯片产业变革的未来引擎（下午场）国际集成电路展览会暨研讨会(IIC Shenzhen 2024)期间举办的“EDA/IP与IC 设计论坛”汇聚了全球行业专家，共同探讨未来发展趋势、挑战与最佳实践，为推动行业创新与发展贡献力量。

机器人所需要的传感器有哪些？随着机器人技术的迭代升级，传感器的重要性将持续提升，其功能性、精度和适配性也将得到显著改进，作为机器人不可
2024年墨西哥市场分析，中国品牌崛起 2024年，墨西哥汽车市场以近10%的增长率展现了强劲的复苏势头，中国品牌的崛起为市场注入了新活力，当然现在的政
2025，大众汽车集团在中国如何转型？ 2024 年，大众汽车集团（中国）在复杂多变的市场环境中成功达成销量目标，向客户交付超过 290 万辆汽车，新能源汽车领
国产射频芯片公司汇总对于射频芯片这项卡脖子技术，国内很多公司在这方面努力，而且也做出了不错的成绩。一些射频芯片公司无论从研发
拆解报告：松下电器1200W电吹风松下EH-NW90电吹风内置10万转高速无刷电机，并具备三档风速和四档风温可选。电吹风内置纳诺怡技术，为秀发提供
拆解报告：白牌电动工具电池多功能放电转换器这款白牌多功能放电转换器适配得伟电动工具电池使用，将电动工具电池和放电转换器组装起来，即可组成移动电源和
拆解报告：MOMA猛玛LARK M2无线麦克风 MOMA猛玛LARK M2无线麦克风在外观方面，采用了极富创新的设计，提供了轻盈舒适的佩戴使用体验。发射器采用了夹
阿根廷2024年：销量下滑，北汽增长240.1%。 2024年阿根廷汽车市场在整体销量下滑的背景下，依然展现出多元化的发展趋势···
2025年第3周：全球最快四足机器人发布 2025年将成为机器人产业的关键时间点，业内预期27年人形机器人出货量可达50~100万台。从技术进步到供应链成熟
欧洲2024年汽车市场：微弱复苏和电动化加速并存 2024年，欧盟新车注册量小幅增长0.8%，达到约1060万辆，欧盟+英国+北欧国家的销量为1296.4万台，同比增长0.9%，整个欧
射频微波领域有哪些高质量期刊？今天我们结合网络上的资料一起整理一份射频微波领域的期刊列表，以便同学们投稿时可以选择···
拆解报告：Portal智能屏幕24W电源适配器 Portal智能屏幕电源适配器采用黑色直板机身，外观整洁，配有2米长黑色输出线。适配器采用美规固定插脚，支持100-2

性能飞跃！升级电流传感器NSM201x-P系列赋能汽车三电和光伏逆变器纳芯微推出全新车规级集成电流路径霍尔传感器NSM201x-P系列。该系列产品是对纳芯微已量产的NSM201x系列的完
意法半导体推出STSPIN32G0新列电机驱动器，满足工业自动化和家电市意法半导体STSPIN32系列集成化电机驱动器新增八款产品，满足电动工具、家用电器、工业自动化等应用的低成本、
Melexis推出性能先进的温度传感器，以红外技术创新实现电磁炉智能全球微电子工程公司Melexis宣布，推出专为电磁炉设计的非接触式红外温度传感器芯片MLX90617···
康佳特SMARC模块更新: 全新英特尔酷睿3处理器低功耗 SMARC 模块AI 加速和图形处理性能再次提升···
康佳特针对要求苛刻的实时应用推出新型高性能COM-HPC模块基于英特尔酷睿 Bartlett Lake S处理器的模块性能全面提升···
为汽车安全保驾护航，纳芯微推出基于AMR技术的ABS轮速传感器纳芯微宣布推出全新基于AMR（各向异性磁阻技术）的轮速传感器NSM41xx系列。该系列产品通过集成先进的磁性传感敏
Microchip推出全新Switchtec™ PCIe® 4.0 16通道交换机系列 PCI100x系列器件可为任何需要加速或专用计算的应用提供高性能和成本效益···
RK3576有多强？实测三屏八摄像头轻松搞定-米尔米尔基于他们推出的MYD-LR3576开发板开发了一个3屏异显，8路摄像头输入的DEMO，实测下来，RK3576轻松搞定了该任
SynQor®推荐先进的军用级三相输入UPS（UPS-1500-S-1U-T） SynQor的三相输入UPS电源能使单相负载在电源端呈现出符合MIL-STD-1399-300B标准的清洁、表现良好且几乎零反
村田开发超小尺寸、超低功耗的Type 2GQ GNSS模块，以匠心品质助在几年前，定位系统充斥于生活方方面面的情节还仅见于各式的科幻影片，而今具备这一功能的产品已经以各种形态步
瑞萨推出性能卓越的新型MOSFET 瑞萨全新晶圆技术可以帮助MOSFET实现导通电阻降低30%、栅漏电荷减少40%、封装尺寸缩小50%的目标···
加特兰集成 Cadence Tensilica ConnX 220 DSP 全面升级汽 ConnX 220 DSP 集成至基于下一代 Andes SoC 的加特兰雷达解决方案后，将带来显著优势，包括提高灵活性、

热门评论
最新评论

换一换

杂志声明

在Hot Chips 2018的25场会议中，我们发现了13款热门芯片

新创公司Tachyum挑战Xeon

Optane引发法规争议？

NEC加速器低价挑战Nvidia V100

为IoT打造超低功耗AI加速器

MIT打造更低功耗导航芯片

Arm展示新款机器学习核心实力

三星提升智能型手机性能

Mythic展示内存处理器最新进展

Google侧写Pixel Visual Core

IBM强化Power 9服务器系统

富士通将Arm核心带入超级计算机

Nvidia展示其GPU服务器实力

英特尔、AMD以及…中东和平？