硬件性能正在被浪费？新框架能让现有计算机速度翻倍-EDN 电子技术设计

 加利福尼亚大学河滨分校的研究团队通过引入同时和异构多线程(SHMT)框架，可以同时利用ARM多核处理器、英伟达GPU和谷歌张量处理器(Google TPU)等硬件加速器，在不额外增加新的处理器的情况下，让系统实现速度的大幅提升和和能耗的显著降低···

当今的计算机设备越来越多地开始使用GPU、人工智能(AI)和机器学习(ML)硬件加速器或数字信号处理单元，这在一定程度上能提高计算机的性能，但由于这些组件只能分别处理信息，依次地将信息从一个处理单元移动到下一个处理单元，实际上对硬件的性能产生了巨大的浪费。PdUednc

最近，加利福尼亚大学河滨分校的研究团队通过引入同时和异构多线程(SHMT)框架，可以同时利用ARM多核处理器、英伟达GPU和谷歌张量处理器(Google TPU)等硬件加速器，在不额外增加新的处理器的情况下，让系统实现速度的大幅提升和和能耗的显著降低。PdUednc

传统的编程和执行模型只能将代码区域专门委托给一种处理器进行处理，而其他计算资源闲置，SHMT则不同，SHMT可以将同一函数的计算分解为多种类型的计算资源，并利用异构硬件同时并行处理。PdUednc

PdUednc

不同的执行模型：(a)传统异构计算机(b)具有软件流水线的传统异构计算机(c)SHMTPdUednc

为了达成这种效果，研究团队做出了多方面的努力：PdUednc

首先SHMT定义了一组可扩展的独立于硬件的虚拟操作(VOP)，允许异构硬件作为中间体与SHMT软件进行交互，从而促进任务匹配和分配，来解决描述和划分不同计算资源上的等效操作和数据的难题。
其次，SHMT提出了一个运行时系统，可以动态调整各种硬件单元上的工作负载，以最大限度地提高硬件效率，同时又让调度策略具有灵活性。
最后，SHMT提出了一种同时考虑结果和性能的低开销调度策略，用以平衡不同硬件之间格式、精度等方面的差异，在获得需要的结果的同时，又不产生过大的开销。

PdUednc

SHMT概述PdUednc

研究团队使用NVIDIA的Jetson Nano和Google的Edge TPU构建了一个示例性SHMT原型，之所以选定该系统平台进行测试，是因为其处理能力以及可用的处理器和加速器类型类似于现代智能手机或移动设备的硬件组件，可以更好的评估SHMT的真实性能。同时，Maxwell GPU和Edge TPU之间的计算能力比率与数据中心服务器上的计算能力比率相似，因此可用于评估SHMT在云服务器上的相对性能，该平台具体配置如下：PdUednc

Cortex-A57 ARM处理器
4GB 64位 LPDDR4 DRAM
128核Maxwell NVIDIA GPU
M.2 Accelerator A+E key Edge TPU

PdUednc

SHMT原型平台PdUednc

测试结果显示，与计算速度最快的加速器的情况相比，SHMT实现了1.95倍的加速，并且由于SHMT利用低功耗硬件加速器与GPU一起辅助程序执行，因此降低了51.0%的能耗。PdUednc

事实上，现代计算机系统已经是异构形式的，由多种类型的硬件架构组成，但是传统的执行模型通常未能充分利用好这些硬件设备，若能够将SHMT框架拓展到更多的设备上，将大幅提高现有设备的性能，并且不会增加额外的硬件成本。PdUednc

责编：Ricardo

阅读全文，请先

技术实例嵌入式系统测试与测量电源管理人机交互操作系统网络/协议工业电子汽车电子智能硬件医疗电子消费电子产业前沿工程师职业发展

上一篇： 选择电流检测电阻没有那么简单，这两方面的权衡要谨慎 下一篇： 疑华为新CPU海思泰山V120服务器CPU基准测试曝光，单核性能媲美Zen 3

微信扫一扫
一键转发
最前沿的电子设计资讯
请关注“电子技术设计微信公众号”

嵌入式Rust：我们如今身处何方？ Rust对于一般应用开发来说很有意义，但对于嵌入式软件团队来说真的有意义吗？Rust如今的情况如何，它是否就是大家所鼓吹的最美好的解决方案？
创新的FPGA技术实现低功耗、模块化、小尺寸USB解决方本文总结了业界用于高性能 USB 3 设备的一些典型解决方案，并介绍了一种新的架构，这种架构既能节省功耗和面积，又能提高灵活性和易用性···
雷击之后加强我的NAS备份，谨慎遵循3-2-1备份规则？在我之前报道被雷击事故时，我曾提到过，这次被雷击损坏的电子设备中包括一台网络存储设备(NAS)。这次挫折迫使我不能再忽视我数据备份防护中一个长期存在的漏洞···
通嘉PD快充适配器高效能及小型化之氮化镓集成方案随着消费者对便携性和高效充电的需求增加，手机厂商和充电器品牌纷纷推出小型化PD快充产品，以满足市场需求···
横向对比考毕兹振荡器和克拉泼振荡器我们之前在“一起来简单聊聊考毕兹振荡器”和“再来谈谈克拉泼振荡器，和考毕兹振荡器有何不同？”中分别研究过这两个振荡器。而对这两个振荡器进行横向对比也是十分有必要的···
该如何设计PCB以保证恶劣环境下的信号完整性在现代电子设计中，保持PCB信号完整性是一项越来越具有挑战性的任务···
用一种简单的方法进行三进制增益切换以简单的开/关/开拨动开关为中心，非常适合用于选择“某选项/无/其他”，但当需要三个活动选项时可能就不太尽如人意了···
基于SiC的高电压电池断开开关的设计注意事项在本文中，我们将讨论在选择功率半导体技术和定义高电压、高电流电池断开开关的半导体封装时的一些设计注意事项，以及表征系统的寄生电感和过流保护限值的重要性···
来看看在这个电源，能通过单个PWM输出进行计算机编程可变稳压电源是电子实验室工作台上的一种便捷工具，能产生极性相反的相等电压输出的对称型电源更是如此···
升压转换器的输出范围该怎么增加？这是一个来自现实生活中的问题：我们如何提高升压转换器的输出电压？
精密双极Dpot变阻器合成存在的致命问题合成Dpot通过使用FET分流器、精密固定电阻器和运算放大器来避免问题，但一个棘手的问题仍然存在：如果Va–Vb差分的极性发生反转怎么办？
用于电路分析和设计的Spice仿真指南–第14部分：评估用在电子仿真软件提供的众多功能中，.MEAS指令是分析和量化仿真电路行为的一个相当强大的工具···

机器人所需要的传感器有哪些？随着机器人技术的迭代升级，传感器的重要性将持续提升，其功能性、精度和适配性也将得到显著改进，作为机器人不可
2024年墨西哥市场分析，中国品牌崛起 2024年，墨西哥汽车市场以近10%的增长率展现了强劲的复苏势头，中国品牌的崛起为市场注入了新活力，当然现在的政
2025，大众汽车集团在中国如何转型？ 2024 年，大众汽车集团（中国）在复杂多变的市场环境中成功达成销量目标，向客户交付超过 290 万辆汽车，新能源汽车领
国产射频芯片公司汇总对于射频芯片这项卡脖子技术，国内很多公司在这方面努力，而且也做出了不错的成绩。一些射频芯片公司无论从研发
拆解报告：松下电器1200W电吹风松下EH-NW90电吹风内置10万转高速无刷电机，并具备三档风速和四档风温可选。电吹风内置纳诺怡技术，为秀发提供
拆解报告：白牌电动工具电池多功能放电转换器这款白牌多功能放电转换器适配得伟电动工具电池使用，将电动工具电池和放电转换器组装起来，即可组成移动电源和
拆解报告：MOMA猛玛LARK M2无线麦克风 MOMA猛玛LARK M2无线麦克风在外观方面，采用了极富创新的设计，提供了轻盈舒适的佩戴使用体验。发射器采用了夹
阿根廷2024年：销量下滑，北汽增长240.1%。 2024年阿根廷汽车市场在整体销量下滑的背景下，依然展现出多元化的发展趋势···
2025年第3周：全球最快四足机器人发布 2025年将成为机器人产业的关键时间点，业内预期27年人形机器人出货量可达50~100万台。从技术进步到供应链成熟
欧洲2024年汽车市场：微弱复苏和电动化加速并存 2024年，欧盟新车注册量小幅增长0.8%，达到约1060万辆，欧盟+英国+北欧国家的销量为1296.4万台，同比增长0.9%，整个欧
射频微波领域有哪些高质量期刊？今天我们结合网络上的资料一起整理一份射频微波领域的期刊列表，以便同学们投稿时可以选择···
拆解报告：Portal智能屏幕24W电源适配器 Portal智能屏幕电源适配器采用黑色直板机身，外观整洁，配有2米长黑色输出线。适配器采用美规固定插脚，支持100-2

性能飞跃！升级电流传感器NSM201x-P系列赋能汽车三电和光伏逆变器纳芯微推出全新车规级集成电流路径霍尔传感器NSM201x-P系列。该系列产品是对纳芯微已量产的NSM201x系列的完
意法半导体推出STSPIN32G0新列电机驱动器，满足工业自动化和家电市意法半导体STSPIN32系列集成化电机驱动器新增八款产品，满足电动工具、家用电器、工业自动化等应用的低成本、
Melexis推出性能先进的温度传感器，以红外技术创新实现电磁炉智能全球微电子工程公司Melexis宣布，推出专为电磁炉设计的非接触式红外温度传感器芯片MLX90617···
康佳特SMARC模块更新: 全新英特尔酷睿3处理器低功耗 SMARC 模块AI 加速和图形处理性能再次提升···
康佳特针对要求苛刻的实时应用推出新型高性能COM-HPC模块基于英特尔酷睿 Bartlett Lake S处理器的模块性能全面提升···
为汽车安全保驾护航，纳芯微推出基于AMR技术的ABS轮速传感器纳芯微宣布推出全新基于AMR（各向异性磁阻技术）的轮速传感器NSM41xx系列。该系列产品通过集成先进的磁性传感敏
Microchip推出全新Switchtec™ PCIe® 4.0 16通道交换机系列 PCI100x系列器件可为任何需要加速或专用计算的应用提供高性能和成本效益···
RK3576有多强？实测三屏八摄像头轻松搞定-米尔米尔基于他们推出的MYD-LR3576开发板开发了一个3屏异显，8路摄像头输入的DEMO，实测下来，RK3576轻松搞定了该任
SynQor®推荐先进的军用级三相输入UPS（UPS-1500-S-1U-T） SynQor的三相输入UPS电源能使单相负载在电源端呈现出符合MIL-STD-1399-300B标准的清洁、表现良好且几乎零反
村田开发超小尺寸、超低功耗的Type 2GQ GNSS模块，以匠心品质助在几年前，定位系统充斥于生活方方面面的情节还仅见于各式的科幻影片，而今具备这一功能的产品已经以各种形态步
瑞萨推出性能卓越的新型MOSFET 瑞萨全新晶圆技术可以帮助MOSFET实现导通电阻降低30%、栅漏电荷减少40%、封装尺寸缩小50%的目标···
加特兰集成 Cadence Tensilica ConnX 220 DSP 全面升级汽 ConnX 220 DSP 集成至基于下一代 Andes SoC 的加特兰雷达解决方案后，将带来显著优势，包括提高灵活性、

热门评论
最新评论

换一换

杂志声明

硬件性能正在被浪费？新框架能让现有计算机速度翻倍