为什么FPGA主频比CPU慢，但却可以用来帮CPU加速？-EDN 电子技术设计

 FPGA的频率一般只有几百MHz，而CPU的频率却高达数GHz。那么，有不少网友心中就有一个疑问：“为什么FPGA主频比CPU慢，但却可以用来帮CPU做加速？”。

我们知道，FPGA的频率一般只有几百MHz，而CPU的频率却高达数GHz。那么，有不少网友心中就有一个疑问：“为什么FPGA主频比CPU慢，但却可以用来帮CPU做加速？”。Pcpednc

今天，EDN就和大家系统性地讨论下这个问题。Pcpednc

将FPGA主频与CPU相比不妥

在开始之前，首先要明确一点，将FPGA的主频与CPU比较，实际是风马牛不相及的问题。FPGA和CPU是两种完全不同的器件，前者是专用，是硬件编程，而后者是通用，是软件编程。Pcpednc

Pcpednc

不同体系结构性能和灵活性的比较。(图片来源：《如何评价微软在数据中心使用 FPGA 代替传统 CPU 的做法？》)Pcpednc

表面上看，FPGA的时钟频率要低；对于通用计算任务，FPGA设计貌似不如CPU设计。但是实际上，单个FPGA的并行度却比CPU要高得多。FPGA的行为是确定性的，用作硬件加速器没有时间片、线程或资源冲突的问题。它始终以完全相同的速度执行一件事。因此，如果需要低延迟，那么FPGA就可能是最佳选择。Pcpednc

Pcpednc

计算密集型任务，CPU、GPU、FPGA、ASIC 的数量级比较（以16位整数乘法为例，数字仅为数量级的估计）（图片来源：《如何评价微软在数据中心使用 FPGA 代替传统 CPU 的做法？》）Pcpednc

FPGA并行计算机制

如知乎网友young cc所言，虽然CPU主频很高，但其是通用处理器，做某个特定运算（如信号处理，图像处理）可能需要很多个时钟周期。而FPGA可以通过编程重组电路，直接生成专用电路。加上电路并行性，可能做这个特定运算只需要一个时钟周期。Pcpednc

举例来说，CPU主频为3GHz，FPGA主频为200MHz。若做某个特定运算，CPU需要30个时钟周期，而FPGA只需一个，那么耗时情况是：Pcpednc

CPU：30/3GHz ＝10ns；Pcpednc

FPGA：1/200MHz ＝5ns。Pcpednc

可以看到，FPGA做这个特定运算速度比CPU块，能帮助加速。Pcpednc

另外，CPU的主频是加过流水线之后的。比如是15级流水线，则第一条指令执行了15个时钟周期后才能出结果。Pcpednc

但是，使用FPGA也不一定总能做加速。Pcpednc

例如，知乎网友Evan172就表示，使用FPGA做加速，只是在某些强计算和数据处理的方面，因为其硬件电路并行运行和有很多DSP硬核资源供调用的特点，可以工作得更出色。Pcpednc

FPGA本身也只是辅助角色，起控制的还是CPU本身，所以FPGA并不能代替CPU，只是在完成一件大任务的过程中将某部分任务分解给FPGA可以更好地一起完成任务。在这过程中也会有额外的开销产生，在某些场合，可能用了FPGA而效果更差也是有的。Pcpednc

另外，通常说的使用FPGA加速比CPU和GPU省电，是指在完成同样的任务下，FPGA耗费的电力比起CPU和GPU更少一些。这是相对而言的，并不是说FPGA本身就一定省电。Pcpednc

一个有趣的例子：数组加法计算

知乎用户doing举了一个很有趣的例子。他指出，假设用FPGA完整实现了CPU，然后再跑软件的话，的确比CPU慢。问题是FPGA不会那么干，它会直指问题本质，解决问题。Pcpednc

例如，有两个数组，其中有256个32位数。现在要把它们对应相加变成一个数组，用CPU写最快大概是这个样子：Pcpednc

r[0] = a[0] + b[0];Pcpednc

r[1] = a[1] + b[1];Pcpednc

...Pcpednc

r[255] = a[255] + b[255];Pcpednc

当然也可能会这么写（在分支预测准确，指令缓存不大的情况下可能更快）：Pcpednc

for (int i = 0; i < 255; i++)Pcpednc

r[i] = a[i] + b[i];Pcpednc

对FPGA来说，也可以用上面相同的写法，不同在于：Pcpednc

CPU是一个一个加法计算，而FPGA排好逻辑电路，在一个时钟周期内计算完毕。就算CPU主频比FPGA快100倍也赶不上啊。话说后来CPU大量的增加SIMD指令，就有点这个意思，不过这相当于提供库函数，没那么灵活。Pcpednc

FPGA的并行是真并行，CPU完全没得比。CPU如果想并行最多也就是让多个核并行，但是对于大部分算法实现来说，如上例，多个核之间的同步调度开销远远大于计算开销，就算多个核之间的调用开销可以做的很小，一般CPU也就那几个核，而FPGA只要门足够，想并行几路就可以并行几路。Pcpednc

所以在做可并行的计算密集型任务时，比如信号处理，网络传输等等FPGA可以帮上忙；但是如果做常见的以串行为主的任务，FPGA的确远远比不上CPU。如果要类比的话，有点像似GPU和CPU之间的关系。Pcpednc

“当年写Verilog的时候，我就想如果CPU里面自带一块FPGA，应用程序程序可以在初始化期间直接烧一段代码下去，那岂不是很爽。后来，有了能写shader的3D显卡...”Pcpednc

为什么FPGA成为数据中心尖端技术？

最后再讨论一个话题，就是为什么FPGA一直是数据中心领域最尖端的技术？Pcpednc

有人可能认为，再大的问题（算力）都可以通过堆CPU核心来解决。那么，假设有一台强大的48核服务器，即使使用非常高端的FPGA，也很难达到相同的吞吐量。而且，FPGA硬件设计还需要由强大的团队来完成，非常烧钱。Pcpednc

这时，如果把机会成本和能源效率两者考虑进去，好处就开始显现出来了。Pcpednc

首先来看能源效率。假设这台48核服务器的功耗为400W并且发热严重，那么就会对数据中心运营不利——能耗和散热是数据中心运营的两项最大支出。而将FPGA连接起来只执行一项任务，就可以实现很高的能效而开销极低。通过正确的设计，可以在实现低功耗的同时获得高吞吐量。Pcpednc

其次，机会成本（这个问题不太明显）。系统中的CPU内核数量就那么多。购买新的内核并且安装需要花很长时间，而且最好是将通用CPU内核保留用于通用任务（例如虚拟机订阅）。每个CPU核卖不出去就会烧钱。Pcpednc

当有任务大量占用CPU时间（例如AI推理）时，FPGA就成为了不错的选择。Pcpednc

一个有关微软Project Catapult项目当中FPGA的趣事

当年，微软必应团队在其Project Catapult项目中发现，在启用FPGA时，CPU的总体利用率实际上略有上升。所有的人都感到困惑，因为从直觉来看FPGA应该要减少CPU负载。但是后来他们发现，数据中心的业务流量达到了原来的2倍！由于效率提高，流量实现了两倍的负载均衡。由此可见FPGA的强大之处。Pcpednc

总结

维基百科的相关词条提到两点：FPGA的优势在于其并行特性，有时对于某些应用而言可以使速度明显变快；可以使用FPGA来对算法中的某些部分加速，也可以在FPGA和通用处理器之间共享部分计算。Pcpednc

综上，FPGA有两个优点：FPGA并行度远超CPU；CPU是通用电路，FPGA是定制电路。但是也有两个缺点：开发周期长；并不是所有东西都适合FPGA。Pcpednc

本文为电子技术设计原创文章，未经授权禁止转载。请尊重知识产权，违者本司保留追究责任的权利。

阅读全文，请先

赵明灿

赵明灿是EDN China的产业分析师/技术编辑。他在电子行业拥有10多年的从业经验。在加入ASPENCORE之前，他曾在电源和智能电表等领域担任过4年的工程师。

进入专栏

模拟/混合信号/RF

上一篇： 2019年全球前十大SSD模组厂品牌排名 下一篇： 2020全球CEO峰会：ADI后疫情时代“重思、重构、重升”及中国本地策略解读

微信扫一扫
一键转发
最前沿的电子设计资讯
请关注“电子技术设计微信公众号”

使用MSO 5/6内置AWG进行功率半导体器件的双脉冲测试在本文中，宽禁带功率器件供应商Qorvo与Tektronix合作，基于实际的SiC被测器件 (DUT)，描述了实用的解决方案···
嵌入式Rust：我们如今身处何方？ Rust对于一般应用开发来说很有意义，但对于嵌入式软件团队来说真的有意义吗？Rust如今的情况如何，它是否就是大家所鼓吹的最美好的解决方案？
毫米波雷达与音频技术重塑汽车驾乘新体验汽车行业的发展正由两大创新领域主导：更为精准可靠的车内感知系统和高质量音频系统。传统方法如增加传感器或音频设备数量，虽可提升性能但会带来成本上升和复杂性增加的问题。
康佳特SMARC模块更新: 全新英特尔酷睿3处理器低功耗 SMARC 模块AI 加速和图形处理性能再次提升···
康佳特针对要求苛刻的实时应用推出新型高性能COM-HPC 基于英特尔酷睿 Bartlett Lake S处理器的模块性能全面提升···
631.2亿美元的市场，创新制造工艺将为柔性电子带来什么？柔性电子设备的新型制造技术正在迅速涌现。有些人可能想知道它们是否比传统方法更好，以及它们什么时候会商业化，它们会影响电子设计工程师未来的创新吗？
创新的FPGA技术实现低功耗、模块化、小尺寸USB解决方本文总结了业界用于高性能 USB 3 设备的一些典型解决方案，并介绍了一种新的架构，这种架构既能节省功耗和面积，又能提高灵活性和易用性···
超薄硅晶圆的演进史让我们一起了解一下历史上是如何通过技术进步和制造工艺的改进，开发出高精度的超薄硅晶圆的···
NFC防伪技术：削弱假货对奢侈品行业的影响打击假冒伪劣最终需要奢侈品行业改进其产品认证方法。但是，随着越来越多的假冒产品不断涌入市场，奢侈品品牌该如何保护自己的知识产权和实体产品呢？
雷击之后加强我的NAS备份，谨慎遵循3-2-1备份规则？在我之前报道被雷击事故时，我曾提到过，这次被雷击损坏的电子设备中包括一台网络存储设备(NAS)。这次挫折迫使我不能再忽视我数据备份防护中一个长期存在的漏洞···
盘点CES 2025上基于Arm架构的AI创新和技术亮点近期在美国拉斯维加斯举行的 CES 2025 再次彰显了其作为展示最新科技创新的重要平台。今年展会上所呈现的众多前沿产品和新的发布将推动各个行业的变革与发展···
PCI Express Gen5：自动化多通道测试本文将重点介绍用于x16测试的RF开关配置。这些开关型号最多支持18条通道（PCIe最大通常为x16），也可支持更低的通道数···

机器人所需要的传感器有哪些？随着机器人技术的迭代升级，传感器的重要性将持续提升，其功能性、精度和适配性也将得到显著改进，作为机器人不可
2024年墨西哥市场分析，中国品牌崛起 2024年，墨西哥汽车市场以近10%的增长率展现了强劲的复苏势头，中国品牌的崛起为市场注入了新活力，当然现在的政
2025，大众汽车集团在中国如何转型？ 2024 年，大众汽车集团（中国）在复杂多变的市场环境中成功达成销量目标，向客户交付超过 290 万辆汽车，新能源汽车领
国产射频芯片公司汇总对于射频芯片这项卡脖子技术，国内很多公司在这方面努力，而且也做出了不错的成绩。一些射频芯片公司无论从研发
拆解报告：松下电器1200W电吹风松下EH-NW90电吹风内置10万转高速无刷电机，并具备三档风速和四档风温可选。电吹风内置纳诺怡技术，为秀发提供
拆解报告：白牌电动工具电池多功能放电转换器这款白牌多功能放电转换器适配得伟电动工具电池使用，将电动工具电池和放电转换器组装起来，即可组成移动电源和
拆解报告：MOMA猛玛LARK M2无线麦克风 MOMA猛玛LARK M2无线麦克风在外观方面，采用了极富创新的设计，提供了轻盈舒适的佩戴使用体验。发射器采用了夹
阿根廷2024年：销量下滑，北汽增长240.1%。 2024年阿根廷汽车市场在整体销量下滑的背景下，依然展现出多元化的发展趋势···
2025年第3周：全球最快四足机器人发布 2025年将成为机器人产业的关键时间点，业内预期27年人形机器人出货量可达50~100万台。从技术进步到供应链成熟
欧洲2024年汽车市场：微弱复苏和电动化加速并存 2024年，欧盟新车注册量小幅增长0.8%，达到约1060万辆，欧盟+英国+北欧国家的销量为1296.4万台，同比增长0.9%，整个欧
射频微波领域有哪些高质量期刊？今天我们结合网络上的资料一起整理一份射频微波领域的期刊列表，以便同学们投稿时可以选择···
拆解报告：Portal智能屏幕24W电源适配器 Portal智能屏幕电源适配器采用黑色直板机身，外观整洁，配有2米长黑色输出线。适配器采用美规固定插脚，支持100-2

性能飞跃！升级电流传感器NSM201x-P系列赋能汽车三电和光伏逆变器纳芯微推出全新车规级集成电流路径霍尔传感器NSM201x-P系列。该系列产品是对纳芯微已量产的NSM201x系列的完
意法半导体推出STSPIN32G0新列电机驱动器，满足工业自动化和家电市意法半导体STSPIN32系列集成化电机驱动器新增八款产品，满足电动工具、家用电器、工业自动化等应用的低成本、
Melexis推出性能先进的温度传感器，以红外技术创新实现电磁炉智能全球微电子工程公司Melexis宣布，推出专为电磁炉设计的非接触式红外温度传感器芯片MLX90617···
康佳特SMARC模块更新: 全新英特尔酷睿3处理器低功耗 SMARC 模块AI 加速和图形处理性能再次提升···
康佳特针对要求苛刻的实时应用推出新型高性能COM-HPC模块基于英特尔酷睿 Bartlett Lake S处理器的模块性能全面提升···
为汽车安全保驾护航，纳芯微推出基于AMR技术的ABS轮速传感器纳芯微宣布推出全新基于AMR（各向异性磁阻技术）的轮速传感器NSM41xx系列。该系列产品通过集成先进的磁性传感敏
Microchip推出全新Switchtec™ PCIe® 4.0 16通道交换机系列 PCI100x系列器件可为任何需要加速或专用计算的应用提供高性能和成本效益···
RK3576有多强？实测三屏八摄像头轻松搞定-米尔米尔基于他们推出的MYD-LR3576开发板开发了一个3屏异显，8路摄像头输入的DEMO，实测下来，RK3576轻松搞定了该任
SynQor®推荐先进的军用级三相输入UPS（UPS-1500-S-1U-T） SynQor的三相输入UPS电源能使单相负载在电源端呈现出符合MIL-STD-1399-300B标准的清洁、表现良好且几乎零反
村田开发超小尺寸、超低功耗的Type 2GQ GNSS模块，以匠心品质助在几年前，定位系统充斥于生活方方面面的情节还仅见于各式的科幻影片，而今具备这一功能的产品已经以各种形态步
瑞萨推出性能卓越的新型MOSFET 瑞萨全新晶圆技术可以帮助MOSFET实现导通电阻降低30%、栅漏电荷减少40%、封装尺寸缩小50%的目标···
加特兰集成 Cadence Tensilica ConnX 220 DSP 全面升级汽 ConnX 220 DSP 集成至基于下一代 Andes SoC 的加特兰雷达解决方案后，将带来显著优势，包括提高灵活性、

热门评论
最新评论

换一换

杂志声明

为什么FPGA主频比CPU慢，但却可以用来帮CPU加速？

将FPGA主频与CPU相比不妥

FPGA并行计算机制

一个有趣的例子：数组加法计算

为什么FPGA成为数据中心尖端技术？

一个有关微软Project Catapult项目当中FPGA的趣事

总结