Meta推出的首款自研AI芯片内部架构长什么样？-EDN 电子技术设计

 Facebook 在历史上一直是开源软件和硬件的坚定支持者，所以 Meta Platforms 为 MTIA 加速器采用 RISC-V 架构并不让人意外。

5月18日，Facebook、WhatsApp 和 Instagram 的所有者 Meta Properties 推出了首款专门为处理人工智能程序而定制的计算机芯片，称为“Meta训练和推理加速器”，（Meta Training and Inference Accelerator，简称 MTIA）。Meta 将MTIA描述为加速 AI 训练和推理工作负载的芯片“家族”的一部分。G6qednc

这是Meta 的第一款用于运行 AI 模型的定制芯片，并针对其自身的内部工作负载进行了优化。扎克伯格在 Facebook 的一篇帖子中表示，该芯片将做一些事情，比如“为我们的人工智能推荐系统提供动力，帮助找出最好的内容，更快地向你展示。”G6qednc

G6qednc

图：专为 AI 工作负载设计的 AI 芯片。来源：MetaG6qednc

在过去十年左右的时间里，Meta 花费了数十亿美元，招募了顶级数据科学家，并建立了各种新的AI，其中一些AI支撑了自己的引擎、审核过滤器和广告推荐器等。但Meta一直想着把这些AI转化为产品，特别是在生成式AI方面。直到 2022 年，Meta 主要使用 CPU 和专为加速 AI 算法而设计的定制芯片的组，但CPU 在处理AI工作负载时的效率往往低于 GPU。G6qednc

最近，Meta公司还收购了英国芯片独角兽Graphcore公司的人工智能网络技术的奥斯陆团队。G6qednc

MTIA采用RISC-V架构

Facebook 在历史上一直是开源软件和硬件的坚定支持者，所以 Meta Platforms 为 MTIA 采用 RISC-V 架构并不让人意外。G6qednc

MTIA基于双核 RISC-V，采用台积电7nm工艺，功率25W。 G6qednc

G6qednc

下图中可以看到，MTIA v1 推理芯片内有一个8x8的处理元件网格，通过网状网络连接，这些处理元件周围环绕着 128 MB 的 SRAM 内存，放置在网格的边缘上。外部有 16 个低功耗 DDR5 (LPDDR5) 内存，高达64GB的片外DRAM容量。G6qednc

G6qednc

两个RISC-V 内核中有一个是带有矢量数学扩展的。G6qednc

G6qednc

Meta Platforms 工程总监Roman Levenstein 透露，与 GPU 相比，MTIA 在全连接层上的每瓦性能最高可达两倍。G6qednc

Meta 也表示，就每消耗一瓦能量的每秒浮点运算次数而言，MTIA 芯片的效率最高可达 GPU 的三倍。然而，当芯片负责更复杂的神经网络时，它会落后于 GPU，Meta 说，这表明未来版本的芯片需要做更多的工作来处理复杂的任务。G6qednc

MTIA 加速器安装在小型双 M.2 板上，可以更轻松地集成到服务器中。这些板使用 PCIe Gen4 x8 链接连接到服务器上的主机 CPU，功耗低至 35 W。G6qednc

G6qednc

图：带有 MTIA 的样品测试板。G6qednc

目前，MTIA的重点是推理--而不是训练。 G6qednc

Meta Platforms 的软件工程师 Joel Coburn 在 AI Infra @ Scale 活动中展示下面这张图表，图中展示了Meta的 DLRM 推理模型在过去三年中的规模和计算需求如何增长，以及未来十八个月的成长：G6qednc

G6qednc

他指出，G6qednc

深度学习推荐模型（DLRM）对业务至关重要
随着时间的推移，模型大小（GB）和复杂度（GFLOPS）显著增长
要跟上这一趋势，需要高效的平台解决方案来实现预期的投资回报率。

Meta也收集了MTIA 与其他加速器性能的结果。比较基于运行五个不同 DLRM 的端到端性能，代表低到高复杂性的工作负载。G6qednc

G6qednc

其他科技巨头也都已开启自己的定制 AI 芯片之路：G6qednc

谷歌的TPU（“张量处理单元”的缩写），用于训练大型生成式人工智能系统，如PaLM-2和Imagen。
亚马逊向 AWS 客户提供专有芯片，用于训练 ( Trainium ) 和推理 ( Inferentia )。
微软正在与 AMD 合作开发一种名为 Athena 的内部 AI 芯片。

G6qednc

责编：Echo

阅读全文，请先

人工智能 EDA/IP/IC设计产业前沿

上一篇： 华为向全球招募天才少年，五倍薪酬 下一篇： iPhone也能玩ChatGPT了，提供五大功能

微信扫一扫
一键转发
最前沿的电子设计资讯
请关注“电子技术设计微信公众号”

创新的FPGA技术实现低功耗、模块化、小尺寸USB解决方本文总结了业界用于高性能 USB 3 设备的一些典型解决方案，并介绍了一种新的架构，这种架构既能节省功耗和面积，又能提高灵活性和易用性···
Arm 技术预测：2025 年及未来的技术趋势 Arm 对 2025 年及未来的技术发展做出了预测，范围涵盖技术的各个方面，从 AI 的未来发展到芯片设计，再到不同技术市场的主要趋势···
该如何设计PCB以保证恶劣环境下的信号完整性在现代电子设计中，保持PCB信号完整性是一项越来越具有挑战性的任务···
CES 2025：洞察汽车创新未来从CES 2025的汽车方案展示可以看到，汽车OEM正从黑盒解决方案转变为区域架构为主的处理主干，传感器功能也逐渐优化，结合多模态输入数据与情境感知的 ML...
CES 2025：Edge AI硬件加速再掀热潮边缘计算/边缘人工智能(Edge AI)一直是热门话题，在CES 2025也不例外。然而，实现边缘计算/智能的底层硬件是什么？又是如何实现与应用的呢？
英伟达50系列显卡发布，RTX 5090D近乎“零提升”？ 1月6日的CES展会上，英伟达正式发布了备受期待的RTX 50系列显卡···
全自动手术机器人出现，缝合速度比医生还快30%？美国约翰霍普金斯大学和斯坦福大学的联合团队创造了一项前所未有的突破，他们首次对机器人进行了训练，使其能够像人类医生一样熟练地执行相同的手术程序···
2024是AI MCU元年？ 2024年开启了MCU领域的AI时代，2025年可望见证更多轻量化AI模型在MCU上的进一步突破...
探索工业应用中边缘连接的未来我们的世界正变得更加智能且紧密相连，楼宇和工厂正以前所未有的方式实现自动化。为了确保这些新系统有效运行，可靠的信息通信至关重要···
其实CPU才是最适合AI推理的？因为这五大理由本文将具体介绍CPU成为AI推理工作负载最佳目标的五大理由···
人工智能前沿｜2025 年影响工程的顶级趋势想要在人工智能竞赛中保持领先的工程领导者应该关注四个关键领域的进步：生成式人工智能、验证和确认、降阶模型（ROM）和控制系统设计···
人工智能对数据中心基础设施带来了哪些挑战在加密货币和人工智能/机器学习（AI/ML）等新兴应用的驱动下，数据中心的能耗巨大，并将快速增长以满足用户需求···

机器人所需要的传感器有哪些？随着机器人技术的迭代升级，传感器的重要性将持续提升，其功能性、精度和适配性也将得到显著改进，作为机器人不可
2024年墨西哥市场分析，中国品牌崛起 2024年，墨西哥汽车市场以近10%的增长率展现了强劲的复苏势头，中国品牌的崛起为市场注入了新活力，当然现在的政
2025，大众汽车集团在中国如何转型？ 2024 年，大众汽车集团（中国）在复杂多变的市场环境中成功达成销量目标，向客户交付超过 290 万辆汽车，新能源汽车领
国产射频芯片公司汇总对于射频芯片这项卡脖子技术，国内很多公司在这方面努力，而且也做出了不错的成绩。一些射频芯片公司无论从研发
拆解报告：松下电器1200W电吹风松下EH-NW90电吹风内置10万转高速无刷电机，并具备三档风速和四档风温可选。电吹风内置纳诺怡技术，为秀发提供
拆解报告：白牌电动工具电池多功能放电转换器这款白牌多功能放电转换器适配得伟电动工具电池使用，将电动工具电池和放电转换器组装起来，即可组成移动电源和
拆解报告：MOMA猛玛LARK M2无线麦克风 MOMA猛玛LARK M2无线麦克风在外观方面，采用了极富创新的设计，提供了轻盈舒适的佩戴使用体验。发射器采用了夹
阿根廷2024年：销量下滑，北汽增长240.1%。 2024年阿根廷汽车市场在整体销量下滑的背景下，依然展现出多元化的发展趋势···
2025年第3周：全球最快四足机器人发布 2025年将成为机器人产业的关键时间点，业内预期27年人形机器人出货量可达50~100万台。从技术进步到供应链成熟
欧洲2024年汽车市场：微弱复苏和电动化加速并存 2024年，欧盟新车注册量小幅增长0.8%，达到约1060万辆，欧盟+英国+北欧国家的销量为1296.4万台，同比增长0.9%，整个欧
射频微波领域有哪些高质量期刊？今天我们结合网络上的资料一起整理一份射频微波领域的期刊列表，以便同学们投稿时可以选择···
拆解报告：Portal智能屏幕24W电源适配器 Portal智能屏幕电源适配器采用黑色直板机身，外观整洁，配有2米长黑色输出线。适配器采用美规固定插脚，支持100-2

性能飞跃！升级电流传感器NSM201x-P系列赋能汽车三电和光伏逆变器纳芯微推出全新车规级集成电流路径霍尔传感器NSM201x-P系列。该系列产品是对纳芯微已量产的NSM201x系列的完
意法半导体推出STSPIN32G0新列电机驱动器，满足工业自动化和家电市意法半导体STSPIN32系列集成化电机驱动器新增八款产品，满足电动工具、家用电器、工业自动化等应用的低成本、
Melexis推出性能先进的温度传感器，以红外技术创新实现电磁炉智能全球微电子工程公司Melexis宣布，推出专为电磁炉设计的非接触式红外温度传感器芯片MLX90617···
康佳特SMARC模块更新: 全新英特尔酷睿3处理器低功耗 SMARC 模块AI 加速和图形处理性能再次提升···
康佳特针对要求苛刻的实时应用推出新型高性能COM-HPC模块基于英特尔酷睿 Bartlett Lake S处理器的模块性能全面提升···
为汽车安全保驾护航，纳芯微推出基于AMR技术的ABS轮速传感器纳芯微宣布推出全新基于AMR（各向异性磁阻技术）的轮速传感器NSM41xx系列。该系列产品通过集成先进的磁性传感敏
Microchip推出全新Switchtec™ PCIe® 4.0 16通道交换机系列 PCI100x系列器件可为任何需要加速或专用计算的应用提供高性能和成本效益···
RK3576有多强？实测三屏八摄像头轻松搞定-米尔米尔基于他们推出的MYD-LR3576开发板开发了一个3屏异显，8路摄像头输入的DEMO，实测下来，RK3576轻松搞定了该任
SynQor®推荐先进的军用级三相输入UPS（UPS-1500-S-1U-T） SynQor的三相输入UPS电源能使单相负载在电源端呈现出符合MIL-STD-1399-300B标准的清洁、表现良好且几乎零反
村田开发超小尺寸、超低功耗的Type 2GQ GNSS模块，以匠心品质助在几年前，定位系统充斥于生活方方面面的情节还仅见于各式的科幻影片，而今具备这一功能的产品已经以各种形态步
瑞萨推出性能卓越的新型MOSFET 瑞萨全新晶圆技术可以帮助MOSFET实现导通电阻降低30%、栅漏电荷减少40%、封装尺寸缩小50%的目标···
加特兰集成 Cadence Tensilica ConnX 220 DSP 全面升级汽 ConnX 220 DSP 集成至基于下一代 Andes SoC 的加特兰雷达解决方案后，将带来显著优势，包括提高灵活性、

热门评论
最新评论

换一换

杂志声明

Meta推出的首款自研AI芯片内部架构长什么样？

MTIA采用RISC-V架构