一文看懂特斯拉Dojo的江湖地位及独门秘籍-EDN 电子技术设计

 近日特斯拉亮相的D1 芯片宣称拥有500亿个晶体管，超过了AMD拥有395.4亿个晶体管的Epyc Rome，落后于NVIDIA的GA100 Ampere SoC的540亿个晶体管的记录。

现在，特斯拉不仅是个汽车公司、AI公司，还是个芯片公司。在AI训练芯片界，用于训练AI模型的芯片供应商，除了英特尔、英伟达和Graphcore，现在还有特斯拉。NUzednc

近日特斯拉亮相的D1 芯片宣称拥有500亿个晶体管，超过了AMD拥有395.4亿个晶体管的Epyc Rome，落后于NVIDIA的GA100 Ampere SoC的540亿个晶体管的记录。NUzednc

D1 芯片总共有645mm²，每mm²上集成7750万个晶体管的有效晶体管密度，仅次于移动芯片苹果M1，功率密度高于Nvidia A100 GPU。NUzednc

NUzednc

D1使用 7nm工艺，推测是由三星或台积电代工，考虑到三星也制造了特斯拉的HW3芯片，所以前者代工D1的可能性更大一些。NUzednc

25个D1芯片组成一个Training Tile（训练片，EDN没有看到官方翻译，根据Tile的原意”瓦片”和它的外观暂且译为”训练片”吧）；然后12个训练片可以组成一个服务器机柜，共108 PFlops；几个机柜再组成Dojo超级计算机。NUzednc

NUzednc

图：每个服务器机柜超过 100,000 个功能单元、400,000 个定制内核和132GB SRAM。NUzednc

Dojo的江湖地位

特斯拉曾经采用NVIDIA GPU构建的超级计算机上过Top10榜单，性能仅略低于中国的太湖之光：NUzednc

NUzednc

从排名上看起来Dojo并不是计算能力最强的超级计算机，这是Dojo的设计目的只是针对一项非常具体的任务，即：基于大量360度视频训练神经网络。所有代码都是专门为在此硬件上理想工作而编写的。NUzednc

相比之下，其他超级计算机的构建都考虑到了灵活性，以便能够适应大量不同的任务。当然，如果真的要在视频训练上一决高下，即使是最强大的 Fugaku (富岳)，也很可能是比Dojo慢的。NUzednc

何况巨大的Fugaku是由256 个机柜组成，Dojo仅由10个机柜组成，因此在尺寸方面Dojo也是最小的超级计算机。NUzednc

如果特斯拉在Dojo中增加54个机柜，Dojo就能超过Fugaku。NUzednc

Dojo没有 RAM，没有共享缓存

智能手机和特斯拉的HW3都是有SoC之外的RAM 芯片的。即使是最快的最厉害的硬盘驱动器也做不到和RAM一样的随机存取，无法取代RAM。NUzednc

理论上，最新的PCIe 4技术只能达到0.5~3GB/s，比消费类计算机标准DDR4 RAM的20~25GB/s差太多，更别提高达50GB/s的下一代 DDR5 RAM。NUzednc

智能手机和消费电脑通常使用 4-32GB的RAM，专业工作站的RAM甚至可以达到512GB。NUzednc

那么，如果特斯拉的训练芯片没用RAM，那用的是啥？NUzednc

它内部是有一个更快的随机内存层，称为缓存。当 SoC/CPU 调用DRAM时，响应时间约为 60纳秒；而L3缓存或片上 SRAM 的响应时间可低至10纳秒。NUzednc

英特尔目前最大的L3缓存是57MB，IBM的记录是120MB，AMD最强大的处理器有256MB的L3缓存，而特斯拉在 2019 年宣布的 HW3 芯片有 64 MB 的 SRAM。 NUzednc

NUzednc

特斯拉的训练节点带有1.25MB的SRAM，354个节点组成的计算阵列，也就是这个SoC算下来就是424.8 MB的缓存，这超过了所有其他处理器。——这有可能都不是L3缓存，而是更快的 L2了。NUzednc

Dojo处理器之间通信采用定制协议

通常SoC是通过引脚把信号发送到主板上再进行传输，但特斯拉并没有把SoC从晶圆上割下来，而是把留在一片晶圆上的所有SoC连接起来。NUzednc

新 PCI-e Gen 4 连接的最新 SSD 的理论限制为 64 GB/s，特斯拉的每个连接器能达到900 GB/s的速度，推测是他们定制了自己的连接方式。NUzednc

NUzednc

Dojo采用液体冷却训练片

每个 D1 芯片的功耗仅400 W，25个芯片组成的MCM训练片的功耗为15千瓦。训练片是液体冷却的，据说用了10公斤液体，但特斯拉没说是水冷。 NUzednc

在Tesla的训练片中，有SoC的一侧与常规处理器一样是暴露着的，可以直接冷却。另一侧被稳压器盖住了，如上图所示。NUzednc

那么稳压器直接盖在处理器有啥好处？NUzednc

常见的处理器的电源都是装在处理器旁边的主板上，电流需要通过主板、插座、引脚和SoC；而Dojo训练片的电源可以直接传输到SoC，减少了散发的热量。NUzednc

最后，看起来特斯拉现在已经掌握着摩尔定律的衣钵，马斯克表示，“We should have Dojo operational next year”。明年值得期待。NUzednc

本文为电子技术设计原创文章，未经授权禁止转载。请尊重知识产权，违者本司保留追究责任的权利。

结果赔了夫人又折兵，成了全民公敌
只能佩服，因为兔子都在忙大数据卖菜呢~~

阅读全文，请先

人工智能汽车电子处理器/DSP

上一篇： 台积电公布其先进 CoWoS 封装技术路线图，2023 年为小芯片和 HBM3 架构做好设计准备 下一篇： 英特尔详解 Alder Lake处理器的P-Core和E-Core混合设计架构性能

微信扫一扫
一键转发
最前沿的电子设计资讯
请关注“电子技术设计微信公众号”

创新的FPGA技术实现低功耗、模块化、小尺寸USB解决方本文总结了业界用于高性能 USB 3 设备的一些典型解决方案，并介绍了一种新的架构，这种架构既能节省功耗和面积，又能提高灵活性和易用性···
盘点CES 2025上基于Arm架构的AI创新和技术亮点近期在美国拉斯维加斯举行的 CES 2025 再次彰显了其作为展示最新科技创新的重要平台。今年展会上所呈现的众多前沿产品和新的发布将推动各个行业的变革与发展···
芯耀辉：从传统IP到IP2.0，AI时代国产IP机遇与挑战齐飞 2024年，集成电路行业在变革与机遇中持续发展。面对全球经济的新常态、技术创新的加速以及市场需求的不断变化，集成电路企业如何在新的一年里保持竞争力并实现可持续发展？
Arm 技术预测：2025 年及未来的技术趋势 Arm 对 2025 年及未来的技术发展做出了预测，范围涵盖技术的各个方面，从 AI 的未来发展到芯片设计，再到不同技术市场的主要趋势···
该如何设计PCB以保证恶劣环境下的信号完整性在现代电子设计中，保持PCB信号完整性是一项越来越具有挑战性的任务···
CES 2025：洞察汽车创新未来从CES 2025的汽车方案展示可以看到，汽车OEM正从黑盒解决方案转变为区域架构为主的处理主干，传感器功能也逐渐优化，结合多模态输入数据与情境感知的 ML...
CES 2025：Edge AI硬件加速再掀热潮边缘计算/边缘人工智能(Edge AI)一直是热门话题，在CES 2025也不例外。然而，实现边缘计算/智能的底层硬件是什么？又是如何实现与应用的呢？
英伟达50系列显卡发布，RTX 5090D近乎“零提升”？ 1月6日的CES展会上，英伟达正式发布了备受期待的RTX 50系列显卡···
全自动手术机器人出现，缝合速度比医生还快30%？美国约翰霍普金斯大学和斯坦福大学的联合团队创造了一项前所未有的突破，他们首次对机器人进行了训练，使其能够像人类医生一样熟练地执行相同的手术程序···
2024是AI MCU元年？ 2024年开启了MCU领域的AI时代，2025年可望见证更多轻量化AI模型在MCU上的进一步突破...
探索工业应用中边缘连接的未来我们的世界正变得更加智能且紧密相连，楼宇和工厂正以前所未有的方式实现自动化。为了确保这些新系统有效运行，可靠的信息通信至关重要···
其实CPU才是最适合AI推理的？因为这五大理由本文将具体介绍CPU成为AI推理工作负载最佳目标的五大理由···

机器人所需要的传感器有哪些？随着机器人技术的迭代升级，传感器的重要性将持续提升，其功能性、精度和适配性也将得到显著改进，作为机器人不可
2024年墨西哥市场分析，中国品牌崛起 2024年，墨西哥汽车市场以近10%的增长率展现了强劲的复苏势头，中国品牌的崛起为市场注入了新活力，当然现在的政
2025，大众汽车集团在中国如何转型？ 2024 年，大众汽车集团（中国）在复杂多变的市场环境中成功达成销量目标，向客户交付超过 290 万辆汽车，新能源汽车领
国产射频芯片公司汇总对于射频芯片这项卡脖子技术，国内很多公司在这方面努力，而且也做出了不错的成绩。一些射频芯片公司无论从研发
拆解报告：松下电器1200W电吹风松下EH-NW90电吹风内置10万转高速无刷电机，并具备三档风速和四档风温可选。电吹风内置纳诺怡技术，为秀发提供
拆解报告：白牌电动工具电池多功能放电转换器这款白牌多功能放电转换器适配得伟电动工具电池使用，将电动工具电池和放电转换器组装起来，即可组成移动电源和
拆解报告：MOMA猛玛LARK M2无线麦克风 MOMA猛玛LARK M2无线麦克风在外观方面，采用了极富创新的设计，提供了轻盈舒适的佩戴使用体验。发射器采用了夹
阿根廷2024年：销量下滑，北汽增长240.1%。 2024年阿根廷汽车市场在整体销量下滑的背景下，依然展现出多元化的发展趋势···
2025年第3周：全球最快四足机器人发布 2025年将成为机器人产业的关键时间点，业内预期27年人形机器人出货量可达50~100万台。从技术进步到供应链成熟
欧洲2024年汽车市场：微弱复苏和电动化加速并存 2024年，欧盟新车注册量小幅增长0.8%，达到约1060万辆，欧盟+英国+北欧国家的销量为1296.4万台，同比增长0.9%，整个欧
射频微波领域有哪些高质量期刊？今天我们结合网络上的资料一起整理一份射频微波领域的期刊列表，以便同学们投稿时可以选择···
拆解报告：Portal智能屏幕24W电源适配器 Portal智能屏幕电源适配器采用黑色直板机身，外观整洁，配有2米长黑色输出线。适配器采用美规固定插脚，支持100-2

性能飞跃！升级电流传感器NSM201x-P系列赋能汽车三电和光伏逆变器纳芯微推出全新车规级集成电流路径霍尔传感器NSM201x-P系列。该系列产品是对纳芯微已量产的NSM201x系列的完
意法半导体推出STSPIN32G0新列电机驱动器，满足工业自动化和家电市意法半导体STSPIN32系列集成化电机驱动器新增八款产品，满足电动工具、家用电器、工业自动化等应用的低成本、
Melexis推出性能先进的温度传感器，以红外技术创新实现电磁炉智能全球微电子工程公司Melexis宣布，推出专为电磁炉设计的非接触式红外温度传感器芯片MLX90617···
康佳特SMARC模块更新: 全新英特尔酷睿3处理器低功耗 SMARC 模块AI 加速和图形处理性能再次提升···
康佳特针对要求苛刻的实时应用推出新型高性能COM-HPC模块基于英特尔酷睿 Bartlett Lake S处理器的模块性能全面提升···
为汽车安全保驾护航，纳芯微推出基于AMR技术的ABS轮速传感器纳芯微宣布推出全新基于AMR（各向异性磁阻技术）的轮速传感器NSM41xx系列。该系列产品通过集成先进的磁性传感敏
Microchip推出全新Switchtec™ PCIe® 4.0 16通道交换机系列 PCI100x系列器件可为任何需要加速或专用计算的应用提供高性能和成本效益···
RK3576有多强？实测三屏八摄像头轻松搞定-米尔米尔基于他们推出的MYD-LR3576开发板开发了一个3屏异显，8路摄像头输入的DEMO，实测下来，RK3576轻松搞定了该任
SynQor®推荐先进的军用级三相输入UPS（UPS-1500-S-1U-T） SynQor的三相输入UPS电源能使单相负载在电源端呈现出符合MIL-STD-1399-300B标准的清洁、表现良好且几乎零反
村田开发超小尺寸、超低功耗的Type 2GQ GNSS模块，以匠心品质助在几年前，定位系统充斥于生活方方面面的情节还仅见于各式的科幻影片，而今具备这一功能的产品已经以各种形态步
瑞萨推出性能卓越的新型MOSFET 瑞萨全新晶圆技术可以帮助MOSFET实现导通电阻降低30%、栅漏电荷减少40%、封装尺寸缩小50%的目标···
加特兰集成 Cadence Tensilica ConnX 220 DSP 全面升级汽 ConnX 220 DSP 集成至基于下一代 Andes SoC 的加特兰雷达解决方案后，将带来显著优势，包括提高灵活性、

热门评论
最新评论

换一换

杂志声明

一文看懂特斯拉Dojo的江湖地位及独门秘籍

Dojo的江湖地位

Dojo没有 RAM，没有共享缓存

Dojo处理器之间通信采用定制协议

Dojo采用液体冷却训练片