寒武纪最新AI芯片数据意外曝光，性能直逼英伟达Tesla T4-EDN 电子技术设计

 近日，知乎上出现一则问题“如何看待寒武纪新一代人工智能芯片（疑似思元/MLU270）规格？”知乎提问者称其在某互联网大厂工作的朋友说已经看到实物，并附上相关PPT照片。本次PPT泄漏事件不仅曝光了新一代云端芯片的中文名“思元270”，还展示了该芯片的制程工艺、峰值性能、功耗等部分技术参数，性能数据直逼英伟达Tesla T4。

近日，知乎上出现一则问题“如何看待寒武纪新一代人工智能芯片（疑似思元/MLU270）规格？”GKvednc

MLU系列是寒武纪云端AI芯片系列产品。去年5月，寒武纪发布其首款云端AI芯片MLU100芯片，但此前未曾宣布过中文命名，官方也从未提到过MLU270这个型号。GKvednc

本次PPT泄漏事件不仅曝光了新一代云端芯片的中文名“思元270”，还展示了该芯片的制程工艺、峰值性能、功耗等部分技术参数，性能数据直逼英伟达Tesla T4。GKvednc

不过去年MLU 100芯片发布现场，另一款名为“MLU 200”也被一并公布，据介绍支持推理和训练，并偏重训练，目前尚不清楚是否和如今发布的MLU270为同一款产品。GKvednc

知乎提问者称其在某互联网大厂工作的朋友说已经看到实物，并附上相关PPT照片。截至智东西截图，这条提问的浏览量已达到18129。GKvednc

011ednc20190507 GKvednc

知乎问题中附上寒武纪思元270系列板卡实物照片GKvednc

012ednc20190507 GKvednc

智东西第一时间向寒武纪一位主要负责人求证了曝光的思元MLU270芯片信息，对方表示，这（MLU270芯片相关信息被曝光）是一次意外，相关图片可能是从合作伙伴处流出，不过寒武纪确实已经注册了“思元”这个商标，该款芯片的正式发布还未敲定。届时智东西将进行进一步报道。GKvednc

另据一位安防行业主要厂商的高层透露，寒武纪芯片（应指该新款）在安防领域的应用，将要落地，正在评估。GKvednc

一、寒武纪第二代云端芯片部分参数曝光

延续寒武纪云端芯片MLU（Machine Learning Unit）系列，其二代云端AI芯片代号为“MLU270”。如今距离其在第一代云端推理AI芯片MLU100的推出刚满1年。GKvednc

另外在今年初，寒武纪已为旗下芯片注册两大中文商标名，分别是“思元”、“玄思”。现在云端芯片基本可以确定中文名是“思元”了，说不定“玄思”会是给终端系列产品取得名字。GKvednc

昨日，某一匿名用户又补上了一张更加直观的产品规格照片。GKvednc

013ednc20190507 GKvednc

根据泄露的照片显示，寒武纪新一代AI芯片名为MLU270，中文名为思元270，于2019年年初研制成功，主要规格参数如下：GKvednc

工艺：TSMC 16nm
峰值性能：256 TOPS [int4]，128 TOPS [int8]，64 TOPS [int16]
系统接口：x 16 PCIe Gen3
形状因素：Low-Profile PCIe
散热设计功耗：75W

从曝光参数可见，寒武纪在制程上的打法相对稳健，延续上一代选用台积电16nm工艺，并没有像美国的赛灵思、AMD、Wave Computing等企业的新一代云端AI芯片那样采用7nm工艺。GKvednc

在芯片架构上，新一代芯片从上一代MLUv01架构升级为MLUv02架构。GKvednc

另外，思元270中内建视频解码单元，应该是为海量的视频处理市场而专门配置。GKvednc

从性能方面来看，思元270似有向NVIDIA Tesla T4看齐的趋势。两者对比如下：GKvednc

014ednc20190507 GKvednc

根据图表，思元270的功耗为75W，与Tesla T4刚发布时的功耗持平，不过现在NVIDIA的官网显示Tesla T4的功耗已经低至70W。GKvednc

在峰值性能方面，思元270显示的数据非常接近Tesla T4。GKvednc

有知乎匿名用户称，Tesla T4的实测性能表现并不如预期，而且溢价较高，认为新的竞争者加入是好事。GKvednc

另有用户称，业内传闻说，寒武纪新一代芯片可以同时做训练和推理。GKvednc

还有一位自称来自海康研究院员工匿名表示，其院长也比较喜欢这款芯片产品。GKvednc

015ednc20190507 GKvednc

二、或在低精度训练领域实现关键性突破

随着深度学习的快速发展，数据科学工作者发现如果芯片能使用低精度计算的方法获得近似答案，其在速度和能耗比上将有很大优势，这对于移动设备及其他功率受限的设备相当适用。GKvednc

虽然低精度计算听起来很好，但该方法目前主要应用于推理，而非训练。GKvednc

这是因为，当使用较少的位进行训练时，舍弃的位会增加误差，致使训练的准确度被限制，通常训练至少需要FP32及更高精度的浮点运算。GKvednc

尽管许多研究人员在探索使用低精度训练且不会限制准确度的算法，目前市场上尚未出现有效且普遍适用的相关应用。GKvednc

根据思元270目前曝光的信息，不过只公布了低精度整数性能，并未公布浮点数据。部分业内人士猜测，或许寒武纪在低精度训练领域实现了关键性突破。GKvednc

如果这一猜测成真，这意味着寒武纪将为现有云端AI训练芯片做出重要的贡献。GKvednc

三、正统学术派，寒武纪的三年造芯历程

寒武纪，全名中科寒武纪科技有限公司，是中科院计算所孵化的企业。GKvednc

寒武纪的两位联合创始人陈天石和陈云霁是两兄弟，两人都是少年天才，从小考进中科大少年班，二十出头就博士毕业，在中科院计算所当研究员。2016年创业之初，寒武纪不仅在天使轮获得了中科院计算所的1000万元研究经费，还在各种项目资源中获得了中科院的支持。GKvednc

作为国家队AI芯片的“扛把子”，出身中科院的寒武纪可以说是战功赫赫，自2016年3月成立以来，每年均发布多款芯片产品，而且客户的名字也都是相当响亮，其AI芯片IP帮助华为海思麒麟970芯片一举拿下国内首发手机AI芯片的桂冠。GKvednc

016ednc20190507 GKvednc

从2016年起，寒武纪已经连续三年每年推出一代终端处理器产品，继去年发布云端AI芯片MLU 100后，第二代云端AI芯片也将在近期浮出水面。按照寒武纪在技术上贯彻“端云协作”的理念，思元270在大概率上能与寒武纪1A/1H/1M系列终端处理器完美适配。GKvednc

此前在媒体采访中，寒武纪执行董事罗韬曾经介绍，寒武纪设立了三条产品线：GKvednc

1、智能终端处理器IP授权，可以集成到手机、安防、汽车、可穿戴等终端芯片中。GKvednc

2、智能云服务器芯片，比如昨天发布的MLU100和即将发布的思元270，作为PCIE加速卡插在云服务器上。另外去年发布会上提到的支持训练和推理的MLU200云端芯片，不确定是否就是今日泄露的思元270芯片。GKvednc

3、家用智能服务机器人芯片，这条产品线暂时没有产品发布，就寒武纪研发产品的高效性来看，该产品线也相当值得期待。GKvednc

017ednc20190507 GKvednc

结语：云端训练AI芯片战事将起，谁能挑战英伟达

云端训练战场正在狼烟四起。过去几年，英伟达凭借GPU的超强算力以及cuDNN、TensorRT等一系列AI软件，在深度学习云端领域构建起强大而稳固的生态，尤其是在云端训练方面基本上一家独大、所向披靡。GKvednc

而随着寒武纪等一批实力芯片玩家加入赛道，云端训练的板块未必会一如既往地稳定不变。对于AI芯片创企而言，建立强大的生态系统是长久发展的关键，这需要持续的研发投入、过硬的技术、围绕芯片衍生的全套软硬件开发维护。GKvednc

假使寒武纪云端芯片的落地应用经过了时间和市场的检验，无论是在安防还是在其它领域，将成为这些领域取代英伟达等进口芯片的选择，前景很大，这对亟待芯片国产化的我国产业而言无疑将是好消息。GKvednc

（来源：智东西）GKvednc

阅读全文，请先

处理器/DSP 产业前沿人工智能

上一篇： 虚拟后视镜技术是厂商“炫技”还是大势所趋？ 下一篇： Middlebrook和Rosenstark的环路增益测量

微信扫一扫
一键转发
最前沿的电子设计资讯
请关注“电子技术设计微信公众号”

毫米波雷达与音频技术重塑汽车驾乘新体验汽车行业的发展正由两大创新领域主导：更为精准可靠的车内感知系统和高质量音频系统。传统方法如增加传感器或音频设备数量，虽可提升性能但会带来成本上升和复杂性增加的问题。
康佳特SMARC模块更新: 全新英特尔酷睿3处理器低功耗 SMARC 模块AI 加速和图形处理性能再次提升···
康佳特针对要求苛刻的实时应用推出新型高性能COM-HPC 基于英特尔酷睿 Bartlett Lake S处理器的模块性能全面提升···
再拆沃尔玛的FHD流媒体棒：“UHD”和“FHD”的区别在哪？在我于2024年7月拆解沃尔玛第一代onn. Android TV 4K UHD流媒体设备的介绍中，我还提到了一个FHD“棒”，它“在我右手边的书架上排队等着拆解”，现在是时候了···
兆易创新推出EtherCAT®从站控制芯片，工业自动化的卓越业界领先的半导体器件供应商兆易创新GigaDevice（股票代码 603986）宣布，正式推出EtherCAT®从站控制芯片···
瑞萨率先推出采用车规3nm制程的多域融合SoC 第五代R-Car SoC为集中式E/E架构，带来面向未来的多域融合解决方案，并支持Chiplet扩展···
艾迈斯欧司朗Belago红外LED，助力Supernode打造高精度避 Supernode与艾迈斯欧司朗携手，通过Belago红外LED实现精准扫地机器人避障；得益于Belago出色的红外补光功能，使扫地机器人能够大大提升其识别物体的能力，实现精准避障；Belago点阵照明器采用迷你封装，兼容标准无铅回流工艺，适用于各种3D传感平台，包括移动设备、物联网设备和机器人。
Nordic Semiconductor推出nRF54L15、nRF54L10 和 n 新型先进低功耗蓝牙SoC 带来更高效率和超强处理能力，为广泛物联网应用提高性能和灵活性···
AMD 宣布推出第二代 Versal Premium 系列，实现全新以业界首款采用 CXL 3.1 及 PCIe Gen6 并支持 LPDDR5 的 FPGA 器件扩展第二代 Versal 产品组合，助力快速连接、更高效数据迁移并释放更多内存···
AMD 以全球极快的纤薄尺寸电子交易加速卡扩展 Alveo AMD Alveo UL3422 加速卡为高频交易员在争夺最快交易执行的竞争中提供了优势，同时降低了进入门槛···
瑞萨推出高能效第四代R-Car车用SoC引领ADAS产品创新全新的R-Car V4M和R-Car V4H SoC产品面向大规模L2及L2+ADAS市场，同时保持现有R-Car产品的可扩展性与软件复用性···
Nordic Semiconductor 即将推出的 nRF54 系列 So 随着蓝牙技术联盟（Bluetooth SIG）将信道探测技术作为蓝牙 6.0 的一部分，Nordic 即将发布的 nRF54 系列中将采用该技术。

机器人所需要的传感器有哪些？随着机器人技术的迭代升级，传感器的重要性将持续提升，其功能性、精度和适配性也将得到显著改进，作为机器人不可
2024年墨西哥市场分析，中国品牌崛起 2024年，墨西哥汽车市场以近10%的增长率展现了强劲的复苏势头，中国品牌的崛起为市场注入了新活力，当然现在的政
2025，大众汽车集团在中国如何转型？ 2024 年，大众汽车集团（中国）在复杂多变的市场环境中成功达成销量目标，向客户交付超过 290 万辆汽车，新能源汽车领
国产射频芯片公司汇总对于射频芯片这项卡脖子技术，国内很多公司在这方面努力，而且也做出了不错的成绩。一些射频芯片公司无论从研发
拆解报告：松下电器1200W电吹风松下EH-NW90电吹风内置10万转高速无刷电机，并具备三档风速和四档风温可选。电吹风内置纳诺怡技术，为秀发提供
拆解报告：白牌电动工具电池多功能放电转换器这款白牌多功能放电转换器适配得伟电动工具电池使用，将电动工具电池和放电转换器组装起来，即可组成移动电源和
拆解报告：MOMA猛玛LARK M2无线麦克风 MOMA猛玛LARK M2无线麦克风在外观方面，采用了极富创新的设计，提供了轻盈舒适的佩戴使用体验。发射器采用了夹
阿根廷2024年：销量下滑，北汽增长240.1%。 2024年阿根廷汽车市场在整体销量下滑的背景下，依然展现出多元化的发展趋势···
2025年第3周：全球最快四足机器人发布 2025年将成为机器人产业的关键时间点，业内预期27年人形机器人出货量可达50~100万台。从技术进步到供应链成熟
欧洲2024年汽车市场：微弱复苏和电动化加速并存 2024年，欧盟新车注册量小幅增长0.8%，达到约1060万辆，欧盟+英国+北欧国家的销量为1296.4万台，同比增长0.9%，整个欧
射频微波领域有哪些高质量期刊？今天我们结合网络上的资料一起整理一份射频微波领域的期刊列表，以便同学们投稿时可以选择···
拆解报告：Portal智能屏幕24W电源适配器 Portal智能屏幕电源适配器采用黑色直板机身，外观整洁，配有2米长黑色输出线。适配器采用美规固定插脚，支持100-2

性能飞跃！升级电流传感器NSM201x-P系列赋能汽车三电和光伏逆变器纳芯微推出全新车规级集成电流路径霍尔传感器NSM201x-P系列。该系列产品是对纳芯微已量产的NSM201x系列的完
意法半导体推出STSPIN32G0新列电机驱动器，满足工业自动化和家电市意法半导体STSPIN32系列集成化电机驱动器新增八款产品，满足电动工具、家用电器、工业自动化等应用的低成本、
Melexis推出性能先进的温度传感器，以红外技术创新实现电磁炉智能全球微电子工程公司Melexis宣布，推出专为电磁炉设计的非接触式红外温度传感器芯片MLX90617···
康佳特SMARC模块更新: 全新英特尔酷睿3处理器低功耗 SMARC 模块AI 加速和图形处理性能再次提升···
康佳特针对要求苛刻的实时应用推出新型高性能COM-HPC模块基于英特尔酷睿 Bartlett Lake S处理器的模块性能全面提升···
为汽车安全保驾护航，纳芯微推出基于AMR技术的ABS轮速传感器纳芯微宣布推出全新基于AMR（各向异性磁阻技术）的轮速传感器NSM41xx系列。该系列产品通过集成先进的磁性传感敏
Microchip推出全新Switchtec™ PCIe® 4.0 16通道交换机系列 PCI100x系列器件可为任何需要加速或专用计算的应用提供高性能和成本效益···
RK3576有多强？实测三屏八摄像头轻松搞定-米尔米尔基于他们推出的MYD-LR3576开发板开发了一个3屏异显，8路摄像头输入的DEMO，实测下来，RK3576轻松搞定了该任
SynQor®推荐先进的军用级三相输入UPS（UPS-1500-S-1U-T） SynQor的三相输入UPS电源能使单相负载在电源端呈现出符合MIL-STD-1399-300B标准的清洁、表现良好且几乎零反
村田开发超小尺寸、超低功耗的Type 2GQ GNSS模块，以匠心品质助在几年前，定位系统充斥于生活方方面面的情节还仅见于各式的科幻影片，而今具备这一功能的产品已经以各种形态步
瑞萨推出性能卓越的新型MOSFET 瑞萨全新晶圆技术可以帮助MOSFET实现导通电阻降低30%、栅漏电荷减少40%、封装尺寸缩小50%的目标···
加特兰集成 Cadence Tensilica ConnX 220 DSP 全面升级汽 ConnX 220 DSP 集成至基于下一代 Andes SoC 的加特兰雷达解决方案后，将带来显著优势，包括提高灵活性、

热门评论
最新评论

换一换

杂志声明

寒武纪最新AI芯片数据意外曝光，性能直逼英伟达Tesla T4

一、寒武纪第二代云端芯片部分参数曝光

二、或在低精度训练领域实现关键性突破

三、正统学术派，寒武纪的三年造芯历程

结语：云端训练AI芯片战事将起，谁能挑战英伟达