去年4月,阿里巴巴集团宣布,公司研发部门达摩院正研发一款神经网络芯片“Ali-NPU”。同年 9 月,阿里巴巴成立独立芯片企业,马云赐名“平头哥”,由阿里内部的芯片业务与外部收购而来的中天微系统有限公司整合而成,阿里全资控股。
今天,阿里自研芯片平头哥终于发布了首款处理器,不过仍然是“半遮面”。
这家芯片公司发布了首款处理器——玄铁910(“玄铁”取自金庸小说、杨过手里的神剑之名,有重剑无锋大巧不工的含义)。据官方介绍,这款处理器基于开源RISC-V架构,同时也是该架构下性能最强的处理器,采用 12nm 制程,主频 2.5GHz,7.1Coremark/MHZ(世界公认的 BenchMark)。
架构上,玄铁 910 采用 16core 结构,12 级乱序流水线,并行 3 发射 8 执行 2 内存访问,最大支持 8MB 二级缓存,AI 增强的向量计算引擎。
据了解,玄铁910采用的 3 发射 8 执行的复杂乱序执行架构,是业界首个实现每周期2条内存访问的RISC-V处理器;基于RISC-V扩展了50余条指令,系统性增强了RISC-V的计算、存储和多核等方面能力。
据现场公布数据,玄铁910较业界主流芯片性能提高40%,较标准指令性能高出20%。戚肖宁介绍,这源于平头哥体系架构、指令系统、系统优化,以及中天微十余年的量产经验而达到的整体效果。
该颗芯片适用于用在人工智能加速器、5G、网络通讯、人工智能、自动将驾驶领域,可嵌入 CPU、SOC 芯片中。
为了进一步降低芯片设计门槛,加速行业创新,平头哥还现场发布英雄帖,邀请有量产能力企业和高校科研机构共同打造标杆项目,并宣布“普惠芯片”计划,在开源的RISC-V基础上进一步降低企业设计芯片的门槛:
换而言之,平头哥要将芯片性能提升一倍以上之余还可以将芯片成本降低一半。
此次架构中采用的 RISC-V 是一种免费开源指令集架构 (ISA)。诞生于加州大学伯克利分校的RISC-V因为其开源、灵活和低成本等优势,从面世开始就受到了开发者的热烈支持和厂商的广泛关注。尤其是进入最近几年,在AIoT潮流和各国政府的支持下,RISC-V更是呈现出一种星火燎原之势。
该指令集设计非常简单,采用了基础指令集与扩展指令集的方式,基础指令集只包含了不到 50 条指令。
“RISC-V 可能真正能成为国产的自主的指令集架构。”RISC-V 技术领袖、芯来科技 CEO 胡振波在接受媒体采访时谈道,RISC-V 作为免费的架构,将会和 ARM 产生竞争。在手机等传统 ARM 的垄断领域会保持强势存在,在一些新兴的边缘领域,比如 IoT、AI、边缘计算领域,RISC-V 将具有爆发空间。
据了解,阿里的芯片研发团队目前已经将近两百余人,分设于上海、美国两地,去年对外公布为数十人,一年时间里发展迅速。
其核心团队拥有十年以上的CPU和芯片研发经验,长期从事自研指令架构、CPU微体系结构与系统芯片产品的研发,累计开发了7款嵌入式CPU IP核;同时这些产品均已得到大规模量产的验证,授权客户超100家,累计销售超十亿颗,这些芯片被广泛应用于机器视觉、工业控制、车载终端、移动通信、多媒体、无线接入和信息安全等领域,主要客户为一线芯片设计公司。
据此前介绍,平头哥公司将做两类芯片,一是云端的神经网络芯片 Ali-NPU,类似于谷歌的 TPU(张量处理器),用于 AI 推理;二是嵌入式芯片,用于物联网终端。
阿里做芯片,还有一个更大的优势在于可以将产品直接用在公司运营中,并且对这些场景足够了解。
而在此之前,阿里广投芯片企业,注资了不少新兴的芯片企业,加码芯片竞争。2018 年 6 月,国内 AI 芯片企业寒武纪科技宣布完成数亿美元 B 轮融资,原股东阿里巴巴创新投跟投。寒武纪的发展思路也是云端一体,与平头哥的定位类似。此外,阿里巴巴创业者基金还投资了美国终端 AI 芯片商耐能(Kneron)。
目前,阿里的嵌入式芯片已经发布,而云端的神经网络芯片 Ali-NPU 的进展同样值得关注,并且将为阿里云业务带来更为直接的推进和影响。据了解,该颗芯片或将于今年晚些时候公布进展。
@知乎匿名用户:“性能提高一倍以上”这是跟谁比?“成本降低一半以上”跟谁比?我希望不是那种性能暴打51,成本比a76低一半的东西。
微博读者@ 中宜云控互联网科技股份有限公司: 玄铁!这名字够硬
@知乎匿名用户:这个东西暂时没法用,没什么成熟的生态。兼容安卓比较困难而且损失性能。用在服务器上应该问题不大,阿里云那么多服务器,自己先消化一部分吧。
微信读者@特朗普:别吹,新造芯片的最起码要迭代三代才能证明能用,离好用还差得远。可参考华为海思和兆芯
知乎用户@ 不自由而无用的人:x86卖芯片,arm卖授权,risc v走开源。这三个设计难度是逐渐变低,性能上限和兼容性目前也是逐渐变低。
微信读者@ciao:推理PPA,只谈性能极限更多的是噱头。Coremark是eembc发布的嵌入式单核处理器benchmark,主要还是测试单核流水线性能以及编译器的优化能力。一个优秀的处理器,只是有一些性能数据是远远不够的,何况还可能是实验室环境下的极限数据。拥有合理PPA,对编程友好,能够稳定可靠工作,市场是检验的最好标准。
知乎用户@ 养猫的哈士奇:根据我的理解,这个芯片单核就是面向物联网等应用的,厂家可以根据IP Core来定制修改,16核这种应该可能是为云平台准备的。不管怎么说迈出第一步总是好的,但是要想发展好必须要进行商业化的量产应用,然后不断的迭代。芯片研发是没有捷径的,平头哥未来的路还很长。
微信读者@SOLOLO:RISC-V处理器+鸿蒙操作系统
微信读者@risclite:两内存访问线,加乱序执行,其实这个单核相当于别家的双核执行。其他家coremark分数只有4到5,平头哥到7,是可信数据。
放眼全球,Facebook、谷歌、苹果、亚马逊等美国科技巨头均投入 AI 芯片的研发和不久。谷歌已将自主研发的 AI 芯片 TPU 应用于加速搜索、翻译、相册等功能。2018 年 2 月,亚马逊开始设计制造 AI 芯片,计划应用于云端摄像头、Echo 扬声器等以服务智能家居硬件市场。同年 4 月,苹果宣布正在开发 Mac 电脑定制芯片,将于 2020 弃用英特尔,导致英特尔股价暴跌 9.2%。国内百度曾公布面向云端的人工智能芯片项目「昆仑」。
李开复认为尽管美国目前仍然占据上风,但权力平衡正发生转移。
他说:“中国显然拥有数据优势,它的工程技术同样发达,它的企业家可能比其他任何国家都要强大。资本总额与美国相当,市场规模更大。双头垄断已经成为现实,只是如今美国依然占据着上风。但我认为,这种趋势将不可避免地改变。”