前年夏天我们写过一篇题为《深度学习的兴起,是通用计算的挽歌?》的文章,这篇文章的观点主要援引了MIT对数字处理器芯片行业未来的看法。此文基于一个时代背景:大规模集成电路的器件尺寸微缩速度显著放缓,而世界对于算力的需求仍在极速增长。比如自动驾驶汽车摄像头数量显著增多,算力需求几何级数增长;万物互联和数字化时代产生海量数据,如何处理这些数据,也对算力提出了更高的要求…
如何解决这对矛盾呢?那就是在处理器架构层面上,转向越来越专用的方向。不同的应用、领域,要有不同架构的专用芯片,可致算力进一步显著提升,并且对于器件尺寸微缩的依赖程度变小。比如说针对数据中心推专门的数据中心芯片或解决方案,对汽车推专门的汽车芯片或解决方案。
这篇文章的部分观点可能是略微偏激的,不过在很多领域,以CPU为代表的通用处理器重要性正在下降是不争的事实。所以这两年不仅有大量更偏DSA专用架构的芯片——尤其是AI芯片问世,而且我们也看到了英伟达GPU在数据中心市场赚得盆满钵满,以及昔日在CPU产品上获益颇丰的Intel,如今也在奋力推行XPU策略,在GPU、FPGA、VPU等各类处理器产品上全面开花。
数字芯片领域的传统市场玩家自然不会错过这样的趋势,推行各自的策略顺理成章。最近安谋科技召开新业务品牌战略发布会,主要是“双轮驱动”战略,以及“核芯动力”新业务品牌。我们来看看,安谋科技在应对这场变革时,都做了些什么。
这两年芯片行业上下游普遍在喊,算力提升还能再续1000倍。单纯就摩尔定律来看这是不现实的。1000倍的提升除了材料、器件结构、封装技术等层面的变化,主体上涉及到专用架构的专门定制。比如GPU,当其应用于图形计算之外时,也能体现出大规模数据并行计算的优越性,性能自然显著的高于CPU。
AI芯片就更是如此了:像谷歌TPU、特斯拉FSD这类芯片是以部分牺牲通用性(可编程性)的方式,以脉动阵列实现了效率和算力相比GPU的进一步提升。更多形态的AI芯片涌现,各种处理器正在越来越多的领域,成就着在算力上显著高于CPU,甚至GPU的地位。
安谋科技这两年自主推出的“周易”NPU、“山海”SPU、“玲珑”ISP、“玲珑”VPU,这些XPU产品事实上本身就是对这种趋势的引导,与Arm CPU等IP共同组成异构计算。这也是本次安谋科技提到“双轮驱动”战略的基础。即“基于Arm的生态系统+安谋科技自主新架构的生态系统”这“双轮”,CPU+XPU融合计算。不过安谋科技对于异构计算的认识似乎不仅限于此,这一点后面再谈。
XPU新战略的提出因此也有了新业务品牌,“核芯动力”。其LOGO如上图所示。安谋科技执行董事长兼CEO吴雄昂说:“这个标志很像涡轮发动机,代表我们希望通过我们的技术给产业提供核芯动力的愿望。标志左边是一个A,A代表了我们在Arm CPU架构上的传承;中间是个X,代表我们的未来,XPU架构给产业提供更好的动能。A+X代表我们希望提供完整的解决方案。”
“同时,右边有很多的的i元素,这些i代表着创新(innovation)、智能(intelligence)以及无限可能性(infinity)。”
一边继续提供Arm的IP产品和服务,一边在自研XPU部分做投入,应当就是双轮战略和“核芯动力”品牌的基本思路了。与此同时,“这次发布的不仅有‘核芯动力’品牌,还有针对XPU的一系列发布,包括指令集、处理器IP、系统软件、设计服务等。”
恒玄科技在这次活动中作为安谋科技这一战略贯彻的代表,也作了发言。恒玄科技副董事长赵国光提到:“恒玄科技目前已经引入安谋科技的NPU、ISP、VPU等多项核心IP技术,针对智能数据流计算打造全新的产品。”
本次发布会上,除了“双轮驱动”战略与“核芯动力”新品牌的发布,安谋科技呈现另一个重要资讯应该就是发起开放NPU指令集了——这件事其实是在7月就发生的。
吴雄昂介绍说:“7月15日,在中国半导体协会的指导下,我们和上下游50多家企业共同发起了开放的NPU指令集。这是中国首发、全球开源的神经网络处理器指令集架构。”……“我们也将依托这个开源指令集和XPU的核心技术,打造一个全球开放的生态。”事实上安谋科技此前联合50多家企业机构共同发起成立了“智能计算产业技术创新联合体”(ONIA)。
虽然通用计算上并不罕见,但像AI处理器这类专用处理器做指令集(ISA)开源应该是不多见的。通常以整套IP微架构授权给到下游芯片设计厂商的模式,也让人感觉偏专用的ISA开源很奇怪。专用芯片因为其专用性,在市场上表现出各自为政的态势是很正常的:现在市面上的AI芯片,大家几乎各有各的指令集;其他各类处理器亦如此。开源本身并不算大事,但要在开源后真正实现规模化的生态,其实是比CPU这类通用芯片更有难度的。
看起来安谋科技的初期布局就已经考虑得比较到位,除了ONIA拉到的合作方之外,安谋科技对于NPU ISA的开源还有两个颇吸引人的策略:
吴雄昂针对这部分也提到了:“大家知道我们2016年成立了安创加速器,前前后后有100多家公司加入,仅独角兽就有近10个。”这对很多企业而言也是相当不错的发展机会。这个计划可能也会有其他合作伙伴的加入,提供产业与技术资源——对安谋科技及其合作伙伴而言,也是拓展业务的机会。
看起来安谋科技对于NPU这个形态的产品还是相当看重,这是期望构建以安谋科技为中心的AI大生态。吴雄昂谈到:“安谋科技今天根据产业发展的规律,将众多合作伙伴的需求整合起来,通过统一的生态来降低开发的成本,实现成果的共建共享。”
“这是我们开放NPU指令集的原因。通过对指令集架构与工具链的共享,各厂商能够基于此发挥自己的核心IP能力,同时也尽快地推动软硬件的对接与应用生态的落地。”或许安谋科技的这一动作也表明,单独建立AI芯片生态的难度不小,推广标准更是不易。以一些吸引人的方式,吸收更多的参与者共建共享,是有利于生态和业务做大的。
在接受媒体采访时,吴雄昂也对本次“双轮驱动”战略、“核芯动力”新品牌作了进一步的补充。我们分享其中一些值得关注的细节部分。吴雄昂介绍说XPU IP相关领域的研发人员,安谋科技对此部署已经达到400多人,这样的投入在同类企业中应该是最多的。“我想我们可以非常有信心地说,在中国核心计算IP上,安谋科技是非常领先的。”
对于XPU的定义,吴雄昂特别谈到其中的字母“X有三个含义:一是它是可定制化的、多样化的结构,包括多域的支持;二是可支持多样化算力的扩展堆叠;三是针对各个场景更精准的优化和效能的提升。”“这三个方向,是我们将其称作XPU的原因。”
这其中的任意一点其实都相当值得深究。事实上在7月15日ONIA成立之际,吴雄昂就提到需要下一代计算域架构来满足相应的需求和挑战,被称作“xDSA超域架构”。安谋科技新业务副总裁张晓波说超域架构特点包括“一是专用的数据流处理;二是多计算域;三是扩展”。这与吴雄昂提到XPU的定义是契合的。
安谋科技在本次会上并未细谈“超域架构”的具体构成和实现,比如这里的扩展是怎么实现的,“多计算域”在具体产品中如何体现价值等。张晓波谈到了超域架构的“主要核心是以高密度数据流处理为中心的专有核心计算单元,同时域处理部分也引入了智能架构。另外也会支持架构扩展进行算力的堆叠。由此新域架构可以高效地进行智能数据流的处理。”
“XPU的新架构具有灵活、高效、专用及支持丰富产品组合等特性。其中,高灵活性表现在可以根据计算密度的需求,动态来分布负载;高效率部分能够基于场景调度XPU,提高整体计算效率;高性能部分可以用新的架构提升性能,并且实现超低功耗。此外,也可以支持丰富的XPU产品组合。”
这两段话整体上还是说得比较模糊,不过大致意思应当包括了围绕专用核心计算单元;从完整解决方案的层面,来优化芯片的效率及性能释放;还能实现弹性化扩展。这其中涉及的技术层面,可能是比较多样的。未来我们有机会可以和安谋科技再做深入探讨。
吴雄昂在答记者问时,有一段话或许可以更清晰地用于解释这一架构,对于当代有很多IP模块的芯片而言,“如何做核心模块之间的互联和优化是个很大的挑战,因为不同的模块与不同的厂商、不同的开发者之间有不同的标准、不同的接口。这对数据搬运而言是很大的挑战,对底层软件、中间件、上层应用的优化也都构成了很大的挑战。”
“我们的目标是逐步把CPU、NPU、VPU这些主要模块的主要场景进行定制化和优化,再把这几个模块重新融合,打造融合计算架构平台。”吴雄昂表示,“这样一来,针对不同的应用场景和不同的域(domain)就有了更好的效率。”
“同时在模块之间,我们将对数据搬运进行优化,这对整个效能的提升是非常有意义的。我们的XPU架构就是基于这样的构想。”
这番话除了用于解释XPU架构,至少还能够表现两点。其一是安谋科技期望在这个多样化处理器崛起的新时代,扮演标准制定者的角色;另一方面则是安谋科技的XPU解决方案,会针对不同的场景做更精准的定制——这是更为契合专用计算时代发展主旋律的一步。
“不同场景下的需求是各异的。”吴雄昂说,“同样是视频数据流,扫地机器人、安防、自动驾驶、未来的人形机器人或者其他比较高端的机器人,需求就都是不同的;对算力的平衡,或者对于不同的信息、指令或功能等,都是有区别的。所以我们希望最终在数据流处理的架构基础上,在不同的场景中,能找出最优的解决方案,从核心IP,到与CPU、NPU的搭配,再到后面的ISP、VPU,都能进行优化和融合,从而实现效率的最优化。”
张晓波列举了3个不同的场景,分别是物联网、自动驾驶、数据中心。“XPU产品构建出的子系统可以完美地支持智能物联网、自动驾驶及新型数据中心等。”
万物互联场景下,“基于多IP及专用总线的XPU子系统可以广泛应用在AIoT、VR/AR以及家庭、安防等多领域。”张晓波表示,“XPU子系统还可以支持新型的自动驾驶”……“XPU的融合计算架构,即超域架构可以完美地满足新的计算架构的技术演进。通过构建车规级的CPU及XPU单元的协同,XPU能够更好地支持整个自动驾驶产业的技术演进。”
而在数据中心应用领域,“针对新型数据中心专用XPU的超域架构,可以更好地以定制的方式来解决不同行业的痛点。”典型如互联网视频的海量数据处理需求,医疗领域的基因测序高密度数据流处理需求等。
针对不同场景做定制化解决方案其实并不是件容易的事情,除了从更系统层面的优化、不同IP的协同方案优化以及不同IP组合选择之外,对处理器IP本身也提出了多样化需求。吴雄昂透露,除了山海SPU、周易NPU、玲珑ISP、玲珑VPU、星辰CPU这些IP之外,“肯定会有新的产品不断地融入‘核芯动力’这个品牌。”“我们确实有一些新的IP规划,目前还没有正式发布。”
张晓波也提到CPU与XPU的产品组合会迭代,不仅是根据客户需求,也是根据安谋科技对技术发展的判断,以及对产业进行长期投入必须的举措。“安谋科技制定了未来5年的发展规划,我们将增加包括像XPU子系统产品线,以及我们还有PDG库的产品,这些都是我们客户的一些产品组合;也将通过生态共建、共享等方式去丰富整个产品线。相信我们会有更多样化的产品组合提供给业界。”
从业务逻辑来看,安谋科技的这套XPU战略更新方案相当完整,以及以其原本的身份亦是相当顺理成章的思路。不过安谋科技设定的都不是简单的目标,比如以NPU指令集开源来构建以安谋科技为中心和标准的AI生态,都需要长期的投入和努力;XPU战略推进与“核芯动力”品牌打造的难度亦不小,还需看其在技术方面能否表现出优越性。这两者看起来也是相辅相成的关系。期待看到未来安谋科技交出的答卷。