近几年,业内刮起一股 AI 算法公司自研芯片的风潮。
2019年5月9日,上海中心,拥有世界级算法优势的依图科技发布其首款深度学习云端定制芯片,定名“QuestCore™”(求索),并基于此推出云端边缘端两款视频解析硬件,成为中国计算机视觉“4 小龙”(商汤、旷视、云从、依图)中第一家尝鲜自研 AI 芯片的公司。公司创始人朱珑更是表示,依图要成为中国最成功的 AI 芯片公司之一。
“求索”是依图推出的第一款云端深度学习推理定制化 SoC芯片,为计算机视觉领域分析任务打造,针对视觉领域的不同运算进行加速,适用于人脸识别、车辆检测等多个应用场景。
在发布会现场,依图联合创始人兼CEO 朱珑谈到了AI芯片为何难做,用了三个“没有”作为排比句:
如果一款AI芯片没有定制方向、没有超过业内最大咖的玩家、没有顶级算法作为支撑,那么这款芯片就不能称为是成功的,这也是依图所面临的挑战。
先来看下规格:
发布会现场,依图科技首席创意官吕昊为大家进行了芯片演示——他手持一台体积与15 英寸苹果 MacBook Pro笔记本相当的依图原子服务器,成功带动200路摄像头同时完成实时智能视频分析任务。
刚开始大屏幕只显示了服务器处理的27个摄像头画面——一个NVIDIA P4显卡大概只能处理27个摄像头。紧接着,大屏幕画面突然显示了原子服务器同时带动200个摄像头的画面:
依图原子服务器基于questcore™ 打造,一台服务器提供的算力与 8 张英伟达P4卡服务器相当,而体积仅为后者的一半,功耗不到20%。在进行视频解析时,1台依图原子服务器(搭载4核 questcore™芯片,除此之外无需其他配置),与8卡英伟达T4服务器(含双核英特尔 x86 CPU)对比,单路视频解析功耗仅为后者的 20%,与8卡英伟达P4 服务器(同样含双核英特尔 x86 CPU)相比,功耗约为后者的10%。
这款芯片作为服务器芯片可以独立运行,不依赖 Intel x86 CPU,并且采用依图自研的ManyCore™架构,具有灵活可拓展的特质,适配各类深度学习算法。
从这些特性来看,这款云端芯片更看重“实用”二字——如何满足更多的需求、如何将本有的算法优势在芯片上发挥更大的作用、如何适应现有的生态。
简单来讲,它致力于解决一个实在的问题——如何实现高性价比。
“利用算法优势”成为全场发布会的一大关键词。依图认为,好的算法才能更高效地利用芯片架构,才能指导芯片架构设计,把算力更高效地转化为智能。这款芯片基于领域专用架构(Domain Specific Architecture,DSA)理念,专为计算机视觉应用而生。
questcore™是款“自立自强”的芯片:它作为服务器芯片可以独立运行,不依赖 Intel x86 CPU。这也是依图芯片与NVIDIA GPU、Google TPU和其他AI芯片公司研发的AI加速器产品一个很大的不同。
另外,这款芯片采用依图自研的ManyCore™架构,据介绍,同等功耗下,这款芯片能提供市面现有同类主流产品 2~5 倍的视觉分析性能。
如果一款芯片想要实用性强,就必须拥有强大的可拓展性,以便应用于更多的场景。ManyCore™架构能够适配各类深度学习算法,支持TensorFlow、PyTorch、Caffe等各类深度学习框架,便于无缝接入现有生态。在此架构下,questcore™构建的产品和解决方案可以兼顾云端和边缘计算的需求。
据依图科技介绍,这款芯片能实现性能和功耗比呈量级提升的根本原因之一是:ManyCore™架构针对INT 8数据(8 位整数数据类型)进行加速。
事实上,对于云端 AI 推理或者说视觉推理计算而言,并不需要高精度的计算,低精度的INT8 数据类型已经足够满足需求。采用16nm制程也是考虑现在业界对视觉分析应用的需求。
在投入极高的芯片行业,如何实现高性价比是众多玩家要实际面对的终极问题,算力的提升正是为了解决AI场景中的经济学难题——用更少的成本解决更多的问题。
对于依图推出这款云端 AI 芯片的原因,依图首席创新官吕昊概括为三点:对行业的理解、产品体量已经达到一定程度(未透露具体量级)、依图算法精度的提升。
第一款 AI 芯片之所以选择了用在云端推理上,也是因为依图各主要业务尤其在安防上的需求。QuestCore™主打视频推理,主要关注分析处理视频的数量,专用于加速视觉推理运算,比如人脸识别、视频结构化分析、行人再识别等等,其和一些终端视频推理芯片的区别在于,终端芯片只需要分析处理一路视频,云端芯片则关心的是可以处理多少路视频。吕昊表示,QuestCore™是目前更智能、性价比更高的视觉推理 AI 芯片。
“QuestCore™将整合在我们的产品中对外售卖。依图的体量相对较大,最深耕的行业就是安防,因此不需要担心由于市场体量较小而产生的成本问题……我们对于市场的需求、对于 AI 领域有自己的理解。2017 年,公司对于 AI 算力需求增长以及产品竞争性有了一定的预判,因此有了自研 AI 芯片的决定”,他说。
不难看出,在这几大动机中,现阶段的业务需求是依图第一次“造芯”的最直接原因。
2017 年中国计算机视觉应用市场份额(来源:IDC)
依图创立于 2012 年 9 月,自成立以来,其 AI 算法在人脸识别领域屡有突破,且现已不再局限于视觉识别方向,在业内也被认为是一家很明确的 AI+垂直行业、应用层技术落地的 AI 算法公司,涉及安防、医疗、AI制药、金融领域等。其中,依图在安防和医疗领域布局较早,现已形成一定的先发优势,例如依图医疗智能辅助诊断系统已经在上海、浙江等近百家三甲医院临床应用,在安防上则搭建了全球首个十亿级人像比对系统,算法已突破亿级静态比对。
依图已有的算法突破(来源:DeepTech)
但显然,现在,和业内很多公司一样,依图不单单只想追求极致的算法,也将目光投向了追求配合算法的极致算力上。“没有典型场景应用没有意义,没有超越英伟达的芯片没有意义,没有世界级的算法没有意义”,朱珑说。
发布会上,依图也第一次对外谈及其对智能算力发展的理解和使命:提升智能密度,即从单位智能走向群体智能,单位面积智能算力更高。这一使命显然已经从算法、数据跨越到了算力领域。
尽管采访中依图多次表示自身并非为了开发芯片而开发芯片、不为芯片商业化,但随着这款云端 AI 芯片的推出,其定位将不再是一家纯粹的 AI 算法公司。
含有 4 颗 QuestCore™ 芯片的板卡(来源:DeepTech)
吕昊透露,公司既然决定自研 AI 芯片就不会只有一款产品,目前依图已经开始着手第二款产品的研发,新芯片的算力还在优化,希望能达到同等产品 2 到 5 倍的提升。依图表示,首先发挥自己最擅长和积累最多的机器视觉领域专业知识,今后将逐渐拓展到其他领域的芯片研发。
与依图科技相似的是,Google、微软、阿里等科技巨头也在自研芯片:同样也是通过利用自身特有优势,从而为客户提供更好的软硬件一体化解决方案。越来越多企业加入了轰轰烈烈的“造芯”大军。
AI芯片是个全新战场。
押宝AI芯片可以说是大势所趋,据研究报告显示,目前AI芯片行业生命周期正处于幼稚期,市场增长快,2022年将从2018年的42.7亿美元,成长至343亿美元。
与其他战场相比,这个新战场充满了不确定性,以及更多的机会——一个没有先例可循的智能时代。中国AI创企与世界科技巨头站在同一起跑线上,完全有可能成为新巨头,同时加速数据中心服务器芯片自主可控进程。
美国杜克大学电子计算机工程系教授陈怡然、美国纽约州立大学教授陈逸中曾在文章《中国AI芯片有可能弯道超车》提到:人工智能应用场景千变万化,其中应用的算法之间的差异更是巨大,可以预期未来各项应用将有不同的定制化芯片,出现人工智能芯片百家争鸣的盛况。AI芯片的另一大特点在于它所面对的是一个全新的、还未被大公司充分定义的新的业务场景。即使是NVIDIA,也只是在云计算这一领域有一定的垄断地位。
定制化芯片必然是未来方向。
世界级的创新需要世界级的命题,如今AI普及也成为世界级命题。依图联合创始人兼CEO 朱珑认为AI普及的关键是智能密度,而这里“智能密度”指单位面积硅芯片提供的算力转化的智能。
然而,在半导体的摩尔定律已经临近终结,智能密度继续翻倍不能再只寄希望于摩尔定律。虽然半导体的摩尔定律逼近终结,但算法性能却仍在万倍增长,过去 4 年依图的人脸识别算法精度提升了 10 万倍。
同时,通用芯片已无法解决所有需求,定制化芯片与依图questcore™一样,Google TPU也是一种DSA,针对深度神经网络(DNN)进行加速,Google TPU充分证明了DSA的优势。而对于DSA芯片而言,领域知识是最重要的,需要对机器视觉技术和行业有着深刻理解,这是需要人工智能公司在研发和商用落地中不断积累的。
了解自身优势、了解市场真正需求,提供定制化芯片成为了依图“高性价比”的解决方案,这也为那些想要加入芯片市场的玩家们提供了一个可高度参考的路线。
正如陈怡然教授和陈逸中教授所说的那样,一个成功的芯片项目所带来的不仅仅是销售芯片本身的利润,还有伴随芯片设计、制造以及销售整套流程中产生的支撑产业与生态系统,从而带动软硬件发展、行业标准制定、知识产权销售等产业发展。
算法即芯片,这条新路还会带给AI公司更多的可能性。
(综合整理自:新智元、DeepTech深科技)