本月初,华为发布了麒麟970,号称全球首款内置神经元网络单元(NPU)的AI处理器;随后,苹果新iPhone中搭载的A11 Bionic仿生处理器也加入了全新的神经网络引擎。
今天,Imagination Technologies 宣布推出完整、独立式的硬件IP神经网络加速器,并直接炸出和华为970以及苹果A11的性能比:
从表格中看到,基本上是一个数量级的差距!
现在越来越多的AI处理开始从云端走向设备端,Imagination的市场传播副总裁David Harold表示,谷歌、苹果、Facebook、百度、华为等都把AI/NN应用于移动领域,而移动端AI有自己的需求,比如低功耗、小面积、 MMU和支持Android等。
“PowerVR 2NX与只有GPU的竞争解决方案相比,小面积PowerVR 2NX结合小面积PowerVR 9XE GPU在同样面积的布局中提供了GPU+NNA 解决方案。”他指出。
随着神经网络日益普及,PowerVR 2NX NNA 这样的专用硬件解决方案 —— 与单纯的DSP解决方案相比,它可提供8倍的性能密度提升。
NNA的潜在应用不计其数,其中包括AR/VR头戴设备中的特征检测与眼球追踪;汽车安全系统中的行人检测与驾驶员警觉性监控;智能监控系统中的脸部辨识与人群行为分析;网络诈欺检测、内容建议(content advice)、以及预测性UX;虚拟助理应用中的语音识别与回应;以及无人机中的防撞与对象追踪等。
显然,在终端侧部署人工智能已成为大势所趋。根据嵌入式视觉联盟于2017年1月进行的嵌入式视觉开发人员调查显示,79%的受访者表示他们已经利用或正计划利用神经网络来执行其产品或服务中的计算机视觉功能。
为了方便SoC工程师,PowerVR 2NX的开发资源包括映射 (mapping) 和微调工具、样本网络、评估工具与文件。
完整的 PowerVR NX Mapping Tool 能从业界标准的机器学习框架,包括Caffe 和 Tensorflow,轻松进行转换。高级的网络设计人员将能在2NX NNA 上设计与构建神经网络,以充分发挥其硬件特性。
Imagination也可提供通用的Imagination DNN (深度神经网络) API,能在CPU、GPU与NNA之间轻松转换。此单一的API能够跨多种SoC配置执行,因此能在现有设备上轻松开发原型。
1.神经网络加速的专用硬件将成为未来SoC的标准IP模块,就如同CPU和GPU一样;
2.PowerVR 2NX NNA的性能参数直甩竞争对手一个数量级;
3.2NX的方案是完整的神经网络解决方案,包括硬件IP、软件与工具。