广告

人工智能应用需要新一代GPU

2019-01-11 09:43:28 赵明灿 阅读:
在移动领域,如手机和平板,涉及照片搜索、高级图像过滤器等。在智能摄像头监控领域,摄像头中正在运用神经网络,用来帮助实现人员跟踪、监控,甚至可疑行动的检测。消费者电子产品,尤其是数字电视,正在通过人工智能实现下一代的视频能力,包括OTT的机顶盒,比如图像的提升、更精确的用户体验(如精确的字幕),以及语音识别、手势控制也成为消费类市场关键的特性。

中国的人工智能应用开发正慢慢走向世界前列。关键的市场包括移动、智能摄像头监控以及消费类电子产品。Ws0ednc

在移动领域,如手机和平板,涉及照片搜索、高级图像过滤器等。在智能摄像头监控领域,摄像头中正在运用神经网络,用来帮助实现人员跟踪、监控,甚至可疑行动的检测。消费者电子产品,尤其是数字电视,正在通过人工智能实现下一代的视频能力,包括OTT的机顶盒,比如图像的提升、更精确的用户体验(如精确的字幕),以及语音识别、手势控制也成为消费类市场关键的特性。Ws0ednc

此外,人工智能在汽车市场也有很大的潜力。这一市场增长非常快,对于自动驾驶,我们可以通过运用人工智能实现更低的功耗和更高的计算性能。Ws0ednc

下一代神经网络加速器(NNA)PowerVR 系列3NX

2018年底,Imagination公司在深圳举办了PowerVR Inspire年度技术盛会。针对人工智能市场发布了下一代神经网络加速器(NNA)PowerVR 系列3NX和PowerVR 9XEP/9XMP/9XTP等新品。Ws0ednc

imagination-1.pngWs0ednc

Ws0ednc

Imagination副总裁兼中国区总经理刘国军先生表示,中国政府和产业界对半导体发展、人工智能应用和各类技术创新的关注度越来越高,投入也越来越大,而Imagination在这些方面拥有很强的优势——强大的图形处理器(GPU)和神经网络加速器(NNA)支持人工智能等各类应用,大量技术专家持续推动创新,因此希望可以和产业界的伙伴开展良好的互动与合作,共同推动中国半导体产业生态及人工智能等创新应用。Ws0ednc

Imagination产品部资深总监Neal Forse在介绍PowerVR Series3NX时表示,前一代2NX有两个IP核,现在有5个新的单核,最高达4K MAX,带来了10TOPS/s单核的能力。同时其多核实现可扩展到160TOPS以上。得益于包括无损权重压缩等架构性增强,Series3NX架构的性能可在相同的芯片面积上较上一代产品提升40%,使SoC制造商可在性能效率方面提高近60%,且带宽需求降低了35%。Ws0ednc

3NX系列是基于之前2NX系列的成功。2NX系列包括AX2145和AX2185两个内核,分别是1TOPS和4.1TOPS。而3NX系列里的升级版AX3145达到1.2TOPS的性能, AX3385达到5TOPS。这两个新核在面积和性能两个方面都实现了提升,它们通过内核架构优化实现。此外,它还补充了3个内核,单核性能分别是0.6TOPS(AX3125,低端)、2.4TOPS(AX3365,中端)和AX3595(高端,10TOPS)。Ws0ednc

针对多核提供之外,3NX和2NX相比,在安全方面还实现了提升。现在支持最多三个单独的部分,包括不安全的部分(包括保护模式和保护内容)以及完全安全部分。Ws0ednc

imagination-2.pngWs0ednc

同时,3NX系列另外一个关键的特性是可编程扩展性。Series3NX-F(F代表灵活性)把高效的运算和NNA网络结合在一起,即NNPU神经网络处理单元。这个单元基于GPU的发展,在功耗和面积方面针对NNA进行了优化。Ws0ednc

Forse表示,这样做有两个原因。增加可编程的扩展性可以优化硬件,但会有面积方面的开销。增加可编程的扩展性有两方面的原因。一是实现差异化。二是神经网络行业快速发展,新的技术、新的神经网络、新的框架不断进入市场。可编程的扩展性可以让客户面向未来提供SoC。Ws0ednc

9系列方案:9XEP、 9XMP和9XTP

Imagination PowerVR业务部副总裁 Graham Deacon介绍了PowerVR 9XEP。他表示,GPU的演进过程经历了多年的发展。第一个市场是移动市场。“两年前大家可能说移动行业是由休闲游戏推动的。现在已经发生大的变化,例如堡垒之夜,非常刺激,在手机上就可以玩。”他介绍说。现在一般的手机也可以玩这样的游戏,因此需要更好的性能以及更高的功率和带宽。Ws0ednc

第二个关键市场是消费、零售、机顶盒、GTV等市场。现在技术的主要推动因素是分辨率,以前是1080P,后来到4K,现在开始使用8K——2020年日本奥运会将使用8K进行转播。这对GPU的要求、内存的要求、带宽的要求都非常高,因此开发产品的时候必须考虑这些因素。Ws0ednc

跟移动行业不一样,DTV行业、机顶盒两年前有很大技术压力,希望加上更好的性能来做游戏,但是这个行业没有游戏的需求。这个行业的关注点是把像素打到屏幕上。Ws0ednc

数字电视市场使用越来越多的神经网络和AI,比如语音识别、面部识别、安全特性,但是其成本并不能支持将这些专用的硬件应用到这些应用中。因此,我们必须通过GPU来实现通用的软件环境,让AI技术也可以应用在各种各样的GPU系列中。“这个市场重要的趋势是成本,现在机顶盒不像原来那么大,机顶盒像USB U盘一样插在后面,这个技术用用就可以扔掉。我们预计价格是在40-50美金,对SoC的成本要求也是非常大的。”Ws0ednc

第三个市场是汽车行业。两年前普通的车只有一个复杂的显示屏用于娱乐系统。现在高端汽车可能有5、6个显示屏,估计未来5年将达到10-12个显示屏,而且分辨率达到4K、8K,因此需要更强的处理能力。而且现在不只是用在娱乐,抬头显示、电子后视镜也开始使用显示屏,并开始应用在安全环境中。SoC中的IP会越来越复杂,不能只是让CPU安全就可以,而是GPU/神经网络加速器也需要有安全的要求。Ws0ednc

从GPU的趋势看,首先低成本的GPU需要更高的性能、更多的特性,面积要更小,芯片成本要低,性能更好、系统成本更低,因此必须提供高密度及带宽和面积降低,系统的面积降低,并且功耗也要降低,我们一直推动功率向下走。对我们来说这种解决方案需要提供更好的灵活性、可扩展性,我们的填充能力也要有更高的灵活性,我们支持神经网络,而且提供其他差异化的因素。根据你的需求来定制GPU。我们提出一个新的概念,不光看GPU功耗的提升,同时我们要看系统,在GPU中可以做什么,让我们的系统整体有更好的功耗和性能表现。Ws0ednc

下一代9系列方案中有三个产品系列,包括9XEP、 9XMP和9XTP。Ws0ednc

imagination-3.pngWs0ednc

PowerVR Series9XEP:基于Rogue架构,这些内核延续了这一类别PowerVR GPU的单位面积填充率领导地位。它们具有PVRIC4视觉无损压缩功能,以便确保带宽和内存占用的降低,从而以最低的系统成本为用户提供GUI、人机界面(HMI)和休闲游戏方面的最佳用户体验。其目标系统产品包括机顶盒、数字电视、低成本移动设备、中档汽车仪表盘和车载信息娱乐系统(IVI)。Ws0ednc

PowerVR Series9XMP:随着计算密度(GFLOPS/mm2)的显著提高,这些基于Rogue架构的GPU为中端移动设备、机顶盒和数字电视提供了业界最佳的计算和游戏体验,并为在 GPU上实现人工智能和神经网络处理提供了基础。Ws0ednc

PowerVR Series9XTP:基于Furian架构开发,这些新的GPU已经显著提高了游戏/计算密度,并在整体设计上有更全面的功耗/性能/面积(PPA)的优化,使其成为高端移动设备和高端车载信息娱乐系统,以及跨计算/服务器细分市场应用的理想选择。Ws0ednc

PowerVR GPU利用了一项被称为分块延迟的渲染(TBDR)技术,该技术保证了几乎所有的图形处理都在“芯片上”完成,并将存储带宽的需求降至最低。与其他GPU解决方案相比,这种解决方案提供了出色的效率。在其25年的历史中,PowerVR已经支持了一些最受欢迎的游戏机和街机系统,推动了移动设备的图形处理革命,并为汽车仪表盘增添了信息娱乐、导航和驾驶员辅助功能。Ws0ednc

新的GPU都采用了PVRIC4技术,它是Imagination强大的图像压缩技术的最新一代,可实现随机访问视觉无损图像压缩,确保了带宽和内存占用率至少节省50%,并使系统能够去克服性能带宽限制。与上一代的GPU相比,新的GPU系列还提供了更强的性能/功耗/面积和时序优化,以及包括可降低合成的工作负载带宽和成本的全新alpha缓冲/单元模块提示等在内的新功能。Ws0ednc

另外,当EDN询问Imagination在中国有哪些成功合作案例时,刘国军表示,2017年第一次发布NNA的产品也是在深圳。Imagination对中国市场非常重视,也意识到中国市场的潜力。“从去年在深圳第一次发布,我们NNA在中国的人工智能业界的反响非常强烈。在中国,已经有两个移动AI的客户已经在用我们的方案做芯片。还有一个新的客户要进来。还有大概10来个客户在评估我们的NNA,接下来会用。”Ws0ednc

这些客户涉及监控、移动手机和物联网等各种应用。有的应用很有趣,在健身仪器上可能会用到一些对人体的测试。物联网监控,大部分和图像相关。目前和语音相关的暂时还没有,但是有同传相关。NNA下一步的计划是要延展我们的生态线。另外在汽车这块,原来讲的汽车电子大部分是被动的、后装的在做这些工作。现在这些也还不是真正的汽车电子,因为和功能没有什么关系,不涉及安全。但接下来就不是这样了——本地的汽车电子做芯片要进入前装,进入车厂的车规。这块我们会计划会做本地汽车电子生态的工作,把我们的GPU和NNA放到车规的生态里,他补充。Ws0ednc

本文为电子技术设计原创文章,未经授权禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
赵明灿
赵明灿是EDN China的产业分析师/技术编辑。他在电子行业拥有10多年的从业经验。在加入ASPENCORE之前,他曾在电源和智能电表等领域担任过4年的工程师。
  • 微信扫一扫
    一键转发
  • 最前沿的电子设计资讯
    请关注“电子技术设计微信公众号”
广告
热门推荐
广告
广告
广告
EE直播间
在线研讨会
广告
面包芯语
广告
向右滑动:上一篇 向左滑动:下一篇 我知道了