日前,在第九届EEVIA年度中国电子ICT媒体论坛暨2021产业和技术展望研讨会上,安谋科技高级FAE经理邹伟带来演讲主题《打造新计算时代的大计算平台》,就该公司最新的Armv9架构进行了详细介绍。
从2011年推出Armv8,到2021年推出Armv9,这十年中Arm的设备已无处不在。基于Arm的设备出货量已经有1800亿,涵盖在各行各业每一个角落,每一个地方。“可能共享的数据一定有一个环节,或者多个环节,经过Arm处理器的计算。从数据采集的IoT设备,到日常使用的手机,到智能电脑,它们收集完数据之后,又会通过有线或者无线的网络设备,然后接到服务器机房里去。在这个环节中大部分都会采用Arm技术,Arm的处理器始终是每个环节的首选。甚至如果一些科学计算需要非常大的计算量,还可以采用超算,超算里也有Arm的选择。”邹伟表示。
“每个环节都有Arm处理器,会有不同的计算形态,包括芯片架构的不同,包括每个环节对算力的不同,从IoT到手机到家庭到服务器搭到汽车到网络,基于Arm的芯片会在各行业给大家做服务。”
同时,Arm在每个行业中都会面临越来越新的应用挑战,也就不仅需要提供不同的产品,例如应用处理器Cortex-A系列,实时处理的Cortex-R系列,和低功耗的Cortex-M系列,还需要在产品提高的同时进行架构的演进,从而满足一些新的计算需求。
预计今年下半年会有Armv9支持的设备面世。Armv9除了传统的架构兼容,还支持Armv8兼容,也就是Armv9处理器出来,依然支持全面的架构兼容。同时引入了三个主要方面:
第一是机器学习。近几年人工智能非常火热,在各行各业都有应用。也就是有一个专门的加速器,加速的计算变成普适性的计算,这时把它适时应用到CPU架构中,就可以做计算了。
第二是真实的信号处理。可以更方便地适应机器学习,以及更多的数据处理要求。
第三是增强了安全性。大家知道安全非常重要,不仅在应用上或者应用程序的开发上要注重安全,在底层架构上也会增强安全性的考虑。
电子产业变化非常迅速,十年前可能大家还在讨论32位到64位有没有必要,如今已经进入到非常先进的地步了。现在有些什么样的特点呢?从计算的角度有些什么样的变化?
第一是CPU的负载越来越复杂,不同的多样化场景中需求会不一样,在每个环节所面临的挑战也都不一样,并且会越来越复杂。
第二是摩尔定律的减缓。明知道摩尔定律减缓了,但对性能、功耗的追求依然没有停歇,这也就带来了挑战。
第三是非常高的硅片费用。
第四是生产周期也变长,以前可能两个月,现在生产工艺五个月。
种种特点在变化中给我们带来什么样的挑战呢?“现在设计一款基于5纳米的芯片,我们希望ROI特别好,因为它非常贵,生产周期又非常长。所以我们希望不仅覆盖当前的应用,也能覆盖以后的应用,希望生命周期变长。另外希望投片能一次成功。所以当前环境下,对IP的要求其实是非常高的,希望它成熟,不容易失败。第二是希望它能覆盖更广的应用,生命周期更长等等。所以这就是我们希望通过架构、设计、IP来应对这些客户遇到的挑战。”邹伟指出。
Arm除了CPU之外,还有其它的IP。虽然摩尔定律减缓,但是大家对性能、对功耗的需求没有任何变化,依然是希望它每年有一定程度的提升。我们在CPU设计性能提升的同时,也希望在系统设计当中,其他配合IP,包括GPU、总线等等其他部件也一起进步,这也就是全面计算的概念。例如在安全方面,安全不可能只是CPU本身的要求,也是对全芯片的要求,所以会贯穿到整个芯片设计中,需要其它IP的配合。例如游戏,大家希望游戏体验更好,是不是只是提高GPU呢?肯定不仅仅如此,还需要CPU和GPU协同性的提高,达到游戏的体验更好。所以基于目前设计上遇到的挑战,安谋科技提出全面计算的概念,来满足大家对计算需求的提升。
从具体的定量数据来看,“从下图中右边的图可以看到,从2013年Arm推出Cortex-A73到今天,它的逻辑性能提升了2.5倍,这是远超行业的平均水平。再看左边的图,用于基础架构这一块,前两年引入的Neoverse系列,它的性能测试基准及测出来的性能也有2.4倍的提升。”邹伟表示,“Armv9推出之后,我们预计会继续延续这个趋势,近两年内还能继续提升30%左右的性能。”
对于全面计算的概念,除了提升CPU之外,还希望系统级的提升,达到更好的用户体验。具体表现为:
首先是频率。例如一个3GHz左右的CPU,每提升100MHz频率,性能就能提升3%。
第二是延迟。如果内存的访问时间降低,系统性能也能提升。在量化数据方面,就是每减少5ns,性能提升1%。
第三是带宽。从20Gb到60Gb,每10Gb带宽提升大概能提升2%的性能。
最后是缓存。每提升一倍缓存大小,大概就能达到9%的性能提升。
“虽然这些数据看起来很可怜,但我们就是这么一年年一点点地抠,达到20%到30%的性能提升。”因此,Arm特别强调,到现在需要考虑全面设计,不仅是提高CPU的性能,在整个系统设计上,每个环节都要考虑,频率、延迟、带宽和缓存大小等等。
虽然大家对Arm的印象,可能还是以手机为主,很多创新都是围绕着移动市场,但该公司为移动市场做的各种创新IP,结果一样适用在电脑上。从去年末开始,很多人至少用过或者听过苹果的M1,基于它的PC,已经完全给大家带来非常好的用户体验了。Arm在为移动市场做的这些技术创新,其实用在PC也是一样的。PC上比手机能接受更大的空间和散热,所以性能会更好,可以支撑更高性能的CPU和GPU。
最后是big.LITTLE的设计。“Arm是在2013年左右推出big.LITTLE设计的。前些年有些公司,也有自研核设计的公司,它们坚持只用大核,觉得big.LITTLE不是特别合适。如果回忆前几年,还有一些争论。但Arm PC出来之后,它们自动用了big.LITTLE计算,所以Arm对基础架构的创新,最终会用到我们每个人身上。”邹伟指出。
另外,现在有很多不同的声音,说CPU的性能提升到了一个瓶颈期,可能更多希望通过一些加速器来做。“当然,加速器在针对一些特定应用的时候会比CPU有很大的优势。可是我们发现,大家对计算性能的要求,除了CPU打好了整个SoC的底座之外,大家对计算性能还是有新的需求。”邹伟表示,“然后是受保护的部分,就是安全。安全底座必须落实在每个角落,CPU一定要提供。然后是普适性,可能为加速器上做的应用开发,只能适用于某一个场景,但是如果在CPU上做应用开发,可能可以适用更宽的领域。最后就是经过验证的技术,Arm有比较大的优势。时代在变迁,Arm也不是在最炫目的位置,但是我们依然觉得CPU非常重要,依然给大家打造这个底座。”
全面计算除了CPU之外,还有频率、带宽和缓存等等。更重要的是其它IP的协同。例如Arm的Mali GPU,也会超越大家的技术性能需求。它会带来光线追踪的技术,以及可变速率的技术,还有其它的高级渲染技术。除此之外,Mali也会由移动端或者消费端进入到汽车领域。移动和汽车对GPU的技术需求会有些什么区别呢?最主要的体现在两点:第一是它的功能安全,第二是虚拟化。“就是手机端,你看它就是一个屏幕,但是在汽车上,可能会有多个屏幕,所以说对虚拟化有技术需求。”邹伟解释说。
再着重讲一下安全。现在随着联网的数据越来越多,大家使用手机、各种物联网设备等等,越来越多的私人数据存储在网络链路上,包括个人的设备或者是在某个地方。这在犯罪分子看来是非常诱人的,他们觉得可以攻击的点越来越多。
下面引用几个第三方数据。首先预测今年因为网络攻击受损可能大概6万亿美元级别。然后是每月每个节点会承受5400次攻击,再然后有越来越多的设备连接在网上(2025年联网设备将达到754亿台),被攻击的面会越来越大。
这个情况要怎么办呢?我们经常听到有些网络安全的事件,例如某个摄像头等等之类的被人攻破了。其实更多的可能工程人员没有意识到这些问题,因此没有去使用这些已经被验证过的、可以应对这些安全攻击的技术,邹伟指出。面对这种情况,Arm和合作伙伴推出了一个平台安全架构(PSA)。“例如在国内我们和信通院(中国信息通信研究院)的实验室联合做PSA的认证,希望给大家引入一个安全的概念。其实很多我们觉得不安全的设备,并不是说设计的时候不懂,更多的是没有这个意识。我们推动这个安全认证的话,会让大家设计的时候会考虑这个,例如是否符合安全规范,上面需要一些什么样的安全IP等等。”
PSA认证就是让整个设计有安全的认证,有个标准可以遵循。另外,从采购方的角度来说,也就知道所买的设备更安全,满足某种设计规范。
然后是Armv9跟Armv8有三点不同:Realm Manager、Hypervisor和SPM。“Armv9会分成三个区域。Non-secure主要用于支付,例如财务数据、密码。我们当时推这个概念也推了很久,最后被广泛接受,但它对现在来说会遇到一个挑战,就是它是预先做好的。例如手机里面某个应用要谈好装在里面,现在个人数据越来越多,可能是非安全的应用,比如人脸识别等等,它不是一个金融支付,没有到这个安全级别,但这些数据又非常敏感,我们在普通应用程序中就想解决,或者有一段算法。假设我是开发人脸识别算法的同事,这段算法特别珍贵,不必须被人破解。本来在这个域里运行,怎么保护呢?在现有架构下,我们相信这个Hypervisor不会被攻破,会保护我们的数据。这就有一个前提,我们相信这个OS,相信它不会被攻破,但一旦被攻破,上面的数据就会被其它恶意的程序偷走。我们在Armv9中希望提升这一块,我们引入了一个叫机密领域,跟以前特别不一样的是,应用程序可以根据自己的需求,在非安全领域运行的时候,突然觉得这些数据,这段代码需要保护,申请进入机密计算,VA就可以满足这个需求,我们就分配相应的空间,让这段空间,即便你是非安全的OS或者Hypervisor,也没有办法访问,达到机密计算的概念。”邹伟介绍说。
“Arm的机密计算现在提出,下半年会逐渐有更多的详细解释,希望大家有这个概念。我们在Armv9中提出机密计算,这个机密计算是基于以前很安全的情况,但提供更灵活的方案,在非安全领域内的应用程序,能随时动态的申请保护它的代码,保护它的数据,这样达到对个人数据的保护,这跟以前很不一样。”
最后,Arm希望在Armv9引入之后,提供一个成熟的IP覆盖大家未来的计算需求,能够满足大家对差异化和对通用性的需求,然后还能满足大家面临的日益增长的多样化的负载计算需求,最后还能在全链路上保护大家的数据。