超大规模业者(hyperscale companies)主宰了电子世界。这些简称为“FANG”──包括Facebook、亚马逊(Amazon)、苹果(Apple)、Netflix、Google,以及“BAT”——阿里巴巴(Alibaba)、腾讯(Tencent)、百度(Baidu),还有微软(Microsoft)──的公司,无论你选择哪一种指标来衡量,都比世界上最大的芯片制造业者来得有份量;我们在接下来十年可以确定,这些巨擘将以我们很少人能想得到的方式重塑这个产业。
苹果与台积电(TSMC)之间的关系就是一个例证;苹果的订单占据了这家全球晶圆代工龙头销售业绩的五分之一左右,还有一半以上的7奈米制程产能。而随着越来越多FANG为了人工智能(AI)与高性能运算(HPC)应用量身订制芯片,这种趋势将为半导体产业带来变革,也对该产业领域的传统业者带来更多压力。
那些颠覆商业、改变文化的“全球最大公司”,正开始重塑半导体产业;而它们到底做了什么前所未见的事情、为什么要这么做?又可能会产生哪些后果?
两年前,Google发表了自家开发的张量处理器(TPU),在机器学习测试上超越了英特尔(Intel)的Xeon处理器以及Nvidia的GPU好几个等级;Google的TPU芯片是委托台积电以28奈米制程技术生产。
大约一年前,亚马逊发表了用以驱动其客户网站以及其他服务的Graviton服务器芯片,该芯片也是在台积电以28奈米制程生产。Gravitron的表现超越了英特尔与AMD现有的通用处理器,能在亚马逊的环境中以高效率运作,有助降低成本;使用以Gravitron驱动之服务器的客户,也能将某些服务的开销节省一半。
现在,Facebook也正着手自己设计芯片。而像是英特尔、AMD与Nvidia等公司必须注意,FANG公司已经踩到它们的地盘。
可以确定的是,FANG们不太可能会加入收购行列,在半导体产业掀起另一次“整并疯”;那些因特网巨擘已经是美国政府“反垄断”行为审查的对象。但是它们有可能会尝试其他低调一点的作法,例如从芯片业挖角人才──这它们完全负担得起。FANGs通常都会与IC设计服务业者合作,它们能轻易地与例如台湾的无晶圆厂IC业者接触,延揽关键人才。
到目前为止,大多数由FANG设计的AI芯片是针对数据中心应用;今年稍早,高通(Qualcomm)也宣布进军该领域的计划,估计数据中心市场到2025年可达到170亿美元的规模。英特尔预期会在今年稍晚发表Nervana NNP-L1000,但该款AI芯片恐怕在性能表现上难以超越Nvidia最新的数据中心应用GPU。
影像与语音识别以及大数据处理等应用,正在让芯片的功能性延展到PC之外;AI芯片能有助于降低数据中心的功率消耗──数据中心的功耗每年以倍数增加,以一种不应该永续发展的速率。而全球有超过40家公司正在开发AI专用加速器,大多数是为了推论而非模型训练;后者以Nvidia为霸主,囊括数十亿美元市场。
当越来越多公司为边缘装置打造AI芯片,会发生什么事?虽然现在这种案例还没有到非常多,但时机已经到来;大多数专家预期,边缘AI会是一个比数据中心AI更大的市场。
“在现实世界所布署的边缘AI应用究竟需要多大的运算力,现在还没有答案;”Arm的机器学习事业群副总裁Steve Roddy 表示,在车用领域可能需要数个分布式系统或是单一个中央化系统,在工厂则可能需要每一台智能装置以无线链接到后端的中央CPU或分布式计算。
Roddy也指出城市中的相同问题:在5G网络中需要多大密度的运算?集中化程度有多高?“Arm的目标之一是打造一种系统,在中间件层可允许应用程序无缝地从不同的运算模式中转换,而且那些模型会随着时间进化。”
显然Arm打算在分布式AI领域扮演关键角色,Google也是一样──Google的TensorFlow行动/嵌入式团队领导人Pete Warden表示:“能支持智能功能如语音控制接口或加速度器的传感器,正朝向低功耗、低价发展,因此它们将随处可见。”
“由AI驱动的运算装置将以各种可能的方式进入我们的生活,”《AI at the Edge: A GigaOm Research Byte》一文的作者Byron Reese表示:“那些在数据被收集的边缘执行推论之装置,在功耗、安全性与速度方面的要求,会让那些在我们日常生活中扮演要角的数字装置,以一种越来越普及的方式扩张规模。”
包括意法半导体(ST)、赛灵思(Xilinx)以及其他许多传统芯片业者,也以进军规模可望远胜数据中心AI的边缘AI市场为目标,但它们才刚起步。这些传统业者与那群规模更大的“新人”站在同一条起跑在线,而我赌赢得胜利的会是后者。
(原文发表于ASPENCORE旗下EDN姐妹媒体EETimes,参考链接: The FANGs & the Foundries,编译:Judith Cheng)