近日,Meta公司宣布,其下一代大规模基础设施正在以人工智能为基础进行构建,将支持包括新的生成式人工智能产品、推荐系统和先进的人工智能研究,并介绍了其新款MTIA芯片的相关细节。
2023年,Meta推出了元训练和推理加速器(MTIA)v1,这是一款专为Meta的深度学习推荐模型设计的第一代人工智能推理加速器。与上一代相比,最新版本芯片的性能得到了显著的提升,采用了更高的5nm工艺(上一代为7nm),采用了更大的物理设计,让芯片拥有更多的处理核心,功耗提升到了90W,时钟频率提高到了1.35GHz(上一代功耗为25W,时钟频率为800MHz)。
据Meta介绍,新款芯片能将该公司之前解决方案的计算和内存带宽增加一倍以上,目前已有16个数据中心使用了新款芯片,与前代相比整体的性能提升达到了3倍,新芯片的使用将极大的帮助其增强在Facebook和Instagram上的排名和推荐广告模型。
而随着人工智能模型的复杂性不断增加,Meta预计未来几年内对MTIA芯片的投入将会不断增长,下一代MTIA芯片的开发正是其全栈开发计划的一部分,用于定制、特定领域的芯片,可解决他们独特的工作负载和系统问题。
事实上,使用定制芯片解决企业特定问题是一种十分高效的解决方案,与直接使用商用的GPU单元相比,使用定制芯片可以针对应用更好的实现适配和优化,极大的提升系统效率,节约项目开发时间。不过,定制芯片本身就意味着巨大的资金投入,同时要想真正发挥好定制芯片的效能,除了投资芯片本身外,内存带宽、网络和容量以及其他下一代硬件系统都是Meta需要考虑的内容。