最近的Google Next大会上,谷歌终于发布了Axion Arm处理器,这是谷歌为数据中心设计的首款基于Arm架构通用CPU,预计将于今年晚些时候给GCP客户使用。
受够了x86,谷歌也要开始自研Arm处理器了
谷歌在官方博客中表达了对于现有CPU提升节奏的不满。通用计算是计算负载的主流,无论分析、信息提取、机器学习训练都需要大量的计算能力。而对于想要最大化性能,减少基础设施成本,满足可持续发展目标的客户而言,现有的CPU的发展节奏太慢了。
谷歌还提到了Amdahl’s Law(阿姆达尔定律)。如果计算机的某一部分得到大幅提升,其他提升比较慢的部分则会制约整体性能表现。随着GPU这种加速器的快速发展,通用计算拖后腿,通用计算的成本将会提高,最终限制基础设施能力的发挥。
谷歌的第一款Arm处理器表现如何?
谷歌自行设计芯片的经验丰富,谷歌从2015年就在自研TPU芯片,现在更新到了第五代。2018年还搞了做视频编解码的VCU,后来还做了SoC相关的东西,开发了在手机上使用的Tensor芯片。
这次,它将Axion打造为云上性能最强的CPU,比现在最强的云主机用的Arm处理器快30%,比当前用的x86处理器的性能高50%,同时,能耗也高了最多60%。
目前,谷歌已经将基于Arm处理器的服务器用于运行BigTable,Spanner,BigQuery,Blobstore,Pub/Sub,Google Earth Engine,以及YouTube广告平台,未来还会将更多负载迁移到基于Axion处理器的主机上。
Axion基于Arm Neoverse V2 CPU打造,是专为通用工作负载设计的,适用于Web和应用服务器、容器化微服务、开源数据库、内存缓存、数据分析引擎、媒体处理等,也适用于基于CPU的AI训练和推理等场景。
与类Amazon Nitro一样的方案搭配构建云主机
谷歌在博客中还提到了一个叫Titanium的系统,这是一个类似Amazon Nitro系统的东西。它是一个高级硬件加速平台,可以从CPU卸载一部分工作负载,提升网络、安全性和存储I/O处理的性能和效率。
Titanium系统会搭配Axion来使用,负责卸载Axion的网络和安全负载,让Axion处理器把更多资源都给到用户。Titanium还将存储I/O处理卸载给了Hyperdisk,Hyperdisk是一种新的块存储服务,它与实例进行了解耦,可以实时动态配置性能和容量。
Axion将帮助谷歌实现更高的能源效率。谷歌云数据中心的效率已经比行业平均水平高出1.5倍。与五年前相比,使用相同的电力能够提供3倍算力。借助Axion处理器,谷歌可以实现更高的能源效率。
谷歌的Arm处理器生态前景如何?
谷歌在开源生态影响巨大,开发并开源了Android、Kubernetes、Tensorflow和Go语言等著名项目,谷歌表示将继续让这些项目适应Arm架构。
谷歌还曾对Arm的硬件和固件互操作性标准做过贡献,用以确保常见的操作系统和软件包可以在基于Arm的服务器和虚拟机上无缝运行,使得客户可以在Google Cloud上部署Arm工作负载,几乎不需要代码重写。
Axion受到了合作伙伴和客户的广泛好评,例如VMware Tanzu、CrowdStrike、Cybereason、Datadog、Elastic、OpenX、Snap和WP Engine等。这些合作伙伴计划用Axion提高其基础设施的性能和效率。
简单短评
谷歌的Axion处理器体现了谷歌对未来计算的愿景。随后,GCP的用户会在各种服务中使用Axion,包括Google Compute Engine、Google Kubernetes Engine、Dataproc、Dataflow、Cloud Batch等。
目前,AWSArm处理器已经进化到了第四代Graviton4,是业内第一个做Arm芯片和Arm云主机的厂商。而微软Ignite大会上也表示将自研Cobalt 100 Arm处理器以及对应的云主机。
这次终于轮到谷歌了。
此前,谷歌主要使用的是来自英特尔和AMD的x86处理器。在Arm方面,主要使用来自专业处理器厂商Ampere的Arm芯片。随着谷歌自己亲自下场做Arm服务器处理器,必然会影响对于x86和第三方Arm处理器的采用。