Google Cloud 發表平台上首款自訂 Arm 架構伺服器處理器 Axion,終於跟 AWS 和 Azure 看齊。Google Cloud 同樣以成本效益作賣點,強調 Axion 的執行個體較平台上的 Arm 處理器效能多 30%,也比目前英特爾和 AMD 的 x86 執行個體效能多 50%。
Google Cloud 是先推出自訂晶片的公共雲服務商,在 2016 年已設 TPU 專用於加速 AI 運算的 ASIC,也在 2023 年 8 月引入 Ampere 的 Arm 伺服器處理器執行個體。如今推出自訂的 Arm 伺服器處理器 Axion。
Axion 基於 Arm Neoverse V2 之上自訂設計,比 Ampere 處理器的執行個體效能多 30%,比 x86 虛擬機器快 50%,也省電 60%。配合 Google Cloud 上的 DPU 架構 Titaium,分擔網絡和安全功能。Google 稱,現在運行在 Ampere 處理器上的平台服務,如 YouTube 廣告、Google Earth、BigTable、BigQuery 等將會轉用 Axion 處理器運行。
公共雲平台早在 6 年前已提供自訂 Arm 處理器執行個體,首先是 AWS 在 2018 年發表 Graviton,由早年收購的創業團隊 Annapurna Labs 負責開發。AWS 在之後每年分別推出新版本:Graviton2、Graviton3、Graviton3E,以及去年的 Graviton4。最新版本採用 Neoverse V2 設計,最多 96 個核心。AWS 行政總裁 Adam Selipsky 在 re:Invent 2023 發表 Graviton4,指新款處理器執行數據庫、網頁應用程式和大型 Java 程式的效能,較前一代處理器快多至 45%。
AWS 亦提供 AI 專用晶片,同樣出自 Annapurna Labs 團隊設計,包括推論的 Inferentia 和訓練模型 Trainium,兩款產品都已發展第二代。該平台上的伺服器由 Nirto System 連接,負責網絡和安全功能,甚至可橫擴展連接,建立類似超級電腦的大型執行個體訓練 AI 模型。
微軟去年 11 月也發表 Arm 處理器 Cobalt 100 和 AI 晶片 Maia 100,預計今年稍後在Azure 平台上提供。Cobalt 100 處理器具備 128 個 Neoverse N2 核心,內部測試運行 Teams、SQL 伺服器等程式,較其他 Arm 伺服器處理器快約 40%。
中國的公共雲平台亦都早已推出 Arm 處理器執行個體,如華為在 2019 年面世的鯤鵬 920,而至今還未有後繼產品。阿里雲則在 2021 年發表倚天 710, 翌年大規模在數據中心內部署,並預計兩年內新增的運算能力有 20% 會採用。