資訊在沃

谷歌云攜手英偉達推A5X實例,多站點集群助力超大規模AI工作負載運行

   發布時間:2026-04-28 19:18 作者:趙云飛

在近期舉辦的 Google Cloud Next 大會上,谷歌云服務部門 Google Cloud 宣布推出一款全新的 A5X 裸金屬實例,該實例由 NVIDIA 的 Vera Rubin 機架級系統提供強大動力支持。

裸金屬服務器,簡單來說就是云上的物理服務器,它具有資源獨立的特點,不存在虛擬化開銷,也不會出現性能損失,能夠為用戶提供更穩定、高效的計算環境。此次推出的 A5X 裸金屬實例,在硬件配置上堪稱豪華。

它采用了英偉達的 ConnectX - 9 SuperNIC 以及谷歌最新的 Virgo Network 超大規模擴展型 AI 數據中心架構。這種強大的硬件組合,使得 A5X 在集群擴展能力上表現卓越。在單站點集群中,它能夠擴展至多達 8 萬個 Rubin GPU;而在多站點集群中,更是可以支持多達 96 萬個 GPU。如此強大的擴展能力,能夠充分滿足客戶運行超大規模 AI 工作負載的需求。

Google Cloud AI 和計算基礎設施副總裁兼總經理 Mark Lohmeyer 表達了對 AI 未來發展的看法。他指出,在 Google Cloud 看來,未來十年 AI 的發展走向,將取決于客戶能否在真正集成且經過 AI 優化的基礎設施堆棧上,運行那些對性能要求極高的工作負載。

他還強調,此次 Google Cloud 與 NVIDIA 的合作意義重大。通過將 Google Cloud 可擴展的基礎設施和托管 AI 服務,與 NVIDIA 先進的平臺、系統和軟件相結合,能夠為客戶帶來極大的靈活性。無論是訓練前沿模型、開放模型,還是部署智能體和物理 AI 工作負載等各種場景,客戶都可以根據自身需求進行選擇,同時還能在性能、成本和可持續性方面實現優化。

 
 
更多>同類內容
全站最新
熱門內容