採用Armv9.0-A架構,提高平台相容性,且更易於執行其他基於Arm架構的二進位檔案。
透過業界第一個資料中心級別的LPDDR技術運用,達成頻寬、能源效率、容量和成本的完美平衡。
提供多個PCIe Gen5訊號,用於靈活的擴充卡配置和系統通訊。
領先業界的900GB/s晶片連接技術,緩解運算瓶頸,互連設計實現記憶體一致性。
NVIDIA設計的網狀布局和分散式快取架構,大大提升整體頻寬和可擴展性。
具備最大擴展能力,透過InfiniBand交換器、BlueField-3 DPU和ConnectX-7高速網卡,每個超級晶片間頻寬高達每秒100GB。
著名的NVIDIA CUDA平台為全新Arm架構CPU進行了最佳化,整合超級晶片、擴充卡和網路系統的加速運算。
採用Armv9.0-A架構,提高平台相容性,且更易於執行其他基於Arm架構的二進位檔案。
透過業界第一個資料中心級別的LPDDR技術運用,達成頻寬、能源效率、容量和成本的完美平衡。
採用高頻寬記憶體,改善記憶體密集型工作負載的效能表現。
提供多個PCIe Gen5訊號,用於靈活的擴充卡配置和系統通訊。
領先業界的900GB/s晶片連接技術,緩解運算瓶頸,互連設計實現記憶體一致性。
具備最大擴展能力,透過InfiniBand交換器、BlueField-3 DPU和ConnectX-7高速網卡,每個超級晶片間頻寬高達每秒100GB。
將常用程式語言引入CUDA平台,充分運用硬體加速記憶體一致性技術,適應新平台更加便利與容易。
著名的NVIDIA CUDA平台為全新Arm架構CPU進行了最佳化,整合超級晶片、擴充卡和網路系統的加速運算。
隨著人工智慧的快速發展,無論是用於大規模語言模型的訓練還是要求實時反應的推論,基於Arm架構的NVIDIA超級晶片挾CPU到GPU的高速傳輸以及CPU的低功耗等特點而占盡優勢。再加上有利於大型人工智慧模型運算的高頻寬晶片連接和記憶體一致性設計,這些超級晶片滿足了現代人工智慧應用的各種運算需求。
隨著多年來高效能運算的發展,應用範疇逐漸從傳統的x86平台轉移到更節能的Arm架構平台上。基於已有一定程度發展的現有Arm生態,一系列HPC應用可以被輕鬆轉移到相容的新平台。伴隨系統配置的高頻寬低功耗記憶體,超級晶片能以低功耗提供優異效能,鼓勵尋求新解決方案的人選擇更加多樣化的平台。
得利於更高的核心密度和更佳的核心可擴展性,NVIDIA Grace CPU 超級晶片在發展趨於穩定的雲端運算中仍能提供更優異的效能、功耗效率及系統擴展性。為不斷增長的私有和公有雲端運算服務需求提供低延遲和高可擴展性的解決方案。