百億億次運算時代的加速器
・Frontier是全球五百大超級電腦中持續強佔領首位的超級電腦,也是 Green500 榜上有名的節能超級電腦;能有此卓越表現歸因於採用AMD EPYC處理器和AMD Instinct系列加速器。即便使用技術領先的處理器,也需要平行運算加速器來進行高效能運算、人工智慧訓練和推理以及資料密集型工作負載。
・針對資料中心等級的AMD加速處理單元(APU)與獨立加速器模組,技嘉已為AMD Instinct™ MI300系列量身訂做氣冷與液冷式伺服器產品。AMD Instinct™ MI325X和MI300X 加速器專為AI訓練和推理而設計;採用安裝在通用機板(UBB)上的開放加速模組(OAM module)型態,裝載在技嘉的G系列伺服器中。AMD Instinct MI300A,採用LGA插槽設計,為整合CPU/GPU的加速處理單元(APU)聚焦於高效能運算和AI訓練工作負載應用;而技嘉的G383-R80伺服器即提供四組MI300A APU插槽。
・El Capitan預計將成為目前上最強大的超級計算機,能夠每秒執行超過2百億億次浮點運算。這台超級電腦的核心為AMD Instinct MI300A APU,專為克服CPU與GPU之間通道不足產生的效能瓶頸、額外的數據管理工作以及為GPU效能修改程式碼而設計。MI300A APU架構採用晶片組設計,AMD Zen4 CPU和AMD CDNA™3 GPU共享記憶體。這意味著該技術不僅能支持單一伺服器等小規模部署,還能擴展至大型計算叢集。人工智慧訓練和高效能運算的需求即在眼前,而技嘉擁有您所需的技術來加速這一進程。
獨立加速器模組與資料中心級的加速處理單元
AMD Instinct™ MI300 系列,包括 MI300X & MI325X 加速器模組及MI300A ,旨在以精實、高效率的形式提升人工智慧和高效能運
算能力;其中,AMD Instinct MI325X 加速器內建業界領先的 256GB 記憶體和 6 TB/s 的頻寬,以加速資料交換時間;用來驅動最大型的 AI 模型。
Instinct MI300X 提供強大的加速效能,於技嘉G系列伺服器中配備八組 GPU。AMD Instinct MI300 系列加速器旨在提升資料中心運算效率,應對預算和可持續性問題,並提供高度可編程的 GPU 軟體平台。它擁有針對生成式 AI 和高性能計算(HPC)設計的先進 GPU、高吞吐量的 AMD CDNA 3 GPU 計算單元(CUs)以及原生的硬體稀疏矩陣支援。MI300X 提供 304 個高吞吐量計算單元,用於 AI運算相關應用,包括新數據類型支援、照片和影片解碼;支援多種數據類型及最新的生成式 AI 模型。
AMD首款整合 CPU/GPU 的加速處理單元(APU)– Instinct MI300A – 旨在克服 CPU 和 GPU 之間通道不足的的效能瓶頸,減少管理數據的程式碼工作,以及每代 GPU 都需要重構和重新編譯程式碼的需求。這項技術已大規模部署於全球最快且最節能的超級電腦中,現在即可採用 GIGABYTE伺服器,針對需求進行適當規模的部署。
通過提升運算吞吐量並簡化程式設計和部署,AMD Instinct MI300 系列應對了資源、複雜性、速度和架構挑戰下日益增長的 AI 和高效能運算需求,技嘉伺服器與AMD Instinct MI300 系列已準備好讓您即刻部署人工智慧資料中心。
選擇搭載AMD Instinct™ MI300系列伺服器
-
高效能運算
搭載8組GPU模組基板的伺服器透過優化的散熱設計,確保處理器和GPU算力維持峰值效能。
-
彈性擴展
提供多組擴充槽,可彈性配置乙太網路或InfiniBand 網路介面卡,以實現節點之間高速資料傳輸。
-
能源效率
透過即時電源管理、自動風扇速度控制以及冗餘鈦金級電源供應器(PSU)確保最佳的散熱效果和能源效率。亦有DLC(液冷)方案供選擇。
-
高密度算力
提供業界領先的高密度算力,5U機身的G593 系列及 3U機身的G383 系列,擁有高密度算力同時亦提供絕佳穩定性。
-
先進散熱
隨著導入直接液冷(DLC)技術,改善系統整體表現,處理器與GPU的熱設計功耗(TDP)持續增長也不構成問題,充分發揮尖端運算的最大潛能。
AMD Instinct™ MI300 系列規格
AMD Instinct™ MI325X & MI300X GPU
AMD Instinct™ MI300A APU
MI325X GPU | MI300X GPU | Model | MI300A APU |
---|---|---|---|
OAM module | Form Factor | APU SH5 socket | |
- | AMD ‘Zen 4’ CPU cores | 24 | |
304 | GPU Compute Units | 228 | |
19,456 | Stream Processors | 14,592 | |
163.4 TFLOPS | Peak FP64/FP32 Matrix* | 122.6 TFLOPS | |
81.7/163.4 TFLOPS | Peak FP64/FP32 Vector* | 61.3/122.6 TFLOPS | |
1307.4 TFLOPS | Peak FP16/BF16* | 980.6 TFLOPS | |
2614.9 TFLOPS | Peak FP8* | 1961.2 TFLOPS | |
256 GB HBM3E | 192 GB HBM3 | Dedicated Memory Size | 128 GB HBM3 |
6.0 GHz | 5.2 GHz | Memory Clock | 5.2 GHz |
6 TB/s | 5.3 TB/s | Memory Bandwidth | 5.3 TB/s |
PCIe Gen5 x16 | Bus Interface | PCIe Gen5 x16 | |
8 | Infinity Fabric™ Links | 8 | |
1000W | 750W | Maximum TDP/TBP | 550W / 760W (Peak) |
Up to 8 partitions | Virtualization Support | Up to 3 partitions |
* Indicates not with sparsity
應用領域
-
人工智慧
隨著AI的快速普及,從一般應用到快速演進的深度學習,通用圖形處理器(GPGPU)已成為改變產業遊戲規則的重要技術。GPGPU的平行處理能力使其能夠處理大量數據集和複雜演算法,這對訓練和部署AI模型至關重要。因此,人工智慧(AI)已成為使各產業領域於生產、營利、工作效率更快、更“智慧”的關鍵,並且以最有效的方式實現目標。
-
高效能運算
在高效能運算(HPC)應用中,需依賴數值分析、模擬和運算來解決複雜問題以獲取洞見。雖然傳統上對加速器的依賴較少,但通用圖形處理器(GPGPU)的強大平行運算能力在近年來大幅加速了高效能運算的發展,使得混合配置成為現代超級計算機的一大趨勢。
-
數據分析
在數據密集型應用中,例如大數據和電腦模擬。工作負載高度依賴通用圖形處理器(GPGPU)平行運算處理、低延遲和高頻寬來挖掘數據和大規模數據處理。通用圖形處理器(GPGPU)同時處理大量數據的能力,不僅加速海量數據集工作負載,亦能提供準確且及時見解,尤其在金融、醫療和科學研究等領域更仰賴資料的處理與應用。
主打新品
加速實現你的科技創新
業務洽詢