Supercomputerul AI NVIDIA DGX GH200

Supercomputerul AI NVIDIA DGX GH200

O nouă clasă de supercomputere cu inteligență artificială conectează 256 de supercipuri Grace Hopper într-un GPU masiv, de 1 exaflop și 144TB, pentru modele gigantice care alimentează inteligența artificială generativă, sistemele de recomandare și procesarea datelor.

NVIDIA a anunțat o nouă clasă de supercomputere cu inteligență artificială cu memorie mare – un supercomputer NVIDIA DGX™ alimentat de supercipurile NVIDIA® GH200 Grace Hopper Superchip și de sistemul de comutare NVIDIA NVLink® – creat pentru a permite dezvoltarea de modele gigantice, de generație nouă, pentru aplicații de limbaj generativ de inteligență artificială, sisteme de recomandare și sarcini de lucru de analiză a datelor.

Spațiul masiv de memorie partajată al NVIDIA DGX GH200 utilizează tehnologia de interconectare NVLink cu NVLink SwitchSystem pentru a combina 256 de supercipuri GH200, permițându-le să funcționeze ca un singur GPU. Acest lucru oferă 1 exaflop de performanță și 144 terabytes de memorie partajată – aproape de 500x mai multă memorie decât generația anterioară NVIDIA DGXA100, care a fost introdusă în 2020.

“Inteligența artificială generativă, modelele lingvistice de mari dimensiuni și sistemele de recomandare sunt motoarele digitale ale economiei moderne”, a declarat Jensen Huang, fondator și CEO al NVIDIA. “Supercomputerele DGX GH200 AI integrează cele mai avansate tehnologii de calcul accelerat și de rețea de la NVIDIA pentru a extinde frontiera inteligenței artificiale.”

Tehnologia NVIDIA NVLink extinde AI la scară largă

Supercipurile GH200 elimină necesitatea unei conexiuni PCIe tradiționale de la CPU la GPU prin combinarea unui procesor NVIDIAGrace™ bazat pe Arm cu un GPU Tensor Core NVIDIA H100 în același pachet, folosind interconexiuni de cipuri NVIDIA NVLink-C2C. Acest lucru mărește lățimea de bandă între GPU și CPU de 7 ori în comparație cu cea mai recentă tehnologie PCIe, reduce consumul de energie de interconectare de peste 5 ori și oferă un bloc de construcție GPU cu arhitectură Hopper de 600 GB pentru supercomputerele DGX GH200.

DGX GH200 este primul supercalculator care asociază Superchipurile Grace Hopper cu NVIDIA NVLink Switch System, o nouăinterconectare care permite tuturor GPU-urilor dintr-un sistem DGX GH200 să lucreze împreună ca unul singur. Sistemul din generația anterioară permitea doar combinarea a opt GPU cu NVLink ca un singur GPU, fără a compromite performanța.

Arhitectura DGX GH200 oferă o lățime de bandă NVLink de 48 de ori mai mare decât generația anterioară, oferind puterea unui supercomputer AI masiv cu simplitatea programării unui singur GPU.

Un nou instrument de cercetare pentru pionierii AI
Google Cloud, Meta și Microsoft se numără printre primii care se așteaptă să aibă acces la DGX GH200 pentru a explora capacitățile sale pentru sarcini de lucru generative AI. NVIDIA intenționează, de asemenea, să furnizeze designul DGX GH200 ca proiect pentru furnizorii de servicii cloud și alți hiper scalatori, astfel încât aceștia să îl poată personaliza în continuare pentru infrastructura lor.

Noul supercomputer NVIDIA Helios pentru a promova cercetarea și dezvoltarea

NVIDIA își construiește propriul supercomputer AI bazat pe DGX GH200 pentru a alimenta munca cercetătorilor și a echipelor sale de dezvoltare.

Numit NVIDIA Helios, supercomputerul va avea patru sisteme DGX GH200. Fiecare va fi interconectat cu rețeaua NVIDIAQuantum-2 InfiniBand pentru a supraîncărca debitul de date pentru antrenarea modelelor AI mari. Helios va include 1.024 de supercipuri Grace Hopper și este așteptar să fie pus în funcțiune până la sfârșitul anului.

Complet integrat și construit special pentru modelele gigant
Supercomputerele DGX GH200 includ software NVIDIA pentru a oferi o soluție completă, la cheie, pentru cele mai mari sarcini de lucru în domeniul inteligenței artificiale și al analizei datelor. Software-ul NVIDIA Base Command™ oferă gestionarea fluxului de lucru AI, gestionarea clusterului de nivel enterprise, biblioteci care accelerează infrastructura de calcul, stocare și rețea, precum și software de sistem optimizat pentru rularea sarcinilor de lucru AI.

De asemenea, este inclus și NVIDIA AI Enterprise, stratul software al platformei NVIDIA AI. Acesta oferă peste 100 de cadre, modele preinstruite și instrumente de dezvoltare pentru a simplifica dezvoltarea și implementarea AI de producție, inclusiv AI generativă, viziune computerizată, AI vocală și multe altele.

Disponibilitate
Se așteaptă ca supercomputerele NVIDIA DGX GH200 să fie disponibile până la sfârșitul anului.