Procesorul Habana Gaudi2 oferă o performanță de două ori mai mare decât GPU-ul A100 de la Nvidia

Habana Labs de la Intel lansează a doua generație de procesoare AI pentru instruire și inferență

La Intel Vision, Intel a anunțat că Habana Labs, echipa sa de centre de date axată pe tehnologiile procesoarelor de învățare profundă AI, a lansat a doua generație de procesoare de învățare profundă pentru instruire și inferență: Habana® Gaudi®2 and Habana® Greco™. Aceste noi procesoare răspund unui decalaj din industrie, oferind clienților opțiuni de calcul de înaltă performanță și eficiență pentru învățare profundă, atât pentru sarcini de lucru de instruire, cât și pentru implementări de inferență în centrele de date, reducând în același timp bariera de intrare în domeniul IA pentru companii de toate dimensiunile.

“Lansarea noilor procesoare de învățare profundă de la Habana este un exemplu excelent de implementare a strategiei Intel AI pentru a oferi clienților o gamă largă de soluții – de la cloud la edge – care să răspundă numărului tot mai mare și naturii complexe a sarcinilor de lucru AI. Gaudi2 poate ajuta clienții Intel să rezolve sarcini de lucru de învățare profundă din ce în ce mai mari și complexe, cu viteză și eficiență, și anticipăm eficiența mare a inferenței pe care le va aduce Greco.”– Sandra Rivera, vicepreședinte executive  Intel și director general al Grupului Datacenter și AI

Caracteristici principale

Noile procesoare Gaudi2 și Greco sunt create special pentru aplicațiile de învățare profundă AI, implementate în tehnologie de 7 nanometri și fabricate pe arhitectura de înaltă eficiență a Habana. În cadrul Intel Vision, Habana Labs a dezvăluit performanța Gaudi2 pentru modelul de viziune computerizată ResNet-50, iar modelul de procesare a limbajului natural BERT oferă un randament de instruire de două ori mai mare decât cel al GPU-ului Nvidia A100-80GB.

 

 

    “În comparație cu GPU A100, implementat în același nod de procesare și cu aproximativ aceeași dimensiune a matriței, Gaudi2 oferă performanțe de lider, după cum demonstrează comparația între sarcini de lucru cheie", a declarat Eitan Medina, director de operațiuni la Habana Labs. "Această arhitectură de accelerare a învățării profunde este fundamental mai eficientă.”

    Despre Gaudi2 Procesoarele de învățare profundă Gaudi2 oferă:

    • Eficiența învățării profunde:  Procesorul Habana Gaudi2 sporește semnificativ performanța de instruire, bazându-se pe aceeași arhitectură Gaudi de înaltă eficiență din prima generație ce oferă o performanță de preț cu până la 40% mai bună în cloud-ul AWS cu instanțele Amazon EC2 DL1 și la fața locului cu Supermicro Gaudi Training Server. Cu un salt de la 16 nm Gaudi la 7 nm, Gaudi2 oferă o creștere semnificativă a capacității de calcul, memoriei și rețelei. Gaudi2 introduce, de asemenea, un motor de procesare media integrat pentru medii comprimate și descărcarea subsistemului gazdă. Gaudi2 triplează capacitatea de memorie de la 32GB la 96GB de HBM2E la o lățime de bandă de 2,45TB/sec și integrează 24 x 100GbE RoCE RDMA NICs, on-chip, pentru scalare în sus și în jos folosind Ethernet standard.
    • Beneficii pentru clienți: Gaudi2 oferă clienților o alternativă mai performantă la accelerarea bazată pe GPU, ceea ce înseamnă că aceștia pot performa mai bine și pot cheltui mai puțin, contribuind astfel la reducerea costului total de proprietate în cloud și în centrul de date. Construit pentru a se adresa multor tipuri de modele și aplicații de pe piața, clienții pot beneficia de timpul mai scurt de instruire al Gaudi2, ceea ce poate duce la o mai mare rapiditate în ceea ce privește timpul de obținere a informațiilor și de introducere pe piață. Gaudi2 este conceput pentru a îmbunătăți în mod semnificativ aplicațiile utilizate în vehiculele autonome, imagistica medicală și detectarea defectelor în producție, precum și în aplicațiile de procesare a limbajului natural.
    • Capacitatea, flexibilitatea și eficiența rețelei: Habana a făcut ca pentru clienți să fie rentabilă și ușoară extinderea capacității de formare prin amplificarea lățimii de bandă pe Gaudi de a doua generație. Prin integrarea standardului industrial RoCE pe cip, clienții pot scala și configura cu ușurință sistemele Gaudi2 pentru a se adapta la cerințele lor de cluster de învățare profundă. Cu implementarea sistemului pe conectivitatea Ethernet standard din industrie, utilizată pe scară largă, Gaudi2 permite clienților să aleagă dintr-o gamă largă de echipamente de comutare Ethernet și echipamente de rețea aferente, permițând economii de costuri. Evitarea tehnologiilor de interconectare proprietare în centrul de date (așa cum sunt oferite de concurență) este importantă pentru factorii de decizie IT care doresc să evite "blocarea" la un singur furnizor. Integrarea pe cip a porturilor controlerului de interfață de rețea (NIC) reduce, de asemenea, costurile componentelor.
    • Construire și migrare simplificate: Suita de software Habana® SynapseAI® este optimizată pentru dezvoltarea modelelor de învățare profundă și pentru a facilita migrarea modelelor existente bazate pe GPU către hardware-ul platformei Gaudi. Software-ul SynapseAI suportă modelele de instruire pe Gaudi2 și inferențierea acestora pe orice țintă, inclusiv pe procesoarele Intel® Xeon®, Habana Greco sau Gaudi2 însuși.  Dezvoltatorii sunt susținuți cu documentație și instrumente, instrucțiuni și un forum de suport pe site-ul Habana Developer Site  cu modele de referință si prezentare pe Habana GitHub. Începerea migrării modelelor este la fel de simplă ca adăugarea a două linii de cod; pentru utilizatorii experți care doresc să își programeze propriile nuclee, Habana oferă o suită completă de instrumente.
    • Despre disponibilitatea Gaudi2 Training Solutions: procesoarele Gaudi2 sunt disponibile pentru clienții Habana. Habana a încheiat un parteneriat cu Supermicro pentru a lansa pe piață în acest an serverul Supermicro Gaudi2 Training Server. De asemenea, Habana a colaborat cu DDN® pentru a livra soluții la cheie la nivel de rack, ce includ serverul Supermicro cu capacitate de stocare AI crescută prin asocierea cu soluția de stocare DDN AI400X2.