Nvidia annuncia la GPU H200: 141GB di HBM3e e una larghezza di banda di 4.8 TB/s

Alimentando la prossima generazione di supercomputer AI exascale

13 Novembre 2023

Nvidia ha annunciato la linea di prodotti H200 e GH200, i chip piÃ¹ potenti mai creati dall'azienda, che alimentano la prossima generazione di supercomputer AI esascale. Il nuovo H200 GPU offre un aumento significativo della capacitÃ di memoria e della larghezza di banda rispetto al suo predecessore, l'H100. Mentre le prestazioni di calcolo grezze sembrano essere rimaste simili, l'H200 offre un miglioramento del 76% nella capacitÃ di memoria e del 43% nella larghezza di banda rispetto all'H100 SXM. Nvidia prevede che oltre 200 exaflop di prestazioni di calcolo AI saranno disponibili entro il prossimo anno grazie a questi nuovi supercomputer.

Nvidia ha annunciato oggi la linea di prodotti H200 e GH200 al Supercomputing 23. Si tratta dei chip piÃ¹ potenti mai creati da Nvidia, che si basano sull'architettura Hopper H100 esistente ma con l'aggiunta di piÃ¹ memoria e piÃ¹ potenza di calcolo. Questi chip sono destinati a alimentare la futura generazione di supercomputer AI, con oltre 200 exaflops di potenza di calcolo AI che verranno attivati nel corso del 2024. Scopriamo i dettagli.

La GPU H200 Ã¨ forse la vera protagonista dello spettacolo. Nvidia non ha fornito una panoramica dettagliata di tutte le specifiche, ma sembra che il punto principale sia un significativo aumento della capacitÃ di memoria e della larghezza di banda per GPU.

La H200 aggiornata offre un totale di 141GB di memoria HBM3e, con una velocitÃ effettiva di circa 6.25 Gbps, per una larghezza di banda totale di 4.8 TB/s per GPU attraverso le sei stack di HBM3e. Questo rappresenta un notevole miglioramento rispetto all'H100 originale, che aveva 80GB di HBM3 e una larghezza di banda di 3.35 TB/s. Alcune configurazioni dell'H100 offrivano piÃ¹ memoria, come l'H100 NVL che accoppiava due schede e forniva un totale di 188GB di memoria (94GB per GPU), ma rispetto alla variante H100 SXM, la nuova H200 SXM offre una capacitÃ di memoria superiore del 76% e una larghezza di banda superiore del 43%.

Si noti che le prestazioni di calcolo grezze sembrano non essere cambiate molto. L'unica grafica mostrata da Nvidia per il calcolo utilizzava una configurazione HGX 200 a otto GPU con '32 PFLOPS FP8' come prestazione totale. L'H100 originale offriva 3.958 teraflops di FP8, quindi otto di queste GPU fornivano giÃ circa 32 petaflops di FP8.

Quanto piÃ¹ veloce sarÃ l'H200 rispetto all'H100? Questo dipenderÃ dal carico di lavoro. Per LLM come GPT-3, che traggono grandi vantaggi dall'aumento della capacitÃ di memoria, Nvidia afferma una performance fino a 18 volte superiore rispetto all'A100 originale, mentre l'H100 Ã¨ solo circa 11 volte piÃ¹ veloce. C'Ã¨ anche un accenno al prossimo Blackwell B100, anche se al momento si tratta solo di una barra piÃ¹ alta che svanisce nel nero.

Naturalmente, questo non Ã¨ solo un annuncio della GPU H200 aggiornata. C'Ã¨ anche un nuovo GH200 in arrivo, che combina la GPU H200 con la CPU Grace. Ogni 'superchip' GH200 conterrÃ un totale di 624GB di memoria. L'GH100 originale combinava 480GB di memoria LPDDR5x per la CPU con 96GB di memoria HBM3, mentre la nuova iterazione utilizza i 144GB di HBM3e precedentemente discussi.

Anche in questo caso, i dettagli sulle eventuali altre modifiche del lato CPU sono scarsi, ma Nvidia ha fornito alcuni confronti tra GH200 e una configurazione 'dual-socket x86' moderna - prendere con molta cautela, dato che Ã¨ stata menzionata l'accelerazione rispetto ai 'sistemi non accelerati'.

Cosa significa? Possiamo solo presumere che i server x86 stessero eseguendo codice meno ottimizzato, soprattutto considerando che il mondo dell'IA Ã¨ in rapido movimento e sembrano esserci nuovi progressi nell'ottimizzazione su base regolare.

L'GH200 sarÃ utilizzato anche nei nuovi sistemi HGX H200. Si dice che siano 'compatibili in modo trasparente' con i sistemi HGX H100 esistenti, il che significa che l'HGX H200 puÃ² essere utilizzato nelle stesse installazioni per aumentare le prestazioni e la capacitÃ di memoria senza dover riprogettare l'infrastruttura - il che solleva l'ultimo dibattito sui nuovi supercomputer che saranno alimentati da GH200.

Il supercomputer Alps del Swiss National Supercomputing Center sarÃ probabilmente uno dei primi supercomputer Grace Hopper ad essere attivato nel prossimo anno. Attualmente utilizza GH100. Il primo sistema GH200 ad andare in funzione negli Stati Uniti sarÃ il supercomputer Venado del Los Alamos National Laboratory. Anche il sistema Vista del Texas Advanced Computing Center (TACC) utilizzerÃ le CPU Grace e i superchip Grace Hopper, che Ã¨ stato annunciato oggi, ma non Ã¨ chiaro se si tratti di H100 o H200.

L'installazione piÃ¹ grande in arrivo, per quanto ne sappiamo, Ã¨ il supercomputer Jupiter del JÃ¼lich Supercomputing Centre. AlloggerÃ 'quasi' 24.000 superchip GH200, con una potenza di calcolo AI combinata di 93 exaflops (presumibilmente utilizzando i numeri FP8, anche se la maggior parte dell'IA utilizza ancora BF16 o FP16 secondo la nostra esperienza). FornirÃ anche 1 exaflop di calcolo FP64 tradizionale. Utilizza schede 'quad GH200' che presentano quattro superchip GH200.

In totale, Nvidia prevede che oltre 200 exaflops di potenza di calcolo AI verranno attivati nel prossimo anno circa con queste nuove installazioni di supercomputer. Ãˆ possibile visualizzare l'intera presentazione di Nvidia di seguito.

Altri articoli

Noctua crea un gigantesco dissipatore per il superchip GH200 Grace Hopper di Nvidia

Il case Fractal Design Raspberry Pi North anticipato - ma Fractal indica che rimarrà una curiosità di Computex

SK hynix e HLDS riportano in vita il marchio Super Multi dell'era ottica per prodotti flash di fascia media

ASRock presenta una serie di schede madri compatibili con Arrow Lake, inclusa una nuova variante Taichi con memoria CAMM2

La leadership di Nvidia nel mercato delle GPU desktop raggiunge l'88% - AMD solo al 12%, Intel trascurabile, afferma JPR

Be quiet! annuncia custodie per PC altamente configurabili e ventole illuminate che portano luce nell'oscurità