11 Novembre 2023
La nuova lineup di GPU per intelligenza artificiale (AI) e calcolo ad alte prestazioni (HPC) di Nvidia è perfettamente in linea con le nuove regole di esportazione espandibili pubblicate dal Dipartimento del Commercio degli Stati Uniti a metà ottobre Secondo Patrick Moorhead, capo di Moor Insights & Strategy, a differenza di quanto riportato da alcuni articoli, l'azienda non sta cercando di eludere le sanzioni statunitensi espandendo i processori AI con le sue nuove GPU per i data center. Nel frattempo, il Dipartimento del Commercio ha recentemente spiegato quali prodotti non possono essere spediti in Cina senza una licenza, anche se non sono destinati ai data center, e sembra che la GeForce RTX 4090 sia uno di questi.
'Ieri, c'è stato un susseguirsi di articoli che suggerivano o interpretavano che Nvidia stesse cercando di aggirare le leggi statunitensi sul controllo delle esportazioni con una presunta linea di nuove schede di accelerazione per data center destinate all'esportazione in Cina', ha scritto Moor in un post sul blog. 'Trovo tutto ciò risibile. Le conseguenze per Nvidia sarebbero immense. L'azienda può essere un'innovatrice e una concorrente feroce, ma non è stupida.'
Le nuove regole statunitensi sulle esportazioni di processori AI e HPC per i data center riguardano le GPU e altri acceleratori AI spediti in Cina, Macao, Arabia Saudita, Emirati Arabi Uniti e Vietnam, richiedendo ai fornitori di richiedere una licenza di esportazione se i loro prodotti superano specifici livelli di prestazioni e/o densità di prestazioni. Per rendere più facile alle aziende, il Dipartimento del Commercio degli Stati Uniti ha recentemente tenuto un briefing pubblico, presentando una tabella relativamente semplice che consente di determinare rapidamente se un processore può essere spedito in Cina e in altri paesi soggetti a restrizioni.
Poiché le nuove regole possono essere un po' complesse, spieghiamole in dettaglio. Le nuove regole definiscono il punteggio di prestazioni totali (TPP), che è essenzialmente la potenza di elaborazione elencata moltiplicata per la durata dell'operazione (ad esempio, FLOPS o TOPS 8/16/32/64) senza sparsità . Il governo statunitense non vuole che la Cina ottenga processori, che siano destinati a data center o PC client, con un punteggio TPP di 4800 senza sparsità (nel caso della moltiplicazione di matrici).
Ad esempio, l'H100 di Nvidia ha una potenza di elaborazione FP16/BF16 elencata di 989 TFLOPS con sparsità , il che significa che il suo punteggio TPP è di 7.912, rendendolo di gran lunga troppo potente per le esportazioni in Cina. Ecco perché la GeForce RTX 4090/AD102, una delle migliori schede grafiche in circolazione, rientra anche nella categoria di prodotti soggetti a licenza di esportazione, poiché la sua potenza di elaborazione FP8 Tensor (660 TFLOPS) raggiunge un punteggio TPP di 5.280. Quindi, no, Nvidia e i suoi partner non possono spedire la GeForce RTX 4090 in Cina, a partire dal 16 novembre.
Un altro parametro introdotto dalle ultime regole è una metrica di densità di prestazioni (PD). Questo parametro è progettato per evitare la falla di acquisire numerosi chip AI per data center di dimensioni minori che, se combinati, sarebbero altrettanto potenti dei chip soggetti a restrizioni. PD viene calcolato dividendo TPP per l'area del die misurata in millimetri quadrati. L'area del die include cache integrate ma esclude dispositivi di memoria esterna come HBMs. Questo parametro è progettato per chip ad alta densità minori con un punteggio TPP compreso tra 1600 e 4800.
Ad esempio, la GPU per data center L4/AD104 di Nvidia ha un punteggio TPP di 1936 (242 FP8 TFLOPS x 8 = 1936). Tuttavia, la sua dimensione del die è di 294 mm^2. Pertanto, la sua densità di prestazioni è di 6,5, quindi la L4 non può essere spedita in Cina. Nel frattempo, la GeForce RTX 4070 Ti di Nvidia, un prodotto non destinato ai data center con un punteggio TPP di 1936, può essere inviata in Cina senza restrizioni.
La parte interessante qui è l'interpretazione del governo sul fatto che un prodotto sia progettato per l'uso in un data center o meno. In questo caso, il Dipartimento del Commercio degli Stati Uniti prevede di valutare la destinazione del particolare prodotto in base alle sue caratteristiche anziché al suo marchio. Ad esempio, una GeForce RTX 4070 Ti a doppio slot con un sistema di raffreddamento a soffietto o passivo sarebbe considerata una scheda per data center, indipendentemente dal nome con cui viene commercializzata.
'Anche se il produttore non sta promuovendo l'articolo per l'uso in data center, l'articolo potrebbe comunque essere progettato per l'uso in data center in base alle caratteristiche tecniche dell'articolo', ha detto Thea D. Rozman Kendler, segretario assistente del Dipartimento del Commercio degli Stati Uniti, Ufficio dell'Industria e della Sicurezza.
Dopo che il Dipartimento del Commercio degli Stati Uniti ha pubblicato le nuove regole di esportazione