Negli ultimi mesi, i modelli linguistici Qwen di Alibaba e Doubao di ByteDance si sono distinti nei benchmark globali, grazie anche all'uso di acceleratori Nvidia situati in cluster offshore. In risposta alle restrizioni imposte dall'amministrazione Trump sui chip H20 e altri, le aziende cinesi hanno aumentato la richiesta di risorse di calcolo in paesi come Singapore e Malesia.
Le norme statunitensi attuali vietano la vendita diretta delle GPU più avanzate a Cina, tuttavia, il leasing di risorse di calcolo da data center esteri rimane legale. Un'eccezione è rappresentata da aziende come DeepSeek, che continua a operare in Cina grazie a scorte pre-bando e collaborazioni con Huawei.
Mentre i cluster di addestramento migrano all'estero, i dati privati non possono lasciare la Cina, rendendo necessario il perfezionamento locale dei modelli basati sui dati degli utenti cinesi.
Cosa ha spinto Alibaba e ByteDance a spostare l'addestramento dei loro modelli di intelligenza artificiale nel Sud-est asiatico?
Le restrizioni imposte dagli Stati Uniti sull'esportazione di chip avanzati, come gli H20 di Nvidia, hanno limitato l'accesso delle aziende cinesi a queste risorse essenziali per l'addestramento di modelli di intelligenza artificiale. Per aggirare queste restrizioni, Alibaba e ByteDance hanno iniziato a utilizzare data center nel Sud-est asiatico, dotati di GPU avanzate, per continuare l'addestramento dei loro modelli.
Quali sono i modelli linguistici sviluppati da Alibaba e ByteDance e come si sono distinti nei benchmark globali?
Alibaba ha sviluppato il modello linguistico Qwen, mentre ByteDance ha creato Doubao. Entrambi questi modelli si sono distinti nei benchmark globali grazie all'utilizzo di acceleratori Nvidia situati in cluster offshore, che hanno permesso un addestramento efficiente e prestazioni elevate.
In che modo DeepSeek è riuscita a continuare l'addestramento dei suoi modelli di intelligenza artificiale in Cina nonostante le restrizioni?
DeepSeek ha accumulato una scorta significativa di chip Nvidia prima che le restrizioni all'esportazione entrassero in vigore. Inoltre, l'azienda ha collaborato con produttori di chip locali, come Huawei, per sviluppare la prossima generazione di hardware per l'addestramento di intelligenza artificiale, permettendo così di continuare l'addestramento dei modelli all'interno della Cina.
Quali sono le implicazioni delle restrizioni statunitensi sull'esportazione di chip avanzati per l'industria tecnologica cinese?
Le restrizioni statunitensi hanno spinto le aziende tecnologiche cinesi a cercare soluzioni alternative per l'accesso a hardware avanzato, come l'utilizzo di data center offshore o la collaborazione con produttori di chip locali. Questo ha accelerato gli sforzi della Cina per raggiungere l'autosufficienza nella produzione di semiconduttori e ha stimolato investimenti nella ricerca e sviluppo di tecnologie domestiche.
Come stanno rispondendo le aziende cinesi alle sfide poste dalle restrizioni sulle esportazioni di chip avanzati?
Oltre a spostare l'addestramento dei modelli di intelligenza artificiale in data center esteri, le aziende cinesi stanno collaborando con produttori di chip locali per sviluppare hardware avanzato. Ad esempio, DeepSeek sta lavorando con Huawei per ottimizzare e sviluppare la prossima generazione di chip per l'addestramento di intelligenza artificiale.
Qual è il ruolo dei data center nel Sud-est asiatico nello sviluppo dell'intelligenza artificiale da parte delle aziende cinesi?
I data center nel Sud-est asiatico, equipaggiati con GPU avanzate di Nvidia, offrono alle aziende cinesi l'accesso alle risorse computazionali necessarie per l'addestramento di modelli di intelligenza artificiale. Questo permette loro di aggirare le restrizioni all'esportazione imposte dagli Stati Uniti e di continuare lo sviluppo dei loro modelli avanzati.