Il primo dispositivo ibrido CXL al mondo combina memoria flash e DRAM - la tiering della memoria arriva alla memoria remota tramite PCIe
Aggiungere più memoria DDR5 al server non è più l'unico modo per aumentare la capacità della RAM
Samsung ha presentato il primo dispositivo ibrido CXL al mondo che combina memoria flash e DRAM, portando il tiering dello storage alla memoria remota tramite PCIe. L'espansione CXL Memory Module-Hybrid for Tiered Memory offre una soluzione economica per aumentare la capacità di memoria dei server senza l'utilizzo di DDR5 installata localmente. Questo dispositivo ibrido RAM/flash permette ai CPU di accedere alla memoria remota tramite il bus PCIe, offrendo nuove possibilità di espansione della memoria per i server.
Samsung ha presentato una nuova scheda aggiuntiva Compute Express Link (CXL) chiamata CXL Memory Module-Hybrid for Tiered Memory (CMM-H TM), che aggiunge RAM e memoria flash aggiuntive che possono essere accessibili in remoto da CPU e acceleratori. La scheda di espansione è dotata di una miscela di DRAM ad alta velocità e NAND flash ed è destinata a fornire un modo economico per aumentare la capacità della memoria per i server senza utilizzare la memoria DDR5 installata localmente, che spesso non è un'opzione nei server sovraffollati.
La tecnologia di Samsung
La soluzione di Samsung si basa sul Compute Express Link (CXL), uno standard industriale aperto che fornisce un'interconnessione coerente della cache tra CPU e acceleratori, consentendo alle CPU di utilizzare le stesse regioni di memoria dei dispositivi connessi che utilizzano CXL. La memoria remota, o in questo caso, un dispositivo ibrido di memoria RAM/flash, è accessibile tramite il bus PCIe, a un costo di circa 170-250ns di latenza, o approssimativamente il costo di un hop NUMA. CXL è stato introdotto nel 2019 ed è alla sua terza revisione, con il supporto a PCIe 6.0.
Tipi di dispositivi CXL
Lo specifico CXL supporta tre tipi di dispositivi: i dispositivi di Tipo 1 sono acceleratori privi di memoria locale, i dispositivi di Tipo 2 sono acceleratori con memoria propria (come GPU, FPGA e ASIC con DDR o HBM), e i dispositivi di Tipo 3 sono costituiti da dispositivi di memoria. Il dispositivo di Samsung rientra nella categoria Tipo 3.
CMM-H TM di Samsung
CMM-H TM è un derivato della soluzione di memoria CXL CMM-H di Samsung. Samsung afferma che è la prima soluzione di memoria CXL tiered basata su FPGA al mondo e è progettata per 'affrontare le sfide della gestione della memoria, ridurre i tempi di inattività , ottimizzare la pianificazione per la memoria tiered e massimizzare le prestazioni, il tutto riducendo significativamente il costo totale di proprietà '.
Questa nuova CMM-H non è veloce come la DRAM; tuttavia, aggiunge una considerevole capacità tramite la flash ma nasconde molta latenza con una caratteristica di caching della memoria intelligente integrata nella scheda di espansione. I dati caldi vengono spostati nei chip DRAM della scheda per migliorare la velocità , mentre i dati meno utilizzati vengono memorizzati nello storage NAND. Samsung afferma che questo comportamento avviene automaticamente, ma alcune applicazioni e carichi di lavoro possono fornire suggerimenti al dispositivo per migliorare le prestazioni tramite un'API. Naturalmente, ciò aggiungerà un po' di latenza per i dati in cache, che non è ideale per tutti i casi d'uso, in particolare quelli che si basano sulle prestazioni al 99° percentile.
Nuove possibilità per i clienti di Samsung
La nuova scheda di espansione di Samsung offrirà ai suoi clienti nuovi modi per espandere la capacità di memoria dei loro server. Questo nuovo paradigma di progettazione sta diventando sempre più importante man mano che modelli di linguaggio avanzati continuano a richiedere più memoria dalle macchine ospiti e dagli acceleratori.