Cuffie AI di UW: traduzione simultanea di più lingue

L'università di Washington sviluppa cuffie in grado di tradurre più voci in tempo reale grazie all'uso dell'Apple M2.

10 Maggio 2025

Un team dell'Università di Washington ha sviluppato delle cuffie avanzate che sfruttano l'AI per tradurre simultaneamente le voci di più persone che parlano lingue diverse. Questa innovazione, denominata Spatial Speech Translation, utilizza cuffie binaurali che simulano il modo naturale in cui le orecchie umane percepiscono il suono. Grazie a microfoni posizionati strategicamente, queste cuffie possono rilevare la direzione del suono, creando un'efficace esperienza di ascolto spaziale.

Guidato dal professor Shyam Gollakota, il team ha sviluppato un sistema che funziona interamente sul dispositivo, garantendo la privacy degli utenti senza inviare dati vocali al cloud. La tecnologia supporta la traduzione in tempo reale ed è stata testata con successo in ambienti interni ed esterni. Attualmente, le lingue incluse sono lo spagnolo, il tedesco e il francese.

Il sistema utilizza il silicon Apple M2 per l'elaborazione in tempo reale, abbinato a cuffie Sony WH-1000XM4 e un microfono binaurale Sonic Presence SP15C. Inoltre, il codice sorgente del dispositivo concettuale è disponibile per la comunità scientifica, invitando ulteriori ricerche e sviluppo nel campo.

Cos'è la traduzione del parlato spaziale?

La traduzione del parlato spaziale è una tecnologia che consente di tradurre in tempo reale le voci di più persone che parlano lingue diverse, mantenendo la direzione e le caratteristiche vocali uniche di ciascun oratore nell'output binaurale. Questo permette agli utenti di percepire le traduzioni come se provenissero dalle stesse direzioni delle voci originali, migliorando l'esperienza di ascolto in ambienti multilingue.

Quali sono le principali sfide tecniche affrontate nello sviluppo di questa tecnologia?

Le principali sfide includono la separazione delle sorgenti sonore senza informazioni preliminari, la localizzazione delle fonti sonore, la traduzione espressiva in tempo reale e la resa binaurale per preservare le direzioni dei parlanti nell'audio tradotto. Inoltre, è fondamentale garantire l'elaborazione in tempo reale su dispositivi come il silicio Apple M2, mantenendo la privacy degli utenti senza inviare dati vocali al cloud.

Quali dispositivi e componenti sono stati utilizzati per implementare il sistema di traduzione del parlato spaziale?

Il sistema è stato implementato utilizzando il silicio Apple M2 per l'elaborazione in tempo reale, abbinato a cuffie Sony WH-1000XM4 e un microfono binaurale Sonic Presence SP15C. Questa combinazione di hardware consente di rilevare la direzione del suono e di fornire un'esperienza di ascolto spaziale efficace.

Come si differenzia la traduzione del parlato spaziale dalle tradizionali tecnologie di traduzione simultanea?

A differenza delle tradizionali tecnologie di traduzione simultanea, la traduzione del parlato spaziale mantiene le informazioni spaziali delle voci originali, permettendo agli utenti di percepire le traduzioni come se provenissero dalle stesse direzioni delle voci originali. Questo migliora l'esperienza di ascolto e facilita la comprensione in ambienti con più parlanti.

Quali sono le potenziali applicazioni della traduzione del parlato spaziale?

Le potenziali applicazioni includono conferenze internazionali, ambienti educativi multilingue, turismo e situazioni quotidiane in cui persone che parlano lingue diverse interagiscono. Questa tecnologia può facilitare la comunicazione e la comprensione in contesti multilingue, migliorando l'inclusione e l'efficienza delle interazioni.

Quali sono le prospettive future per la traduzione del parlato spaziale?

Le prospettive future includono l'espansione del supporto a un maggior numero di lingue, l'ottimizzazione dell'hardware per migliorare le prestazioni e la portabilità, e l'integrazione con altre tecnologie di realtà aumentata e virtuale per creare esperienze immersive. Inoltre, la collaborazione con la comunità scientifica potrebbe portare a ulteriori miglioramenti e innovazioni nel campo.

Altri articoli

Meta lancia occhiali AI Ray-Ban ottimizzati per prescrizione

Garmin integra Natural Cycles per il monitoraggio della fertilità tramite smartwatch

Google lancia una fitness band senza schermo per sfidare Whoop

Google prepara un nuovo wearable fitness senza schermo

Meta lancia le Ray-Ban smart con lenti graduate e nuove funzioni AI

Un wearable per rilevare microplastiche nel corpo umano