Google ammette che il video dimostrativo di Gemini AI era falso
I comandi vocali sono stati aggiunti successivamente e il video non è stato registrato in tempo reale.
Il video Hands-on with Gemini di Google è stato uno degli aspetti più impressionanti del lancio del nuovo modello di linguaggio AI (LLM) dell'azienda. Tuttavia, Bloomberg ha parlato con un portavoce di Google che ha ammesso che il video non è stato registrato in tempo reale. Inoltre, i comandi vocali non sono stati nemmeno utilizzati, l'interazione vocale con Gemini che si sente è stata aggiunta successivamente. Google ha anche pubblicato un post sul blog, contemporaneamente alla demo, che illustra come è stato realizzato il video.
Sundar Pichai, CEO di Google, ha condiviso il video hands-on giovedì, dicendo che il modo migliore per capire le 'sorprendenti capacità sottostanti di Gemini' è vederle in azione. Un indizio che non tutto era come sembrava è stato incluso nella descrizione del video su YouTube. 'Per scopi dimostrativi, la latenza è stata ridotta e le uscite di Gemini sono state abbreviate', si legge a piè di pagina.
Quel piè di pagina potrebbe essere descritto come un eufemismo, o come una deviazione dalla verità . Infatti, il video non è stato solo abbreviato, non c'è stata alcuna interazione reale durante la registrazione. Il portavoce di Google ha detto a Bloomberg che il video hands-on è stato realizzato 'utilizzando immagini fisse dei fotogrammi del filmato e sollecitazioni tramite testo'. Così, Gemini ha risposto solo a sollecitazioni inserite tramite testo e immagini fisse che sono state caricate. Il flusso di conversazione, con una persona che parla, disegna, mostra oggetti, gioca con tazze e altri oggetti, sembrava essere solo una messa in scena per il video dimostrativo.
Se guardiamo indietro al video, la spiegazione del portavoce smonta l'impressione di un assistente conversazionale naturale che abbiamo avuto durante la prima esposizione alla demo.
Ulteriori spiegazioni sul video 'Hands-on with Gemini' sono arrivate da Oriol Vinyals, VP di Ricerca e Responsabile Deep Learning di Google DeepMind, oggi. 'Il video illustra come potrebbero essere le esperienze utente multimodali costruite con Gemini', ha ragionato Vinyals. 'L'abbiamo realizzato per ispirare gli sviluppatori'. Il post del VP di Google DeepMind ha suscitato molte critiche per aver ripetuto l'affermazione che il video era 'reale, abbreviato per brevità '.
Speriamo che il video di Google possa ispirare gli sviluppatori - presso Google - a far funzionare Gemini esattamente come appare nel video dimostrativo. In caso contrario, le persone potrebbero sentirsi un po' ingannate, o addirittura truffate, dalla differenza tra la demo video e la realtà .