La Gioconda, Microsoft, l’intelligenza artificiale e Anne Hathaway. Sono questi gli ingredienti di un pastrocchio diventato subito virale su X, voluto dalla multinazionale informatica. Il colosso creato da Bill Gates ha voluto lanciare così la sua nuova tecnologia di AI, VASA-1, che è in grado di combinare un’immagine e un audio, creando un video nuovo di zecca con una sincronizzazione di livello assoluto. Per dimostrarlo, Microsoft ha pubblicato un breve filmato con Mona Lisa mentre rappa Paparazzi. Ma non la canzone di Lady Gaga, quanto la composizione che Anne Hathaway ha improvvisato nel talk show di Conan O’Brien nel 2011. La clip, pubblicata il 16 aprile, è diventata ovviamente virale, toccando stamattina su X oltre 7 milioni di visualizzazioni.
Microsoft just dropped VASA-1.
This AI can make single image sing and talk from audio reference expressively. Similar to EMO from Alibaba
10 wild examples:
1. Mona Lisa rapping Paparazzi pic.twitter.com/LSGF3mMVnD
— Min Choi (@minchoi) April 18, 2024
In effetti, al netto della stranezza del video, la sincronia tra i movimenti labiali dell’immagine e l’audio è davvero impressionante. Ciò che colpisce è anche l’espressività della figura.
I commenti del pubblico non sono stati granché positivi. Per un pugno di persone che hanno reagito ridendo, ce ne sono altre orripilate dalla scena. Uno ha anche scritto: “Se solo Da Vinci potesse vedere questa cosa…“, ovviamente in senso negativo.
Microsoft incassa e va avanti, certa che questa nuova tecnologia possa essere sfruttata con finalità educative. E per offrire compagnia o supporto alle persone che ne avessero la necessità. Ma gli usi di VASA-1 possono aprirsi anche ai videogiochi e alla creazione di avatar sempre più realistici.
Microsoft ha tenuto a specificare che in nessun modo la nuova tecnologia sarà usata per fuorviare o ingannare gli utenti. E per fugare ogni rischio che VASA-1 si trasformi in un gigantesco boomerang, la società ha affermato di non voler rendere pubblico il modello. In giorni difficili come questi non serve insomma una macchina generatrice di pericolosi deep fake. “Non abbiamo intenzione di rilasciare una demo online, un’API, un prodotto, ulteriori dettagli di implementazione o qualsiasi offerta correlata finché non saremo certi che la tecnologia verrà utilizzata in modo responsabile e in conformità con le normative appropriate“, si legge in una nota dell’azienda.