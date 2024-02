Sapresti riconoscere un video creato da un'intelligenza artificiale?

Un frame di un video generato da Sora

“Video or it didn’t happen”. Mostrami un video o non è successo. Secondo lo Urban Dictionary, questa formula nasce nei forum, come risposta, spesso scherzosa, a un’affermazione diciamo difficile da verificare da parte di un altro utente. È interessante perché è un po’ la testimonianza di una cultura, nell’evoluzione del web e della tecnologia: grazie agli smartphone, tutto può essere registrato, tutto può diventare un video. Le immagini in movimento, quindi, diventano la prova testimoniale per eccellenza dello spazio digitale.

Sora, l’intelligenza artificiale che genera video realistici

Lo scorso 15 febbraio, però, succede qualcosa. OpenAI, l’azienda di ChatGPT, mostra al pubblico Sora, un nuovo modello di intelligenza artificiale in grado di generare video da testo. Non è il primo, ce ne sono altri come Gen-2 di Runway o Pika. Questo, però, ha una particolarità: genera video piuttosto lunghi (fino a 60 secondi) e anche molto realistici, almeno a un primo sguardo.

“Sora – si legge nell’annuncio pubblicato sul blog di OpenAI - è in grado di generare scene complesse con più personaggi, tipi specifici di movimento e dettagli accurati del soggetto e dello sfondo. Il modello non solo comprende ciò che l'utente ha richiesto nel prompt, ma anche come quegli elementi esistono nel mondo reale”.

Prompt: “A gorgeously rendered papercraft world of a coral reef, rife with colorful fish and sea creatures.” pic.twitter.com/gzEE8SwP81 — OpenAI (@OpenAI) February 15, 2024

Il funzionamento, seppur non spiegato dall’azienda, sembra essere simile a quello di altri sistemi di intelligenza artificiale generativa. Il modello viene addestrato con una quantità enorme di immagini in movimento, opportunamente descritte ed etichettate. A partire da queste, riesce a individuare correlazioni e, di conseguenza, a generare immagini in movimento a partire da una richiesta di testo. Non capisce davvero il mondo e le leggi fisiche che lo regolano. È in grado, però, di correlare una richiesta, come quella di un pesce che nuota, al fatto che l’animale lo faccia sott’acqua, con le leggi che regolano il movimento nelle profondità del mare. Ad oggi, Sora non è disponibile al pubblico. È stato rilasciato solo ad alcuni addetti ai lavori e utenti che dovranno testarlo per studiarne le debolezze e gli impatti sulla società.

Le conseguenze e i problemi

L’impatto di Sora sul mondo dei social network è stato importante. Pur non disponibile, OpenAI ha continuato a pubblicare video, più o meno realistici, su X, alimentando l’hype e la discussione. I temi sono sostanzialmente due.

Del primo ha scritto bene The Atlantic, in un articolo che non a caso si intitola “Sora è un totale mistero”. Del resto, OpenAI – e non è la prima volta – ha condiviso solo un report tecnico, che non fornisce vere e proprie specifiche né sul funzionamento specifico del sistema, né sul materiale utilizzato per l’addestramento. Il sistema, oggi, è ancora più chiuso di altri: è disponibile solo a un gruppo ristretto di utenti e online vediamo sicuramente i risultati migliori, quelli più efficaci, magari generati dopo una serie di tentativi a vuoto.

Anche in questo contesto, a un occhio attento molti dei video creati da Sora contengono alcuni difetti: un gatto con una zampa in più, strani movimenti, torsioni innaturali. Insomma, il modello è meno perfetto di quanto OpenAI non sia interessata a mostrare. Ma non abbiamo modo di verificarlo in prima persona, ad oggi.

Il secondo tema riguarda il potenziale impatto di una tecnologia di questo genere sulla società. È un impatto che ci riporta alla formula con cui ho aperto questo articolo: cosa succede quando la prova testimoniale per eccellenza del web smette di essere tale? Non è solo un problema di deepfake o di disinformazione, il cui rischio è evidenziato anche dalla stessa OpenAI nell’annuncio di lancio. È una questione più ampia, che ha a che fare con il cosiddetto liar’s dividend, il dividendo del bugiardo teorizzato in un articolo scientifico da Daniel Schiff, Kaylyn Jackson e Natalia Bueno. E che dice che chi vuole diffondere disinformazione beneficia di un contesto in cui è difficile capire cosa è vero e cosa è falso.