“E se i primi a perdere il lavoro per colpa dell’intelligenza artificiale fossero gli influencer?”, si è chiesto qualcuno in questi giorni, dopo aver letto la storia di Aitana Lopez. Se non ne avete mai sentito parlare, si tratta di una modella generata con intelligenza artificiale da un’agenzia spagnola che si chiama The Clueless. Su Instagram ha oltre 200.000 follower, anche grazie all’attenzione mediatica degli ultimi tempi, e guadagnerebbe fino a 10.000 euro al mese grazie a sponsorizzazioni e partnership con aziende.

Il suo feed è una raccolta di foto, più o meno realistiche, che la ritraggono in vari momenti, in scenari diversi. Può sembrare un po’ finto, a volte, ma più di ogni altra cosa è statico: anche nelle Storie, Aitana appare solo in foto, mai in video.

Ecco, anche questo potrebbe cambiare presto.

Che cos'è Animate Anyone e perché se ne parla molto

In questi giorni, nella bolla di X (insomma, quello che si chiama Twitter, ci siamo capiti) si è parlato molto di un nuovo modello di intelligenza artificiale. Si chiama Animate Anyone e l’ha creato la divisione IA del colosso dell’e-commerce cinese Alibaba. Non è ancora disponibile per il pubblico: per ora ci sono un paper e un video che ne spiega le potenzialità.

Stando a quanto scrivono i ricercatori, Animate Anyone può trasformare qualunque foto (o immagine, anche disegnata) in un video, con la possibilità di scegliere l’animazione, le mosse che il personaggio andrà a fare.

Non si tratta, in sé, di una novità assoluta. Già da qualche tempo, esistono modelli di IA che possono animare immagini statiche. Sono sistemi che analizzano e processano dettagli nella foto, per poi provare a prevedere il comportamento di quei dettagli nello spazio. Il problema sono quelle che in gergo si chiamano allucinazioni: il modello è chiamato a immaginare dettagli molto specifici, come il movimento di una manica, e poi inventare, creando immagini bizzarre e poco realistiche.

Animate Anyone, stando a quanto si legge nel paper e si vede nel video, sembra riuscire a rendere il movimento più naturale e credibile, attraverso una fase intermedia che si concentra su aree specifiche dell’immagine, per identificare i dettagli più importanti per ciascuna animazione.

Almeno per il momento, il modello non è disponibile, nemmeno per gli sviluppatori. La data di lancio, stando a quanto si legge nel paper, potrebbe però essere vicina: “L’intenzione – scrivono i ricercatori – è rendere disponibile presto sia una demo sia il codice sorgente”.

Quali sono i pericoli

La possibilità di creare video realistici a partire da immagini apre almeno due scenari. Da un lato, c’è il filone Aitana Lopez, ovvero quello degli e delle influencer virtuali o, più in generale, dell’interazione tra uomo e IA. In un lungo thread su Twitter, AI Companions, un’azienda specializzata in partner virtuali, ha spiegato come Animate Anyone potrà aprire a questa categoria le porte dei Reels di Instagram e di TikTok. “I fan – scrivono – potranno chiedere a un influencer di indossare un determinato outfit, di qualunque genere, o di fare un balletto in particolare”.

Short form videos from a single photo? We'll be able to do this for all our influencers soon!



Based on the latest cutting edge research from the Alibaba group, this is nearly here. Why is this tech important? How can influencers best use this tech?



Thread below �� pic.twitter.com/C4QCJCeEXP — MyCompanions (@MyCompanionsAI) December 3, 2023

C’è, poi, il tema che riguarda i deepfake, ovvero quei contenuti multimediali in cui una determinata persona, stavolta reale, fa qualcosa che in realtà non ha mai fatto. Una tecnologia resa sempre più semplice dalla diffusione dell’IA generativa che strumenti come Animate Anyone potrebbero portare su una nuova dimensione. “La prospettiva che, partendo da una singola immagine di buona qualità, un soggetto malintenzionato possa manipolare l'immagine per far compiere qualsiasi azione è inquietante”, scrive il magazine statunitense TechCrunch.

Del resto, questa possibilità si aggiunge a una serie di innovazioni tecnologiche che già hanno portato la qualità dei deepfake su un livello molto diverso anche solo da un anno fa. Per dirne una, uno strumento come HeyGen, di cui si è parlato molto dopo il video di Salvini che parla francese, oggi permette con due minuti di video di creare un avatar digitale di chiunque, replicandone la voce. E, quindi, di fargli dire qualunque cosa si desideri come se si trovasse davanti a una telecamera, con il movimento delle labbra che si adatta a quanto si sta dicendo.

Immaginate questo scenario, a cui si aggiunge la possibilità di far muovere, magari quello stesso soggetto, in qualunque modo.