Open AI presenta Sora: la vera rivoluzione?

 In News tecnologia

ChatGPT ha scoperchiato il vaso di Pandora circa un anno e mezzo fa e ha mostrato come l’IA potesse influire sul lavoro quotidiano di molti, con le dovute cautele. Ma qualche giorno fa Open AI ha presentato uno strumento forse più rivoluzionario.

Sora: di cosa si tratta

Sora è un’IA in grado di convertire il testo in video, così come ne sono nate molte negli scorsi mesi che generano immagini a partire dal video. In termini più tecnici si tratta di un “diffusion transformer model”. 

Questi modelli sono addestrati fornendo loro delle immagini alle quali è stato aggiunto del rumore accompagnate da un testo che le descrive. L’IA, grazie ad un processo iterativo, rimuove gradualmente il rumore fino ad ottenere l’immagine originale. 

Ma questo genererebbe soltanto immagini statiche che vengono attaccate insieme generando un risultato “artificiale” e che verrebbe percepito come anomalo. 

Per operare interviene la parte del trasformatore che calcola il modo migliore per “agganciare” tra loro i frame che andranno a comporre il video in modo che il risultato sia fluido.

Qualche esempio

Nel corso del video di presentazione sono stati mostrati diversi prompt con il risultato che hanno generato a seguito. Non tutti sono convincenti nello stesso modo. 

Ad esempio il video del fuoristrada che corre ha ancora qualche difetto a livello di gestione della fisica dell’auto. Sembra più il trailer di un videogioco che un video reale. Le mani rimangono sempre un grande problema da gestire e sono quelle che stonano di più nei video che contengono umani.

Invece buoni gli animali, il comportamento dell’acqua e dei corpi immersi nei fluidi. Senz’altro rimangono soggetti più semplici da gestire per l’IA ma occorre anche essere onesti: il risultato è comunque stupefacente.

Problemi

Prima ancora di accennare ai problemi etici occorre analizzare una questione pratica sottolineata dallo stesso Sam Altman, CEO di Open AI.

Il primo problema è la potenza di calcolo: non ce n’è abbastanza per ciò che Altman progetta. Per questo a Davos si è detto pronto a cercare di raccogliere 7.000 miliardi di dollari per creare un gigante dei semiconduttori e rivoluzionare il mercato. Un progetto molto ambizioso che non sappiamo se possa essere concretizzato.

Questo problema non è poi svincolato dalla potenza energetica necessaria a far funzionare computer potentissimi per addestrare IA e quant’altro.

Sora: l’impatto sulla sicurezza

Per il momento i video generati in questo modo presentano ancora una serie di errori che possono aiutare a comprendere quali siano autentici e quali no. Il futuro, come abbiamo ben sperimentato negli scorsi mesi, è però molto veloce ad arrivare e quindi sarà necessario avere nuovi mezzi per trovare i video “fake” da quelli reali.

Le implicazioni sono importanti perché video di questo tipo potrebbero mostrare un politico importante pronunciare frasi irricevibili e che scatenerebbero grandi problemi. Oppure si potrebbero rubare le identità di personaggi famosi, lo abbiamo già visto recentemente, per scopi di lucro. 

Rimangono interrogativi che non hanno una risposta, al momento Open AI non ha annunciato un rilascio proprio perché sta prendendo misure preventive di protezione.

Recommended Posts
Richiesta info

Hai una domanda, un dubbio, una curiosità, una richiesta? Inviaci un messaggio, saremo lieti di risponderti al più presto!

Start typing and press Enter to search

Cervello IAologramma