OpenAI lancia Sora, il modello capace di produrre video da istruzioni testuali

Ennesima rivoluzione nel mondo dell’intelligenza artificiale. Grazie a Sora, che in giapponese significa “cielo”, sarà possibile generare un video partendo da poche righe di testo.

OpenAI lancia Sora, il modello capace di produrre video da istruzioni testuali
La presentazione
Preroll AMP

redazione Modifica articolo

20 Marzo 2024 - 19.43 Culture


ATF AMP

Novità in casa OpenAI, attrice principale tra le compagnie che operano nel settore dell’intelligenza artificiale generativa e “madre” di ChatGPT e DALL-E. L’azienda ha introdotto il proprio modello Sora, in grado di riceve istruzioni testuali e trasformale in sequenze video realistiche.

Top Right AMP

Secondo la società, fondata nel 2015 e diretta da Sam Altman, Sora dimostra la capacità di produrre “ambientazioni intricate con particolari riguardanti gli elementi principali della scena e il suo contesto”. L’impresa statunitense ha inoltre affermato che il modello è in grado di “riconoscere la presenza degli oggetti nel mondo fisico” e possiede la competenza di “interpretare con precisione le istruzioni e generare personaggi convincenti che esprimono emozioni vivide”.

OpenAI ha precisato di non aver ancora reso disponibile il software al pubblico in quanto lo sta ancora esaminando per comprendere i pericoli e i rischi, almeno secondo quanto riportato e anticipato dal New York Times. La tecnologia alla base è stata condivisa con un ristretto gruppo di accademici e altri ricercatori esterni il cui compito è individuare i possibili utilizzi dannosi di “Sora”, al fine di sviluppare eventuali contromisure.

Dynamic 1 AMP

Steven Levy, giornalista di Wired, ha raccontato la sua esperienza in cui OpenAI gli ha concesso di visionare, ma non di utilizzare, tale modello. Il prompt quello di creare una scena della città di Kyoto ripresa da una telecamera in movimento, seguendo alcune persone in una giornata di neve. “Il risultato è una rappresentazione coinvolgente di ciò che è senza dubbio Kyoto in questo momento, con fiocchi di neve e fiori di ciliegio che convivono”, ha scritto Levy. “La telecamera virtuale, montata su un drone, segue una coppia che passeggia in questo paesaggio artificiale”.

La compagnia sottolinea che Sora è in grado di creare una vasta gamma di mondi, incluse scene realistiche o fantastiche, tridimensionali, con movimenti fluidi e anche in ambientazioni inesistenti nel mondo reale. Il modello, inoltre, applica le corrette regole fisiche che governano gli oggetti.

FloorAD AMP
Exit mobile version