Decode Sora - L'IA de création de vidéos virales d'OpenAI

VnExpress - VN Express - 20/02
Sora ne crée pas de vidéos en assemblant plusieurs photos, mais restitue plutôt les pixels en temps réel sur la base d'une compréhension du mouvement physique.

Sora d'OpenAI est considéré par les experts comme l'outil d'IA générative qui produit aujourd'hui des images de la meilleure qualité. "Sora marque un pas en avant dans le domaine de la conversion texte-vidéo", a évalué ABC News.

Pendant ce temps, Time a déclaré qu'avant l'apparition de Sora, le monde disposait déjà de modèles d'IA de création vidéo tels que Runway et Pika. Cependant, leurs faiblesses sont une mauvaise qualité vidéo et une courte durée. Pendant ce temps, Sora peut créer des vidéos de 60 secondes avec des contextes complexes tout en garantissant fluidité et logique, même s'il reste encore quelques erreurs.

Le secret de la création vidéo Sora

Vidéo créée par Sora à partir du texte : Un troupeau d'avions en papier vole à travers la jungle, se faufilant autour des arbres comme s'ils migraient. Source : OpenAI

La percée d'OpenAI

OpenAI n'a pas divulgué au public son modèle de création de vidéos à partir de texte. Dans la description, l’entreprise a également très peu mentionné la technologie qui la sous-tend et la source de données utilisée pour la formation.

"Sora utilise un modèle de diffusion, créant une vidéo en commençant par une vidéo bruyante à basse résolution, puis en supprimant le bruit en plusieurs étapes jusqu'à ce que le résultat soit satisfaisant", explique la société derrière ChatGPT à propos du fonctionnement de Sora. Grâce à cela, cette IA est capable de créer la vidéo entière en une seule fois au lieu de courts segments et de les comb...
[Courte citation de 8% de l'article original]

Loading...