Stability AI a annoncé la sortie de Stable Video Diffusion, un modèle vidéo d’IA génératif capable de transformer des images statiques en contenu vidéo.
Alors que les spécialistes du marketing recherchent des moyens innovants pour créer du contenu visuel, nous proposons un aperçu de l’avenir de la création de contenu vidéo grâce à l’intelligence artificielle (IA) générative.
Qu’est-ce que la diffusion vidéo stable ?
Stable Video Diffusion est un modèle de base en matière d’aperçu de recherche de Stability AI avec une capacité d’image en vidéo.
Il a été conçu pour effectuer des tâches telles que la synthèse multi-vues à partir d’une seule image, une capacité renforcée par un réglage fin sur des ensembles de données multi-vues.
Stability AI propose deux versions, capables de générer 14 et 25 images à des fréquences d’images allant de 3 à 30 images par seconde.
Bien que la société soit enthousiaste à l’idée d’intégrer les commentaires et de mettre à jour les modèles avec les dernières avancées, elle a précisé que le modèle n’est pas destiné à des applications réelles ou commerciales à ce stade.
Le code de Stable Video Diffusion est disponible sur GitHub, et les poids nécessaires pour l’exécuter localement peuvent être trouvés sur la page Hugging Face. Ce document comprend les capacités techniques détaillées du nouveau modèle.
Comment créer une vidéo à partir d’une image statique : 3 démos du générateur vidéo AI
Les démos de recherche suivantes optimisées par Stable Video Diffusion offrent un aperçu de l’avenir de la création de contenu visuel avec l’IA générative.
1. Démo communautaire pour une diffusion vidéo stable – Img2Vid – XT On Hugging Face
J’ai utilisé cette démo pour créer un fichier GIF téléchargeable à partir d’un logo généré par ChatGPT.
La vidéo générée par l’IA résultante :
2. SVD lors de la réplication
J’ai utilisé cette démo pour générer un fichier MP4 téléchargeable à partir du même logo.
La vidéo générée par l’IA résultante :
3. Terrain de jeu de diffusion vidéo stable sur Fal
J’ai essayé cette démo pour créer un fichier GIF téléchargeable.
Malheureusement, le test du logo a rencontré des difficultés techniques. Voici donc un GIF généré par l’IA que j’ai créé il y a quelques jours à l’aide de cette démo et d’une image générée par DALL-E 3.
J’ai demandé @ChatGPTapp pour mettre une tête de lion dans une rose que j’ai photographiée ce matin avec DALL·E 3 et que je l’ai animée avec @fal_ai_data en utilisant la diffusion vidéo stable à partir de @StabilitéAI 🦁🏵️🔥 pic.twitter.com/S6jfKAEWK9
– Kristi Hines (@kristileilani) 25 novembre 2023
Liste d’attente pour l’interface texte-vidéo
Les personnes et organisations intéressées peuvent s’inscrire sur une liste d’attente pour accéder à une nouvelle expérience Web à venir de Stability AI, dotée d’une interface texte-vidéo, qui présentera les applications pratiques de cette technologie.
La sortie de Stable Video Diffusion marque une étape importante dans l’évolution de la technologie de l’IA générative, ouvrant la voie à de futures innovations en matière de technologie de marketing et de publicité.
Image en vedette : Rafapress/Shutterstock