Microsoft continue d’investir lourdement dans la recherche relative à l’intelligence artificielle générative. Dernier projet en date : VASA-1. Il permet de créer des visages animés ultra-réaliste grâce à une simple photo et de l’audio.
Une démonstration impressionnante
VASA-1 est un projet de Microsoft et non un produit commercial à ce stade, mais les résultats semblent déjà très impressionnants. L’IA est capable de générer une vidéo animée d’un visage en temps réel et synchronisée avec la voix de l’utilisateur. La vidéo envoyée est en 512 x 512 pixels à 40 images par seconde, ce n’est pas énorme, mais c’est suffisant pour une conversation sur Zoom, Microsoft Teams ou Google Meet.
À partir d’une simple image portrait d’une personne, l’IA générative peut animer la bouche, le visage et les yeux pour simuler la parole. La voix, elle, est bien celle de l’utilisatrice. On pourrait imaginer pouvoir parler au micro lors d’une réunion sans afficher sa caméra, et être remplacé par cet avatar virtuel.
Pour ne pas inciter le vol d’identité, Microsoft précise que les démonstrations présentées sur la page du projet sont faites à partir de portraits eux-mêmes générés par Dall-E 3. En effet, on pourrait imaginer mélanger ces travaux avec les autres moteurs d’IA générative comme ceux imitant la voix pour améliorer les deep fakes.
Microsoft présente aussi une démo enregistrée en temps réel où l’utilisateur passe d’un visage à un autre et va jusqu’à utiliser un moteur de synthèse vocale pour remplacer la piste audio. On peut, en temps réel, changer le cadrage de l’image. C’est vraiment impressionnant, d’autant que tout cela est réalisé avec un PC de bureau « grand public » équipé d’une puce graphique Nvidia GeForce RTX 4090, et non sur un serveur dans le cloud.
La génération de vidéo est devenue en quelques mois le nouvel eldorado des firmes spécialisées dans l’IA générative. En février, Open AI a présenté Sora, son outil de génération de vidéo.
Utilisez-vous Google News (Actualités en France) ? Vous pouvez suivre vos médias favoris. Suivez Frandroid sur Google News (et Numerama).
Ce contenu est bloqué car vous n'avez pas accepté les cookies et autres traceurs. Ce contenu est fourni par Disqus.
Pour pouvoir le visualiser, vous devez accepter l'usage étant opéré par Disqus avec vos données qui pourront être utilisées pour les finalités suivantes : vous permettre de visualiser et de partager des contenus avec des médias sociaux, favoriser le développement et l'amélioration des produits d'Humanoid et de ses partenaires, vous afficher des publicités personnalisées par rapport à votre profil et activité, vous définir un profil publicitaire personnalisé, mesurer la performance des publicités et du contenu de ce site et mesurer l'audience de ce site (en savoir plus)
En cliquant sur « J’accepte tout », vous consentez aux finalités susmentionnées pour l’ensemble des cookies et autres traceurs déposés par Humanoid et ses partenaires.
Vous gardez la possibilité de retirer votre consentement à tout moment. Pour plus d’informations, nous vous invitons à prendre connaissance de notre Politique cookies.
Gérer mes choix