Après Imagen, il y a eu Imagen 2, puis Imagen 3 : Google continue d’itérer son modèle de génération d’images. La firme a en effet officialisé la troisième version d’Imagen lors de sa conférence Google I/O en direct de San Francisco ce 14 mai. Parmi les annonces, Google a par exemple présenté Ask Photos, une fonctionnalité de Google Photos utilisant Gemini.
Quels sont les progrès apportés par Imagen 3 ?
Google présente Imagen 3 comme son modèle de génération d’images à partir de texte le plus performant, tant en termes de qualité qu’en termes de niveau de détail. La promesse : des images photoréalistes/réalistes, et surtout « moins d’artefacts visuels gênants » par rapport à Imagen 2 notamment. Autre progrès très important : la génération de texte. En fait, les générateurs d’images sont conceptuellement incapables de comprendre qu’une lettre en est une : alors représenter des mots, c’est très compliqué. Google annonce grandement avoir amélioré les capacités de dessin de texte de son modèle.
La firme explique ces progrès par le fait qu’Imagen 3 est meilleur en interprétation du langage, et « comprend » davantage l’intention derrière un prompt, notamment parce qu’il prend plus en compte les détails dans les messages plus longs.
Comme pour Imagen 2, Imagen 3 n’est utilisable qu’en anglais. Une IA disponible pour certains créateurs dans ImageFX, l’un des outils d’IA expérimentaux disponibles sur l’AI Test Kitchen de Google. Ce dernier précise qu’Imagen 3 sera prochainement disponible sur Vertex AI, sa solution pour Google Cloud.
Quels usages et quelles intégrations pour cet énième générateur d’images ?
Des générateurs d’images, même gratuits, il y en a un peu partout, bien qu’ils ne soient pas forcément tous intégrés dans les applications que nous utilisons. Le plus avancé, c’est sans doute Microsoft, avec son Copilot. Du côté de Google, Imagen 2 ne peut être utilisé que dans ImageFX, un outil expérimental disponible (de manière restreinte) sur son AI Test Kitchen.
Parmi les usages imaginés par Google, il y a la possibilité de « générer des messages d’anniversaire personnalisés, des diapositives de titre dans les présentations » notamment. Et dans les intégrations, Gemini permet depuis quelques mois de générer des images, ce qui n’a pas été sans conséquences en matière de diversité. On sait par ailleurs que Google travaille à intégrer un générateur d’images dans Google Messages, via son chatbot Gemini.
Pour aller plus loin
Élections européennes : le rôle important de Google
Espérons que ces outils arrivent en France, puisqu’en raison des législations européennes, Google se retrouve en difficulté pour un déploiement sur le Vieux Continent.
Ce contenu est bloqué car vous n'avez pas accepté les cookies et autres traceurs. Ce contenu est fourni par Disqus.
Pour pouvoir le visualiser, vous devez accepter l'usage étant opéré par Disqus avec vos données qui pourront être utilisées pour les finalités suivantes : vous permettre de visualiser et de partager des contenus avec des médias sociaux, favoriser le développement et l'amélioration des produits d'Humanoid et de ses partenaires, vous afficher des publicités personnalisées par rapport à votre profil et activité, vous définir un profil publicitaire personnalisé, mesurer la performance des publicités et du contenu de ce site et mesurer l'audience de ce site (en savoir plus)
En cliquant sur « J’accepte tout », vous consentez aux finalités susmentionnées pour l’ensemble des cookies et autres traceurs déposés par Humanoid et ses partenaires.
Vous gardez la possibilité de retirer votre consentement à tout moment. Pour plus d’informations, nous vous invitons à prendre connaissance de notre Politique cookies.
Gérer mes choix