DALL-E 3 : la fusion entre ChatGPT et la génération d’images qui va bousculer Midjourney

Midjourney a du souci à se faire

 
OpenAI, la maison mère de ChatGPT, n’est plus à présenter. Après nous avoir offert ChatGPT, elle annonce désormais la capacité de ce dernier à générer des images précises, grâce à la fusion de DALL-E et ChatGPT dans DALL-E 3.
DALL-E 3 // Source : OpenAI

Frandroid, pour ceux qui suivent, a recours à un outil de génération d’images : Midjourney. Si cet instrument s’est avéré puissant et innovant dans le monde de la génération d’images, DALL-E d’OpenAI était aussi sur la piste, avec un parcours tout aussi impressionnant. Et le nouvel opus DALL-E 3 risque bien de changer la donne.

D’après les démonstrations partagées par OpenAI, il est clair que DALL-E 3 se distingue de ses prédécesseurs et concurrents. Là où Midjourney excelle dans la restitution photoréaliste, mais demande encore de nombreuses manipulations, DALL-E 3 promet une génération d’image nettement plus efficace et moins erronée. Un exploit notable, surtout en considérant le fait qu’il s’agit d’une avancée majeure par rapport à DALL-E 2.

DALL-E 3 // Source : OpenAI

De plus, ce nouvel outil semble avoir développé une compétence spécifique pour gérer le texte dans les images, surpassant les capacités de certains de ses concurrents tels que Stable Diffusion XL et DeepFloyd. En particulier, OpenAI met en avant sa capacité à produire des images convaincantes de lettres, de chiffres, et même de mains humaines (une réelle difficulté pour ces outils).

En intégrant DALL-E à ChatGPT, OpenAI renforce sa position en tant que leader dans le monde de l’IA générative. ChatGPT et DALL-E 3, ensemble, promettent de repousser les frontières de l’IA.

Les chatbots vont, non seulement, être capables de converser de manière presque humaine, mais aussi d’imaginer et de créer des images à partir de simples descriptions. On a hâte de tester.

Si vous voulez tester DALL-E 3, il va être disponible pour les utilisateurs de ChatGPT Plus et Enterprise. Ce qui est beaucoup plus simple à utiliser que Midjourney… où il faut un client Discord.

À qui appartient les images générées ?

La question des droits d’auteur liés aux images générées par IA est actuellement un sujet brûlant. Les régulations actuelles suggèrent que les images nées de l’IA entrent dans le domaine public. Cependant, OpenAI déclare clairement que la propriété des images produites par DALL-E 3 revient à leurs créateurs. Et ça, c’est un autre débat du secteur.

Bing Chat aussi a droit à DALL-E 3

Ce jeudi 21 septembre, Microsoft a tenu une conférence pour annoncer l’arrivée très prochaine de Copilot, mais aussi la nouvelle gamme Surface. En parallèle, l’entreprise a communiqué sur l’arrivée du modèle DALL-E 3 dans Bing Image Creator. Pour rappel, il s’agit de l’outil de création d’images de Bing Chat. Selon Microsoft, Bing Image Creator « comprend également mieux ce que vous demandez, ce qui permet d’obtenir des images plus précises. »

Microsoft dit aussi aller plus loin en ajoutant « un filigrane numérique invisible à toutes les images générées par l’IA dans Bing, y compris l’heure et la date de leur création. » Difficile de savoir à quel point ce filigrane sera puissant, ni comment on pourra vérifier sa présence ou non, mais c’est une première étape.


Utilisez-vous Google News (Actualités en France) ? Vous pouvez suivre vos médias favoris. Suivez Frandroid sur Google News (et Numerama).

Les derniers articles