Avec les Galaxy S24 qui sont sortis récemment, Samsung a déployé Galaxy AI, à savoir un ensemble de fonctionnalités d’intelligence artificielle. Un certain nombre d’entre elles sont dédiées à la photo : correction, suppression d’un élément, recadrage, etc. Logiquement, Apple s’y intéresse aussi. L’entreprise a d’ailleurs publié un modèle d’édition d’images baptisé MGIE, disponible en open source.
Un Photoshop d’Apple basé sur de l’IA
Ce modèle est nommé MGIE, pour MLLM-Guide Image Editing ; à noter que MLLM signifie « multimodal large language model », pour grand modèle de langage multimodal en français. Ce programme est le résultat d’une recherche d’Apple en collaboration avec plusieurs chercheurs de l’Université de Californie à Santa Barbara.
L’idée est d’utiliser une image que l’on fait modifier par une requête textuelle. Le modèle peut gérer plusieurs aspects de l’édition photo, comme des modifications façon Photoshop, de l’optimisation globale ou des modifications locales. Au-delà de la simple prise en compte de la requête, ce que fait MGIE, c’est l’améliorer.
Par exemple, sur une photo de pizza que l’on veut rendre plus vertueuse pour la santé, MGIE va transformer la demande en « la pizza comprend une garniture avec des légumes, comme des tomates ou des herbes ». Cette « amélioration » du prompt (la requête) permet au modèle de modification d’image d’avoir des instructions plus précises et plus claires, pour un résultat qui l’est aussi.
Si l’on en croit les exemples montrés, MGIE est également capable de retirer un objet d’une photographie, d’ajouter du contraste, de la netteté ou de la luminosité sur une photo ou encore de changer la couleur d’un élément. À la manière de Photoshop, on peut aussi lui demander de recadrer, redimensionner, faire pivoter, retourner une image, ou bien de lui ajouter un filtre.
On peut faire remplacer un arrière-plan par ailleurs. Le style d’une image peut être modifié : on peut remplacer une photographie par une peinture, ou une esquisse par une caricature. Les possibilités semblent assez grandes, et il est difficile de toutes les lister.
Ce modèle open source arrivera-t-il un jour sur les iPhone ?
La particularité de ce modèle, en tout cas dans le domaine de l’intelligence artificielle, c’est qu’il est totalement open source. Ce qui signifie qu’il est accessible gratuitement pour tout le monde, et que chacun est libre de le modifier et/ou de le commercialiser. Cela comprend le code, les données ainsi que les modèles pré-entraînés.
Sur la page GitHub du projet, on trouve même des instructions pour apprendre à utiliser MGIE. Le chercheur Tsu-Jui Fu, qui a participé à la recherche, a mis en ligne une démonstration sur la plateforme Spaces de Hugging Face. Ce qu’on apprend, c’est que MGIE peut être intégré à d’autres applications d’édition d’images, ce qui permet d’imaginer l’avenir.
Apple travaille sur l’intelligence artificielle générative, on en est sûrs aujourd’hui. Ce modèle d’édition est très intéressant, puisqu’il pourrait très bien être intégré dans l’application Photos des iPhone, iPad et Mac. On peut imaginer que dans quelques années, Apple permette de modifier comme on le souhaite ses photos à l’aide de cette IA. Cela ne verra peut-être jamais le jour, mais à l’heure actuelle, c’est ce vers quoi la marque tend.
Des invités passionnants et des sujets palpitants ! Notre émission UNLOCK est à retrouver un jeudi sur deux en direct, de 17 à 19h sur Twitch. Pensez aussi aux rediffusions sur YouTube !
Ce contenu est bloqué car vous n'avez pas accepté les cookies et autres traceurs. Ce contenu est fourni par Disqus.
Pour pouvoir le visualiser, vous devez accepter l'usage étant opéré par Disqus avec vos données qui pourront être utilisées pour les finalités suivantes : vous permettre de visualiser et de partager des contenus avec des médias sociaux, favoriser le développement et l'amélioration des produits d'Humanoid et de ses partenaires, vous afficher des publicités personnalisées par rapport à votre profil et activité, vous définir un profil publicitaire personnalisé, mesurer la performance des publicités et du contenu de ce site et mesurer l'audience de ce site (en savoir plus)
En cliquant sur « J’accepte tout », vous consentez aux finalités susmentionnées pour l’ensemble des cookies et autres traceurs déposés par Humanoid et ses partenaires.
Vous gardez la possibilité de retirer votre consentement à tout moment. Pour plus d’informations, nous vous invitons à prendre connaissance de notre Politique cookies.
Gérer mes choix