Et si l’avenir de l’IA ne se jouait pas dans de gros serveurs remplis de GPU, mais au contraire tout près de nous, sur nos appareils. C’est ce que cherche à réaliser Qualcomm, fondeur de SoC pour smartphone et ordinateurs portables. Le constructeur a réussi à créer un programme d’intelligence artificielle capable de générer des images depuis un simple smartphone.
Pour aller plus loin
Cet outil transforme vos gribouillis en chefs-d’œuvre artistiques
Générer une image avec un smartphone, c’est possible en 12 secondes
En février, Qualcomm faisait une première démonstration du fonctionnement de Stable Diffusion sur un smartphone Android. Le fabricant a réitéré l’expérience lors de la Conference on Computer Vision and Pattern Recognition (CVPR), conférence scientifique organisée chaque année par l’IEEE, une association professionnelle américaine d’ingénieurs en électronique.
La division dédiée à la recherche scientifique autour de l’IA de Qualcomm y a fait la présentation de ControlNet, un modèle d’IA de vision et de langage (LVM) composé de 1,5 milliard de paramètres. Il permet de contrôler précisément la génération d’images en indiquant à Stable Diffusion en entrée une image et une description textuelle.
Au total, ce sont 16 étapes qui sont nécessaires à la génération d’une image. Dans la démonstration vidéo publiée par Qualcomm AI Research, on voit que l’IA crée les contours des objets, puis ajoute les couleurs et textures pour enfin combiner les deux.
Pourquoi faire fonctionner une IA « en local »
Un modèle qui fonctionne entièrement sur un smartphone et qui permet de générer des images en moins de 12 secondes. La particularité ici, c’est qu’aucun accès à Internet ou à un service de cloud n’est requis : les calculs sont effectués directement une puce de Qualcomm. Le modèle utilisé n’est pas un smartphone commercialisé, mais un appareil de test développé par Qualcomm, équipé de la puce Snapdragon 8 Gen 2.
Les intérêts d’utiliser une IA « en local » sont multiples selon Qualcomm. Cette méthode serait moins chère, plus performante, offrirait davantage de personnalisation, de protection des données et de sécurité. De quoi aussi réduire la consommation électrique de la génération d’images par IA, défi de plus en plus important dans un contexte de réchauffement climatique et de réduction de la consommation.
Toutefois, il ne s’agit que d’une démonstration : comme on peut le voir dans les exemples montrés, le résultat est loin de ce que peut proposer Midjourney, modèle d’IA bien plus poussé, notamment, dans sa version 5.
Une méthode sur laquelle tend à se pencher Google, qui voudrait permettre de faire de la génération par IA directement dans Chrome. Du côté des générateurs de texte, on sait que LLaMA, le modèle de langage de Meta ayant fuité il y a quelques mois, est en capacité de fonctionner sur un ordinateur.
Téléchargez notre application Android et iOS ! Vous pourrez y lire nos articles, dossiers, et regarder nos dernières vidéos YouTube.
Ce contenu est bloqué car vous n'avez pas accepté les cookies et autres traceurs. Ce contenu est fourni par Disqus.
Pour pouvoir le visualiser, vous devez accepter l'usage étant opéré par Disqus avec vos données qui pourront être utilisées pour les finalités suivantes : vous permettre de visualiser et de partager des contenus avec des médias sociaux, favoriser le développement et l'amélioration des produits d'Humanoid et de ses partenaires, vous afficher des publicités personnalisées par rapport à votre profil et activité, vous définir un profil publicitaire personnalisé, mesurer la performance des publicités et du contenu de ce site et mesurer l'audience de ce site (en savoir plus)
En cliquant sur « J’accepte tout », vous consentez aux finalités susmentionnées pour l’ensemble des cookies et autres traceurs déposés par Humanoid et ses partenaires.
Vous gardez la possibilité de retirer votre consentement à tout moment. Pour plus d’informations, nous vous invitons à prendre connaissance de notre Politique cookies.
Gérer mes choix