Décrire une image n’est plus un défi très complexe pour une intelligence artificielle bien rodée. Cependant, Google a réussi à pousser le concept un peu plus loin pour le rendre plus pratique et impressionnant. Le géant américain vient de dévoiler la fonction « Image Q&A » dans son application d’accessibilité Lookout – Vision assistée et nous avons pu en avoir une brève démonstration pendant la Google I/O 2023 quelques jours auparavant.
Le concept se résume facilement : vous posez n’importe quelle question pour comprendre ce qu’il y a dans l’image et l’intelligence artificielle vous fournit à chaque fois une réponse claire. L’objectif de cette fonction — et de Lookout en général — est d’aider les personnes malvoyantes à savoir ce qu’il y a dans une photo ou un dessin. D’où la notion de Q&A qui signifie questions-réponses. La démo, elle, avait un petit quelque chose d’assez bluffant.
Concrètement, vous téléversez une image dans l’application et vous demandez à l’IA de la décrire. Cette dernière va s’exécuter et vous expliquer ce que l’on voit. Cette première description est efficace et pourrait suffire si vous souhaitiez juste un résumé rapide. Cependant, pour celles et ceux qui ont besoin d’aller plus dans les détails, il suffit de poser une question, à l’écrit ou à voix haute.
L’IA répond à vos questions pour décrire l’image
Pendant la démonstration à l’I/O, l’option Image Q&A de Lookout était confrontée à une image et voici la conversation qu’elle a ensuite eue avec l’utilisateur humain.
IA : Sur cette image, je peux voir un chien courir sur la plage. Je peux aussi voir qu’il a une balle dans sa gueule. En arrière-plan, je peux voir de l’eau, des montagnes et le ciel.
Humain : De quelle race est le chien ?
IA : Le chien est un croisement.
Humain : Est-ce que le chien a l’air joueur ?
IA : Oui, le chien est joueur.
Humain : Décris l’océan.
IA : L’océan est calme et il y a une montagne en arrière-plan.
Humain : Est-ce que les vagues sont grandes ?
IA : Non les vagues sont petites.
Humain : Y a-t-il des nuages dans le ciel ?
IA : Oui, il y a un nuage dans le ciel.
Humain : La plage est-elle bondée ?
IA : Non, la plage est vide.
La conversation n’est pas forcément la plus naturelle, mais elle a assez de fluidité et de clarté pour représenter une solution intéressante pour les personnes malvoyantes qui, sur le web, doivent souvent se contenter de description très sommaire.
Là, elles ont un outil avec un beau potentiel pour leur donner une idée précise d’une image.
Nous avons filmé la démonstration en question. Précisons simplement que cet enregistrement n’est pas de grande qualité, il avait surtout une vocation de support pour la rédaction de cet article.
Rappelons enfin que Lookout est une application disponible depuis un bon moment sur le Play Store. Cet outil d’accessibilité avait déjà plusieurs fonctionnalités intéressantes pour les personnes malvoyantes : lecture de cartes de visite et de fidélité ou d’étiquettes, détection de la valeur d’un billet de banque et aide pour scanner un document.
Notre émission Twitch SURVOLTÉS, c’est un mercredi sur deux de 17h à 19h : retrouvez-vous nous pour parler voiture électrique ou vélo électrique, autour de débats, d’interviews, d’analyses et de jeux !
Ce contenu est bloqué car vous n'avez pas accepté les cookies et autres traceurs. Ce contenu est fourni par Disqus.
Pour pouvoir le visualiser, vous devez accepter l'usage étant opéré par Disqus avec vos données qui pourront être utilisées pour les finalités suivantes : vous permettre de visualiser et de partager des contenus avec des médias sociaux, favoriser le développement et l'amélioration des produits d'Humanoid et de ses partenaires, vous afficher des publicités personnalisées par rapport à votre profil et activité, vous définir un profil publicitaire personnalisé, mesurer la performance des publicités et du contenu de ce site et mesurer l'audience de ce site (en savoir plus)
En cliquant sur « J’accepte tout », vous consentez aux finalités susmentionnées pour l’ensemble des cookies et autres traceurs déposés par Humanoid et ses partenaires.
Vous gardez la possibilité de retirer votre consentement à tout moment. Pour plus d’informations, nous vous invitons à prendre connaissance de notre Politique cookies.
Gérer mes choix