Imaginons que vous soyez chez vous en fin de journée, perplexe devant votre réfrigérateur ouvert. Vous vous demandez ce que vous pourriez bien cuisiner avec les ingrédients disponibles. Au lieu de chercher des recettes en ligne en espérant qu’elles correspondent à ce que vous avez, vous pouvez simplement prendre une photo de l’intérieur de votre réfrigérateur et une autre de votre garde-manger, puis les envoyer à ChatGPT.
Cette mise à niveau vient après d’autres nouveautés, notamment le lancement de Dall-E 3 et son intégration avec ChatGPT. Le chatbot pourra maintenant voir, entendre, et parler, une première dans le monde des IA conversationnelles. Le but est simple : rendre l’interface utilisateur aussi intuitive que possible, vous permettant de communiquer avec la machine de la manière la plus naturelle.
Des conversations vocales
L’une des améliorations majeures de cette mise à jour est l’introduction des conversations vocales. OpenAI a rendu cette fonctionnalité facilement accessible depuis les paramètres de l’application mobile, où les utilisateurs pourront choisir parmi cinq voix différentes. On ne sait pas si la langue française sera prise en compte au début. Une fois que c’est fait, tout ce que vous avez à faire est d’appuyer sur le bouton du casque situé dans le coin supérieur droit de l’écran d’accueil pour engager une conversation vocale.
Ce pas en avant n’est pas seulement une prouesse technologique, il a aussi un impact pratique. Vous pouvez parler avec ChatGPT lors de vos déplacements, demander une histoire au coucher pour votre enfant, ou même régler un débat à table. OpenAI promet une voix qui sonne étonnamment réaliste. Pour cela, le spécialiste de l’IA a travaillé avec des acteurs vocaux pour créer ces voix, afin de prévenir les abus potentiels que pourraient engendrer des voix synthétiques trop convaincantes.
L’interaction avec des photos et des images
Si les conversations vocales étaient la seule mise à jour, ce serait déjà impressionnant. Mais OpenAI ne s’arrête pas là. Désormais, ChatGPT pourra aussi interagir avec des images. Imaginez que vous êtes à la maison et vous vous demandez ce que vous pouvez cuisiner pour le dîner. Vous pouvez simplement prendre des photos de votre réfrigérateur et de votre garde-manger, et demander des suggestions de recettes à ChatGPT.
Le modèle, capable de « voir » les images que vous avez envoyées, identifie les ingrédients disponibles et vous propose une ou plusieurs recettes que vous pourriez réaliser avec ceux-ci. Par exemple, si ChatGPT identifie des œufs, du fromage et des légumes, il pourrait vous suggérer une omelette aux légumes et au fromage. Et si vous avez des questions de suivi, comme la meilleure manière de battre les œufs ou le temps de cuisson optimal, le chatbot peut vous fournir des instructions étape par étape, rendant le processus de préparation du dîner plus fluide et intuitif.
Cette capacité à interagir avec les contenus multimédias ouvre une myriade de possibilités, surtout dans le secteur de l’éducation. Vous pouvez aider votre enfant à résoudre un problème de mathématiques en prenant une photo du problème, l’encercler, et demander des indices à ChatGPT.
Bref, OpenAI ne se repose pas sur ses lauriers. Avec ces améliorations, l’entreprise américaine cherche à conserver son avance. Les utilisateurs Plus et Enterprise auront un premier aperçu de ces nouvelles fonctionnalités dans les prochaines semaines, et d’autres groupes d’utilisateurs, y compris les développeurs, suivront peu après. Au-delà des aspects techniques, ces nouvelles fonctionnalités visent à créer une expérience utilisateur plus riche et plus intuitive, rapprochant ainsi l’intelligence artificielle d’une interaction humaine véritable.
Pour aller plus loin
Comment utiliser ChatGPT et à quoi sert-il ?
Utilisez-vous Google News (Actualités en France) ? Vous pouvez suivre vos médias favoris. Suivez Frandroid sur Google News (et Numerama).
Ce contenu est bloqué car vous n'avez pas accepté les cookies et autres traceurs. Ce contenu est fourni par Disqus.
Pour pouvoir le visualiser, vous devez accepter l'usage étant opéré par Disqus avec vos données qui pourront être utilisées pour les finalités suivantes : vous permettre de visualiser et de partager des contenus avec des médias sociaux, favoriser le développement et l'amélioration des produits d'Humanoid et de ses partenaires, vous afficher des publicités personnalisées par rapport à votre profil et activité, vous définir un profil publicitaire personnalisé, mesurer la performance des publicités et du contenu de ce site et mesurer l'audience de ce site (en savoir plus)
En cliquant sur « J’accepte tout », vous consentez aux finalités susmentionnées pour l’ensemble des cookies et autres traceurs déposés par Humanoid et ses partenaires.
Vous gardez la possibilité de retirer votre consentement à tout moment. Pour plus d’informations, nous vous invitons à prendre connaissance de notre Politique cookies.
Gérer mes choix