Un assistant plus intelligent que jamais qui permet, en quelque sorte, de discuter à l’oral avec ChatGPT. Voici un raccourci un peu grossier, certes, mais décrivant assez bien ce que va devenir Amazon Alexa sur les enceintes connectées. C’est en tout cas l’avenir vers lequel on se dirige si l’on en croit la présentation pleine de promesses faite par David Limp, vice-président chez Amazon et chargé des produits et services de l’entreprise.
Le dirigeant a en effet évoqué un nouveau grand modèle de langage — large language model (LLM) en anglais — sur lequel l’assistant vocal Alexa allait désormais s’appuyer. Un LLM « spécifiquement optimisé pour la voix ». Ainsi, non seulement vous aurez affaire à un assistant vocal plus intelligent, mais ce dernier paraîtra aussi beaucoup plus naturel, presque humain, dans la manière de s’exprimer et d’interagir avec vous.
Dans la vidéo de démonstration ci-dessous, on voit même que l’on peut interrompre l’IA et que cela ne la perturbe pas pour continuer à comprendre la conversation et la poursuivre fluidement.
Selon Amazon, vous allez ainsi pouvoir faire des conversations plus longues (avec des phrases plus longues) et demander des tâches relativement complexes semblables à celles que vous pouvez déjà faire avec de puissants agents conversationnels comme ChatGPT ou Google Bard.
« Alexa, let’s chat » : une discussion plus naturelle
Une autre vidéo de démonstration illustre assez bien les futures capacités d’Amazon Alexa. Dans un des passages, on y voit une femme apostrophait l’assistant vocal en disant « Alexa, let’s chat ». Cela pourrait se traduire par « Alexa, discutons » (mais dans un ton un peu plus décontracté). La personne demande ensuite à l’intelligence artificielle d’imaginer un message d’invitation pour participer à un dîner centré autour d’une thématique d’enquête policière et précise, avec un phrasé assez naturel, qu’elle souhaite un texte assez mystérieux.
Alexa s’exécute et récite le premier jet qu’il a préparé. Cela convient à la dame qui enchaîne direct en demandant de l’envoyer sur son téléphone. Sans transition, elle continue de s’adresser à son assistant vocal en lui demandant de baisser les rideaux des fenêtres du salon. Enfin, la conversation se termine avec l’humain qui demande à Alexa de lui citer un morceau de jazz connu. L’IA répond et la femme réagit en disant simplement : « cool, joue ça ».
Cette démonstration s’inscrit dans une vidéo évidemment promotionnelle, sans aléas. Au crédit d’Amazon, notons tout de même que nos collègues de Numerama saluent une démonstration sur scène encore plus impressionnante, « avec une vraie conversation digne de deux humains ». Pour y arriver, Amazon affirme notamment avoir longuement étudier toutes les subtilités d’une discussion à l’oral.
Dans toute conversation, nous traitons des tonnes d’informations supplémentaires, telles que le langage corporel, la connaissance de la personne avec laquelle vous parlez et le contact visuel. Pour permettre cela avec Alexa, nous avons fusionné les données des capteurs d’un Echo — la caméra, les données vocales, sa capacité à détecter la présence — avec des modèles d’IA capables de comprendre ces signaux non verbaux. Nous nous sommes également attachés à réduire la latence afin que les conversations se déroulent naturellement, sans pause, et que les réponses soient d’une longueur adaptée à la voix, et non l’équivalent d’un paragraphe lu à haute voix.
Les capacités débloquées par le nouveau grand modèle de langage seront disponibles à partir de 2024. Aux États-Unis, certains utilisateurs pourront avoir la chance de le découvrir en preview. En France, il faudra sans doute attendre un peu avant de voir le nouveau LLM maîtriser la langue officielle de l’Hexagone.
Téléchargez notre application Android et iOS ! Vous pourrez y lire nos articles, dossiers, et regarder nos dernières vidéos YouTube.
Ce contenu est bloqué car vous n'avez pas accepté les cookies et autres traceurs. Ce contenu est fourni par Disqus.
Pour pouvoir le visualiser, vous devez accepter l'usage étant opéré par Disqus avec vos données qui pourront être utilisées pour les finalités suivantes : vous permettre de visualiser et de partager des contenus avec des médias sociaux, favoriser le développement et l'amélioration des produits d'Humanoid et de ses partenaires, vous afficher des publicités personnalisées par rapport à votre profil et activité, vous définir un profil publicitaire personnalisé, mesurer la performance des publicités et du contenu de ce site et mesurer l'audience de ce site (en savoir plus)
En cliquant sur « J’accepte tout », vous consentez aux finalités susmentionnées pour l’ensemble des cookies et autres traceurs déposés par Humanoid et ses partenaires.
Vous gardez la possibilité de retirer votre consentement à tout moment. Pour plus d’informations, nous vous invitons à prendre connaissance de notre Politique cookies.
Gérer mes choix