
Amazon dévoile un nouveau système de reconnaissance vocale basée sur l’intelligence artificielle nommé Nova Sonic. Ce système conçu pour les développeurs permettrait de créer des applications de conversations vocales pouvant imiter des intonations humaines pour mieux comprendre et répondre aux demandes des utilisateurs.
Des interactions plus humaines
Aujourd’hui, lorsque l’on interagit vocalement avec certains chatbot comme Alexa ou encore ChatGPT on reste confronté à des interactions qui peuvent sonner encore très robotique. Si certaines entreprises ou laboratoires comme Google avec Google Gemini ou Kyutai avec MoshaVis permettent de rendre ces interactions plus naturelles avec plus d’émotions simulées, elles restent pour le moment à la marge.
Pour aller plus loin
« Vos images prennent la parole », la startup de Xavier Niel lance MoshiVis
Avec Nova Sonic, Amazon souhaite également prendre part à ce secteur. L’entreprise indique vouloir « tenir compte des nuances et de la complexité de la conversation humaine » afin de proposer des interactions vocales « plus proches de l’humain dans les applications d’IA ». On observe sur quelques exemples, une IA changer de ton pour rassurer un utilisateur qui souhaite réserver un voyage à l’étranger, mais s’inquiète du prix qu’il pourrait lui coûter. Si l’agent IA se montre rassurant en proposant une offre économique, ce genre d’adaptation dans un contexte de vente de service pourrait poser dans l’avenir certaines questions éthiques et morales.
Pour le moment, on sait peu de choses sur le système d’Amazon, si ce n’est qu’il serait capable d’unifier « les capacités de compréhension et de génération en un seul modèle ». En fonction de son application, on se rapprocherait sûrement d’un LLM multimodal à la manière de Google Gemini.
Pour aller plus loin
C’est quoi un LLM ? Comment fonctionnent les moteurs de ChatGPT, Gemini et autres ?
Amazon annonce que Nova Sonic est disponible via Amazon Bedrock, son service proposant différents systèmes de modèle de langage. Grâce à Nova Sonic, Amazon promet de simplifier, le développement d’applications vocales dans le secteur du service client ou encore dans le domaine du voyage, de l’éducation ou de la santé.
Envie de rejoindre une communauté de passionnés ? Notre Discord vous accueille, c’est un lieu d’entraide et de passion autour de la tech.
Ce contenu est bloqué car vous n'avez pas accepté les cookies et autres traceurs. Ce contenu est fourni par Disqus.
Pour pouvoir le visualiser, vous devez accepter l'usage étant opéré par Disqus avec vos données qui pourront être utilisées pour les finalités suivantes : vous permettre de visualiser et de partager des contenus avec des médias sociaux, favoriser le développement et l'amélioration des produits d'Humanoid et de ses partenaires, vous afficher des publicités personnalisées par rapport à votre profil et activité, vous définir un profil publicitaire personnalisé, mesurer la performance des publicités et du contenu de ce site et mesurer l'audience de ce site (en savoir plus)
En cliquant sur « J’accepte tout », vous consentez aux finalités susmentionnées pour l’ensemble des cookies et autres traceurs déposés par Humanoid et ses partenaires.
Vous gardez la possibilité de retirer votre consentement à tout moment. Pour plus d’informations, nous vous invitons à prendre connaissance de notre Politique cookies.
Gérer mes choix