L’intelligence artificielle franchit une nouvelle étape dans son évolution avec le lancement de l’assistant vocal ChatGPT par OpenAI. Cette nouvelle fonction avait été annoncée lors de l’arrivée de GPT-4o, elle permet de transformer nos interactions avec l’IA grâce à une latence très faible.
Une sortie progressive et contrôlée
Après un léger retard dû à des préoccupations de sécurité, OpenAI a commencé à déployer l’assistant vocal pour ChatGPT. Mais attention, ne vous attendez pas à pouvoir discuter avec ChatGPT dès demain matin en prenant votre café. Pour l’instant, seul un groupe restreint d’utilisateurs privilégiés, abonnés au service ChatGPT Plus, ont la chance de tester cette nouvelle fonctionnalité.
Pour aller plus loin
Bienvenue dans le film Her : OpenAI ouvre le bal avec GPT-4o
Ce lancement en douceur n’est pas un hasard. OpenAI joue la carte de la prudence, l’entreprise américaine préfère une approche progressive pour peaufiner son assistant vocal avant un déploiement à grande échelle. C’est ce qu’on appelle une phase « alpha », un terrain d’essai grandeur nature qui permettra à l’entreprise de collecter des données précieuses sur l’utilisation réelle de l’assistant.
Les heureux élus recevront une notification par email et dans l’application mobile ChatGPT. Ils auront alors accès à quatre voix prédéfinies pour leur assistant. Et non, aucune ne ressemble à celle de Scarlett Johansson, désolé pour les fans de « Her » !
Pour aller plus loin
ChatGPT aurait volé la voix de Scarlett Johansson et le démenti fait grincer des dents
Les promesses d’une IA plus humaine
Mais que peut-on attendre exactement de cet assistant vocal ? OpenAI promet des conversations plus naturelles et en temps réel, avec une latence minimale. En d’autres termes, vous pourrez parler à ChatGPT comme vous parleriez à un ami, sans ces temps de latence gênants qui rappellent que vous discutez avec une machine.
Pour aller plus loin
Discuter avec ChatGPT : la démonstration bluffante qui va faire trembler Google Assistant
L’un des aspects les plus intéressants est la possibilité d’interrompre l’IA à tout moment. Fini le temps où vous deviez attendre patiemment que l’assistant finisse sa tirade avant de pouvoir placer un mot.
Les défis de l’IA vocale
La sécurité et l’éthique sont au cœur des préoccupations d’OpenAI dans le développement de cet assistant vocal. C’est d’ailleurs ce qui a causé le retard initial dans le lancement. L’entreprise a pris un mois supplémentaire pour s’assurer que son assistant vocal répondait à des « normes élevées de sécurité et de fiabilité ».
L’une des mesures prises concerne la protection contre le clonage vocal. Les quatre voix prédéfinies sont les seules que l’assistant peut utiliser, et des systèmes ont été mis en place pour bloquer toute tentative de sortie vocale différente. C’est une précaution importante à l’ère des deepfakes vocaux et des arnaques téléphoniques sophistiquées.
De plus, OpenAI a intégré des mesures de sécurité pour empêcher l’assistant de répondre à des demandes de contenu violent ou protégé par le droit d’auteur. C’est un pas dans la bonne direction, mais on peut se demander comment ces systèmes réagiront face à des requêtes plus subtiles ou ambiguës.
OpenAI est loin d’être le seul acteur à s’engouffrer dans la conception d’un assistant vocal intelligent à faible latence, une startup française a tout juste lancé Moshi.
Pour aller plus loin
Plus rapide que ChatGPT, plus naturelle que Siri et c’est français : voici Moshi par Kyutai
Ce contenu est bloqué car vous n'avez pas accepté les cookies et autres traceurs. Ce contenu est fourni par Disqus.
Pour pouvoir le visualiser, vous devez accepter l'usage étant opéré par Disqus avec vos données qui pourront être utilisées pour les finalités suivantes : vous permettre de visualiser et de partager des contenus avec des médias sociaux, favoriser le développement et l'amélioration des produits d'Humanoid et de ses partenaires, vous afficher des publicités personnalisées par rapport à votre profil et activité, vous définir un profil publicitaire personnalisé, mesurer la performance des publicités et du contenu de ce site et mesurer l'audience de ce site (en savoir plus)
En cliquant sur « J’accepte tout », vous consentez aux finalités susmentionnées pour l’ensemble des cookies et autres traceurs déposés par Humanoid et ses partenaires.
Vous gardez la possibilité de retirer votre consentement à tout moment. Pour plus d’informations, nous vous invitons à prendre connaissance de notre Politique cookies.
Gérer mes choix