ChatGPT lance son assistant vocal qui va ridiculiser Google Assistant et Amazon Alexa

 
« Alexa, dis bonjour à ton nouveau concurrent. ». L’assistant vocal de ChatGPT vient d’être lancé par OpenAI, ce qui promet des conversations plus naturelles.

L’intelligence artificielle franchit une nouvelle étape dans son évolution avec le lancement de l’assistant vocal ChatGPT par OpenAI. Cette nouvelle fonction avait été annoncée lors de l’arrivée de GPT-4o, elle permet de transformer nos interactions avec l’IA grâce à une latence très faible.

Une sortie progressive et contrôlée

Après un léger retard dû à des préoccupations de sécurité, OpenAI a commencé à déployer l’assistant vocal pour ChatGPT. Mais attention, ne vous attendez pas à pouvoir discuter avec ChatGPT dès demain matin en prenant votre café. Pour l’instant, seul un groupe restreint d’utilisateurs privilégiés, abonnés au service ChatGPT Plus, ont la chance de tester cette nouvelle fonctionnalité.

Pour aller plus loin
Bienvenue dans le film Her : OpenAI ouvre le bal avec GPT-4o

Ce lancement en douceur n’est pas un hasard. OpenAI joue la carte de la prudence, l’entreprise américaine préfère une approche progressive pour peaufiner son assistant vocal avant un déploiement à grande échelle. C’est ce qu’on appelle une phase « alpha », un terrain d’essai grandeur nature qui permettra à l’entreprise de collecter des données précieuses sur l’utilisation réelle de l’assistant.

Une démo de GPT-4o par la voix

Les heureux élus recevront une notification par email et dans l’application mobile ChatGPT. Ils auront alors accès à quatre voix prédéfinies pour leur assistant. Et non, aucune ne ressemble à celle de Scarlett Johansson, désolé pour les fans de « Her » !

Pour aller plus loin
ChatGPT aurait volé la voix de Scarlett Johansson et le démenti fait grincer des dents

Les promesses d’une IA plus humaine

Mais que peut-on attendre exactement de cet assistant vocal ? OpenAI promet des conversations plus naturelles et en temps réel, avec une latence minimale. En d’autres termes, vous pourrez parler à ChatGPT comme vous parleriez à un ami, sans ces temps de latence gênants qui rappellent que vous discutez avec une machine.

Pour aller plus loin
Discuter avec ChatGPT : la démonstration bluffante qui va faire trembler Google Assistant

L’un des aspects les plus intéressants est la possibilité d’interrompre l’IA à tout moment. Fini le temps où vous deviez attendre patiemment que l’assistant finisse sa tirade avant de pouvoir placer un mot.

Les défis de l’IA vocale

La sécurité et l’éthique sont au cœur des préoccupations d’OpenAI dans le développement de cet assistant vocal. C’est d’ailleurs ce qui a causé le retard initial dans le lancement. L’entreprise a pris un mois supplémentaire pour s’assurer que son assistant vocal répondait à des « normes élevées de sécurité et de fiabilité ».

L’une des mesures prises concerne la protection contre le clonage vocal. Les quatre voix prédéfinies sont les seules que l’assistant peut utiliser, et des systèmes ont été mis en place pour bloquer toute tentative de sortie vocale différente. C’est une précaution importante à l’ère des deepfakes vocaux et des arnaques téléphoniques sophistiquées.

De plus, OpenAI a intégré des mesures de sécurité pour empêcher l’assistant de répondre à des demandes de contenu violent ou protégé par le droit d’auteur. C’est un pas dans la bonne direction, mais on peut se demander comment ces systèmes réagiront face à des requêtes plus subtiles ou ambiguës.

OpenAI est loin d’être le seul acteur à s’engouffrer dans la conception d’un assistant vocal intelligent à faible latence, une startup française a tout juste lancé Moshi.

Pour aller plus loin
Plus rapide que ChatGPT, plus naturelle que Siri et c’est français : voici Moshi par Kyutai


Rejoignez-nous de 17 à 19h, un jeudi sur deux, pour l’émission UNLOCK produite par Frandroid et Numerama ! Actus tech, interviews, astuces et analyses… On se retrouve en direct sur Twitch ou en rediffusion sur YouTube !

Les derniers articles