Plus rapide que ChatGPT, plus naturelle que Siri et c’est français : voici Moshi par Kyutai

Xavier Niel frappe fort

 
En seulement six mois, une poignée de chercheurs français ont réussi l’impossible : créer un assistant vocal capable de rivaliser avec les géants américains. Moshi, le petit prodige de Kyutai, promet des conversations fluides et naturelles comme jamais auparavant. Un tour de force qui pourrait bien rebattre les cartes de l’IA mondiale.
Source : Kyutai

Oubliez tout ce que vous pensiez savoir sur les assistants vocaux. Moshi, la nouvelle IA de Kyutai, vient de changer les règles du jeu. Plus rapide que ChatGPT, plus naturelle que Siri, cet assistant vocal français pourrait bien révolutionner notre façon d’interagir avec l’intelligence artificielle. La conférence au lieu aujourd’hui, ce 3 juillet, et vous pouvez la revoir en ligne.

Une IA qui parle plus vite que son ombre

Le chiffre est impressionnant : 160 millisecondes. C’est le temps de latence annoncé pour Moshi, un record dans l’industrie. Pour vous donner une idée, c’est plus rapide que le temps qu’il vous faut pour cligner des yeux. Cette réactivité fulgurante permet des conversations d’une fluidité inédite, comme si vous parliez à un véritable être humain.

Mais la rapidité n’est pas le seul atout de Moshi. Contrairement aux autres assistants vocaux qui convertissent la voix en texte avant de répondre, Moshi traite directement le son. Résultat ? Il peut reconnaître et imiter jusqu’à 70 émotions différentes. C’est une IA  qui est capable de chuchoter, de blaguer, ou même d’adopter l’accent de votre choix. L’équipe s’est également attaquée au défi de la latence, réussissant à la réduire à seulement 200 millisecondes. C’est un temps de réponse qui se rapproche remarquablement de celui d’une conversation entre humains, rendant les échanges avec Moshi étonnamment naturels. C’est la promesse de Moshi.

Source : Kyutai

Enfin, Kyutai a optimisé le code et réduit la taille des modèles, permettant à Moshi de fonctionner localement sur des appareils comme un MacBook Pro. Cette prouesse technique ouvre la voie à une utilisation plus large et plus privée de l’assistant vocal, sans dépendance constante à une connexion internet.

L’Europe dans la course à l’IA

Derrière Moshi se cache Kyutai, un laboratoire co-fondé par Xavier Niel avec un objectif ambitieux : empêcher la fuite des cerveaux européens vers les États-Unis ou la Chine. En seulement six mois, une équipe de huit chercheurs a réussi à développer cette IA révolutionnaire. C’est un véritable tour de force qui montre que l’Europe a toutes les cartes en main pour rivaliser avec les géants de la Silicon Valley.

Pour aller plus loin
Comment Xavier Niel veut faire face à Google, OpenAI et Adobe

Mais Kyutai va plus loin que la simple compétition technologique. En choisissant une approche open source, le laboratoire veut démocratiser l’accès à l’IA de pointe.  Malgré ses prouesses, Moshi n’est pas sans défauts. Pour l’instant, l’assistant ne parle qu’anglais, un choix stratégique pour toucher un public plus large rapidement. De plus, son modèle de langage Helium, avec ses 7 milliards de paramètres, reste modeste comparé aux mastodontes comme GPT-4. Ce dernier comporte 175 milliards de paramètres.

Pour aller plus loin
C’est quoi un LLM ? Comment fonctionnent les moteurs de ChatGPT, Gemini et autres ?

La question de la vie privée se pose également. Moshi a été entraîné sur des enregistrements d’appels téléphoniques datant des années 90. Même si ces données sont anciennes, on peut s’interroger sur les implications éthiques d’une telle pratique.

En tout cas, Moshi frappe fort dans un domaine qui fait parler de lui en ce moment : celui de la voix. L’assistant vocal pourrait vraiment comprendre le ton de votre voix, réagir à votre humeur, et vous répondre de manière parfaitement naturelle. Le lancement de Moshi est un signal fort pour l’industrie de l’IA en Europe. Il montre qu’avec les bons investissements et une vision claire, le Vieux Continent peut non seulement rattraper son retard, mais aussi innover de manière significative.

Cependant, le vrai test pour Moshi et Kyutai commence maintenant. L’assistant sera bientôt disponible en version prototype pour le grand public sur le site officiel. On a hâte de tester ses capacités.