Alors qu’auparavant un accès internet était nécessaire à Gboard pour retranscrire la voix en texte, ce n’est maintenant plus le cas. Dans une publication du blog Google AI, les membres cette division dévoilent les nouveautés apportées au clavier de Google. Des nouveautés qui restent pour l’instant réservées aux utilisateurs de Google Pixel avec un clavier anglais. Nul doute que l’on devrait les retrouver sur plus d’appareils à l’avenir.
Une reconnaissance vocale intégrée aux téléphones
Les ingénieurs de Google ont réussi à compresser et intégrer un réseau neuronal destiné à transcrire un signal physique — ici la voix –, en signal numérique. Cette technologie se nomme RNN-T, et permet de diminuer la taille des modèles utilisés pour la transcription : ils sont passés de 2 Go à 80 Mo.
Une réduction conséquente, qui va permettre aux téléphones d’être directement équipés de cette fonctionnalité. D’habitude, il fallait être connecté à Internet pour envoyer l’enregistrement sonore aux serveurs de Google qui en faisait une transcription et la renvoyait au téléphone. Un aller-retour d’informations qui prend du temps, et augmente le risque d’interception des données.
Une transcription plus fluide
La transcription actuelle est plutôt hachée : même si elle reconnaît bien ce que l’on dit, les mots apparaissent par groupe de 3 ou 4 et sont bien loin de simuler un flot fluide de paroles. La faute à des données qui jouent au yo-yo entre le téléphone et les serveurs de Google.
En s’intégrant directement au téléphone, la transcription est plus fluide. Les mots s’affichent les uns après les autres et collent bien mieux au rythme de nos paroles. C’est en tout cas ce que montre ce GIF partagé par les équipes de Google afin de montrer la différence entre ancienne et nouvelle transcriptions.
C’est avec toutes les données dont Google dispose grâce à ses utilisateurs que des fonctionnalités comme celles-ci sont aussi efficaces. La firme de Mountain View a maintenant l’habitude d’intégrer du machine learning dans bon nombre de ses services, comme pour la navigation en réalité augmentée de Google Maps très récemment, et cela lui réussit.
Pour aller plus loin
Google Maps : la navigation en réalité augmentée est disponible, nous l’avons testée
Des invités passionnants et des sujets palpitants ! Notre émission UNLOCK est à retrouver un jeudi sur deux en direct, de 17 à 19h sur Twitch. Pensez aussi aux rediffusions sur YouTube !
pas dispo encore en france
Lourd à embarquer c'est clair reste à espérer que les packs de langue puissent être déplacé sur carte micro sd
Une des difficultés doit être que le modèle prends un peu de poids sur le téléphone… Trop lourd pour embarquer toutes les langues, c'est sûr. Il faut pouvoir télécharger le package de sa langue.
Ce contenu est bloqué car vous n'avez pas accepté les cookies et autres traceurs. Ce contenu est fourni par Disqus.
Pour pouvoir le visualiser, vous devez accepter l'usage étant opéré par Disqus avec vos données qui pourront être utilisées pour les finalités suivantes : vous permettre de visualiser et de partager des contenus avec des médias sociaux, favoriser le développement et l'amélioration des produits d'Humanoid et de ses partenaires, vous afficher des publicités personnalisées par rapport à votre profil et activité, vous définir un profil publicitaire personnalisé, mesurer la performance des publicités et du contenu de ce site et mesurer l'audience de ce site (en savoir plus)
En cliquant sur « J’accepte tout », vous consentez aux finalités susmentionnées pour l’ensemble des cookies et autres traceurs déposés par Humanoid et ses partenaires.
Vous gardez la possibilité de retirer votre consentement à tout moment. Pour plus d’informations, nous vous invitons à prendre connaissance de notre Politique cookies.
Gérer mes choix