Les domaines d’application sont nombreux pour la nouvelle IA de Facebook. Après le lancement par Nvidia d’un système RTX Voice capable de supprimer avec une efficacité bluffante les bruits de fond parasites lors d’échanges vocaux, c’est au tour de Facebook d’apporter sa contribution en matière de traitement du son. Sur son blog Facebook IA, le géant californien a dévoilé les grandes lignes d’une technologie permettant d’isoler, à partir d’un seul et unique micro et avec beaucoup de finesse, les voix de plusieurs interlocuteurs dans un brouhaha.
Cette nouveauté pourrait, de l’aveu même du groupe, améliorer l’expérience d’écoute des personnes équipées d’appareils auditifs (tout spécialement dans les lieux publics, lors de fêtes ou au restaurant), mais aussi s’appliquer aux marchés de la réalité virtuelle et augmentée, ou encore au secteur des assistants personnels, pour permettre la captation de requêtes plus claires malgré les bruits de fond.
Jusqu’à 5 interlocuteurs isolés dans le bruit ambiant
En tout, Facebook explique être capable d’isoler les voix d’un maximum de 5 interlocuteurs malgré un fort bruit de fond, tandis que son système est capable de détecter ces différents interlocuteurs et de maintenir — sur le long terme — leurs voix séparées les unes des autres pour une restitution plus claire.
Pour parvenir au résultat dévoilé dans la vidéo accessible ici, Facebook indique avoir eu recours à de nombreuses fonctions objectif (loss function) permettant d’entrainer l’IA, mais aussi d’optimiser le processus de séparation des voix. L’une d’entre elles a en outre été spécialement conçue pour le suivi des voix, afin que les fréquences de chaque interlocuteur restent bien centrées sur des canaux différents. L’entrainement de l’IA s’est fait avec deux, trois, quatre, puis cinq voix, note enfin le groupe, et ce au travers de modèles différents.
Comme l’indique Facebook, si des systèmes de ce genre existaient déjà, ils mettaient seulement à contribution des modèles et décodeurs dont l’efficacité affichait vite ses limites pour détecter différents interlocuteurs… et conserver les fréquences de leurs voix séparées les unes des autres sur le long terme. Le système proposé par Facebook, lui, parvient à un résultat bien meilleur en se basant sur un réseau neuronal capable d’exploiter directement des fréquences brutes.
Envie de retrouver les meilleurs articles de Frandroid sur Google News ? Vous pouvez suivre Frandroid sur Google News en un clic.
La NSA valide cette IA ^^ Il faudra la puce 4g pour tout envoyer dans le cloud pour l'ia bien sur ^^
Voila une technologie qui me laisse espérer un bel avenir !! Je ne suis pas un papi mais je suis appareillé auditif ( malformation de l'oreille interne ) et je peux vous dire que suivre une conversation dans un bar est un véritable calvaire, si bien, que je n'ai jamais vraiment apprécié ces sorties qui, pourtant, se veulent conviviale!!
Bien dit ! Faut ouvrir les yeux !
Facedebouk.... utiliser par des Pathétiques narcisses en manque d'attention... Aïe aïe pauvre monde.....
Ce contenu est bloqué car vous n'avez pas accepté les cookies et autres traceurs. Ce contenu est fourni par Disqus.
Pour pouvoir le visualiser, vous devez accepter l'usage étant opéré par Disqus avec vos données qui pourront être utilisées pour les finalités suivantes : vous permettre de visualiser et de partager des contenus avec des médias sociaux, favoriser le développement et l'amélioration des produits d'Humanoid et de ses partenaires, vous afficher des publicités personnalisées par rapport à votre profil et activité, vous définir un profil publicitaire personnalisé, mesurer la performance des publicités et du contenu de ce site et mesurer l'audience de ce site (en savoir plus)
En cliquant sur « J’accepte tout », vous consentez aux finalités susmentionnées pour l’ensemble des cookies et autres traceurs déposés par Humanoid et ses partenaires.
Vous gardez la possibilité de retirer votre consentement à tout moment. Pour plus d’informations, nous vous invitons à prendre connaissance de notre Politique cookies.
Gérer mes choix