Chaque jour, Facebook réalise près de 20 milliards de traductions sur son fil d’actualité pour informer dans toutes les langues sur le Covid-19, relayer des informations fiables et éviter les contenus « préjudiciables ». Une prouesse permise grâce aux efforts consentis par le géant américain dans la recherche sur la traduction automatique à faibles ressources et aux progrès de la qualité des traductions.
Depuis plusieurs années, Facebook a ouvert son laboratoire de recherche sur l’intelligence artificielle baptisée Facebook AI et la traduction automatisée, fiable et rapide, est devenue un des pans d’activité les plus actifs. Il faut dire que, quotidiennement, les deux milliards d’utilisateurs du réseau social publient des contenus dans 160 langues différentes. Alors, Facebook avait besoin de se doter d’un outil capable de multiplier les traductions dans un maximum de langues.
Capable de traduire 100 langues en 100 langues
Voici donc M2M-100, une IA créée par le laboratoire de recherche après plusieurs années de recherche fondamentale en traduction automatique. C’est le « premier modèle de traduction automatique multilingue » (MMT – Multilingual Machine Translation en VO). Sa force : il peut traduire 100 langues… en 100 langues.
Cela signifie que l’IA de Facebook est capable de traduire du chinois au français sans avoir à passer par l’anglais en intermédiaire comme c’est souvent le cas avec les modèles multilingues. Pour trouver leur fonctionnement, ces IA ont tendance à apprendre d’abord à traduire du chinois vers l’anglais, puis de l’anglais vers le français pour élaborer leur résultat final. Pour préserver le sens de la formulation initiale, le modèle de Facebook AI s’entraîne, lui, directement du chinois au français.
« Les systèmes de MT typiques nécessitent la création de modèles d’IA séparés pour chaque langue et chaque tâche, mais cette approche ne s’adapte pas efficacement sur Facebook », explique-t-on chez Facebook AI. « Les systèmes multilingues avancés peuvent traiter plusieurs langues à la fois, mais compromettent la précision en s’appuyant sur les données anglaises pour combler le fossé entre les langues source et cible. Nous avons besoin d’un modèle MMT capable de traduire n’importe quelle langue dans n’importe quelle direction ».
7,5 milliards de phrases étudiées
Ainsi, le M2M-100 a été formé sur un total de 2 200 directions linguistiques, soit 10 fois plus que les meilleurs modèles multilingues centrés sur l’anglais. Au total, 7,5 milliards de phrases en 100 langues ont aidé à construire l’ensemble des données de l’IA pour être certain que le sens initial de la phrase ne souffre pas d’une altération culturelle en passant en anglais avant d’atterrir dans une troisième langue. Les chercheurs de Facebook ont, pour cela, combiné les ressources d’exploration de données complémentaires (notamment ccAligned , ccMatrix et LASER) et open source.
Et le modèle ainsi élaboré est mis à disposition du plus grand nombre en open source.
Mettre au point l’outil de traduction ultime pour tous
Mais si le M2M-100 est une prouesse technique du travail de l’IA, l’intérêt est avant tout que le plus grand nombre en profite. Pour cela, il va être déployé prochainement sur Facebook pour être utilisé par le réseau social et permettre ainsi encore plus d’interactions entre utilisateurs de tous les pays. Cela va surtout permettre à chacun de lire instantanément (automatiquement si l’option est activée dans les paramètres de votre compte pour basculer tous les messages dans votre langue) n’importe quelle publication postée dans une langue qui n’est pas la vôtre. Plus besoin d’aller faire un tour sur Google Traduction, Facebook le fera pour vous, sous vos yeux.
Cela répond surtout au but affiché par la recherche en IA depuis des années de créer un modèle universel unique, capable de comprendre toutes les langues, tous les dialectes dans différents types de tâches et d’activités. « Ce travail nous en rapproche », se félicite Facebook, ajoutant que cela permettra aussi de « servir plus de personnes, maintenir les traductions à jour et créer de nouvelles expériences pour des milliards de personnes. »
Si vous souhaitez connaître tous les détails d’élaboration du projet M2M-100, ses différentes étapes, Facebook AI s’est fendu d’un billet de blog très développé sur le sujet.
Envie de rejoindre une communauté de passionnés ? Notre Discord vous accueille, c’est un lieu d’entraide et de passion autour de la tech.
et ? je demandais juste si la trad est meilleur ou pas. pas le nombre de langues ou le prix... tu lis les messages avant d'y répondre ?!
Deepl c'est biaisé car le nombre de caractères est limité afin de rediriger vers la version pro donc payante !
donc bon quoi? faut prendre un truc qui traduit moins bien anglais->francais sous prétexte qu'il sait traduire plus de langues ?!
Même si Deepl est plus précis que Google Translate, il ne propose qu'une 10ene de langues. Donc bon.
ca vaut quoi par rapport a https://www.deepl.com/translator ?
Ce contenu est bloqué car vous n'avez pas accepté les cookies et autres traceurs. Ce contenu est fourni par Disqus.
Pour pouvoir le visualiser, vous devez accepter l'usage étant opéré par Disqus avec vos données qui pourront être utilisées pour les finalités suivantes : vous permettre de visualiser et de partager des contenus avec des médias sociaux, favoriser le développement et l'amélioration des produits d'Humanoid et de ses partenaires, vous afficher des publicités personnalisées par rapport à votre profil et activité, vous définir un profil publicitaire personnalisé, mesurer la performance des publicités et du contenu de ce site et mesurer l'audience de ce site (en savoir plus)
En cliquant sur « J’accepte tout », vous consentez aux finalités susmentionnées pour l’ensemble des cookies et autres traceurs déposés par Humanoid et ses partenaires.
Vous gardez la possibilité de retirer votre consentement à tout moment. Pour plus d’informations, nous vous invitons à prendre connaissance de notre Politique cookies.
Gérer mes choix