Facebook lance un puissant outil de traduction instantanée, dans n’importe quelle langue

Bientôt votre publication dans plus de 100 langues sans rien faire

 
Facebook AI, le laboratoire de recherche du géant californien sur l’intelligence artificielle, a dévoilé son premier modèle multilingue. Un outil puissant qui va permettre de traduire rapidement n’importe quel contenu dans une centaine de langues. Et sans en altérer le sens !
Facebook

Chaque jour, Facebook réalise près de 20 milliards de traductions sur son fil d’actualité pour informer dans toutes les langues sur le Covid-19, relayer des informations fiables et éviter les contenus « préjudiciables ». Une prouesse permise grâce aux efforts consentis par le géant américain dans la recherche sur la traduction automatique à faibles ressources et aux progrès de la qualité des traductions.

Depuis plusieurs années, Facebook a ouvert son laboratoire de recherche sur l’intelligence artificielle baptisée Facebook AI et la traduction automatisée, fiable et rapide, est devenue un des pans d’activité les plus actifs. Il faut dire que, quotidiennement, les deux milliards d’utilisateurs du réseau social publient des contenus dans 160 langues différentes. Alors, Facebook avait besoin de se doter d’un outil capable de multiplier les traductions dans un maximum de langues.

Capable de traduire 100 langues en 100 langues

Voici donc M2M-100, une IA créée par le laboratoire de recherche après plusieurs années de recherche fondamentale en traduction automatique. C’est le « premier modèle de traduction automatique multilingue » (MMT – Multilingual Machine Translation en VO). Sa force : il peut traduire 100 langues… en 100 langues.

Cela signifie que l’IA de Facebook est capable de traduire du chinois au français sans avoir à passer par l’anglais en intermédiaire comme c’est souvent le cas avec les modèles multilingues. Pour trouver leur fonctionnement, ces IA ont tendance à apprendre d’abord à traduire du chinois vers l’anglais, puis de l’anglais vers le français pour élaborer leur résultat final. Pour préserver le sens de la formulation initiale, le modèle de Facebook AI s’entraîne, lui, directement du chinois au français.

« Les systèmes de MT typiques nécessitent la création de modèles d’IA séparés pour chaque langue et chaque tâche, mais cette approche ne s’adapte pas efficacement sur Facebook », explique-t-on chez Facebook AI. « Les systèmes multilingues avancés peuvent traiter plusieurs langues à la fois, mais compromettent la précision en s’appuyant sur les données anglaises pour combler le fossé entre les langues source et cible. Nous avons besoin d’un modèle MMT capable de traduire n’importe quelle langue dans n’importe quelle direction ».

7,5 milliards de phrases étudiées

Ainsi, le M2M-100 a été formé sur un total de 2 200 directions linguistiques, soit 10 fois plus que les meilleurs modèles multilingues centrés sur l’anglais. Au total, 7,5 milliards de phrases en 100 langues ont aidé à construire l’ensemble des données de l’IA pour être certain que le sens initial de la phrase ne souffre pas d’une altération culturelle en passant en anglais avant d’atterrir dans une troisième langue. Les chercheurs de Facebook ont, pour cela, combiné les ressources d’exploration de données complémentaires (notamment ccAligned , ccMatrix et LASER) et open source.

Et le modèle ainsi élaboré est mis à disposition du plus grand nombre en open source.

Mettre au point l’outil de traduction ultime pour tous

Mais si le M2M-100 est une prouesse technique du travail de l’IA, l’intérêt est avant tout que le plus grand nombre en profite. Pour cela, il va être déployé prochainement sur Facebook pour être utilisé par le réseau social et permettre ainsi encore plus d’interactions entre utilisateurs de tous les pays. Cela va surtout permettre à chacun de lire instantanément (automatiquement si l’option est activée dans les paramètres de votre compte pour basculer tous les messages dans votre langue) n’importe quelle publication postée dans une langue qui n’est pas la vôtre. Plus besoin d’aller faire un tour sur Google Traduction, Facebook le fera pour vous, sous vos yeux.

Cela répond surtout au but affiché par la recherche en IA depuis des années de créer un modèle universel unique, capable de comprendre toutes les langues, tous les dialectes dans différents types de tâches et d’activités. « Ce travail nous en rapproche », se félicite Facebook, ajoutant que cela permettra aussi de « servir plus de personnes, maintenir les traductions à jour et créer de nouvelles expériences pour des milliards de personnes. »

Si vous souhaitez connaître tous les détails d’élaboration du projet M2M-100, ses différentes étapes, Facebook AI s’est fendu d’un billet de blog très développé sur le sujet.


Envie de rejoindre une communauté de passionnés ? Notre Discord vous accueille, c’est un lieu d’entraide et de passion autour de la tech.

Les derniers articles