Communiquer de manière instantanée avec des interlocuteurs de n’importe quel pays sans connaître un mot de leur langue maternelle respective, serait-ce bientôt possible ? Lors de l’événement virtuel “Inside the lab, building for the metaverse with AI”, le PDG de Meta, Mark Zuckerberg, a annoncé travailler sur la création d’un traducteur vocal universel alimenté par l’Intelligence Artificielle. L’objectif : traduire en temps réel toutes les langues (dont le français, 5e place des langues les plus parlées dans le monde) pour mettre fin aux barrières linguistiques. On fait le point sur les outils de traduction vocale existants et sur les spécificités de ce nouveau projet ambitieux.
Traduction vocale : les solutions actuelles
Actuellement, il existe plusieurs possibilités pour réaliser une traduction vocale.
Par exemple, tout le monde connaît Google Translate. Basé sur l’IA, cet outil performant et gratuit de traduction automatique peut traduire un texte, mais également une saisie vocale, aussi bien depuis un ordinateur qu’un smartphone, et restituer la traduction à l’oral. D’autres applications de ce type sont disponibles comme iTranslate Voice ou Microsoft Translator. Vous connaissez surement Deepl, un outil de traduction en ligne gratuit très performant. L’agence Tradutec a d’ailleurs comparé Deepl et Google Translate.
L’autre solution consiste à utiliser un traducteur électronique. Il s’agit d’un traducteur portable spécialement dédié à la traduction vocale. Sur le marché des traducteurs électroniques, la fourchette de prix est très large, car leurs fonctionnalités et caractéristiques techniques diffèrent : traduction hors ligne ou non, avec ou sans écran tactile, type de batterie rechargeable via un câble USB, carte SIM intégrée ou non… Selon la marque (Vasco, Langogo…), le traducteur vocal instantané nécessite une connexion Internet (réseau Wifi ou emplacement pour une carte SIM selon le modèle). Si ce produit fonctionne hors ligne, les fonctionnalités sont réduites (moins de combinaisons linguistiques).
Ces outils de traduction automatique sont bien pratiques. Mais ils ont aussi leurs limites en termes de langues disponibles, de pertinence de reconnaissance vocale, de précision de traduction…
Meta et son traducteur vocal universel : décryptage du projet
Ces 5 dernières années, d’énormes progrès ont été réalisés en matière de traduction automatique (en anglais Machine Translation MT) grâce à l’IA. Les systèmes développés sont de plus en plus perfectionnés. Mais ils reposent jusqu’à présent sur un apprentissage réalisé via une grande quantité de données textuelles collectées sur Internet.
Donc, ils concernent un nombre restreint de langues, à savoir les langues qui dominent le web. Et ils excluent de fait les langues à faibles ressources et sous-présentées, c’est-à-dire avec des référentiels écrits insuffisants (voire inexistants) et sans aucun système d’écriture standardisé.
L’objectif de Meta avec ce nouveau projet de traduction basé sur l’Intelligence Artificielle
Selon Mark Zuckerberg, “la capacité de communiquer avec n’importe qui dans n’importe quelle langue, c’est une superpuissance dont les gens ont toujours rêvé”. L’IA serait en capacité de le leur offrir à court terme comme il l’a annoncé dans un communiqué en février 2022. En effet, ses équipes travaillent sur la création d’un super traducteur vocal universel capable de traduire une langue en temps réel, et ce pour tous les utilisateurs de tous les pays. Une technologie accessible à n’importe qui et de n’importe où.
L’objectif des recherches en Intelligence Artificielle menées par Meta est d’éliminer définitivement les barrières de la langue en permettant aux interlocuteurs du monde entier de communiquer instantanément et simultanément dans leur langue maternelle. Une véritable révolution !
Le supertraducteur de Meta : 2 composantes innovantes
Généralement bilingues, les outils de traduction actuels ne sont pas conçus pour traiter les milliers de langues utilisées dans le monde ni pour fournir une traduction simultanée.
Mais, ces dernières années, Meta a multiplié les avancées en développant plusieurs IA directement applicables à la traduction, notamment à son nouveau projet. Et ce, dans différents domaines : traitement du langage naturel, apprentissage multimodal, nouvelles techniques d’apprentissages autonomes…
Citons par exemple le premier modèle de traduction automatique multilingual “M2M-100” élaboré en 2020 : une innovation capable de traduire chaque paire de langues, sans intermédiaire (sans utiliser l’anglais comme référence).
La même année a vu le jour “ccMatrix”, le plus grand ensemble de données de bitextes web de haute qualité : il permet de créer de meilleurs modèles de traduction fonctionnant avec plus de langues, en particulier les langues à faibles ressources. Plus récemment (en 2021), Meta a développé “FLORES-101”, le plus grand ensemble de données d’évaluation de la traduction multilingue couvrant 101 langues. Les performances des systèmes de traduction peuvent être mesurées dans toutes les directions linguistiques.
Pour créer son traducteur vocal universel, Meta travaille sur 2 nouvelles intelligences artificielles :
- No Language Left Behind (“aucune langue laissée de côté”). Il s’agit d’un modèle d’IA avancé en capacité d’apprendre des langues malgré peu de données (d’exemples) pour s’entraîner. En clair, il pourra réaliser des traductions de qualité même dans des langues rares ou peu documentées.
- Universal Speech Translator. Il s’agit de concevoir une nouvelle approche pour traduire instantanément et directement les paroles d’une langue à l’autre, sans étape intermédiaire (à savoir sans avoir besoin de produire un texte comme c’est le cas actuellement). Il pourra ainsi prendre en charge toutes les langues, celles sans système d’écriture standard et celles à la fois écrites et parlées.
Les limites à surmonter pour créer un traducteur vocal universel
Pour réussir le pari de ce projet ambitieux, les équipes de Meta vont devoir relever plusieurs défis comme :
- Résoudre la problématique principale, à savoir le manque de données requises aux traducteurs automatiques pour être efficaces concernant toutes les langues, notamment celles disposant uniquement de ressources orales.
- Réduire le temps de latence, habituellement nécessaire au calcul d’une production de traduction automatique. Et ce, afin de permettre une véritable conversation. Un défi difficile à relever, alors que les professionnels en traduction simultanée eux-mêmes ont besoin de quelques secondes pour transposer une parole.
- Développer des moyens d’évaluer régulièrement la qualité des traductions vocales fournies par les systèmes de traduction automatique. Car, chaque langue est une matière vivante évoluant avec ses locuteurs.
En 2022, le traducteur vocal universel de Meta est encore en phase de développement. Il reste plusieurs problématiques à solutionner, qui représentent de véritables challenges technologiques. Mais, ce supertraducteur basé sur l’IA pourrait bien révolutionner à plus ou moins long terme l’univers de la traduction automatique.