Apprentissage automatique

Le réseau neuronal de Google apprend tout seul à traduire du japonais au coréen

Google a récemment introduit un système de réseau neuronal pour booster les capacités de son outil de traduction. Le système est parvenu à traduire de lui-même une paire de langue jamais explicitement apprise.

Le réseau neuronal pour Google Translate fait circuler les connaissances d'une paire de langues aux autres. (Source: Google)
Le réseau neuronal pour Google Translate fait circuler les connaissances d'une paire de langues aux autres. (Source: Google)

En septembre dernier, Google annonçait une mise à jour de son outil de traduction. Pour 10 paires de langues, celui-ci se base désormais sur un système de réseau neuronal, une approche d'apprentissage automatique de deep learning. Avec ce système, la traduction automatique devient plus efficace en puisant dans des millions d’exemples de phrases traduites, expliquent les chercheurs de Google.

Zero-shot translation

Mais faire passer les 103 langues supportées par Google Translate à cette technologie de deep learning représente un immense défi, confient les chercheurs de Google. Pour le relever, ils ont testé une architecture de traitement qu’ils ont baptisé «zero-shot translation». Cette méthode a permis de réaliser directement des traductions entre des paires de langues jamais vues explicitement par le système.

Apprentissage automatique d’une «interlingua»

Comment cet apprentissage automatique s'est-il opéré? Au préalable, les chercheurs ont explicitement appris au système à traduire deux paires de langues: de l’anglais au japonais (et vice versa); de l’anglais au coréen (et vice versa). Le réseau neuronal fait circuler les connaissances d'une paire de langues aux autres, expliquent les spécialistes. Ils ont ensuite eu l’idée de tester si ce partage pouvait servir à réaliser des traductions entre le japonais et le coréen alors même que le système n’avait pas spécifiquement appris à traduire directement cette paire de langues. La réponse est affirmative, à la grande satisfaction des chercheurs, qui imaginent que le réseau neuronal est parvenu de lui-même à générer une «interlingua». Soit un système de représentations communes de phrases de même signification, et ce, indépendamment de la langue.

Webcode
DPF8_17231