Un outil de génération de texte jugé trop dangereux pour être publié
Mise au point par les chercheurs d’OpenAI, l’intelligence artificielle GPT-2 a le potentiel de générer des textes de façon si performante qu’elle n’a pas été rendue public, les dérives possibles étant nombreuses.
Trop risqué... Les chercheurs d’OpenAI ont décidé de ne pas rendre public les travaux du développement de GPT-2, un robot rédacteur particulièrement performant. Le système dopé au machine learning pourrait s’avérer dangereux en tombant entre les mains de personnes malveillantes, estiment les chercheurs. Organisation à but non lucratif co-fondée par Elon Musk, OpenAI a tout de même publié un résumé de ses travaux et dévoilé un exemple de texte produit par leur intelligence artificielle (IA).
Formé à l’aide de 8 millions de pages web
GPT-2 se présente comme un transformateur de contenu, formé à l’aide de 8 millions de pages web. Pour assurer une qualité suffisante, les pages sélectionnées devaient avoir bénéficié d’une curation par des internautes. Le but des chercheurs consistait à créer un système capable de prédire le mot suivant compte tenu de tous les mots précédents d’un texte. Au final, le robot est en mesure de générer des articles cohérents dans leur forme, en se basant simplement sur un court texte d’amorçage auquel il donne une suite logique. GPT-2 est en outre doué dans les tâches de compréhension de texte et parvient à répondre aisément à des questions concernant les extraits qu’on lui soumet.
Enorme marge de progression
Les chercheurs admettent cependant que leur IA présente des faiblesses. Elle a ainsi tendance à générer du contenu répétitif ou à produire des incohérence flagrantes, en écrivant par exemple que des des incendies surviennent sous l’eau…. Toutefois, OpenAI estime que le modèle a une énorme marge de progression et pourrait vite trouver des applications dans le domaine de la rédaction assistée par IA ou dans le développement d’agents conversationnels plus performants et de programmes de traduction non supervisée. Parmi les dérives qui motivent la non publication des travaux de recherche, OpenAI évoque par exemple la rédaction d’articles trompeurs, la possibilité de se faire passer pour quelqu'un d'autre en ligne (GPT-2 reproduisant aussi le style pour les réseaux sociaux ou encore l’automatisation de la production de contenu spam utilis dans des tentatives de phishing.
Des licornes découvertes dans les Andes
L’un des exemples de textes signés GPT-2, plutôt cocasse, est un article de style journalistique relatant la découverte de licornes dans les Andes. Ci-dessous, nous publions le texte d’amorçage et l’article farfelu qui en découle, traduit de l'anglais à l'aide de l’outil de traduction DeepL, qui exploite également des capacités d’intelligence artificielle.
Amorce du système (écrit par un humain):
Dans le cadre d'une découverte stupéfiante, un scientifique a trouvé un troupeau de licornes vivant dans une vallée isolée, auparavant inexplorée, dans la cordillère des Andes. Le plus surprenant pour les chercheurs résidait dans le fait que les licornes parlaient un anglais parfait.
Complétion du modèle (écrit par la machine, 10 essais):
Le scientifique a donné à la population, d'après leur corne particulière, licorne d'Ovide. Ces licornes à quatre cornes, blanches argentées, étaient auparavant inconnues de la science.
Aujourd'hui, après presque deux siècles, le mystère de ce qui a déclenché ce phénomène étrange est enfin résolu.
Jorge Pérez, biologiste évolutionniste de l'Université de La Paz, et plusieurs de ses compagnons, exploraient la cordillère des Andes lorsqu'ils ont trouvé une petite vallée, sans aucun autre animal ou humain. Pérez remarqua que la vallée avait ce qui semblait être une fontaine naturelle, entourée de deux sommets de roche et de neige argentée.
Pérez et les autres se sont alors aventurés plus loin dans la vallée. «Lorsque nous avons atteint le sommet d'un pic, l'eau avait l'air bleue, avec quelques cristaux sur le dessus», dit Pérez.
Pérez et ses amis furent étonnés de voir le troupeau de licornes. On pouvait voir ces créatures des airs sans avoir à trop bouger pour les voir - elles étaient si près qu'ils pouvaient toucher leurs cornes.
En examinant ces étranges créatures, les scientifiques ont découvert qu'elles parlaient aussi un anglais assez courant. Pérez a déclaré: «Nous pouvons voir, par exemple, qu'elles ont un langage commun, quelque chose comme un dialecte ou une dialectique.»
Le Dr Pérez croit que les licornes pourraient provenir d'Argentine, où l'on croyait que les animaux descendaient d'une race perdue qui vivait là avant l'arrivée des humains dans ces régions de l'Amérique du Sud.
Bien que leurs origines ne soient pas encore claires, certains croient que les créatures ont peut-être été créées lorsqu'un humain et une licorne se sont rencontrés à une époque antérieure à la civilisation humaine. Selon Pérez, «En Amérique du Sud, de tels incidents semblent assez fréquents.»
Cependant, Pérez a également souligné qu'il est probable que la seule façon de savoir avec certitude si les licornes sont effectivement les descendants d'une race extraterrestre perdue passe par l'ADN. «Mais elles semblent être capables de communiquer en anglais assez bien, ce qui, je crois, est un signe d'évolution, ou du moins un changement dans l'organisation sociale», a déclaré le scientifique.