IA et copyright

Plainte collective contre GitHub Copilot: la question brûlante du copyright dans les IA génératives

Aux Etats-Unis, la polémique autour du copyright concernant l’assistant au codage GitHub Copilot a abouti à une action collective en justice contre OpenAI, Microsoft et GitHub. La question brûlante du droit d'auteur dans les IA génératives concerne tous les modes d’expression.

(Source: Markus Winkler on Unsplash)
(Source: Markus Winkler on Unsplash)

A l’heure où les IA génératives se démocratisent et deviennent toujours plus accessibles, ces systèmes soulèvent de nombreuses questions relatives aux droits d'auteur. Car pour former ces modèles de machine learning, leurs concepteurs utilisent du contenu pouvant être protégé. On se souvient que dès son lancement, l’assistant au codage GitHub Copilot a fait polémique notamment à propos de ces enjeux.

La fronde contre Copilot s'est aujourd'hui organisée et un recours collectif a été déposé aux Etats-Unis contre OpenAI, Microsoft et GitHub, au motif que leur plateforme de génération de code basée sur l’IA viole les lois sur le droit d'auteur. Sur un site dédié à cette action en justice, l'avocat et entrepreneur Matthew Butterick déclare que l'objectif consiste à remettre en cause la légalité de GitHub Copilot. «C'est la première étape de ce qui sera un long voyage. Pour autant que nous le sachions, il s'agit de la première action collective aux États-Unis contestant la formation et les résultats des systèmes d'IA. Ce ne sera pas la dernière. Les systèmes d'IA n'échappent pas à la loi. Ceux qui créent et exploitent ces systèmes doivent rester responsables», souligne Matthew Butterick.

Ces enjeux liés au copyright ne concernent pas que la programmation, cela va sans dire, mais les contenus de tous types générée par des algorithmes entraînés à l’aide de créations et d'œuvres protégées. Dans le domaine des contenus graphiques, par exemple, les banques d’images Shutterstock et Getty se sont récemment positionnées. La première a ainsi pactisé avec OpenAI pour étendre sa coopération avec les concepteurs du générateur «text-to-image» DALL∙E. Une initiative qui se complète de la création d’un fonds servant à payer les utilisateurs pour leurs contributions aux bases de données de l'IA.

Une IA musicienne entraînée sur des morceaux libres de droits

La musique aussi constitue un mode d’expression artistique exploitable par des IA génératives. Des expérimentations dans ce domaine ont déjà émergé voici plusieurs années, rappelle un article du site spécialisé Techcrunch, qui mentionne aussi plusieurs outils IA permettant de créer de la musique. Par exemple AudioLM de Google ou Jukebox, signé OpenAI. En outre, l’équipe derrière Stability AI, solution IA de copywriting, travaille sur un modèle de génération de contenu musical, Dance Diffusion. Pour répondre à la problématique du droit d'auteur, ses concepteurs affirment entraîner leur modèle en se servant uniquement de musique libre de droits. «Tous les modèles qui sont officiellement publiés dans le cadre de Dance Diffusion sont formés sur des données du domaine public, des données sous licence Creative Commons et des données fournies par des artistes de la communauté», explique à Techcrunch Zach Evans de Stability AI.

Tags
Webcode
DPF8_273842