Des marketplaces pour commercialiser les contenus destinés à entraîner les IA
La start-up Trainspot vient de lancer une marketplace permettant aux créateurs de monétiser leurs contenus et aux développeur de modèles IA d’acquérir des données d’entraînement sans risque. L’entreprise Cloudflare prévoit également de lancer une telle marketplace.
Fin septembre, le spécialiste de la connectivité Cloudflare a lancé une série d’outils pour aider les sites web à contrôler la manière dont les modèles IA utilisent leur contenu à des fins d’entraînement. Le kit offre notamment un moyen aisé de bloquer les extracteurs de contenus (crawlers) exploités par les fournisseurs IA sur un site donné, ainsi qu’un outil d’audit pour visualiser leur activité, une fonctionnalité utile notamment aux sites web ayant conclu des accords avec les fournisseurs IA.
> Sur le sujet: Ces crawlers pillent les sites web pour former les chatbots IA
Le dashboard de suivi de l'activité des crawlers IA conçu par Cloudflare.
En parallèle, Cloudflare a annoncé son projet d’ajouter une marketplace à son kit. Au-delà du suivi de l’activité des crawlers IA, les détenteurs de sites web pourront fixer un prix pour l’entier ou une partie des contenus de leur site, et facturer les fournisseurs IA qui les utilisent. Cloudflare se chargeant de tout le processus.
Alors que de plus en plus de créateurs s’inquiètent de l’exploitation inopinée de leurs contenus, et que les fournisseurs IA sont assoiffés de contenus spécialisés, récents et, surtout, créés par des humains, l’idée d’une marketplace a de quoi intéresser. En particulier pour les «petits» sites web et éditeurs, qui ne peuvent pas négocier des deals avec les géants de l’IA.
> Sur le sujet: Les développeurs d’IA craignent de ne plus disposer de données humaines via le crowdsourcing
Trainspot: une première marketplace pionnière
Au stade de projet chez Cloudflare, le concept de marketplace est déjà opérationnel chez Trainspot. La start-up californienne a lancé fin octobre sa place de marché ouverte pour les données IA d’entraînement. La plateforme permet aux développeurs de rechercher et d’acquérir des contenus et datasets spécialisé directement après de leurs ayant-droits, et donc sans craindre de futurs procès. De l’autre côté, les créateurs de contenus - youtubeurs, photographes, rédacteurs et autres développeurs informatiques - peuvent monétiser leurs productions mieux protéger leurs droits d’auteur. Pour l’heure la plateforme ne propose qu’une dizaine de sources…
Ron Palmeri, CEO de Trainspot,explique que l’IA a besoin d’un meilleur modèle d’affaires que le vol massif de données: «L'ère du “move fast-and-break-things” de l'IA n'est plus qu'un mauvais souvenir. Nous établissons des droits de propriété sur les données d'apprentissage et créons un environnement propice au développement de l'économie de l'IA. Notre plateforme offre aux particuliers et aux entreprises un moyen de céder leurs données sous licence selon leurs conditions et aux développeurs d'IA de toutes tailles un outil puissant pour découvrir, agréger et acquérir sous licence les données dont ils ont besoin. Pour les deux parties, l'expérience est aussi simple que d'inscrire et d'acheter sur eBay».