LLM

Llama et Mixtral ne peuvent plus prétendre être des modèles open source

Avec la publication de sa définition pour l'IA open source, l'Open Source Initiative (OSI) écarte des modèles qui ne garantissent pas une transparence suffisante, incluant Llama de Meta et Mixtral de Mistral.

(Source: Tim Mossholder sur Unsplash)
(Source: Tim Mossholder sur Unsplash)

C'est désormais officiel: les modèles Llama de Meta et Mixtral de Mistral ne peuvent plus prétendre à l’appellation «open source». Ces grands modèles de langage, bien que présentés sous cette étiquette par leurs concepteurs, ne remplissent pas les conditions désormais établies formellement par l'Open Source Initiative (OSI) avec la publication de la première version de l'Open Source AI Definition (OSAID). 

Cette première version stable de l'Open Source AI Definition est le fruit d’un an de collaboration avec des experts et parties prenantes. L'OSI stipule désormais que pour qu'un modèle soit considéré comme open source, il doit fournir suffisamment d'informations sur ses données d'entraînement pour permettre à une personne qualifiée de recréer un système similaire avec des données comparables. Cette exigence va au-delà du niveau de transparence souvent offert par les modèles qui se déclarent open source mais qui restent pour la plupart sous licence propriétaire. En outre, l'étiquette «open source» ne peut s’appliquer qu’à des LLM dont il est possible d'examiner et d'analyser le fonctionnement, de les modifier pour en adapter les résultats selon les besoins, et enfin de les partager, modifié ou non, pour tout usage. 

Dans une FAQ, l'OSI dresse la liste des modèles qui répondent aux nouveaux critères de l'open source : Pythia (Eleuther AI), OLMo (AI2), Amber et CrystalCoder (LLM360), et T5 (Google). D'autres modèles, tels que BLOOM de BigScience et Starcoder2 de BigCode, pourraient satisfaire aux critères après ajustement de leur licence. En revanche, Llama (Meta), Grok (X), Phi-2 (Microsoft) et Mixtral (Mistral) ne satisfont pas aux exigences actuelles, en raison d'un manque de transparence ou d'incompatibilités juridiques.

Un duo de chercheurs avaient déjà récemment pointé du doigt le manque d'ouverture de certains LLM prétendument open source, allant jusqu’à évoquer une «pratique d’open-washing»
 

Webcode
HNKaw6mv