Llama et Mixtral ne peuvent plus prétendre être des modèles open source

News

Avec la publication de sa définition pour l'IA open source, l'Open Source Initiative (OSI) écarte des modèles qui ne garantissent pas une transparence suffisante, incluant Llama de Meta et Mixtral de Mistral.

(Source: Tim Mossholder sur Unsplash)

C'est désormais officiel: les modèles Llama de Meta et Mixtral de Mistral ne peuvent plus prétendre à l’appellation «open source». Ces grands modèles de langage, bien que présentés sous cette étiquette par leurs concepteurs, ne remplissent pas les conditions désormais établies formellement par l'Open Source Initiative (OSI) avec la publication de la première version de l'Open Source AI Definition (OSAID).

Cette première version stable de l'Open Source AI Definition est le fruit d’un an de collaboration avec des experts et parties prenantes. L'OSI stipule désormais que pour qu'un modèle soit considéré comme open source, il doit fournir suffisamment d'informations sur ses données d'entraînement pour permettre à une personne qualifiée de recréer un système similaire avec des données comparables. Cette exigence va au-delà du niveau de transparence souvent offert par les modèles qui se déclarent open source mais qui restent pour la plupart sous licence propriétaire. En outre, l'étiquette «open source» ne peut s’appliquer qu’à des LLM dont il est possible d'examiner et d'analyser le fonctionnement, de les modifier pour en adapter les résultats selon les besoins, et enfin de les partager, modifié ou non, pour tout usage.

Dans une FAQ, l'OSI dresse la liste des modèles qui répondent aux nouveaux critères de l'open source : Pythia (Eleuther AI), OLMo (AI2), Amber et CrystalCoder (LLM360), et T5 (Google). D'autres modèles, tels que BLOOM de BigScience et Starcoder2 de BigCode, pourraient satisfaire aux critères après ajustement de leur licence. En revanche, Llama (Meta), Grok (X), Phi-2 (Microsoft) et Mixtral (Mistral) ne satisfont pas aux exigences actuelles, en raison d'un manque de transparence ou d'incompatibilités juridiques.

Un duo de chercheurs avaient déjà récemment pointé du doigt le manque d'ouverture de certains LLM prétendument open source, allant jusqu’à évoquer une «pratique d’open-washing».

Llama et Mixtral ne peuvent plus prétendre être des modèles open source

PLUS DE NEWS

Zurich craint que l’intégrité numérique des citoyens n’empiète sur les libertés de son administration

Jo Debecker dirigera Akkodis, filiale technologique d’Adecco

Datadog étend ses capacités au monitoring des données

Events

Bechtle IT Forum #BITF25

Dossiers

AI shopper

GenAI & cybersécurité

Robotique

Numéro Actuel

Déléguer les achats aux agents IA

Llama et Mixtral ne peuvent plus prétendre être des modèles open source

Les LLM dits ouverts sont de l’open-washing selon des chercheurs

Meta prône l’IA open source mais ses LLM ne sont pas tout à fait ouverts

GenAI: la personnalisation stimule le recours aux modèles open source

L’EPFZ et LatticeFlow dévoilent un framework pour évaluer la conformité des LLM avec la règlementation européenne

PLUS DE NEWS

Zurich craint que l’intégrité numérique des citoyens n’empiète sur les libertés de son administration

Jo Debecker dirigera Akkodis, filiale technologique d’Adecco

Datadog étend ses capacités au monitoring des données

Events

Bechtle IT Forum #BITF25

Dossiers

AI shopper

GenAI & cybersécurité

Robotique

Numéro Actuel

Déléguer les achats aux agents IA