Llama

Meta prône l’IA open source mais ses LLM ne sont pas tout à fait ouverts

En parallèle à la publication de nouvelles versions du LLM Llama de Meta, Mark Zuckerberg a défendu les avantages de l'IA open source. Mais selon des chercheurs, Llama n’est que partiellement ouvert.

(Source: Oli Bekh sur Unsplash)
(Source: Oli Bekh sur Unsplash)

Meta a récemment publié Llama 3.1, présenté comme un LLM open source et l’un des modèles de fondation les plus avancés du marché. Dans une lettre ouverte, le CEO Mark Zuckerberg plaide en faveur du développement de l'IA en open source. Contrairement à des entreprises comme OpenAI, Microsoft et Google, le patron de Meta est convaincu que l'IA en libre accès assure une meilleure surveillance et un déploiement plus sûr. Selon lui, les modèles d'IA à code source ouvert prendront le pas sur les modèles propriétaires, au même titre que Linux est devenu le système d'exploitation à code source ouvert qui équipe aujourd'hui la plupart des serveurs. «Je pense que la version 3.1 de Llama sera un point d'inflexion dans l'industrie qui verra la plupart des développeurs commencer à utiliser principalement l'open source, et je m'attends à ce que cette approche ne fasse que croître à partir de maintenant», déclare Mark Zuckerberg dans sa lettre.   

Selon le CEO de Meta, en rendant les modèles d'IA open source, un groupe plus large et plus diversifié de développeurs peut contribuer à leur développement, ce qui pourrait conduire à des systèmes plus robustes et plus sûrs. Il souligne l'importance pour les organisations de pouvoir former et affiner leurs propres modèles pour répondre à leurs besoins spécifiques. Avoir accès à des modèles ouverts permet en outre aux entreprises de ne pas dépendre de fournisseurs et de protéger leurs données sensibles. Mark Zuckerberg souligne également la rentabilité de l'exploitation de modèles open source par rapport aux modèles fermés.  

Pourquoi les LLM de Meta ne sont en réalité que partiellement ouverts 

Présenter les modèles Llama comme open source est toutefois sujet à débat. La FAQ de Meta concernant ses LLM précise qu’ils sont publiés sous la Llama Community License, ajoutant: «Les modèles Llama font l'objet d'une licence commerciale sur mesure qui établit un équilibre entre le libre accès aux modèles et la responsabilité et les protections mises en place pour faire face à d'éventuelles utilisations abusives». Dans un récent article scientifique, les chercheurs Mark Dingemanse et  Andreas Liesenfeld ont d’ailleurs pointé du doigt ce qu’ils décrivent comme un «open-washing» de la part de certains développeurs de LLM. Ils ont évalué le degré d'ouverture réelle de la plupart des LLM disponibles à l'époque de leur recherche, selon de nombreux critères. 

Concernant Llama 2, les chercheurs font remarquer qu’il s'agit d’un modèle pouvant être qualifié de partiellement ouvert. Comme déjà mentionné, Llama 2 est distribué sous la licence communautaire de Meta, mais le code source reste inaccessible. Seuls des scripts permettant de faire fonctionner le modèle sont proposés. Aucune documentation détaillée n'est fournie. Meta a publié les poids de son LLM, mais pour y accéder, il faut remplir un formulaire de consentement. En outre, l'API n'est accessible qu'après avoir suivi une procédure d'inscription peu respectueuse de la vie privée, toujours selon les chercheurs. 

La Maison Blanche en faveur des LLM à poids ouverts

Dans un communiqué récent, la Maison Blanche a reconnu l'importance du développement de l’IA selon une approche open source. L'Administration nationale des télécommunications et de l'information (NTIA) a publié un rapport dans lequel elle préconise en particulier une approche «à poids ouverts». La NTIA recommande au gouvernement US de surveiller les risques potentiels, mais d'éviter de restreindre l'accès aux poids des modèles ouverts pour les systèmes existants.
 

Tags
Webcode
y2kRkjSg