Les besoins en eau des IA comme ChatGPT sont énormes
Des chercheurs ont mis au point une méthodologie pour estimer l'empreinte hydrique des grands modèles algorithmiques qui fondent les IA génératives type ChatGPT. Pour former GPT-3, 700’000 litres d’eau aurait été nécessaires.
Pour chaque discussion, ChatGPT consomme un demi-litre d’eau. C’est l’estimation que des scientifiques ont réalisée à partir de la méthodologie qu’ils ont développée et qu’ils détaillent dans un récent papier de recherche. Cette bouteille d'eau correspond à un dialogue de 20 à 50 questions-réponses, précisent les chercheurs. Multiplier par les millions de requêtes envoyées tous les jours au célèbre chatbot, les besoins de ce dernier sont déjà énormes rien qu’en prenant en compte son utilisation. Le tableau s'assombrit encore davantage en se penchant sur les ressources nécessaires à l'entraînement de ce type de larges modèles de langage.
700’000 litres d'eau, soit 370 BMW
Actifs à l'université de Californie (Riverside) et à l’université du Texas (Arlington), les chercheurs ont appliqué leur méthodologie pour estimer la consommation d'eau nécessaire à la formation de GPT-3 d’OpenAI, le modèle à l'origine de ceux qui sont aujourd’hui au coeur de ChatGPT. Selon leurs calculs, cet entraînement aurait consommé 700’000 litres d'eau douce et propre, soit assez pour produire 370 BMW. Un chiffre qui s'applique à des datacenters ultramodernes aux Etats-Unis. La consommation triplerait dans des datacenters situés en Asie, selon les scientifiques.
Mais de quelle eau parle-t-on? Cette recherche prend en compte l'eau consommée dans les datacenters, essentiellement pour refroidir les serveurs. Mais aussi les ressources en eau nécessaires pour produire l'électricité qui alimente ces infrastructures (également pour les processus de refroidissement). Dans leurs calculs, les chercheurs se basent sur des indicateurs disponibles (Water Usage Effectiveness ou WUE). Ils précisent toutefois: le simple fait de multiplier la consommation d'énergie du modèle d'IA par la WUE ne permet pas d'obtenir une estimation précise de l'empreinte hydrique des modèles d'IA. Car l'empreinte hydrique d'un modèle d'IA dépend en partie de sa consommation d'énergie. Et cette dépendance varie dans le temps.
Avec ces travaux, les chercheurs souhaitent susciter une prise de conscience concernant l'importance de l'empreinte hydrique des modèles algorithmiques géants qui fondent les IA génératives. Ils soulignent en outre la nécessité d'améliorer la transparence en la matière, précisant qu'il conviendrait de traiter de manière holistique l'empreinte hydrique et l'empreinte carbone afin de rendre l'IA véritablement durable.