Défaillances délibérées

Pourquoi les entreprises adoptent-elles l’ingénierie du chaos?

Pratique consistant à éprouver des environnements IT en créant des événements perturbateurs, l’ingénierie du chaos est aujourd’hui expérimentée par une majorité d'entreprises. Quels sont les bénéfices de ces tests et les obstacles à leur adoption?

(Source: Charl Folscher on Unsplash)
(Source: Charl Folscher on Unsplash)

Popularisée par Netflix et ses Chaos Monkeys, l’ingénierie du chaos (Chaos Engineering) s’impose toujours plus dans les entreprises. Alors que les outils de Netflix pour mettre délibérément hors service des instances AWS sont disponibles en open source, Amazon a sorti il y a peu Fault Injection Simulator, sa propre solution consistant à éprouver des environnements cloud de test ou de production en créant des événements perturbateurs.

Le Chaos Engineering est utilisé dans des entreprises de toutes tailles

Editeur d’une plateforme de Chaos Engineering, Gremlin a récemment publié une étude indiquant qu'aujourd’hui, près de deux tiers des entreprises ont expérimenté cette pratique au moins une fois. Se basant sur ses données et une enquête auprès de plus de 400 spécialistes IT, l’éditeur constate que l’ingénierie du chaos est moins utilisée dans les petites structures. Mais au-delà des 100 employés, son taux d’adoption ne dépend pas de la taille de l'entreprise.

Les équipes adeptes et les méthodes privilégiées

Tester la résilience des systèmes IT et des workloads est avant tout une procédure utilisée par les équipes responsables de l'ingénierie de la fiabilité des sites (SRE, Site Reliability Engineering), de même que par les développeurs et les équipes en charge des opérations. La pratique est en outre plus fréquente au sein d'environnements de test et de développement. Créer délibérément une défaillance de l'hôte s’avère beaucoup moins populaire que simuler des attaques ciblant le réseau et les ressources.

Les principaux bénéfices

L’augmentation de la disponibilité des applications ressort comme le principal bénéfice observé par les entreprises adeptes de l’ingénierie du chaos. Suit une diminution de la durée moyenne de résolution d’une perturbation. Les entreprises peuvent également profiter d’une meilleure compréhension des architectures. «L'exécution d'expériences de chaos permet d'identifier les couplages étroits ou les dépendances inconnues qui ont un impact négatif sur nos applications et suppriment souvent une grande partie des avantages de la création d'applications en microservices», ajoutent les auteurs de l’étude.

Les principaux obstacles

Le manque de sensibilisation et d'expérience s’imposent comme les principaux obstacles à l'adoption de l'ingénierie du chaos, avec le fait d'avoir d'autres priorités. Certaines entreprises se montrent frileuses face à cette approche car elles craignent de voir quelque chose mal tourner. «Il est vrai qu'en pratiquant l'ingénierie du chaos, nous injectons de l'échec dans les systèmes, mais en utilisant des méthodes modernes qui suivent des principes scientifiques, et en isolant méthodiquement les expériences à un seul service, nous pouvons être intentionnels sur la pratique et ne pas perturber les expériences des clients», rassurent les spécialistes de Gremlin.

Tags
Webcode
DPF8_228227