AI Factory

MLOps, les nouveaux indispensables de la data

par Xavier Bays, Head of Consulting & Associate chez Swiss-SDI

Avez-vous déjà rencontré un MLOps? Vous ne le savez peut-être pas encore mais vous avez déjà besoin de ses ­compétences. Arrêt sur image, pas de recul et vision d’avenir sur l’arrivée de ces futurs indispensables de la donnée, remplis de mystères.

Le rôle de Machine Learning Operations (MLOps) s’inspire de son cousin de l’IT, le DevOps. Derrière cette fonction se cache la faculté d’industrialiser et de rendre productifs des modèles de Machine Learning (ML). Le MLOps est le pont parfait entre le développement d’intelligences artificielles et la gestion des opérations. Si ce profil résonne comme logique et indispensable, sa popularité est encore naissante dans nos régions. Il n’existe d’ailleurs pas de formation académique permettant d’obtenir ce titre. Vous avez rencontré ou engagé un MLOps? Il y a de fortes chances à parier que cette personne se soit autoproclamée en tant que tel. Cela n’est pas forcément problématique. Nous avions fait de même en 2017 en nous autodéclarant Data Scientist, avant que les écoles polytechniques n’y proposent un master dédié. La difficulté est en revanche présente lorsqu’il s’agit de valider les compétences prétendues d’un candidat ou d’un fournisseur.

Des compétences difficiles à délimiter

Si les mathématiciens et les informaticiens s’attribuaient la casquette de data scientist il y a sept ans, quels profils le font aujourd’hui pour le MLOps? La question est d’autant plus complexe que le domaine du MLOps est mal délimité. Dans mon entreprise, nous avons pris le parti de former nos Data Engineers sur ce rôle.

Concrètement, sur le terrain, des entreprises nous approchent en nous demandant une liste improbable de compétences MLOps à maîtriser pour collaborer avec elles. Ce schéma et ce type de demande ne sont que l’écho de la recherche des fameux moutons à cinq pattes qui constituaient toutes les offres d’emploi pour les data scientists. Il est arrivé que nous n’avions que trois compétences sur les huit demandées par un prospect mais que le mandat nous soit tout de même attribué. Cela souligne la difficulté des entreprises, aussi grosses soient-elles, à trouver des collaborateurs ou des externes compétents sur tout le spectre de leurs attentes ainsi qu’à délimiter les technologies réellement utiles.

Le rôle du MLOps

Le MLOps a pour objectif principal de rendre les modèles de ML fiables et robustes aux aléas de la vie quotidienne. Pour cela, le MLOps construit et consolide des flux de données capables d’assumer des problèmes comme des données manquantes, des changements structurels dans les bases de données ou des modifications d’API. Il s’assure que la prédiction parte ou que le support s’active lorsque cela n’est définitivement pas possible.

Le MLOps est également garant de la reproductibilité des résultats. Cela implique d’être en mesure de retrouver les données et le modèle qui avait généré telle prédiction à l’époque. Cette tâche peut paraître simple, mais en pratique les données évoluent. Des lignes changent, disparaissent et des variables sont renommées. Les modèles sont également en constante évolution, c’est d’ailleurs là leur principale qualité.

Finalement, on attend du MLOps d’être capable de gérer l’orchestration des mises en production. Il met en place du CI/CD et établit les fonctions de test unitaires pour s’assurer que les mises à jour des modèles se passent dans les meilleures conditions.

Une arrivée indispensable

Afin de comprendre pourquoi les MLOps sont de plus en plus demandés actuellement, il est important de se replonger dans la progression de l’utilisation avancée des données. Il y a quelques années, les premiers data scientists ont été engagés. Ces personnes ont souvent eu en rôle de pionniers de la data dans leurs environnements en créant des liens entre le business et des solutions basées sur le ML. Problème : les data scientists n’ont pas les compétences informatiques nécessaires pour mettre leurs solutions en live. Concrètement, on se retrouve bloqué dans des PoC sans fin, dans une R&D qui n’aboutit pas. C’est là que le MLOps entre en scène. Le retour sur investissement de la data science peut enfin arriver.

Avec l’arrivée de l’IA générative, l’adoption des modèles d’IA par les entreprises est en plein essor. Cela va nécessiter toujours plus de compétences MLOps car la dépendance à ces modèles augmentera en parallèle. Souvenez-vous d’une panne internet en 2005. Un événement fâcheux tout au plus, et la vie continuait sans encombre. A contrario, beaucoup d’entreprises sont complètement paralysées aujourd’hui en cas de rupture avec la connexion internet. Je suis convaincu que la donnée va connaître la même évolution. Votre modèle de ML vous lâche aujourd’hui? Vous pouvez continuer vos activités sans problème. Votre modèle s’arrête soudainement en 2034? Vous ne pouvez plus travailler et vous appellerez vos MLOps en toute urgence.

L'auteur: Xavier Bays est Head of Consulting & Associate chez Swiss-SDI.

Xavier Bays, Head of Consulting & Associate chez Swiss-SDI. (Source: DR)

Tags
Webcode
7wDGFxs8