Entreprise data-driven

Quelle est l'utilité des données et des algorithmes lorsque tout est chamboulé?

Les données historiques et les algorithmes qu’elles ont servi à entraîner sont mis au défi lorsque tout est chamboulé, de la chaîne logistique au comportement des clients et employés. Passées les adaptations ad hoc, des pistes existent pour rendre les systèmes intelligents plus robustes et agiles face à l’imprévu. A cela s’ajoute que les données collectées durant la pandémie pourraient servir dans le futur.

Photo: Mick Haupt / Unsplash
Photo: Mick Haupt / Unsplash

Bien des commerces suisses ont vu leur activité bouleversée par le confinement. Fin avril, le propriétaire d’un snack bar bernois confiait à Swissinfo: «Depuis le début du confinement, c’est très calme. À côté des kebabs, je propose aussi d’autres spécialités turques. Concernant la quantité de nourriture, je dois improviser chaque jour. Je ne peux plus me fier à mon expérience pour estimer le nombre de clients que je dois attendre. Le soir, il y a souvent des restes, que je dois malheureusement jeter».

La situation du restaurateur n’aurait pas été bien différente s’il avait disposé d’un logiciel puisant dans le machine learning pour prédire l’affluence de son restaurant et les provisions à acheter. Entraînés avec des données historiques, de nombreux algorithmes sont pris au dépourvu lorsque survient un événement imprévisible de grande ampleur tel que le COVID-19.

Quand le présent n’a plus rien à voir avec le passé

«La plupart de nos clients appliquent des algorithmes dans leurs systèmes industriels, qui sont par nature peu affectés par des événements tels qu’une pandémie. Il en va autrement des algorithmes employés pour prédire la demande ou les stocks nécessaires. Là, les modèles basés sur une situation normale peuvent devenir soudainement inefficaces», avertit Marcin Pietrzyk, CEO de la jeune société suisse Unit 8.

Avec la pandémie et les mesures sanitaires décidées par les gouvernements du monde entier, les comportements d’achat des consommateurs ont été chamboulés. Outre la ruée des premières semaines sur des produits inhabituels, les clients ont aussi changé leur façon d’acheter. Spécialisée dans l’optimisation de la présence des e-boutiques sur Amazon, la start-up londonienne Nozzle a notamment constaté un changement des critères d’achat en ligne. Davantage que le prix, le délai de livraison est soudainement devenu un facteur décisif, rendant inopérant des systèmes proposant automatiquement toujours le meilleur prix. «Les tactiques devront être adaptées à ce nouveau monde. Lorsque les données des tendances historiques sont inutiles, l’analyse de la situation devient encore plus importante», explique Victor Malachard, président exécutif, sur le blog de Noozle.

Elle aussi touchée, la start-up Phrasee qui propose des algorithmes générant des textes publicitaires, a dû introduire des contrôles dans ses outils de manière à écarter des expressions en vogue comme «effet viral» et quantité d’autres termes anxiogènes susceptibles d’être contre-productifs pour les marques.

L’explosion soudaine des paiements mobiles a sans doute aussi challengé des algorithmes de détection des fraudes, sans oublier les systèmes anti-spam et anti-malware eux aussi entraînés avec des données historiques.

Adaptations «manuelles» et leçons à long terme

Face à ces problèmes, plusieurs remèdes: d’abord s’appuyer pour un temps sur les experts humains, comme l’explique Carlos Cordon, Professeur à l’IMD, à propos de la supply chain: «Des changements de volume importants et inattendus rendent les modèles statistiques inutiles. Ils considèrent des événements tels que la pandémie comme des "valeurs aberrantes" et, par conséquent, les écartent des données. Bien que nous ayons besoin de visibilité pour que les personnes de la chaîne d'approvisionnement puissent prendre des décisions, la plupart des décisions devraient être prises manuellement. Par conséquent, le facteur humain est essentiel».

Pour remédier aux déficiences des systèmes entraînés, de nombreuses techniques sont également possibles. Au début de la crise, McKinsey recommandait ainsi que les équipes d’analystes soient «préparées à mettre en œuvre les corrections nécessaires, qui peuvent comprendre le débogage des modèles, l’application de nouvelles techniques de modélisation et l'incorporation de nouvelles sources de données».

Certains suggèrent ainsi de réentraîner rapidement les algorithmes avec des données plus récentes. «Nous voyons maintenant davantage de travaux et projets qui sont déclenchés par la pandémie, en particulier dans le secteur des assurances où les entreprises essaient d'inclure des données relatives au Covid dans leur modélisation des risques», constate Marcin Pietrzyk de Unit 8.

Professeur de machine learning à l’University College de Londres, David Barber propose d’améliorer et d’accélérer l’apprentissage sur les nouvelles données en laissant les machines se charger de la tâche laborieuse de leur étiquetage (apprentissage actif). «Si vous développez l'IA en utilisant l'approche traditionnelle qui consiste à collecter de grandes quantités de données et à entraîner ensuite un modèle de deep learning, il n'y a pas de miracle, confiait-il au site ZDNet. Avec le modèle traditionnel, vous pouvez vous estimer chanceux si un nouveau modèle est mis en production en moins de quelques mois. Mais avec l'apprentissage actif, cela peut ne prendre que quelques jours tout au plus».

Senior Data Scientist chez Crayon, une société spécialisée dans l’IA, David Mosen, appelle les organisations à développer la capacité de leurs algorithmes à gérer ces situations d’exception. «Si vous pensez que l'apprentissage machine est déconnecté de circonstances telles que la pandémie de Covid, détrompez-vous. Aussi abstrait que soit le concept, l'apprentissage machine est directement lié et influencé par le monde réel, avertit-il sur le blog de Crayon. C'est particulièrement vrai pour les entreprises qui ont des modèles de machine learning en production pour développer des connaissances pour la prévision des ventes, l'optimisation des stocks ou le comportement des clients. Les entreprises, en particulier celles qui sont data-driven et utilisent des solutions de machine learning, doivent être préparées au changement.»

David Mosen propose ainsi plusieurs pistes pour gérer les modèles et améliorer leur capacité face à l’imprévu, comme d’augmenter la fréquence d’entraînement des algorithmes ou de tenir compte d’historiques plus courts et spécifiques ou encore de fonder les prévisions sur des situations analogues concertées avec des experts.

La valeur des données d’exception

Lorsqu’une crise survient, l’idée de s’appuyer sur des données recueillies durant des situations analogues est frappée de bon sens. Taiwan et la Corée du Sud ont sans doute profité de leur expérience et des données collectées lors des épisodes SARS et H1N1, au moment où il a fallu répondre à COVID-19. Encore faut-il disposer et avoir conservé de telles data… «Certaines personnes s'empressent de rejeter les "vieilles" données comme étant "obsolètes", et jugent que la valeur des données s'érode au fil du temps. Cependant, les données historiques peuvent être tout aussi précieuses que les données actuelles pour tenter de déterminer l'impact commercial et opérationnel potentiel de situations ou d'événements actuels», explique Bill Schmarzo, Chief Innovation Officer chez Hitachi Vantara. Les données collectées lors d’événements rares sont ainsi d’une grande valeur, qu’il s’agisse de manifestations régulières (trafic lors des Jeux Olympiques, ventes de Noël), de situations déclenchées (arrivée d’un nouveau concurrent sur le marché) ou d’événements totalement imprévisibles, comme la pandémie actuelle. «En matière de données, ce qui n’est est que du bruit dans un cas, peut s’avérer un signal dans un autre cas», conclut Schmarzo.

Au-delà de leur utilité pour faire face à des situations similaires, les données d’exception peuvent aussi servir de référence et d’horizon. A Genève, l’Hepia a ainsi profité du trafic réduit durant le confinement pour établir des valeurs de référence en matière de niveau sonore qui serviront de référence pour l’élaboration de futures politiques liées au bruit. De quoi méditer avant d’effacer les données collectées ces derniers mois…

Webcode
DPF8_189241