Data lakehouse en vogue

L’IA stimule la modernisation des architectures de données

L'évolution rapide des technologies d'IA générative stimule la modernisation des systèmes de données. Promettant un accès unifié et riche aux données et donc une accélération des développements IA, les architectures de type data lakehouse ont le vent en poupe.

(Source: janer zhang sur Unsplash)
(Source: janer zhang sur Unsplash)

Les technologies d'intelligence artificielle (IA), en particulier l'IA générative, poussent les entreprises à moderniser leurs systèmes de données. Les responsables IT cherchent à se doter d'architectures de données permettant à la fois d'innover (technologies émergentes, données en temps réel) et de simplifier l'environnement (systèmes intégrant données structurées et non-structurées, gouvernance unifiée), selon une enquête de la MIT Technology Review pour Databricks.

«Les implications de l'IA générative pour l'architecture des données sont énormes, commente John Roese, CTO de Dell Technologies. Je vois trois défis majeurs: alimenter les modèles avec d'énormes volumes de données, pour la plupart non structurées, afin de les entraîner; stocker les données à long terme d'une manière propice à la consommation de l'IA; et mettre en place une sécurité adéquate autour des modèles».

Le data lakehouse a le vent en poupe

Ces divers priorités et défis engendrent un intérêt croissant pour les architectures unifiées, telles que les data lakehouse. Trois quarts des leaders interrogés dans l'étude ont adopté un data lakehouse. Et la plupart de ceux qui n’ont pas encore opté pour cette architecture prévoient de le faire dans les trois prochaines années.

Mot-valise, l'architecture de data lakehouse enrichit les data lakes et leurs données non-structurées d'une couche de métadonnées caractéristique des data warehouses. Les données servant à entraîner et alimenter les modèles IA sont ainsi plus riches et faciles d'accès. «Un data lakehouse utilise le stockage flexible de données non structurées à partir d'un lac de données, ainsi que les fonctionnalités et les outils de gestion des data warehouses, puis les implémente stratégiquement ensemble en tant que système plus vaste», dans les mots d'Oracle. 

L'architecture présente l'autre avantage de réunir données structurées et non-structurées dans une seule et même plateforme. Un atout de simplification quand on sait que 80% des plus grandes entreprises comptent plus d'une dizaine de systèmes de données, IA et ML différents, selon l'enquête de la MIT Technology Review. «Il n'est pas nécessaire d'avoir plusieurs outils de règles et de gouvernance, plusieurs warehouses et des lakehouses séparées; vous pouvez avoir une plateforme lakehouse avec un outil de règles et de gouvernance unifié», résume Naveen Zutshi, Chief Information Officer chez Databricks.
 

 

 

Webcode
jBQsPHyD