A Milan, Oracle explique les atouts de sa base de données convergente pour l’IA générative
Dans le cade de sa conférence milanaise, Oracle a expliqué comment sa stratégie de réunir tous les types de données - y compris graphes et vecteurs - dans un seul et même système simplifie les requêtes combinant critères «structurés» et sémantiques.
Lors de son CloudWorld Tour qui faisait escale le 21 mars à Milan, Oracle a parlé de nombreux thèmes et bien sûr d’intelligence artificielle. Le géant rouge comptant bien profiter de sa technologie et de sa position privilégiée dans la gestion des données d’entreprise pour tirer parti de la tendance.
Ce n’est pas un secret, l’intelligence artificielle repose avant tout sur les données qu’elle ingère. Et dans le domaine de l’IA générative, le sujet du moment dans beaucoup d’organisations ce sont les techniques de RAG (Retrieval-Augmented Generation) permettant de profiter à la fois de la puissance conversationnelle des grands modèles de langage et des données propres à l’entreprises pour des réponses plus pertinentes.
De nombreuses jeunes pousses suisses se sont lancées sur ce créneau et proposent par exemple de développer des chatbots «de deuxième génération» capables de répondre aux requêtes des clients avec davantage d’aisance conversationnelle et sans être pris au dépourvu lorsque les demandes s’écartent des scénarios anticipés.
Et les grands fournisseurs de logiciels d’entreprise améliorent eux aussi leur offre en la matière. C’est dans leurs systèmes que résident bien des données et documents de l’entreprise et, ces derniers mois, plusieurs d’entre eux ont enrichi leur logiciel de fonctionnalités de bases de données vectorielle et graphe - les deux manières en vogue de présenter les données pour le RAG.
Oracle mise sur sa stratégie de base de données unifiée
Retour à Oracle. Dans les grandes entreprises c’est souvent la base de données au logo rouge qui traite les données les plus critiques, tant pour les transactions que pour les analyses. Ce n’est pas pour rien que Microsoft s’est récemment associé à Oracle, pour que ce dernier opère son cloud au sein même des datacenters et régions cloud d’Azure.
Invité par Oracle à sa conférence milanaise*, la rédaction d’ICTjournal s’est entretenue avec deux de ses responsables. Michele Porcu, Responsable Business Value Services & Strategy pour la région EMEA, met en avant la stratégie de convergence d’Oracle. Non seulement c’est le même système qui gère les données transactionnelles et analytiques, mais les différents types et formats sont aussi réunis dans une seule et même base. Outre les données structurées classiques, le même système réunit les données non-structurées, mais aussi les données graphe et, depuis peu, les données vectorielles. Si bien que les organisations s'évitent le labeur d'intégrer diverses bases de données.
Oracle a ainsi dévoilé il y a quelques mois Vector Search (actuellement en public preview), un outil permettant de rechercher des vecteurs stockés dans sa base de données, typiquement pour trouver des contenus similaires. Une application pourrait par exemple trouver au sein de la base de données des maisons ressemblant à une photo téléchargée par un utilisateur à la recherche d’un bien immobilier.
Cette fonction permet typiquement d’augmenter les modèles avec la technique RAG. Mais le fait qu'Oracle réunissse ces vecteurs et les autres données de l'entreprise dans un même système permet aussi de simplifier les requêtes combinées...
Simplification des recherches combinées intégrant des vecteurs
Oracle se démarque en effet par le caractère convergent de sa base de données, qui permet de combiner aisément plusieurs formats et logiques de recherche, explique Çetin Özbütün, Senior VP Oracle Database Server Technology. Pour reprendre l'exemple de la recherche de bien immobilier, la base de données contenant également des données structurées et graphe, il est possible de rechercher une maison ressemblant à la photo, dans une certaine fourchette de prix et dans une ville spécifique, en s'adressant à un seul système et avec une seule requête (voir l’image ci-dessous de la présentation de Çetin Özbütün). Ou de demander des films ressemblant à celui qu’on vient de voir, figurant dans le catalogue, disponibles en français, et aimés par ses connaissances.
A cela s’ajoute qu’Oracle a développé une fonctionnalité d’index pour les contenus stockés sous forme de vecteurs, et la possibilité de «partitionner» cet index. Cette division permet, dans l’exemple de la recherche de maison, d’avoir des sous-index pour les maisons de chaque ville. Ainsi, au moment de la requête, le système ne va pas chercher parmi toutes les photos de maison de la base de données, mais uniquement parmi celles de la ville choisie, avec un gain de performance important. Une fonctionnalité étroitement liée au fait que la base de donnée dispose aussi de ces méta-informations, explique Çetin Özbütün.
Encore une fois, vu sa stratégie de convergence, vu sa position sur le marché et vu que sa base de données renferme les données clés de quantité de grandes entreprises, Oracle est bien placé pour profiter des projets en cours dans le domaine de l'IA générative.
(*) Oracle a pris en charge le train aller-retour à Milan, ainsi qu’une nuit d’hôtel du journaliste présent.