Quand un agent IA visite un site d’e-commerce
Les consommateurs vont peu à peu pouvoir confier leurs recherches et achats de produits en ligne à des agents IA. Très flexibles, ces outils sont capables d’imiter le comportement d’un acheteur sur un site e-commerce standard. Du côté des boutiques en ligne, d’autres interfaces pourraient cependant émerger permettant de mieux répondre à ces nouveaux «acheteurs».

L’arrivée d’outils GenAI capables de parcourir et d’effectuer des actions sur une page web pourrait transformer l’e-commerce. Les boutiques en ligne sont aujourd’hui conçues pour maximiser les achats et optimiser l’expérience des acheteurs humains. Demain, elles devront peut-être faire de même avec des acheteurs automatisés.
L’outil Operator dévoilé en janvier dernier par OpenAI ne nécessite pas de tels changements et il est sensé opérer sur un site standard «fait pour l’humain». Operator y parvient en combinant fonctionnalités perceptives (captures d’écran documentant le contexte actuel), explicitation de raisonnement (chain-of-thought pour la planification, le suivi et l’adaptation des étapes) et actions proprement dites (remplir un champs de recherche, sélectionner des menus, cliquer sur des boutons, etc.).
Ainsi, en réponse à un prompt cherchant une paire de chaussures de marque d’un couleur et d’une taille bien précises avec un prix maximum, Operator va chercher la marque en question sur Bing, visiter le site dédié, naviguer vers la page produits, sélectionner les filtres de couleur et de prix, vérifier pour chaque produit si la taille exigée est disponible, et finalement retourner une proposition. Toute l’opération ne prend que quelques minutes et toutes les étapes entreprises par l’agent s’affichent à l’utilisateur, qui peut intervenir quand il le souhaite ou quand il le faut, notamment pour saisir ses données d’accès et de paiement… pour pour résoudre un CAPTCHA.
Préparer son site d’e-commerce pour les agents
L’exemple est tiré du blog, de l’agence marketing Limelight aux Etats-Unis. L’auteur du post en retire plusieurs leçons pour les concepteurs de sites e-commerce. Tout d’abord s’assurer d’être bien référencé dans Bing, sachant que c’est le moteur de recherche utilisé par défaut par Operator (ce qui s’explique par le partenariat entre Microsoft et OpenAI). Ensuite, optimiser le site pour la découverte de produits par Operator, en considérant que l’outil cherche l’efficacité et ne perd pas de temps à surfer sur le site, comme le ferait un utilisateur humain. L’auteur recommande aussi de se concentrer sur l’accessibilité: Operator s’appuyant sur des captures d’écran, la lisibilité des menus et des boutons est encore plus importante que pour les utilisateurs humains. Enfin, l’agent exploitant les évaluations des utilisateurs et autres badges pour faire ses choix, ces aspects sont très importants.
API «pour agents»
L’agent développé par OpenAI permet ainsi à l’IA d’interagir avec un site web standard. D’autres démarches pourraient toutefois s’avérer plus efficaces pour faire converser IA générative et système e-commerce. Lorsqu’il s’agit d’interfacer deux systèmes informatiques on emploie des API standardisée, mais ces dernières sont inadaptées à la souplesse du LLM.
Une idée intéressante développée par le spécialiste norvégien Daniel Bendes consiste à créer des interfaces d’un nouveau genre, des «API pour agents» en quelque sorte. C’est ce qu’il propose avec le protocole UIM (pour Unified Intent Mediator).
Destiné à gérer et à sécuriser la manière dont un agent interagit avec des services web, le protocole comprend plusieurs concepts, à commencer par celui d’intention. L’idée étant qu’un service web puisse exposer des actions structurées que l’agent va pouvoir facilement associer à l’intention de l’utilisateur exprimée dans son prompt. Chaque intention exposée par le service web fournit par ailleurs des informations, notamment sur la manière de s’en servir (input requis).
Le protocole inclut également une «API de découverte» permettant à l’agent de rechercher les actions et intentions mises à disposition par le site web. Le protocole comprend aussi une dimension sécurité pour encadrer le comportement de l’agent, ses permissions, les actions qu’il peut réaliser, etc.