Avec les start-up Figure et Covariant, ChatGPT s’invite dans les robots industriels
L’IA générative se positionne au cœur de la révolution robotique, avec Figure, qui va collaborer avec OpenAI, et Covariant, qui met au point un modèle pouvant auto-apprendre à partir du monde physique.
L’essor des LLM, les modèles de machine learning que l'on trouve au cœur des outils de GenAI, devrait rapidement avoir un impact dans le domaine de la robotique. Les géants de la tech les plus en vue sur le marché de l’IA l'ont apparemment bien compris. Les robots humanoïdes de la start-up californienne Figure ont ainsi récemment fait l’objet d’une levée de fonds de série B de 675 millions de dollars, valorisant l'entreprise à 2,6 milliards de dollars. Un financement auquel ont participé Microsoft, OpenAI, NVIDIA, Jeff Bezos (via Bezos Expeditions) ou encore Intel (qui avait déjà injecté 9 millions dans Figure en juillet dernier), indique le communiqué de la jeune pousse.
Dans le cadre de cet investissement, Figure et OpenAI ont en outre signé un accord de collaboration pour développer la prochaine génération de modèles d'IA pour les robots humanoïdes. Cette collaboration entend associer les recherches d'OpenAI à l’expertise de Figure en matière de hardware et de software pour la robotique. L'objectif déclaré étant d'améliorer la capacité des robots humanoïdes à traiter le langage naturel.
Partenariat avec BMW
Fondée en 2022 par Brett Adcock, ancien fondateur d'Archer Aviation et de Vettery, Figure est sortie du mode furtif au printemps 2023 et a dévoilé Figure 01, un robot humanoïde conçu pour soutenir les chaînes d'approvisionnement. La start-up a conclu il y a peu un partenariat avec BMW. Dans un premier temps, Figure identifiera des cas d'utilisation pour ses robots dans la production automobile. Leur déploiement se fera ensuite progressivement dans une usine américaine de BMW.
Figure envisage d'utiliser ses robots dans les secteurs de la fabrication, de l'expédition et de la logistique, de l'entreposage et de la vente au détail, où les pénuries de main-d'œuvre sont les plus graves, selon le CEO et fondateur Brett Adcock. Il résume sa vision sur le site web de son entreprise: «Chez Figure, nous pensons que les robots humanoïdes à usage général conçus pour un environnement humain sont la voie à suivre pour avoir l'impact global le plus important. C'est pourquoi la forme de nos robots humanoïdes ressemble à celle du corps humain».
Au-delà du LLM avec Covariant
La start-up Figure s’est lancée sur un marché compétitif, occupé par des firmes qui développent leurs solutions depuis plus longtemps, à l'image de Covariant. Contrairement à Figure, qui s'attaque à la fois au hardware et au software, Covariant s’est spécialisé dans les logiciels pour robots. En outre, sa technologie vise à alimenter tous types de robots manufacturiers et ne met pas la priorité sur les humanoïdes. Fondé en Californie en 2017, Covariant a bouclé en 2023 un financement de série C de 75 millions de dollars et compte parmi ses clients des groupes industriels tels que Otto Group ou Würth Industrie Service.
Covariant a récemment introduit le RFM-1 (Robotics Foundation Model-1), un modèle exploitant la GenAI et qui, selon les explications de la start-up, permet à des robots de fabrication ou de manutention de «comprendre le langage et le monde physique». RFM-1 permet aux robots et aux humains de collaborer et de résoudre des problèmes en communiquant simplement entre eux. A l'instar des LLM, le modèle de Covariant se nourrit de quantités massives de données: il a été formé sur des textes, des images, des vidéos, mais aussi sur des actions de robots, ainsi qu’à partir de données de capteurs. Les dizaines de millions de jeux de données employés sont issus d'une vaste flotte de robots d'automatisation d'entrepôts déployés chez les clients de la firme.
L’IA des robots s’améliore via les interactions physiques
La «compréhension» de l'environnement physique par le modèle RFM-1 provient notamment de sa capacité à générer des vidéos qui prédisent la réaction des objets aux actions robotiques. «Les progrès récents de l'IA générative ont démontré de magnifiques capacités de création vidéo, mais ces modèles sont encore très déconnectés de la réalité physique et limités dans leur capacité à comprendre le monde auquel les robots sont confrontés. Le RFM-1 de Covariant, qui est entraîné sur un très grand ensemble de données riches en interactions physiques avec les robots, représente un bond en avant significatif vers la construction de modèles d'IA généralisée capables de simuler avec précision le monde physique», souligne Pieter Abbeel, Chief Scientist et cofondateur de Covariant.
Dans un billet de blog, Covariant explique croire en «l'hypothèse de l'incarnation» selon laquelle le comportement intelligent découle des interactions physiques d'une entité avec son environnement. Via le RFM-1, des robots peuvent réaliser un apprentissage par autoréflexion de façon extrêmement rapide, met en avant la jeune pousse.