Analyse des données statistiques

L’OFS développe une plateforme pour l’analyse confidentielle des données de l’administration

Le Centre de compétences en science des données (DSCC) de l’Office fédéral de la statistique (OFS) a mis au point Lomas, une nouvelle plateforme open source qui permet d’exploiter les données des administrations sans compromettre la protection de la vie privée.

(Source: Bluberries / iStock.com)
(Source: Bluberries / iStock.com)

L’Office fédéral de la statistique (OFS) a développé une plateforme appelée Lomas pour exploiter les données des administrations publiques en respectant la vie privée. Lomas, qui se fonde sur une approche d'informatique confidentielle, permet aux chercheurs agréés et aux analystes gouvernementaux d'exécuter des algorithmes sur les données sans y accéder directement. Le but est de tirer parti des données statistiques grâce à des méthodes d'analyse avancées, tout en respectant les lois sur la protection de la vie privée qui limitent leur utilisation secondaire. 

«Concrètement, [les utilisateurs] accèdent à la plateforme à distance et soumettent leurs requêtes pour exécution sur ces jeux de données. Lomas exécute les algorithmes sans révéler les données aux utilisateurs et renvoie les résultats protégés par la confidentialité différentielle (differential privacy), une méthodologie qui introduit un bruit contrôlé dans ces résultats afin d’empêcher qu’un tiers mal intentionné puisse extraire avec fiabilité des informations identifiables», lit-on dans un article du blog du Centre de compétences en science des données (DSCC) de l’OFS, qui a développé la plateforme Lomas. La confidentialité différentielle permet de mesurer et de contrôler mathématiquement le risque de divulgation, expliquent les chercheurs de l’OFS dans un article académique. Et de préciser qu'en randomisant les résultats des algorithmes, la confidentialité différentielle rend toute tentative d'extraction de données identifiables à partir du produit de données peu fiable, tout en garantissant une transparence complète sur la protection et l'utilisation des données. 

La plateforme Lomas est conçue sur le code open source d’une solution qui a été mise au point lors d’un hackathon organisé par les Nations Unies. Se trouvant encore au stade du proof-of-concept au sein de l’OFS, la plateforme est disponible en open source sur le GitHub du DSCC. Ses concepteurs invitent les instituts nationaux de statistique à la tester. 

Confidential computing appliqué aux LLM

Sans quitter le domaine de l’informatique confidentielle, signalons que la start-up suisse Decentriq vient de dévoiler une version preview d’une nouveauté tirant parti de sa technologie de data clean room. Il s'agit d’une fonctionnalité qui permet d'exploiter un LLM open source au sein de sa plateforme, afin de donner la possibilité  de combiner des données sensibles et de les interroger, le tout avec les garanties de sécurité par chiffrement fournies par l'informatique confidentielle.
 

Tags
Webcode
FveScSFy