Le chiffrement homomorphe multipartite au service de la médecine de précision
Une recherche impliquant l'EPFL et le CHUV a permis d'élaborer un système de chiffrement homomorphe multipartite appliqué à l'apprentissage fédéré. De quoi répondre aux défis de la sécurité et de la confidentialité des données cliniques dans la recherche biomédicale à grande échelle.
Des chercheurs de l’EPFL et du CHUV ont élaboré une technique de chiffrement en mesure de faire progresser la médecine de précision. Impliquant également des équipes du MIT et de Harvard, cette recherche a abouti à l’élaboration d’une solution au principal frein à l’amélioration des diagnostics et des thérapies ciblées: le partage des données sensibles.
Approches actuelles limitées et risquées
Pour progresser, la recherche biomédicale à grande échelle doit rassembler des données cliniques provenant des hôpitaux, cabinets et cliniques du monde entier, afin de les exploiter pour créer des modèles d'apprentissage fédéré en machine learning. D’où un risque de fuite de données. Or, selon le communiqué de l’EPFL, certaines des approches actuelles n’offrent dans ce cadre qu’une protection limitée de la vie privée des patients, en obligeant les institutions à partager les résultats intermédiaires. Tandis que d’autres approches sacrifient la précision des résultats, en introduisant du bruit dans les données pour limiter les fuites potentielles. Pour relever ces défis, les chercheurs ont mis au point le système FAMHE, une approche de chiffrement homomorphe multipartite appliqué à l'apprentissage fédéré. Selon l’EPFL, le système FAMHE est un bon compromis entre la protection des données, la précision des résultats de recherche et le temps de calcul pratique.
Calculs sur des données sans communication entre les parties
Dans leur article, publié dans la revue Nature Communications, les chercheurs expliquent que leur approche combine la puissance de chiffrement homomorphe (HE) «pour effectuer des calculs sur des données chiffrées sans communication entre les parties, avec les avantages des protocoles interactifs qui peuvent simplifier considérablement certaines opérations HE coûteuses.» Le système FAMHE introduit une nouvelle approche où chaque institution participante effectue des calculs locaux et chiffre les résultats intermédiaires en utilisant le chiffrement homomorphe multipartite. Les résultats sont ensuite combinés et distribués à chaque institution pour d'autres calculs. «En partageant uniquement des informations chiffrées, notre approche garantit que, lorsque cela est nécessaire, un niveau minimum d'obscurcissement peut être appliqué uniquement au résultat final afin de le protéger des attaques par inférence, au lieu d'être appliqué à tous les résultats intermédiaires», précisent les chercheurs dans leur article.
Aussi efficace que les approches moins sécurisées
L’efficacité du système FAMHE a été démontrée en reproduisant correctement les résultats des deux études qui reposaient sur le transfert et la centralisation préalables des données. «Jusqu’à présent, personne n’a été capable de reproduire des études montrant que l’analyse fédérée fonctionne à grande échelle. Nos résultats sont précis et ont été obtenus avec un temps de calcul raisonnable», explique Jean-Pierre Hubaux, professeur de l’EPFL et auteur principal de l’étude. Les chercheurs sont déjà en discussions avancées, avec des partenaires à l'échelle mondiale, pour déployer FAMHE à grande échelle. «Nous voulons que cela soit intégré dans les activités normales de la recherche médicale», conclut Jean Louis Raisaro, docteur du CHUV et l’un des chercheurs principaux de l’étude.
Listé dans le dernier Hype Cycle des technologies émergentes de Gartner, le chiffrement homomorphe est exploré par les géants de la tech. Mais aussi par la start-up Inpher, en partie basée à l’EPFL, dont les solutions combinent aussi calcul multipartite sécurisé, apprentissage fédéré et chiffrement totalement homomorphe.
> Sur le sujet: L’informatique confidentielle se dévoile