Comment les radiologues s’appuient sur l’IA pour analyser les mammographies
Le dépistage du cancer du sein est un domaine prometteur pour l’IA dans lequel cette technologie commence à s’établir. ICTjournal a rencontré trois radiologues travaillant dans des institutions romandes, qui emploient un logiciel basé sur le deep learning pour identifier les lésions malignes dans les mammographies. Leurs témoignages révèlent ce qui se joue lorsqu’un spécialiste travaille au quotidien avec un assistant IA, entre complémentarité, complicité et compétition.
L’écran affiche deux mammographies. Médecin radiologue chez Medimage à Genève, Carolina Walter les analyse attentivement quelques minutes, puis elle consulte l’analyse effectuée par l’IA. Sur les images, des zones entourées apparaissent accompagnées d’un pourcentage. «Je me fais d’abord mon idée et après, en deuxième lecture, je regarde ce que me signale le logiciel. Je repasse ainsi sur chaque lésion en me posant la question si elle est bénigne ou maligne», explique-t-elle à ICTjournal. Carolina Walter s’appuie depuis deux ans sur un outil exploitant l’IA pour détecter les signes d’un cancer du sein sur les mammographies. Les indications du logiciel l’aident à décider du suivi de la patiente et des éventuels examens complémentaires avec son gynécologue. «L’outil m’oriente, me conforte dans mon analyse, c’est un soutien et en aucun cas un remplacement», précise la radiologue.
A la Clinique de La Source à Lausanne, les radiologues, la Dre Simona Artemisia et la Dre Carmen Picht, emploient depuis plus d’un an le même logiciel, qu’elles consultent également comme un second avis après avoir fait leur propre analyse. «C’est utile, notamment lorsqu’on a un doute sur une lésion. L’outil peut confirmer ou au contraire infirmer une anomalie. C’est comme si l’on discutait avec quelqu’un», commente la Dre Artemisia. «Notre travail est très répétitif et il peut nous arriver de manquer d’attention en fin de journée. L’outil nous aide à être toujours alertes», ajoute la Dre Picht.
Intérêt grandissant
Les médecins radiologues de Medimage et de La Source ne sont pas des cas isolés. Le dépistage du cancer du sein est en effet l’un des domaines où le recours à l’intelligence artificielle commence à être établi. A cela plusieurs explications. D’une part, les mammographies sont prises dans des positions standardisées et il existe de très grandes bases de données d’images documentées disponibles, deux conditions clés permettant un entraînement efficace des modèles algorithmiques. D’autre part, le besoin est grand. Le Fonds mondial de recherche contre le cancer recensait 2,2 millions de femmes souffrant d’un cancer du sein et 685’000 décès en 2020. De nombreux pays ont ainsi mis en place des programmes de dépistage et, dans certaines régions, les radiologues à même d’analyser les images ne sont pas assez nombreux.
L’intérêt pour l’emploi de l’IA dans le dépistage est si grand qu’en 2023, la Radiological Society of North America a organisé une compétition sur la plateforme Kaggle invitant les data scientists à développer des algorithmes de détection avec 10’000 dollars pour le plus méritant.
Plusieurs éditeurs spécialisés proposent aujourd’hui des logiciels s’appuyant sur l’IA pour l’analyse des mammographies. Certains produits servent à la détection du cancer, d’autres à l’amélioration des images, d’autres encore à l’évaluation du risque. Chez Medimage et à la Clinique de La Source, les médecins radiologues emploient l’outil ProFound AI® de la société iCAD. Entraîné pour détecter les lésions malignes pour la mammographie 2D et la tomosynthèse, ce dernier affiche un score pour chacune d’entre elles en fonction du degré de certitude de l’algorithme. Le logiciel est assorti d’un outil complémentaire indiquant le risque général de cancer, à partir de l’ensemble des lésions et de l’âge de la patiente.
Basée dans les environs de Boston, iCAD développe depuis plus de 20 ans des logiciels d’assistance au diagnostic pour les radiologues. Après le CAD, la société a expérimenté les technologies de machine learning et recourt désormais au deep learning dans ses outils. En 2022, l’entreprise a noué un accord avec Google Health, qui cherchait un partenaire spécialisé pour commercialiser et poursuivre le développement de ses propres algorithmes de détection du cancer du sein. En cours d’expérimentation, les algorithmes de Google ne sont cependant pour l’heure pas intégrés dans les outils employés en Suisse, précise une responsable d’iCAD à ICTjournal.
Quelle est la précision des algorithmes? iCAD mentionne une étude menée en Allemagne, dans laquelle son logiciel ProFound AI® a identifié plus de 90% des cas de cancer (sensibilité) et écarté 80% des cas qui n’étaient pas atteints (spécificité). De telles études abondent. Certaines indiquent que l’IA fait mieux que les radiologues, d’autres affirment le contraire. Les résultats obtenus dans les études peinent souvent à être reproduits dans la pratique clinique ou dans d’autres contextes, relève une méta-étude publiée en 2023. Là où les études concordent en général, c’est que les meilleures performances sont atteintes lorsqu’on combine les meilleures IA aux meilleurs radiologues, ces derniers voyant leur sensibilité et leur spécificité augmenter de plusieurs points.
Un compagnon efficace plus qu’un substitut
Medimage explique que l’achat du logiciel résulte d’une décision collégiale entre l’administration et les médecins radiologues. L’outil leur a été proposé par leur partenaire Intellimed, un fournisseur romand spécialisé dans les équipements médicaux. «L’IA commençait à faire beaucoup parler d’elle dans les congrès auxquels assistent les médecins radiologues», ajoute le cabinet de radiologie. A la Clinique de La Source, la Dre Artemisia explique s’être intéressée au logiciel après avoir participé à des congrès et parce qu’elle avait précédemment employé longtemps un autre système IA au CHUV.
Dans les deux institutions, les médecins radiologues attendaient de l’outil qu’il les assiste et améliore leur travail. «La motivation était d'être plus performant et d'avoir en quelque sorte un compagnon toujours à disposition», explique la Dre Artemisia. «Ça me permet d’avoir une validation rapide, de sécuriser les zones normales pour me concentrer sur les zones plus complexes, donc je gagne en efficience», commente la Dre Carolina Walter. Elle ajoute qu’il n’y a en revanche pas de gain de temps, la première évaluation suivie de la consultation de l’IA lui prenant dans l’ensemble environ le même temps que lorsqu’elle analysait les mammographies sans IA.
Assistance multiforme
L’outil IA fait donc surtout office d’assistant pour les radiologues. Mais quelles formes prend cette assistance? En théorie, le rôle de l’IA est d’aider les spécialistes à identifier des lésions qu’elles n’avaient pas identifiées comme malignes ou à écarter au contraire des lésions bénignes. Comme souvent, la réalité est plus complexe.
En premier lieu l’outil guide et structure un deuxième regard sur les images, les radiologues parcourant et analysant une à une les zones signalées par le logiciel. «Il va détecter davantage de lésions et je vais passer sur chacune et voir le score pour faire un diagnostic, ça m’aide à m'orienter», décrit la Dre Carolina Walter.
Le logiciel aide aussi les radiologues à maintenir leur attention. «Quand il signale une lésion, ça va nous rendre attentifs, on va la comparer avec ce que l’on connaît». «Il arrive que ça nous rappelle à l'ordre, que ça donne l’alerte si pour une raison ou une autre, on n’a pas identifié une lésion», relève la Dre Picht. «Quand il signale une lésion, ça va nous rendre attentifs et on va la comparer avec ce qu’on connaît », commente Carolina Walter.
Grâce à sa précision, le logiciel peut également affûter et compléter l’analyse. La Dre Artemisia explique que le logiciel lui permet d’être plus performante «dans la détection de certaines anomalies où l’on est vraiment à la limite de la visibilité». La Dre Picht y voit un complément: «Si mon analyse est incomplète, il peut la compléter et me dire: fais attention, en plus de l'opacité il y a des micro-calcifications. Et cela peut m’amener à changer ma modalité de prise en charge de la patiente».
Pas question en revanche d’écarter un cas qu’on avait identifié, parce que le logiciel ne le détecte pas, précise la Dre Picht: «Si je pense que c'est une lésion où je dois aller plus loin, ce n'est pas parce que lui me dit qu'il n'y a rien ou bien qu'il ne faut pas aller plus loin ou bien que le risque est très minime que je vais changer ma façon de procéder».
Des systèmes très sensibles
Dans leurs témoignages, toutes les radiologues décrivent aussi et surtout un logiciel très sensible et donc de très nombreux faux positifs. Ainsi, lorsqu’elles passent en revue les résultats de l’IA, c’est souvent pour les banaliser, soit pour des raisons techniques (microcalcifications bénignes, par exemple), soit parce qu’elles disposent d’autres informations, notamment l’historique de la patiente et les images réalisées antérieurement. «Le logiciel détecte par exemple une lésion. Moi je sais qu’elle est là depuis plus de deux ans et je vois qu’elle est stable, donc je vais banaliser», décrit la Dre Carolina Walter. «Le logiciel nous montre l'image, et nous on sait que ce n’est rien du tout parce qu'on a les anciens examens auxquels le logiciel n’a pas accès. On se dit: il l'a vu, mais je peux le banaliser», explique Dre Artemisia. «S’il me dit qu’une lésion est fortement suspecte, mais que moi je sais que la dame a déjà été opérée d'un cancer du sein et que ce qu’il me montre, c'est une cicatrice, il est clair que je vais banaliser», renchérit sa collègue la Dre Picht.
Les logiciels de détection étant souvent calibrés pour être sensibles (les éditeurs semblent privilégier la réduction des faux négatifs), certains pays déploient des outils IA avec une sensibilité volontairement accrue pour opérer un triage des cas. Dans cette configuration, l’outil IA n’assiste pas les radiologues, mais il est utilisé en amont pour analyser toutes les images et écarter les cas où il ne détecte rien. Après ce filtrage automatisé, les médecins n’analysent que les cas où l’IA a identifié une lésion.
Cette autre manière de combiner humain et machine a notamment l’avantage de réduire la charge de travail des radiologues, et de permettre un dépistage à large échelle malgré le manque de spécialistes. Cela signifie toutefois que des cas sont écartés sans être vus par un humain. « C’est mieux que rien, dans des pays où l’on manque de radiologues. Heureusement, ce n’est pas le cas en Suisse», commente la Dre Artemisia. Elle s’interroge toutefois: «Il y a quand même une autre problématique, qui est de plus en plus un enjeu dans notre domaine, c'est la responsabilité. Qui prend la responsabilité lorsqu'un algorithme a éliminé quelqu’un qui avait un cancer?».
Collègue, co-équipier, concurrent
On sait que les utilisateurs de ChatGPT tendent à personnifier le chatbot et, dans leur propos, les radiologues font parfois de même avec leur logiciel. «Je me dis "moi je ferai ça" et puis après je demande au logiciel: toi tu as vu quoi?», décrit l’une des médecins radiologues. «Je commence par me faire mon avis et ensuite je regarde ce qu’il me dit», ajoute une autre.
Elles développent par ailleurs divers types de relation avec leurs compagnons algorithmiques. Tantôt, comme on l’a vu plus haut, le logiciel fait office de collègue. Il les pousse à repasser sur chaque lésion, il les rend attentives à certaines zones, il les «remet à l’ordre» si elles ont été distraites. Il peut également valider l’évaluation du médecin: «Si je n’ai rien vu et que le logiciel n'a rien vu, ça va me conforter. S’il voit des choses que j’ai vues, je suis contente que lui aussi les ait vues. Ça nous soutient dans notre diagnostic», explique la Dre Walter.
A l’opposé, les radiologues en parlent parfois comme d’un expert concurrent qui les challengent et qu’elles challengent. «Je l'utilise surtout pour aller voir qui est discordant avec ce que moi j'ai vu», explique la Dre Picht. «Je vois ça, toi, tu vois ça, qui de nous deux a raison? Je le prends comme un défi. Je ne prendrais pas l’IA comme un chef de mon raisonnement. Je pars de l’idée que je dois le contredire, qu'il doit me contredire», ajoute la Dre Artemisia.
Saine méfiance
Cette façon critique de s’engager avec l’outil a une double utilité. C’est d’abord une manière de justifier le rôle et l’expertise de l’humain face à l’IA. «C’est une collaboration et pas un remplacement. Si on dit "Amen" à tout, ça veut dire que notre avis ne compte pas et qu’on se met en retrait. En faisant cela, on prend le risque que l'intelligence artificielle nous remplace», avertit la Dre Picht. Elle ajoute que grâce à sa pratique et son expérience, elle a un savoir dont ne dispose pas l’IA. «On fait une palpation, on discute avec la patiente, on voit qu’il y a quelque chose qui ne va pas. Et ça, ça fait aussi partie de notre travail», explique-t-elle.
Mais cette relation critique a une autre utilité: elle permet d’éviter le biais d’automatisation. Comme dans d’autres professions, le risque existe en effet que les radiologues cessent de considérer les résultats de l'IA d'un œil critique et se mettent à les suivre sans réfléchir. Un risque accru compte tenu de «la nature répétitive et du flux de travail hautement standardisé du dépistage par mammographie», relève un article de recherche paru en 2023.
L’étude montre que tous les radiologues sont enclins à ce type de biais lorsqu’ils utilisent l’IA. Les auteurs relèvent toutefois que les spécialistes inexpérimentés pourraient y être plus vulnérables, car ils sont moins confiants dans leurs propres évaluations. L’article relève ainsi que le recours à l’IA durant la formation pourrait «présenter un risque de déqualification, de sorte que certaines compétences sont perdues ou n'ont pas été correctement acquises au départ et ne peuvent pas être exécutées sans l'aide de l'IA».
A l’inverse, les auteurs constatent que les radiologues expérimentés ont passé plus de temps à analyser les mammographies. «Une explication possible de cet effet est que les lecteurs très expérimentés se sont engagés de manière plus critique dans les suggestions du système basé sur l'IA en comparant leurs propres évaluations avec les résultats de l'IA, ce qui a eu pour effet d'allonger le temps de lecture par mammographie», écrivent-ils.
A la Clinique de La Source, les médecins radiologues rencontrées par ICTjournal relèvent elles aussi ces dangers. «Je pense que s’ils manquent de pratique et d’expérience, les radiologues en formation risquent de trop s’appuyer sur l’intelligence artificielle. Ce faisant, ils pourraient manquer de faire leurs propres observations qui sont la base de l’apprentissage», estime la Dre Artemisia. Elles y voient aussi une question de caractère et d’attitude. «Tout dépend de comment on se positionne par rapport à l’IA. Si on l’utilise comme un raccourci sans réfléchir le risque de faute s’installe», commente à nouveau la Dre Artemisia. Et sa collègue ajoute: «L’être humain tend à être assisté, mais on peut résister…».
Sources
“Artificial Intelligence Applications in Breast Imaging: Current Status and Future Directions”, revue Diagnostics (2023)
“Automation Bias in Mammography: The Impact of Artificial Intelligence BI-RADS Suggestions on Reader Performance”, revue Radiology (2023)