Dans une étude récente, les chercheurs ont développé et évalué un modèle pathologique basé sur l’IA appelé Prov-GigaPath. Selon les chercheurs, il s’agit du premier modèle de base de pathologie à lame entière pour diagnostiquer les cellules cancéreuses formées sur de grands ensembles de données provenant de cas réels.

La pathologie informatique contribue à transformer le diagnostic du cancer, en aidant les professionnels à identifier les sous-types, les stades et les progrès possibles de la maladie. Dans de nombreuses études, l’apprentissage automatique et l’apprentissage profond ont montré de meilleurs résultats pour la détection précoce de divers types de cancer.

Lisez aussi : Des scientifiques développent un modèle basé sur l’IA pour améliorer les immunothérapies contre le cancer

Providence Health Systems et l'Université de Washington ont mené la dernière étude de recherche, publiée dans le Journal Nature. Un certain nombre d’équipes internes de Microsoft ont également collaboré pour faciliter la recherche.

Prov-GigaPath diagnostique le cancer 

Prov-GigaPath s'appuie sur la méthode d'imagerie sur lame entière, largement appliquée à l'évaluation et au diagnostic du cancer.

Organigramme montrant l'architecture du modèle de Prov-GigaPath.

Dans la technique d’imagerie sur lame entière, une lame de microscopie d’une image tumorale est transformée en une image numérique haute résolution. Ces images de diapositives entières contiennent des informations essentielles qui aident à comprendre le microenvironnement tumoral. 

« Prov-Path est plus de cinq fois plus grand que TCGA en termes de nombre de tuiles d'images et plus de deux fois plus grand que TCGA en termes de nombre de patients. » Nature.

Prov-GigaPath est formé sur un vaste ensemble de données appelé Prov-path du Providence Health Network, qui compte 28 centres de cancérologie. L’ensemble de données contient plus de 1,3 milliard de tuiles d’images provenant de 171 189 lames de microscopie réelles. Les lames ont été développées lors de biopsies et de résections de plus de 30 000 patients et couvrent 31 principaux types de tissus.

L'ensemble de données Prov-Path contient également des données sur la stadification du cancer, les rapports de pathologie associés, les profils de mutation du génome et les résultats histopathologiques. Ensemble, ces diverses parties de données permettent une meilleure compréhension des conditions du modèle.

GigaPath améliore l'identification des diapositives Gigapixel

GigaPath est un nouveau transformateur de vision que Prov-GigaPath utilise pour évaluer les lames pathologiques gigapixels. Une diapositive complète devient une série de jetons lorsque les vignettes d'images sont utilisées comme jetons visuels. Afin de simplifier les modèles complexes pour la modélisation de séquences, le transformateur de vision est une architecture neuronale.

Graphique à barres pour le sous-typage du cancer.

Le fait est qu’un transformateur de vision conventionnel ne peut pas être appliqué directement à la pathologie numérique en raison du grand nombre de carreaux dans chaque lame de microscope. Dans le cas des données Providence, le nombre de diapositives peut atteindre 70 121. Les chercheurs ont noté que,

"Pour résoudre ce problème, nous exploitons l'auto-attention dilatée en adaptant notre méthode LongNet récemment développée."

De nombreuses mutations génétiques altérant la fonction sont impliquées dans la progression du cancer, qui peuvent être dépistées à la fois pour le diagnostic et le pronostic du cancer. L’étude a noté que malgré la diminution significative du coût du séquençage, il existe encore des lacunes en matière de soins de santé. L’accès au séquençage des tumeurs dans le monde entier serait le principal facteur expliquant cette lacune. 

Les chercheurs ont souligné que la prévision des mutations tumorales à partir d’images pathologiques peut aider à sélectionner des méthodes de traitement et des médicaments personnalisés. 

Les chercheurs comparent les modèles de pathologie

La pathologie numérique présente des défis informatiques, car les diapositives gigapixels standard sont généralement des milliers de fois plus grandes que les images naturelles traditionnelles. Les transformateurs de vision conventionnels ont des limites et ont du mal à gérer des images aussi gigantesques, car les exigences informatiques augmentent avec de telles quantités de données.

Lisez aussi : Un outil d'IA prédit les réponses immunitaires dans la lutte contre le cancer

Un autre point est que les recherches antérieures en pathologie numérique n’ont pas exploité les interdépendances entre les différentes tuiles d’images de chaque lame de microscopie. Cette ignorance de la connexion des interdépendances a conduit à éliminer le contexte au niveau de la lame, qui est crucial pour de nombreuses applications, telles que la modélisation du microenvironnement tumoral.

Les chercheurs ont comparé Prov-GigaPath à d’autres modèles de base de pathologie accessibles au public tels que HIPT, Ctranspath et REMEDIS pour l’étude. Les chercheurs ont découvert que Prov-gigaPath affichait de meilleures performances sur 25 tâches sur 26, l'étude notant que :

"Prov-GigaPath a atteint une amélioration de 23,5 % en AUROC (une mesure de performance pour les modèles de classification) et de 66,4 % en AUPRC (une mesure utile pour traiter des ensembles de données déséquilibrés) par rapport au deuxième meilleur modèle, REMEDIS."

Le cancer peut être une maladie potentiellement mortelle et coûte des millions de vies chaque année. Comme Thomas Fuchs, co-fondateur et scientifique en chef du fournisseur de pathologie numérique Paige, l'a déclaré à CNBC dans une interview : « Vous n'avez pas de cancer tant que le pathologiste ne le dit pas. C’est l’étape cruciale de tout l’édifice médical. 

Comme nous le savons, les techniques de pathologie conventionnelles ont facilité le diagnostic des maladies car elles reposent en grande partie sur l’examen d’échantillons de tissus au microscope. Cependant, avec l’avènement de la technologie et de l’intelligence artificielle, les pratiques évoluent et le processus d’identification et de classification des cancers s’accélère. La plupart des modèles de pathologie d’IA exploitent la même technique d’examen des lames de microscopie, mais de manière numérique. 

Reportage cryptopolitain d'Aamir Sheikh