W niedawnym badaniu naukowcy opracowali i ocenili model patologii oparty na sztucznej inteligencji o nazwie Prov-GigaPath. Zdaniem naukowców jest to pierwszy podstawowy model patologii obejmujący cały slajd, służący do diagnozowania komórek nowotworowych wytrenowanych na dużych zbiorach danych z rzeczywistych przypadków.

Patologia obliczeniowa pomaga w zmianie diagnozy raka, pomagając profesjonalistom w identyfikowaniu podtypów, etapów i możliwego postępu choroby. W wielu badaniach uczenie maszynowe i głębokie uczenie się wykazały lepsze wyniki we wczesnym wykrywaniu różnych typów nowotworów.

Przeczytaj także: Naukowcy opracowują model oparty na sztucznej inteligencji w celu usprawnienia immunoterapii nowotworów

Providence Health Systems i Uniwersytet Waszyngtoński przeprowadziły najnowsze badanie, opublikowane w czasopiśmie Nature. Aby ułatwić badania, współpracowało także wiele wewnętrznych zespołów Microsoftu.

Prov-GigaPath diagnozuje raka 

Prov-GigaPath opiera się na metodzie obrazowania całych slajdów, która jest szeroko stosowana w ocenie i diagnostyce nowotworów.

Schemat blokowy przedstawiający architekturę modelu Prov-GigaPath.

W technice obrazowania całego slajdu preparat mikroskopowy obrazu guza przekształca się w obraz cyfrowy o wysokiej rozdzielczości. Te obrazy obejmujące cały slajd zawierają najważniejsze informacje, które pomagają zrozumieć mikrośrodowisko guza. 

„Prov-Path jest ponad pięć razy większy niż TCGA pod względem liczby płytek obrazowych i ponad dwa razy większy niż TCGA pod względem liczby pacjentów”. Natura.

Prov-GigaPath jest szkolony na dużym zbiorze danych o nazwie Prov-path z Providence Health Network, który obejmuje 28 ośrodków onkologicznych. Zbiór danych zawiera ponad 1,3 miliarda płytek obrazów ze 171 189 rzeczywistych szkiełek mikroskopowych. Slajdy opracowano podczas biopsji i resekcji ponad 30 000 pacjentów i obejmują 31 głównych typów tkanek.

Zbiór danych Prov-Path zawiera także dane na temat stopnia zaawansowania raka, powiązane raporty patologiczne, profile mutacji genomu i wyniki badań histopatologicznych. Razem te różnorodne części danych zapewniają lepsze zrozumienie warunków modelu.

GigaPath usprawnia identyfikację slajdów gigapikselowych

GigaPath to nowy transformator wizyjny, którego Prov-GigaPath używa do oceny gigapikselowych slajdów patologicznych. Kompletny slajd staje się serią żetonów, gdy kafelki z obrazami są używane jako żetony wizualne. Aby uprościć skomplikowane wzorce modelowania sekwencji, transformatorem wizyjnym jest architektura neuronowa.

Wykres słupkowy do podtypu nowotworu.

Rzecz w tym, że konwencjonalnego transformatora wizyjnego nie można zastosować bezpośrednio w patologii cyfrowej ze względu na ogromną liczbę płytek w każdym szkiełku mikroskopowym. W przypadku danych Providence liczba slajdów może sięgać nawet 70 121. Naukowcy zauważyli, że

„Aby rozwiązać ten problem, wykorzystujemy rozszerzoną samouważność, dostosowując naszą niedawno opracowaną metodę LongNet”.

Wiele mutacji genów zmieniających funkcje jest zaangażowanych w progresję nowotworu, co można badać przesiewowo pod kątem zarówno diagnozy nowotworu, jak i rokowania. W badaniu zauważono, że pomimo znacznego spadku kosztów sekwencjonowania nadal istnieją luki w opiece zdrowotnej. Uważa się, że głównym czynnikiem tworzącym tę lukę jest dostęp do sekwencjonowania nowotworów na całym świecie. 

Naukowcy podkreślili, że przewidywanie mutacji nowotworu na podstawie obrazów patologicznych może pomóc w wyborze metod leczenia i spersonalizowanego leczenia. 

Naukowcy porównują modele patologii

Patologia cyfrowa wiąże się z wyzwaniami obliczeniowymi, ponieważ standardowe slajdy gigapikselowe są zwykle tysiące razy większe niż tradycyjne obrazy naturalne. Konwencjonalne transformatory wizyjne mają ograniczenia i nie radzą sobie z tak gigantycznymi obrazami, ponieważ wymagania obliczeniowe rosną wraz ze wzrostem ilości danych.

Przeczytaj także: Narzędzie AI przewiduje reakcje układu odpornościowego w walce z rakiem

Inną kwestią jest to, że poprzednie badania patologii cyfrowej nie wykorzystywały współzależności pomiędzy różnymi kafelkami obrazów na każdym szkiełku mikroskopowym. Ta nieznajomość łączenia współzależności doprowadziła do wyeliminowania kontekstu na poziomie slajdu, który jest kluczowy dla wielu zastosowań, takich jak modelowanie mikrośrodowiska nowotworu.

Na potrzeby badania badacze porównali Prov-GigaPath z innymi publicznie dostępnymi podstawowymi modelami patologii, takimi jak HIPT, Ctranspath i REMEDIS. Naukowcy odkryli, że Prov-gigaPath wykazał się lepszą wydajnością w przypadku 25 z 26 zadań, co stwierdzono w badaniu:

„Prov-GigaPath osiągnął poprawę o 23,5% w AUROC (miara wydajności modeli klasyfikacyjnych) i 66,4% w AUPRC (miara przydatna w przypadku niezrównoważonych zbiorów danych) w porównaniu z drugim najlepszym modelem, REMEDIS”.

Rak może być chorobą zagrażającą życiu i każdego roku kosztuje miliony istnień ludzkich. Jak powiedział w wywiadzie dla CNBC Thomas Fuchs, współzałożyciel i główny naukowiec w Paige, dostawcy patologii cyfrowej: „Nie masz raka, dopóki patolog tego nie powie. To krytyczny krok w całej konstrukcji medycznej.” 

Jak wiemy, konwencjonalne techniki patologiczne są pomocne w diagnozowaniu chorób, ponieważ w dużej mierze opierają się na oglądaniu próbek tkanek pod mikroskopem. Jednak dzięki dostępnej technologii i sztucznej inteligencji praktyki się zmieniają, a proces identyfikacji i klasyfikacji nowotworów przyspiesza. Większość modeli patologii AI wykorzystuje tę samą technikę badania szkiełek mikroskopowych, ale w sposób cyfrowy. 

Kryptopolityczne raporty Aamira Sheikha