Sztuczna inteligencja, która analizuje zdjęcia płuc tak samo jak radiolog
Każdego dnia radiolodzy przeglądają ogromną liczbę tomografii komputerowych, szukając czegoś, co łatwo przeoczyć. Małego guzka. Niewielkiego cienia. Czegoś, co może być wczesnym stadium raka płuc, a może też niczym poważnym.
Rak płuc zabija na całym świecie więcej osób niż jakikolwiek inny nowotwór. Przeżywalność jest ściśle powiązana z tym, jak wcześnie zostanie wykryty. Natomiast obciążenie pracą w większości oddziałów radiologicznych pozostawia niewiele miejsca na taką długotrwałą, skupioną na dwóch aspektach uwagę, jakiej faktycznie wymaga wykrycie niewielkiej, podejrzanej zmiany.
W opublikowanym właśnie w czasopiśmie „Scientific Reports” badaniu międzynarodowy zespół badawczy, w skład którego wchodzą naukowcy z Politechniki w Kownie na Litwie, stworzył system sztucznej inteligencji przeznaczony do zadania, z którym dotychczasowe narzędzia nieustannie borykały się. System ten analizuje skan na dwa sposoby jednocześnie.
Jak radiolog faktycznie ocenia wyniki badania obrazowego
Kiedy radiolog analizuje wyniki tomografii komputerowej, nieustannie zmienia perspektywę. Powiększa interesujący go obszar, aby zbadać najdrobniejsze szczegóły. Następnie cofa się, aby zrozumieć, jak ten obszar wpisuje się w całość płuca. Nie chodzi o to, by wybierać jedno albo drugie. Chodzi o to, by robić jedno i drugie, wielokrotnie, przez cały czas trwania analizy.
Większość systemów sztucznej inteligencji stworzonych do tego zadania musiała dokonać wyboru. Albo dobrze radzą sobie z uchwyceniem drobnych szczegółów lokalnych, albo dobrze rozumieją szerszy kontekst strukturalny. Jednoczesne osiągnięcie obu tych celów stanowi od dawna problem techniczny.
Rozwiązaniem opracowanym przez zespół jest model, który nazwali C-Swin. Łączy on w sobie dwie różne architektury sieci neuronowych, które współpracują ze sobą. Sieć neuronowa konwolucyjna zajmuje się szczegółowymi cechami lokalnymi – czyli rozpoznawaniem szczegółowych wzorów, które pozwala wykrywać niewielkie zmiany chorobowe i subtelne tekstury. Natomiast szerszy kontekst obsługuje Swin Transformer – architektura wykorzystująca metodę przesuwnego okna do analizy obszarów przestrzennych obrazu. Oba elementy działają równolegle, a ich wyniki są integrowane, a nie przetwarzane sekwencyjnie.
Badacz Inzamam Mashood Nasir z KTU wyjaśnia to w prosty sposób. Jedna część modelu skupia się na drobnych szczegółach, takich jak niewielkie plamki czy struktury w płucach, podczas gdy druga analizuje ogólny obraz i pozwala uchwycić szerszy kontekst. Można to porównać do sytuacji, w której jednocześnie korzysta się z lupy i ma przed sobą pełny obraz badania.
Co wykazały wyniki
Model przetestowano na zbiorze danych IQ-OTH/NCCD, czyli publicznie dostępnym zbiorze obrazów tomografii komputerowej, klasyfikując obrazy do trzech kategorii: prawidłowe, łagodne i złośliwe.
Rozróżnienie między guzkami łagodnymi (nie nowotworowymi) a nowotworami złośliwymi jest jednym z najtrudniejszych zadań w radiologii; popełnienie błędu w tej kwestii prowadzi albo do przeoczenia nowotworów, albo do niepotrzebnych, inwazyjnych biopsji.
Wyniki były bardzo dobre. Model C-Swin osiągnął dokładność na poziomie 96,26%, precyzję wynoszącą 97,48% oraz wskaźnik F1 wynoszący 97,42%. W porównaniu z istniejącymi metodami poprawa dokładności wynosiła od 2,31% do 6,81%, w zależności od konkretnego porównania.
W medycynie różnice te nie są niewielkie. Jeden punkt procentowy różnicy w dokładności diagnostycznej, w skali tysięcy pacjentów i setek tysięcy badań obrazowych, przekłada się na konkretne wyniki.
Naukowcy podchodzą ostrożnie do swoich twierdzeń. Model został wytrenowany na jednym zbiorze danych. Nie został jeszcze przetestowany w odniesieniu do urządzeń różnych producentów, różnych protokołów obrazowania ani różnych grup pacjentów. Nasir mówi o tym wprost. W rzeczywistych warunkach występuje wiele zmiennych, a przed wprowadzeniem do użytku klinicznego system musi zostać przetestowany w odniesieniu do wszystkich z nich.
To zastrzeżenie nie umniejsza znaczenia wyników badań. Stanowi ono rzetelny opis etapu, na którym znajdują się dobre badania naukowe, zanim zostaną wdrożone do praktyki klinicznej. Kolejne etapy to walidacja kliniczna, testy w warunkach szpitalnych oraz wdrożenie do istniejących systemów obrazowania medycznego.
Dlaczego czas ma kluczowe znaczenie
Rak płuc nadal najczęściej jest diagnozowany w późnym stadium, kiedy możliwości leczenia są ograniczone, a rokowania mniej korzystne. Rozbieżność między tym, co jest biologicznie możliwe, a tym, co faktycznie dociera do pacjentów na czas, stanowi jeden z kluczowych problemów w onkologii.
Narzędzia oparte na sztucznej inteligencji, które rzeczywiście ograniczają liczbę przeoczonych przypadków i obniżają wskaźnik wyników fałszywie dodatnich – co oznacza, że mniej pacjentów jest kierowanych na niepotrzebne badania i odczuwa związany z tym niepokój – rozwiązują jednocześnie obie strony tego problemu.
Nasir zwraca uwagę, że architektura ta nie ogranicza się wyłącznie do raka płuc. Każde zadanie z zakresu obrazowania medycznego, które wymaga zarówno szczegółowej analizy lokalnej, jak i szerszego zrozumienia struktury, mogłoby skorzystać z tego samego podejścia. Jako potencjalne obszary zastosowań wymieniono guzy mózgu, raka piersi oraz choroby oczu.
Szersza perspektywa
W tym tygodniu dyrektor generalny Google DeepMind, Demis Hassabis, udzielił dwóch ważnych wywiadów – jednego w podcaście „20VC” z Harrym Stebbingsem oraz drugiego z popularyzatorką nauki Cleo Abram – w których omówił swoją wizję tego, co sztuczna inteligencja może wnieść do medycyny. Jego spójnym przesłaniem było to, że najważniejszym zadaniem sztucznej inteligencji nie są produkty konsumenckie, lecz walka z chorobami. Mówił o tym, że chciałby, aby trwający dziesięć lat proces odkrywania leków został skrócony do kilku miesięcy. O tym, że sztuczna inteligencja doprowadzi do sytuacji, w której medycyna nie będzie już wyglądać tak, jak dzisiaj.
Artykuł dotyczący C-Swin nie ma aż tak wielkich ambicji. To jeden model, jeden zbiór danych, jeden starannie wyznaczony zestaw wyników, który czeka na weryfikację kliniczną. Ale właśnie w ten sposób pokonuje się dystans dzielący nas od celu. Nie pojedynczymi skokami, ale dzięki badaniom takim jak to – przeprowadzonym starannie, opublikowanym w sposób otwarty i rozwijanym przez kolejny zespół.
Coraz lepiej rozumiemy biologię raka płuc. Na tej podstawie zaczynają powstawać odpowiednie metody leczenia. A teraz, powoli, rozwija się również system wykrywania tej choroby.
Źródło: Yousafzai SN, Nasir IM, Mansour S i in. Hybrydowe podejście oparte na głębokim uczeniu, łączące sieć CNN i model transformatorowy w klasyfikacji raka płuc na podstawie tomografii komputerowej. Scientific Reports. 2026. doi:10.1038/s41598-026-41161-7
Zdjęcie: ilustracja wygenerowana przez sztuczną inteligencję