Algorytmy uczenia maszynowego dopasowują metody leczenia do specyficznych cech nowotworów
Naukowcy zajmujący się nowotworami i onkolodzy coraz częściej skłaniają się ku zastępowaniu standardowych metod leczenia terapiami dostosowanymi do danego pacjenta, w których uwzględnia się niejednorodność choroby. W przypadku nowotworów piersi brak informacji na temat cech charakterystycznych raka występującego u danego pacjenta może przyczynić się do nawrotów w postaci przerzutów. Leczenie pierwszego rzutu raka piersi jest skuteczne w około 90 % przypadków, natomiast w przypadku przerzutów wskaźnik przeżycia spada do 27 %. By móc skuteczniej pomagać pacjentom, eksperci tworzą ogromne bazy danych, w których charakterystyczne cechy nowotworów (i potencjalne biomarkery) są łączone ze specyficznymi reakcjami pacjentów na leczenie. Projekt jest w początkowym stadium i na razie zidentyfikowano jedynie kilka biomarkerów. „To właśnie nazywamy »przekleństwem wymiarowości«”, mówi Agnes Basseville, badaczka z francuskiego Institut de Cancérologie de l’Ouest (ICO) i koordynatorka projektu PredAlgoBC (Machine learning prediction for breast cancer therapy). Prace badawcze w ramach projektu zostały zrealizowane dzięki wsparciu w ramach działania „Maria Skłodowska-Curie”. „Obecnie na niewystarczającą liczbę pacjentów przypada zbyt wiele mierzonych zmiennych, a algorytmy uczenia maszynowego, których używamy do analizy danych dotyczących biomarkerów, nie działają odpowiednio w takich warunkach”. Celem projektu PredAlgoBC jest rozwiązanie tego problemu poprzez połączenie różnych podejść matematycznych z dogłębną analizą biologiczną. Basseville ma nadzieję, że na podstawie informacji dostarczanych przez opracowywane algorytmy możliwe będzie efektywniejsze dostosowanie metod leczenia. „Korzystaliśmy głównie z dwóch publicznych baz danych: amerykańskiej GEO i europejskiej ENA. Udało nam się zebrać dane pochodzące od ponad 4 000 pacjentów chorujących na raka piersi wraz z powiązanymi informacjami uzupełniającymi. Łącząc zbiory danych, uzyskujemy wystarczającą moc statystyczną, by opracować kompleksowy przegląd złożoności nowotworu. Niektóre dane, które chcieliśmy zebrać, a mianowicie RNA-Seq, są dostępne tylko na żądanie, po półrocznej ocenie takiego zgłoszenia. Ze względu na ograniczenia czasowe postanowiliśmy z nich nie korzystać”.
Przełom w hormonoterapii
Zbiór danych został podzielony na dwie części. Pierwszą wykorzystano do nauczenia algorytmu, jak lepiej przewidywać skutki leczenia, po czym przy pomocy drugiej weryfikowano celność przewidywań modelu. „W ten sposób możemy porównać przewidywania ze znaną odpowiedzią i określić, czy nasze modele działają prawidłowo”, wyjaśnia Basseville. Zmienne w każdym z modeli zostały uszeregowane pod względem ich znaczenia w przewidywaniach. Zmienne o najwyższej randze można rozważać jako potencjalne biomarkery. Przewidywania nie są jeszcze wystarczająco trafne, aby można je było wykorzystać w opracowywaniu metod leczenia, ale nadawanie rang zmiennym pozwoliło zespołowi zidentyfikować czynniki rozwoju nerwowego, które są istotnie związane ze słabą odpowiedzią na hormonoterapię. Jest to poważny przełom – nigdy wcześniej nie zidentyfikowano formalnie takiego powiązania. Innym rezultatem projektu jest wdrożenie algorytmu opartego na głębokim uczeniu się do tworzenia wirtualnych kohort pacjentów. Umożliwiają one wymianę danych na poziomie pacjenta bez ujawniania żadnych jego rzeczywistych danych. Ponadto nowo odkryte biomarkery zostaną wkrótce opisane w recenzowanym artykule. Zespół projektu zajmie się opracowaniem nowych zbiorów danych, które pomogą w dalszej walidacji biomarkerów. „Kolejnym krokiem będzie określenie najlepszego sposobu ich oceny w szpitalach, przy użyciu narzędzi ICO do rutynowej obsługi badania za pomocą testów takich jak PCR lub immunohistochemia. Po wybraniu najodpowiedniejszego testu klinicznego planujemy przeprowadzić retrospektywną analizę danych pacjentów w ICO, aby zweryfikować nasze nowe markery i potwierdzić ich przydatność przy kwalifikowaniu pacjentów do hormonoterapii”, dodaje Basseville. Proces ten, któremu towarzyszyć będą badania dotyczące najlepszego wykorzystania nowych biomarkerów w terapiach celowanych, potrwa kilka lat.
Słowa kluczowe
PredAlgoBC, rak piersi, algorytm, biomarkery, przerzuty, przewidywania, leczenie