12 Marca 2024
Aktualności
Na czym polega wykorzystanie uczenia maszynowego i modelowania sieci do badania ekologii wód?
Dość dawno, bo w roku 1957 jeden z „ojców” ekologii wód prof. Georg Evelyn Hutchinson zauważył, że w ekosystemie mamy do czynienia z dynamicznym, wielowymiarowym układem interakcji między gatunkami oraz między nimi a ich środowiskiem. Niecałe dwadzieścia lat później niemieccy biofizycy Manfred Eigen i Ruthilda Winkler ogłosili, że Natura jest areną wieloczynnikowej gry. Jeśli więc tak ją widzimy, to musimy sobie zadać pytanie: jakimi metodami tę skomplikowaną rzeczywistość ogarnąć? Czy opis i statystyka tu wystarczą? Nie. I dlatego odchodzimy od ujęcia statycznego i upraszczającego, które oferuje statystyka, do przewidywań i głębszego wniknięcia za pomocą bardziej zaawansowanego aparatu matematycznego. Uczenie maszynowe i modelowanie sieci do badania ekologii wód polega zatem przede wszystkim na zmianie podejścia badawczego. W przypadku uczenia maszynowego wykorzystujemy algebrę liniową, rachunek różniczkowy, teorię optymalizacji, probabilistykę. Uczenie maszynowe zbudowanym z tych matematycznych „cegiełek” algorytmom pozwala modelować wielowymiarowe relacje w systemach wodnych, przewidywać zmiany czynników ekologicznych i całych systemów, zajrzeć do tzw. „czarnej skrzynki” układów przyrodniczych, ocenić ważność parametru ekologicznego dla wzmacniania lub osłabiania określonego czynnika. Z kolei modelowanie sieci, oparte na teorii grafów, służy do określania różnych ról i znaczenia populacji gatunków w sieci biocenotycznej czy troficznej, a także do określania np. jej spójności i gęstości. Dla badacza kluczowe jest to, że te nowe sposoby analizy danych dają nie tylko możliwość empirycznej weryfikacji intuicyjnych założeń badawczych ekologów, ale również budowania nowych hipotez i wniosków praktycznych.
Dlaczego, kiedy i w jakich okolicznościach zajął się pan tym tematem? Jakie korzyści taka metoda daje?
Moją wędrówkę po modelowaniu matematycznym zacząłem w Instytucie Ekologii PAN jeszcze w ubiegłym wieku. Od ok. 2010 roku zacząłem stosować modelowanie równań strukturalnych. W tym też czasie „uwiodła” mnie również teoria grafów przełożona na sieci układów ekologicznych. W ostatnich pięciu latach zacząłem poszukiwać przydatności algorytmów uczenia maszynowego do weryfikacji hipotez z zakresu ekologii wód. Ostatnio skupiam się na zastosowaniu modelowania wyjaśniającego SHAP należącego do tzw. Explanaible AI (Sztucznej Inteligencji Wyjaśniającej) i utworzonego na podstawie teorii gier amerykańskiego noblisty L. S. Shapley’a w 1951 roku.
Co do korzyści, to poza osobistą przygodą intelektualną i satysfakcją ze współpracy uczestniczę w dorobku Wydziału Matematyki i Informatyki, który od 3 lat jest moim miejscem pracy. Nasz zespół opublikował od 2020 roku cykl 11 publikacji w prestiżowych czasopismach JCR o łącznym IF 48,7 i 1350 pkt MNiE.
Jak w praktyce wykorzystywał pan metody sztucznej inteligencji?
Zdałem sobie np. pytanie: czy coraz częściej pojawiające się zimy ze stosunkowo wysoką temperaturą i niezamarzającymi jeziorami powodują wzrost czy spadek biomasy zooplanktonu (skorupiaków)? Intuicja podpowiada, że cieplejsza woda sprzyja wzrostowi planktonu. Tak dzieje się w otwartych wodach mórz i oceanów. Model SHAP wykazał jednak, że w zbiornikach śródlądowych mechanizm może być inny. Tu dostępne w wodzie składniki pokarmowe bardzo szybko „wyłapuje” zanurzona roślinność naczyniowa, blokując ich dostępność dla fitoplanktonu i tym samym „głodząc” zooplankton, zmniejszają jego biomasę. I dlatego w takich jeziorach nie mamy na wiosnę zakwitu glonów, ale „podwodny las”. Było to do zaobserwowania np. w Jeziorze Długim w Olsztynie w roku 2023 po bardzo łagodnej zimie.
Drugi przykład pochodzi z Zalewu Wiślanego, którego wieloletnim problemem jest słaba jakość wody wykluczająca np. jej funkcje rekreacyjne. Oscyluje ona na granicy eutrofii i hipertrofii, czyli wody przeżyźnionej i nadmiernie przeżyźnionej. Granicą między tymi dwoma stanami jest określone stężenie „chlorofilu a”. Jest on wskaźnikiem stężenia komórek sinic. Model SHAP pozwolił mi ocenić wpływ kilkunastu parametrów wody na prognozowanie przekroczenia granicy hipertrofii i na wykazanie „powrotu” z tego stanu do nieco czyściejszej wody. SHAP umożliwia formułowanie wniosków nie tylko dla całego zbiornika wodnego, ale również, dla każdego punktu badawczego na nim.
Badał pan wody sam, czy korzystał z wyników prac innych naukowców?
Publikacje oparte na uczeniu maszynowym i modelowaniu sieci w ekologii wód muszą mieć swą przyrodniczą bazę. Dlatego opracowując potrzebne mi algorytmy, współpracowałem z prof. Ewą Paturej i dr hab. Anną Goździejewską z Instytutu Inżynierii i Ochrony Środowiska Wydziału Geoinżynierii, prof. Joanną Pakulnicką z Wydziału Biologii i Biotechnologii. To wybitne ekolożki i autorki baz danych z nawet kilkudziesięciu lat badań. Współtworzenie z nimi prac do publikacji zawsze odbywa się na zasadzie dyskusji nad interpretacją wyników modelowania i ich przydatnością do poszerzenia wiedzy ekologicznej. Prof. Piotr Artiemjew z Wydziału Matematyki i Informatyki, jako doświadczony matematyk i informatyk, pełni rolę konsultanta m. in. w moich „bojach” z modelami i językiem programowania Python.
Kto jeszcze podobnie jak pan podchodzi do ekologii wody?
Głównie Amerykanie i Chińczycy. Od nich też najczęściej otrzymuję propozycje publikowania, recenzji i udziału w konferencjach.
Rozmawiał Lech Kryszałowicz
Dr hab. Marek Kruk, prof. UWM jest ekologiem. Na UWM pracuje od 1994 roku, wcześniej związany był z Instytutem Ekologii PAN. Jego dorobek obejmuje prace z biogeochemii torfowisk, ekologii wód przybrzeżnych i jezior, monitoringu jakości wód za pomocą teledetekcji satelitarnej. W ostatnich latach zajął się analizą danych z zakresu ekologii wód, stosując innowacyjne metody oparte na teorii sieci i uczeniu maszynowym.