Etykietowanie w radiologii

Etykietowanie w radiologii
Jeżeli dane nazywane są złotem, to etykietowane dane są złotem najwyższej próby - górnolotnie, ale nie ma w tym przesady.

Etykietowanie lub zapożyczone z j. angielskiego anotowanie (‚annotate’), oznacza „opatrywanie komentarzem lub znacznikiem” [1]. Wśród synonimów znajdziemy także określenia takie jak „znakowanie”, „tagowanie”, „katalogowanie”, „indeksowanie” czy „kategoryzowanie”, „oznaczanie”.

Po co etykietujemy zbiory danych? Perspektywa technik uczenia maszynowego

Zainteresowanie ludzkości sztuczną inteligencją wynika z potrzeby automatyzowania czynności, które trudno opisać algorytmem. Bardzo łatwo opisać algorytm parzenia czarnej herbaty: zagotuj wodę, wrzuć torebkę herbaty, poczekaj 5 min, gotowe. Natomiast czy da się opisać zbiorem konkretnych kroków cały proces rozpoznania zmian ogniskowych na zdjęciach rtg płuc? Jest to niemożliwe, ale z pomocą przychodzą techniki uczenia maszynowego - gdy pokażemy im np. 10 000 przykładów danej patologii to oczekujemy, że same zauważą pewne cechy wspólne dla tych zmian. Jakie to cechy? To zazwyczaj pozostawiamy już trenowanemu modelowi (chociaż i w tej kwestii coraz szerzej mówi się o “wyjaśnialności” modeli, tj przejrzystemu określeniu parametrów, na podstawie których model podjął taką, a nie inną decyzję). Gdy pokażemy wytrenowanemu modelowi kolejny, 10 001 przykład, to model będzie w stanie określone zmiany w nim rozpoznać (lepiej lub gorzej, ale to temat na kolejny odcinek).

Etykietowanie w radiologii

W kontekście radiologii i diagnostyki obrazowej najczęściej mówi się o etykietowaniu obrazów (np. klasyfikacja zdjęć rtg klatki piersiowej jako zdrowe lub chore, z określeniem kategorii choroby; segmentacja struktur anatomicznych i zmian patologicznych poprzez zaznaczenie bezpośrednio w badaniu, np. guzków w badaniu TK klp; oznaczenia obrysu struktury lub w postaci ramki otaczającej zmianę - tzw. bounding-box), ale coraz częściej podkreśla się też rolę analizy tekstu (analogicznie do w/w, oznaczanie badań na podstawie opisów - również klasyfikacja zdrowy / chory, czy strukturyzowanie opisów, tj układanie wprowadzanego tekstu w strukturę zrozumiałą dla systemów informatycznych, co umożliwia ich dalszą analizę).

Etykietowanie wykonywane jest w sposób automatyczny lub ręczny

Sposób automatyczny jest szybszy, ale wymaga specjalistycznego oprogramowania, które zwykle dobrze radzi sobie z przypadkami łatwymi, ale często ma duże problemy z przypadkami trudnymi (doskonałym przykładem jest oznaczanie zakresu płuc w badaniach TK - oprogramowanie prawidłowo zakreśla obszar płuca zdrowego, natomiast płuco chore, z niedodmą, guzem, konsolidacjami, zwłaszcza położonymi obwodowo - często oznaczane jest nieprawidłowo, bez obszarów patologicznych, lub wręcz przeciwnie - z zaznaczeniem obszarów znajdujących się poza płucem, takich jak ściana klatki piersiowej - wynika to oczywiście z podobnej densyjności tych obszarów). Do automatycznej anotacji obrazów coraz częściej wykorzystywana jest sztuczna inteligencja (np. CNN - splotowe sieci neuronowe).

Ręczne oznaczanie wykonywane jest przez ekspertów dziedzinowych - w przypadku badań obrazowych mówimy tu oczywiście o radiologach. Dla ścisłości należy podkreślić, że takie etykietowanie również wymaga wykorzystania narzędzi (odpowiednie oprogramowanie), a także potrafi sprawić spore trudności (jak wspomniane wyżej patologie znajdujące się przy ścianie klatki piersiowej - trudno rozpoznać i zaznaczyć rzeczywistą granicę pomiędzy patologicznie zmienionym płucem a ścianą klp), do tego dochodzi aspekt czasu (trudne przypadki są czasochłonne). Niemniej jest to ciekawa opcja dla lekarzy interesujących się nowymi technologiami, aby rozpocząć przygodę z projektami wykorzystującymi sztuczną inteligencję.
Który sposób jest lepszy? Odpowiedź nie jest łatwa, ale to temat na osobny odcinek.

P.S. Lekarzy zainteresowanych projektami wykorzystującymi sztuczną inteligencję zapraszamy do kontaktu contact@upmedic.io

  1. https://sjp.pwn.pl/poradnia/haslo/Anotowac-anotacja-adnotacja;17958.html