Rad Marie Brbić i Ivice Koprive među 1% najcitiranjih radova
Znanstveni rad Marie Brbić i Ivice Koprive "Multi-view Low-rank Sparse Subspace Clustering", objavljen u časopisu Pattern Recognition, je u bazi Web-of-Science kategoriziran kao highly cited paper. Rad se sa 106 citata nalazi se u vodećih 1% radova po citiranosti u kategoriji Engineering.
Znanstveni rad je bio rezultat istraživanja doktorandice Marie Brbić u okviru istraživačkog projekta Hrvatske zaklade za znanost voditelja dr.sc. Ivice Koprive, IP-2016-5235: Strukturne dekompozicije empirijskih podataka za računalno potpomognutu dijagnostiku bolesti.
Originalan znanstveni doprinos rada je u razvoju algoritama za grupiranje podatka generiranih iz više pogleda. Radi se o jednom od temeljnih problema u računalnim znanostima u kojem se na nenadzirani način podaci temeljem sličnih osobina grupiraju u skupine. Više pogleda predstavljaju podatke iz različitih perspektiva, a zadatak algoritama je da informacije iz više pogleda iskoriste u procesu učenja.
Razvoj ovakvih algoritama je važan zbog velikih količina podataka koji se zbog ubrzanog razvoja tehnologije generiraju u sve više različitih područja. Praktično važna primjena ovih algoritama je u suvremenoj medicini gdje se različitim postupcima prikupljaju vrlo heterogeni skupovi podataka. Jedan primjer odnosi se na međusobno registrirane slikovne podatke prikupljene PET, CT i MR kamerama.
Temeljem takvih podataka moguće je precizno lokalizirati tumorske lezije što je važno u praćenju učinaka terapije. Ovaj koncept je ilustriran na slici koja se odnosi na problem iz računalne patologije: segmentacija na razini slikovnog elementa slike smrznute sekcije adenokarcinoma debelog crijeva u jetri. Tri pogleda čine originala slika histopatološkog preparata, te njene dvije verzije dobivene normalizacijom boje u odnosu na dvije referentne slike.
Ilustracija postupka grupiranja podataka generiranih iz više pogleda na primjeru segmentacije slike smrznutog preparata adenokarcinoma debelog crijeva u jetri (D. Sitnik, et. al, Biomed. Sig. Proc. Cont.). Originalna slika i dvije slike normalizirane bojom u odnosu odabrane referentne slike predstavljaju podatke iz tri pogleda. Algoritam grupira slikovne elemente u skupine, od kojih je prikazane skupina koja predstavlja adenokarcinom. Dijagnoza dobivena usaglašavanjem patologa dana je za usporedbu.
Na teorijskoj razini doprinos rada je u formulaciji optimizacijskog problema za učenje reprezentacije zajedničke svim pogledima uz strukturna ograničenja niskog ranga i rijetkosti. Time se uči reprezentacija koja sadrži informacije o globalnom (nizak rang) i lokalnom (rijetkost) karakteru prikupljenih podataka.
Za matricu reprezentacije je ključno da dobro odražava odnose među podacima. Vrijednost koeficijenta koji mjeri sličnost među podacima koji pripadaju istoj skupini mora biti velika, a među podacima koji pripadaju različitim skupinama mala. Sam postupak grupiranja se svodi na grupiranje singularnih vektora Laplaceove matrice koja se izvodi iz matrice sličnosti.