GORBI: Web aplikacija za predviđanje funkcionalnog konteksta proteina
Pristup moderne molekularne biologije razumijevanju složenih bioloških sustava temelji se na proučavanju djelovanja mnoštva njihovih zasebnih komponenti. Međutim, potrebne su opsežne eksperimentalne studije za identifikaciju funkcija samo jednog od desetina tisuća proteina u njegovom staničnom okruženju. Čak je i za dobro poznate modelne organizme funkcija mnogih proteina jos uvijek nepoznata. Primjerice, kod kvasca Saccharomyces cerevisiae približno 20% proteina u potpunosti je nekarakterizirano, a za mnoge druge proučavane organizme taj je postotak znatno viši. Sekvenciranje čitavih genoma, kao jedna od visoko produktivnih (engl. high-throughput) molekularno bioloških tehnika, daje uvid u potpuni genetski materijal mnogih organizama i otvara vrata ulasku algoritama strojnog učenja u analizu bioloških funkcija. Strategija prenošenja funkcije proteina zasniva se na pregledavanju uzoraka koordiniranog pojavljivanja homolognih gena (engl. gene co-occurrence) kroz različite genome (Pellegrini et al, PNAS, 1999). Cilj pretrage je prepoznati skupine gena koje su pod zajedničkim selektivnim pritiskom tijekom evolucije, zbog čega se može pretpostaviti njihova funkcionalna povezanost (pregled metode: Kensche et al, J. R. Soc. Interface, 2008). Varijantu ovog pristupa, kojom su dobiveni rezultati koji će biti implementirani u web sučelje GORBI, razvili smo u suradnji sa partnerima sa Instituta Jožef Stefan, u sklopu bilateralnog hrvatsko – slovenskog projekta pod nazivom „Induktivne baze podataka u genomici i proteomici“ (prof. S. Džeroski – IJS; dr. T. Šmuc, IRB). Naglasak zajedničkog rada je na metodologiji, zbog čega vizualizacija i približavanje rezultata krajnjim korisnicima – eksperimentalnim biolozima – nisu predviđeni. Smatramo da će prezentacija dobivenih rezultata na konzistentan i intuitivan način znatno pridonijeti pravilnom usmjeravanju bioloških eksperimenata sa ciljem otkrivanja funkcije slabo opisanih proteina.