Metode umetne inteligence za odkrivanje znanj v funkcijski genomiki

Naročnik (šifra): ARRS (BI-IT/05-08-011)
Tip projekta: Bilateralni projekt
Trajanje projekta: 2006 - 2009


Od vseh vprašanj, o katerih znanstveniki pogosto razmišljamo, je to o nastanku življenja in naravi živih bitij najbrž najpogosteje zastavljeno. Kljub nedavnim napredkom v molekularni biologiji in bioinformatiki smo šele na začetku odkrivanja neverjetne kompleksnosti živih organizmov. Glavna iziva sodobne biologije sta določitev funkcije genov in odkrivanje genetskih mrež. Današnja funkcijska genomika se ukvarja predvsem z odkrivanjem funkcije vseh genov genoma, opazovanjem organizma, njegovih elementov in interakcij le-teh kot celote. Iziv biologom so izumi na področju visoko-prepustnih eksperimentalnih tehnik, ki omogočajo merjenje in zbiranje velike množice podatkov hkrati, zbrane podatke pa potem posredujejo podatkovnim analitikom – informatikom, da razvijejo in uporabijo specializirane tehnike odkrivanja zakonitosti in znanja v podatkih.

V projetku sodelujemo s skupino dr. Riccarda Bellazzija, ki vodi Laboratorij za bioinformatiko na Univerzi v Pavii. Sodelovanje obsega razvoju tehnik umetne intelligence za podporo odkrivanja znanja v funkcijski genomiki. Osnova našega sodelovanja so pretekle izkušnje v analizi časovnih podatkov (Pavia) in raziskave o gradnji regulatornih genetskih mrež ter analizi izražanja genov in zaporedij DNA (Ljubljana). Pri delu uporabljamo različne metode s področja strojnega učenja, kot so časovna abstrakcija, abduktivno in induktivno sklepanje, ter sklepanje o kvalitativnih genetskih mrežah.

Poleg teoretičnea razvoja novih metod nameravamo v projektu razviti praktična in splošno uporabna orodja ter te ponuditi raziskovalni sferi v obliki odprto-kodnih programskih komponent znotraj ogrodja za strojno učenje Orange. Razvite metode bomo na področju funkcijske genomike uporabili za določanje genov in odkrivanje genskih mrež za kvasovko S. cerevisiae in amebo D. dictyostelium. V te namene bomo v projektu uporabili obstoječe in prosto dostopne zbirke podatkov o zaporedju DNA, izražanju genov ter razpoložljivi funkcijski razlagi. Glavni cilj projekta je uporaba razvitih metod obeh partnerjev z namenom uvajanja novih pristopov, ki omogočajo gradnjo genskih regulacijskih mrež iz eksperimentalnih podatkov za celotni genom, kar je tudi glavni izziv današnje bioinformatike.