• Preprosta rešitev za povezovanje biomedicinskih podatkov
Novice

Gregor Pavlin Poličar je razvil odprtokodno knjižnico, ki omogoči enostavno uporabo podatkov iz različnih virov. Ta se je med drugim izkazala za zelo uporabno pri povezovanju biomedicinskih podatkov, ki so nastali v različnih laboratorijih. Za svoje magistrsko delo, v katerem je opisal to rešitev, je prejel univerzitetno Prešernovo nagrado. Tudi po uspešno zaključeni prvi in drugi stopnji študija računalništva in informatike ostaja na Fakulteti za računalništvo in informatiko, kjer na doktorskem študiju nadaljuje raziskave na področju strojnega učenja.


Zakaj si se po srednji šoli odločil za študij računalništva?

Računalniki so me zanimali že od malih nog, ampak bolj resno sem se z računalništvom začel ukvarjati proti koncu gimnazije, ko sem začel programirati. Sprva je bilo vse skupaj bolj za zabavo in s prijatelji nismo naredili nič resnega, vendar je služilo kot dober uvod. Že takrat in pozneje tudi na fakulteti sem želel postati programer. Precej me je zanimala tudi biologija in zdaj, ko se ukvarjam z bioinformatiko, se spet lahko nekoliko pozabavam z učenjem biologije. Matematika me nikoli ni tako pritegnila, zato sem se sprva hitro odpovedal bolj zahtevnim temam, kot sta strojno učenje in umetna inteligenca.

 

Kaj ti je najbolj všeč pri študiju na FRI?

Ker sem zelo aplikativno usmerjen so se mi zdeli nekateri teoretični in matematični predmeti nepotrebni, dokler nisem v zadnjem letniku prve stopnje izbral predmeta “Uvod v umetno inteligenco” pri prof. dr. Blažu Zupanu, kjer sem spoznal, kako lahko z matematiko in teorijo zgradimo zares zanimive in koristne sisteme, ki lahko delajo vse mogoče, od prepoznavanja mačk na fotografijah do generiranje novih skladb v stilu Mozarta. Ker sem bil popolnoma navdušen, sem prosil prof. dr. Zupana, če bi bil moj mentor pri diplomski nalogi. Na magistrskem študiju sem se nato usmeril v strojno učenje in začel sodelovati z Laboratorijem za bioinformatiko.

 

Za magistrsko delo z naslovom »Dodajanje primerov v referenčno vložitev t-SNE odstrani razlike med različnimi podatkovnimi viri« si prejel najvišje univerzitetno priznanje za dosežke študentov. Nam lahko na kratko pojasniš, kaj si raziskoval?

Moja magistrska naloga se je pravzaprav začela kot majhen projekt za programsko okolje Orange, ki ga razvijamo v Laboratoriju za bioinformatiko. Želeli smo dopolniti priljubljeno metodo t-SNE, ki je namenjena vizualizaciji visoko razsežnih podatkov tako, da bi lahko te vizualizacije ponovno uporabili, če bi dobili nove podatke. To razširitev smo želeli vgraditi v Orange, zato sem algoritem in našo razširitev zapakiral v Python knjižnico openTSNE. Očitno je bila implementacija na mestu, saj je knjižnico zelo hitro začelo uporabljati na tisoče uporabnikov po celem svetu. Istočasno smo v laboratoriju delali tudi razne analize podatkov genskih ekspresij, kjer je eden od glavnih izzivov sočasna vizualizacija in analiza podatkov iz različnih laboratorijev. Opazili smo, da s to našo enostavno razširitvijo lahko rešimo to težavo in pripravimo informativne vizualizacije. Ker je to zelo aktualen problem na področju bioinformatike, smo kasneje napisali tudi članek in delo predstavili na mednarodni konferenci Discovery Science.

 

Kaj so najbolj zanimivi zaključki tvoje raziskave? Koliko so uporabni v praksi?

Meni je bilo pravzaprav najbolj zanimivo to, da lahko s tako enostavno razširitvijo rešimo tako velik problem. Produkti moje raziskave se že uporabljajo v praksi. Razvita knjižnica openTSNE je odprtokodna in ima na tisoče uporabnikov po celem svetu. Nameščena je bila več kot 75.000-krat. Metodo za reševanje težav z različnimi podatkovnimi zbirkami smo predstavili na konferenci in jo bomo kmalu začeli vgrajevati v paket scanpy, ki je najbolj priljubljena Python knjižnica za analizo podatkov genskih ekspresij. Vse skupaj smo pa seveda že vgradili v Orange, ki ga vsak dan uporablja več tisoč uporabnikov.

 

Kaj si želiš početi po študiju?

Zaenkrat nimam točno začrtane poti, a prav gotovo bi želel nadaljevati z raziskovalnim delom na področju strojnega učenja in bioinformatike. Kljub temu, da se povprečen človek že danes zanaša na inteligentne sisteme, vidim še ogromen potencial, ki bo ljudem še dodatno olajšal življenje.

 

Imaš nasvet za dijake in dijakinje, ki se vpisujejo na fakulteto?

Ne bojte se težkih predmetov in vse te matematike. Sam prva tri leta nisem pričakoval, da bom večino tega kadarkoli potreboval, vendar je potreben en sam trenutek, da se vse poveže. V času študija sem se zagotovo največ naučil iz sodelovanja z laboratorijem, zato vsem priporočam aktivno sodelovanje na različnih projektih v laboratorijih. Tako boste še dodatno razširili pridobljeno znanje.

 

Vse, ki vas zanima študij računalništva in informatike, vabimo na informativne dneve, ki bodo v petek, 14. februarja, ob 11.00 in 15.30 ter v soboto, 15. februarja, ob 10.00 na Fakulteti za računalništvo in informatiko, Večna pot 113, Ljubljana. Več si lahko preberete na strani Bodoči študenti, kjer so na voljo opisi študijskih programov in pomembni datumi.

Vabljeni!

 

Fotografija (na vrhu): prof. dr. Blaž Zupan (mentor), Gregor Pavlin Poličar (univerzitetni Prešernov nagrajenec), izr. prof. dr. Mojca Ciglarič (dekanja UL FRI)