Ozko grlo novih genomskih tehnologij je analiza podatkov. Moderni biomedicinski laboratoriji so sposobni pridobiti velike količine podatkov s pomočjo raznovrstnih eksperimentalnih platform. Biomedicinska interpretacija podatkov se običajno prične z iskanjem zanimivih podmnožic genov, proteinov ali povezav med njimi. Raziskovalci želijo te primerjati z obstoječimi anotacijami in ontologijami, izvesti analizo obogatenosti genskih oznak, poiskati podobne eksperimente javno dostopnih bazah, poiskati sorodne ugotovitve iz literature, razvrstiti izide glede na obstoječe anotacije v publikacijah, poiskati med seboj poveze genov, tvoriti hipoteze in te preveriti na prvotnih in novi eksperimentalnih podatkih.
V projektu bomo razvili ogrodje nove generacije programske opreme za analizo podatkov, ki vključuje spletne bioinformatične aplikacije ter skriptno okolje in okolje z vizualnim programiranjem za celovito, integrativno analizo genomskih podatkov. Pri tem bomo uporabili našo ekspertizo in znanja s področja odkrivanja znanj iz podatkov, a z vizijo splošne uporabnosti v biomedicini. Ogrodje bo biologom omogočalo izvajanje naprednih analiz preko vizualne analitike in interaktivnega raziskovanja podatkov, brez posebnega potrebnega predznanja o programiranju. Prav tako bo razvijalcem omogočalo preko uporabe obstoječih komponent lažje sestavljati nove postopke in povezovati podatke in znanja s samo nekaj vrsticami programske kode. Ogrodje bo temeljilo na odprtokodnem programju in bo razvito na inovativni programski arhitekturi načrtovani z ozirom na hitrost, prilagodljivost in enostavnost. Projekt bo razvil in uporabil FLASH komponente za interaktivne spletne aplikacije, pristop vizualnega programiranja, podatkovno analitiko, interaktivne vizualizacije, strežniško skladišča predobdelanih podatkov in sodobne skriptne jezike.