• Model za domensko specifično napovedovanje trendov na osnovi semantične bogatitve nestrukturiranih vzorcev
Naročnik: Javna agencija za raziskovalno dejavnost RS
Tip projekta: Raziskovalni projekti ARRS
Trajanje projekta: 2013 - 2016
  • Opis

Nedavni tehnološki razvoj vedno bolj uresničuje možnost napovedovanja trendov na osnovi semantične bogatitve nestrukturiranih vzorcev. Z razmahom svetovnega spleta nenehno nastajajo obsežne zbirke pretežno nestrukturiranih podatkov. Področje metodološke analize teh podatkov s ciljem zaznavanja in napovedovanja trendov pa je še slabo razvito. Da je potencial ogromen, dokazujejo presenetljivi rezultati napovedovanja trendov iz enostavnih iskanj v spletnih iskalnikih. S pomočjo Googlovih napovedi trendov so raziskovalci pokazali korelacijo med iskanji po imenih podjetij ter količino prometa na borzi ter med vsebino iskanj državljanov in gibanjem BDPja držav. Uspešno so tudi razvili pristope za določanje pričakovane stopnje inflacije in brezposelnosti ter za ocenjevanje trenutnega obsega prodaje na nivoju države ipd.

Na drugi strani je napredek pri analizi večjih količin nestrukturiranih podatkov, kar vsebina zadetkov iskanj gotovo je, pripomogel k uspešnemu pridobivanju formalnega znanja iz njih. Zaradi izobilja tovrstnih podatkov in odsotnosti ustrezne metodološke podpore pa je kljub zrelosti tehnologije zaznavanje vzorcev in napovedovanje trendov prezahtevno tako iz časovnega kot tudi finančnega vidika. Istočasno napredek na področju računalništva v oblaku, obdelave velikih količin podatkov (Big Data) in velikega števila transakcij (XTP Extreme Transaction Processing) omogoča razvoj tovrstnih rešitev brez potrebe po gradnji dragih podatkovnih centrov.

Menimo, da je mogoče izdelati avtomatiziran model, ki bo ne samo zaznaval vzorce, pač pa bo na njihovi osnovi zmogel napovedovati trende znotraj posameznih domen. Pri tem bo uporabljal metode zbiranja, analize in vzorčenja podatkov iz raznolikih virov. Vključeval bo iskanja in obiskane strani znotraj portalov, elektronska sporočila in zapise na socialnih omrežjih. Na inovativen način bo uporabljal metode statistične analize in poslovne inteligence, predvsem OLAP (OnLine Analytical Processing) in podatkovno rudarjenje (Data Mining), oba podprta s pristopi računalništva v oblaku, Big Data ter XTP. Naš pristop se naslanja na obstoječe modele pridobivanja formalnega znanja, vpeljuje pa inovativen, na konsenzu temelječ odločitveni model za zaznavanje vzorcev s pomočjo metod umetne inteligence ter izvirni matematični model napovedovanja trendov. Predlagano splošno rešitev bo mogoče prilagoditi na specifične domene, s čimer je mogoče zagotoviti večjo relevantnost in natančnost napovedi v krajšem času in z manj viri, saj predlagan pristop uporablja problemsko izbrane vhodne podatke.

Pričakovani izdelki in glavni cilji projekta, ki služijo tudi preverjanju uspešnosti projekta, so trije, in sicer:

(1) definirati splošni kontekstni model za zaznavanje vzorcev,

(2) definirati splošni kontekstni model za napovedovanje trendov,

(3) razviti prototip sistema, kot dokaz izvedljivosti predlaganega pristopa, v domenah konkretnih okolij: obrambne aktivnosti države (Ministrstvo za obrambo Republike Slovenije MORS), uporabe telekomunikacijskih storitev (Telekom Slovenije d.d.) in v primeru razširjenega projekta še porabe električne energije (Informatika d.d).

Predlagan projekt naslavlja temeljne izzive poslovne inteligence nad podatki, ki nastajajo tako znotraj organizacij kot širše v d r užbi. Analiza obstoječega dela je pokazala, da predlagan projekt predstavlja unikaten in inovativen pristop v svetovnem merilu ter

nadgrajuje spoznanja EU/FP7 projektov, v katerih sta do sedaj sodelovala prijavitelja in sodelujoči raziskovalni skupini iz EU. Za potrebe razvoja, verifikacije in validacije predlaganega modela bomo uporabili računalniški oblak Centra za računalništvo v oblaku

na UL FRI in kompetenčnega centra CLASS. Projekt vsebinsko predstavlja nadaljevanje projekta L52245 in številnih EU/FP7 projektov, v katerih sta sodelovala prijavitelja ter bo vodil v prijavo novih EU raziskovalnih projektov.