09.
dec
Zagovor magistrskega dela: Vanda Antolović
ob 11:15

Naslov magistrskega dela: Ovrednotenje in primerjava orodij za podatkovno rudarjenje in strojno učenje znotraj sistemov za upravljanje relacijskih podatkovnih baz

 

Povzetek: Razvoj podatkov in podatkovne znanosti sta začela prinašati algoritme strojnega učenja neposredno k podatkom, kar je olajšalo proces učenja in zmanjšalo možnost poškodovanja podatkov s prenosom iz sistema v sistem. V magistrskem delu smo izbrali pet kombinacij sistemov upravljanja relacijskih baz podatkov in integriranih ali polintegriranih naborov orodij za strojno učenje - Python z SQLite, Python s PostgresML, MariaDB z MindsDB, PostgreSQl z MindsDB ter Oracle z Oracle Machine Learning. Vseh pet kombinacij smo primerjali s pomočjo metrike točnosti in časa učenja, ki so ga dosegli nad sedmih naborih podatkov. MariaDB z MindsdDB je imel napočasnejši čas učenja, medtem ko MindsDB ni mogel oceniti naborov podatkov, ki vsebuje večje nize, niti izdelati kakovostnih meril za oceno regresijeskega nabora podatkov. Oracle z Oracle Machine Learning je dosegel najboljše rezulate, saj je natančno ocenil vse nabore podatkov s hitrim časom učenja. Enako sicer, velja za Python s SQLite, vendar je bilo treba podatke optimizirati in spremeniti v numerične, da je lahko Pythonova glavna knjžnica za strojno učenje Scikit-learn obdelala podatke. Glede na vse je bil ustvarjen preprost sistem za podporo odločanju, ki pomaga sprejeti odločitev, kateri nabor orodij uporabiti pri danih potrebah uporabnikov.

 

Mentor: izr. prof. dr. Matjaž Kukar

 

Komisija za zagovor:

doc. dr. Rok Rupnik, predsednik

izr. prof. dr. Dejan Lavbič, član

doc. dr. Luka Šajn, član

 

Povezava do video kanala, po katerem se bo prenašal zagovor in ga bo možno spremljati, bo dodana najkasneje na dan zagovora (predvidoma 30 minut pred terminom izvedbe zagovora) na spletni strani: https://ucilnica.fri.uni-lj.si/course/view.php?id=35