Naslov diplomskega dela: Razvoj dinamičnega programa za gručenje podatkov in detekcijo anomalij z knjižnico ML.NET in storitvijo Azure OpenAI
Povzetek:
Razvoj umetne inteligence in strojnega učenja je bistveno poenostavil analizo podatkov. Ob sočasnem eksponentnem porastu količine podatkov v podjetjih se pojavlja potreba po avtomatiziranih rešitvah, ki lahko nadomestijo ročno analizo. V okviru te diplomske naloge je bil razvit dinamičen sistem za gručenje podatkov in detekcijo anomalij, ki temelji na algoritmu razvrščanja z voditelji (angl. \textit{K-Means}) ter knjižnici ML.NET. Sistem omogoča avtomatsko pripravo podatkov, normalizacijo z različnimi pristopi (npr. min-max normalizacija in robustno skaliranje), iskanje optimalnega števila gruč z metodo komolca in silhuetno metodo ter zaznavanje odstopanj z metodo PCA. V sklepni fazi so bili rezultati interpretirani s pomočjo velikega jezikovnega modela GPT-4o preko platforme Azure OpenAI, kar omogoča boljše razumevanje vzorcev v podatkih. Rešitev je bila preizkušena na realnih anonimiziranih podatkih farmacevtskega podjetja.
Mentorica: doc. dr. Vida Groznik
Komisija za zagovor:
izr. prof. dr. Iztok Lebar Bajec (predsednik),
doc. dr. Vida Groznik (mentorica),
izr. prof. dr. Aleksander Sadikov (član).
Prostor: Predavalnica 2