22.
jan
Zagovor magistrskega dela - Rok Zidarn
ob 09:15

Naslov dela: Avtomatsko povzemanje slovenskih besedil z globokimi nevronskimi mrežami

Povzetek: Povzemanje besedil naslavlja problem naraščujoče količine tekstovnih podatkov, v katerih želimo odkrivati pomembne informacije, npr. med raziskovanjem dokumentov želimo proces izbire poenostaviti in se odločati le na podlagi povzetkov. V delu smo se posvetili problemu povzemanja slovenskih besedil. Naš cilj je generiranje kvalitetnega in berljivega povzetka. Problema smo se lotili z uporabo globokih nevronskih mrež in arhitekture zaporedje v zaporedje. Razvili smo devet modelov, ki se razlikujejo po tipu rekurenčnih celic, številu rekurenčnih celic, številu nivojev in dodatnih mehanizmih, kot sta mehanizem pozornosti in mehanizem kopiranja. Uspešnost povzemanja smo evalvirali z metrikama ROUGE in BERTScore. Med trenutno obstoječimi slovenskimi povzemalniki naš najuspešnejši model dosega najboljše rezultate.

Termin zagovora: sreda, 22. 1. 2020, ob 9.15 v diplomski sobi

Mentor: prof. dr. Marko Robnik Šikonja

Komisija za oceno in zagovor:

-  prof. dr. Branko Šeter, predsednik,

-  Gašper Fijavž, član,

-  prof. dr. Blaž Zupan, član.