J6-2581 - Računalniško podprta večjezična analiza novičarskega diskurza s kontekstualnimi besednimi vložitvami

Zmožnost analize, razumevanja in interpretacije medijskega poročanja je v današnjem svetu pomembnejša kot kadarkoli prej. Razmah spletnih vsebin, dnevna izpostavljenost napačnim informacijam in pristranemu poročanju, je povzročila upad zaupanja v konvencionalne novičarske medije in posledično na vedno večji vpliv lažnih novic iz nepreverjenih virov in družbenih medijev.

Metode kvalitativne analize diskurza so bile razvite z namenom razkrivanja pristranosti, gledišč in interesov posameznih

družbenih akterjev ter tehnik konstrukcije diskurza, vendar imajo v času množične produkcije vsebin omejeno uporabnost zaradi kompleksnosti in časovne potratnosti ročne analize. Na drugi strani so bile v zadnjem času razvite učinkovite metode za avtomatsko

obdelavo naravnega jezika, ki lahko v kratkem času obdelajo in kategorizirajo množico tekstov na veliko različnih načinov. Te metode pa so le redko uporabljene za potrebe kritične analize diskurza, poleg tega pa so slabše razvite za manj zastopane jezike, kot je tudi slovenščina.

V projektu bomo prilagodili obstoječe in razvili nove metode za procesiranje naravnega jezika za področje analize diskurza in za slovenščino. Nove metode, razvite v sodelovanju računalniških in korpusnih jezikoslovcev z raziskovalci s področja analize diskurza, bodo omogočale identifikacijo diskurzivnih fenomenov, podporo večjezični analizi novic in razvoj orodij za vizualizacijo novic, ki bodo pospešila ročno analizo in povečala kvaliteto raziskav.

Projekt je razdeljen v pet faz:

·Anotiranje novic

·Razvoj metod za diahrono analizo novic

·Razvoj metod za primerjalno analizo novic

·Razoj metod za zaznavanje metafor in metonimij

Uporaba metod v razlicnih demonstrativnih primerih, ki prikazujejo, kako enojezične in medjezične metode obdelave naravnega jezika pomagajo pri kriticni analizi diskurza.

Bibliografske reference:

KOLOSKI, Boshko, STEPIŠNIK PERDIH, Timen, ROBNIK ŠIKONJA, Marko, POLLAK, Senja, ŠKRLJ, Blaž (2022). Knowledge graph informed fake news classification via heterogeneous representation ensembles. Neurocomputing.

Martinc M, Novak P. K, Pollak S (2019). Leveraging contextual embeddings for detecting diachronic semantic shift.

McGregor S, Agres K, Rataj K, Purver M, Wiggins G (2019). Re-representing metaphor: Modeling metaphor perception using dynamically contextual distributional semantics. Frontiers in Psychology, 10:765.

MIOK, Kristian, ŠKRLJ, Blaž, ZAHARIE, Daniela, ROBNIK ŠIKONJA, Marko (2022). To BAN or not to BAN: Bayesian attention networks for reliable hate speech detection. Cognitive computation.

Sodelavci na projektu