Naslov diplomskega dela: Odkrivanje globokih ponaredkov z video transformerji
Povzetek:
V diplomski nalogi se soočamo s problematiko odkrivanja lažnih posnetkov. Lažni posnetki se na spletu pojavljajo vse pogosteje in z uporabo tehnologije globokih ponaredkov (angl. Deepfakes) za ustvarjanje teh posnetkov postajajo tudi tako prepričljivi, da lahko pretentajo ljudi. Cilj globokih ponaredkov je velikokrat širjenje dezinformacij ali omadeževanje ugleda znane osebe. Za namen računalniškega prepoznavanja globokih ponaredkov predstavimo dva sorodna pristopa, ki temeljita na arhitekturi transformerjev in delujeta na osnovi posnetka, za razliko od drugih metod, ki delujejo na osnovi posameznih slik. Imenujeta se Video Vision Transformer (ViViT) in UniFormerV2. Modele teh pristopov smo naučili na podatkovnih zbirkah globokih ponaredkov FaceForensics++ in Celeb-DF-v2. Preizkusili smo tudi zmogljivost modelov na testnem naboru iz zbirke DFDC. S temi modeli smo dosegli rezultate, ki so primerljivi tudi z dosedaj najboljšimi na tem področju. V okviru diplomske naloge opišemo še našo metodologijo, tehnologijo uporabljenih modelov in podrobnosti implementacije. Predstavimo tudi podrobne rezultate, eksperimente ter primerjavo z drugačnimi pristopi pri odkrivanju globokih ponaredkov.
Mentor: prof. dr. Peter Peer
Somentor: viš. pred. dr. Borut Batagelj
Komisija za zagovor:
doc. dr. Žiga Emeršič (predsednik),
prof. dr. Peter Peer (mentor),
doc. dr. Luka Šajn (član).
Prostor: Diplomska soba