Naslov diplomskega dela: Spodbujevano učenje na impulznih nevronskih mrežah
Povzetek:
V diplomskem delu obravnavamo spodbujevano učenje na impulznih nevronskih mrežah, ki se obnašajo podobno kot človeški možgani. Predstavimo in rešimo ključne izzive učenja impulznih mrež ter razvijemo rešitve, ki upoštevajo tako biološko smiselnost kot zahtevnost simulacije. S prilagoditvijo klasične oblike sinapse, odvisne od nagrajevanja in časovne razporeditve impulzov (R-STDP), omogočimo učinkovito učenje in dodeljevanje zaslug preteklim odločitvam, pri čemer ohranimo osnovni princip R-STDP, kjer sinapse kodirajo vpliv pretekle aktivnosti nevronov na izbrane akcije brez uvedbe negativnih nagrad ali nerealističnih mehanizmov.
Razviti sistem razširimo v arhitekturo akter-kritik, ki omogoča reševanje problemov z zakasnjenimi nagradami s prenosom pričakovane nagrade iz cilja v prejšnja stanja. Sistem ovrednotimo na poenostavljenih in nato na kompleksnejših nalogah, kot sta igra Pong in problem mrežnega sveta (gridworld). V igri Pong rezultati kažejo postopno daljše sekvence igranja brez zgrešitve žogice, v nalogi mrežnega sveta pa postopno izboljševanje strategije in krajšanje poti do cilja.
Mentor: prof. dr. Zoran Bosnić
Komisija za zagovor:
doc. dr. Žiga Emeršič (predsednik),
prof. dr. Zoran Bosnić (mentor),
doc. dr. Blaž Meden (član).
Prostor: Predavalnica 18