Učni načrt za spodbujevano učenje v vizualnem sledenju

Hostnik, Marko

Učni načrt za spodbujevano učenje v vizualnem sledenju
ID Hostnik, Marko (Avtor), ID Čehovin Zajc, Luka (Mentor) Več o mentorju... Povezava se odpre v novem oknu

PDF - Predstavitvena datoteka, prenos (6,55 MB)
MD5: 4276E8ECF75A4044C8B68C9BC25A19EF

Izvleček

V nalogi obravnavamo problem vizualnega sledenja objektom, ki ga združimo z uporabo metode s področja spodbujevanega učenja in učenja z učnim načrtom. Implementiramo sledilnik ADNet, ki iterativno izbira akcije, s katerimi sledi objektu. Sledilnik učimo z metodo gradienta strategije in predlagamo izboljšave učenja. Predvsem izboljšamo funkcijo nagrade in stabilnost učenja. Predlagan učni načrt sestavimo iz postopoma težjih umetnih sekvenc slik objektov in ozadij na podlagi dveh domen umetnih objektov. Koristnost učnega načrta na hitrost in uspeh učenja eksperimentalno potrdimo. Pristop primerjamo z uporabo učenja iz ekspertnih demonstracij in ugotovimo, da oba pristopa dosežeta primerljivo dobre rezultate. Uspešni rezultati odpirajo možnosti za nadaljnji razvoj na področju učnih načrtov in uporabe umetnih sekvenc v vizualnem sledenju.

Jezik:	Slovenski jezik
Ključne besede:	vizualno sledenje, spodbujevano učenje, učni načrt, računalniški vid
Vrsta gradiva:	Diplomsko delo/naloga
Tipologija:	2.11 - Diplomsko delo
Organizacija:	FRI - Fakulteta za računalništvo in informatiko FMF - Fakulteta za matematiko in fiziko
Leto izida:	2021
PID:	20.500.12556/RUL-129728
COBISS.SI-ID:	76164099
Datum objave v RUL:	07.09.2021
Število ogledov:	826
Število prenosov:	182
Metapodatki:
:	Kopiraj citat
Objavi na:

Sekundarni jezik

Izvleček:
Jezik:	Angleški jezik
Naslov:	Learning curriculum for reinforcement learning in visual tracking
The thesis addresses the problem of visual object tracking in combination with reinforcement learning methods and the usage of a learning curriculum. We implement the tracker ADNet, which iteratively picks actions to pursue objects. The tracker is trained using a policy gradient method for which we propose certain improvements, especially addressing the reward function and learning stability. The proposed curriculum is constructed from synthetic sequences gradually increasing in difficulty within two domains of synthetic objects. We experimentally show the benefits of using a curriculum on the speed and success of convergence. We compare the proposed method with learning from expert demonstrations and conclude that both methods yield similar results. The promising results from our work lead to further research in the field of curriculum learning and the use of synthetic sequences in visual object tracking.
Ključne besede:	visual object tracking, reinforcement learning, curriculum learning, computer vision

Podobna dela

Podobna dela v RUL:
Podobna dela v drugih slovenskih zbirkah:

Nazaj