Podrobno

Spodbujevano učenje avtonomnih agentov v videoigri
ID Ciglar, Miha (Avtor), ID Sadikov, Aleksander (Mentor) Več o mentorju... Povezava se odpre v novem oknu

.pdfPDF - Predstavitvena datoteka, prenos (1,13 MB)
MD5: 6BA6E9AB4347DEB58F36281872DDF90B

Izvleček
V diplomski nalogi preučujemo uporabo spodbujevanega učenja za učenje agentov v 2D igri, ki znano igro Flappy Bird razširi s predmeti, inventarjem, izstrelki in sovražniki. Za učenje izberemo algoritem proximal policy optimization (PPO), predstavimo njegove teoretične osnove in utemeljimo njegovo izbiro za dinamična okolja, ki se hitro spreminjajo. Praktični del zajema pripravo učnega okolja, opazovanj in akcij, sistem nagrajevanja, nevronsko mrežo ter nastavitve hiperparametrov. Učenje poteka postopoma po fazah, z naraščajočo zahtevnostjo za agenta. Rezultati potrjujejo uspešnost pristopa s stabilnim učenjem in smiselnim vedenjem ter izpostavljajo izzive pri uporabi spodbujevanega učenja v hitrih, dinamičnih igrah.

Jezik:Slovenski jezik
Ključne besede:spodbujevano učenje, proximal policy optimization (PPO), avtonomni agenti, umetna inteligenca v videoigrah
Vrsta gradiva:Diplomsko delo/naloga
Tipologija:2.11 - Diplomsko delo
Organizacija:FRI - Fakulteta za računalništvo in informatiko
Leto izida:2025
PID:20.500.12556/RUL-173314 Povezava se odpre v novem oknu
COBISS.SI-ID:253380611 Povezava se odpre v novem oknu
Datum objave v RUL:15.09.2025
Število ogledov:180
Število prenosov:41
Metapodatki:XML DC-XML DC-RDF
:
Kopiraj citat
Objavi na:Bookmark and Share

Sekundarni jezik

Jezik:Angleški jezik
Naslov:Reinforcement learning for autonomous agents in a video game
Izvleček:
This thesis investigates reinforcement learning for training autonomous agents in a custom 2D side-scrolling game that extends Flappy Bird with items, an inventory system, bullets, and enemy agents. We employ proximal policy optimization (PPO), reviewing its theoretical foundations and justifying its selection for dynamic, fast-paced gameplay environments. The practical part documents environment modelling, observation and action design, reward shaping, network architecture, and hyperparameter choices, together with a curriculum that incrementally introduces more demanding tasks for the player agent. Experiments demonstrate overall stable learning and meaningful in-game behaviour while highlighting the challenges of continual, multi-objective training in fast real-time games.

Ključne besede:reinforcement learning, proximal policy optimization (PPO), autonomous agents, video game AI

Podobna dela

Podobna dela v RUL:
Podobna dela v drugih slovenskih zbirkah:

Nazaj