Vaš brskalnik ne omogoča JavaScript!
JavaScript je nujen za pravilno delovanje teh spletnih strani. Omogočite JavaScript ali pa uporabite sodobnejši brskalnik.
Repozitorij Univerze v Ljubljani
Nacionalni portal odprte znanosti
Odprta znanost
DiKUL
slv
|
eng
Iskanje
Brskanje
Novo v RUL
Kaj je RUL
V številkah
Pomoč
Prijava
Podrobno
Uporaba predvidevanja akcij nasprotnika pri učenju inteligentnega agenta
ID
ŠUTAR, MATIC
(
Avtor
),
ID
Lebar Bajec, Iztok
(
Mentor
)
Več o mentorju...
PDF - Predstavitvena datoteka,
prenos
(589,61 KB)
MD5: 1D670AB09EA8E40DCD7C2A8680C9561E
Galerija slik
Izvleček
V diplomskem delu so predstavljeni glavni koncepti strojnega učenja s poudarkom na spodbujevanem učenju. Osredotoča se na probleme z okolji, v katerih nastopa več agentov. Taki problemi metodam spodbujevanega učenja prestavljajo dodatne izzive. Diplomsko delo raziskuje različne načine reševanja problemov z več agenti. Predstavlja obstoječe rešitve, ki uporabljajo predvidevanje akcij nasprotnika pri učenju inteligentnega agenta. V diplomskem delu je podrobneje predstavljena metoda DRON, ki je zasnovana na osnovi globokega q-učenja. Primerjana je z osnovno metodo globokega q-učenja na izbranem okolju. V delu je predstavljena in primerjana tudi razširitev metode raziskovanja, ki temelji na radovednosti, na okolje z več agenti. Okolje je bilo implementirano v igralnem pogonu Unreal Engine 5. Predstavljena metoda raziskovanja se na koncu ni izkazala za opazno uspešnejšo od osnovne metode raziskovanja. Po drugi strani je uporaba arhitekture DRON v kombinaciji z osnovno metodo globokega q-učenja kazala na potencialno izboljšanje osnovne metode. Za konkretnejše zaključke bi morali izvesti dodatne poskuse.
Jezik:
Slovenski jezik
Ključne besede:
inteligentni agent
,
spodbujevano učenje
,
modeliranje nasprotnika
,
globoko q-učenje
,
raziskovanje okolja na podlagi radovednosti
,
unreal engine
Vrsta gradiva:
Diplomsko delo/naloga
Tipologija:
2.11 - Diplomsko delo
Organizacija:
FRI - Fakulteta za računalništvo in informatiko
Leto izida:
2023
PID:
20.500.12556/RUL-149699
COBISS.SI-ID:
165939203
Datum objave v RUL:
08.09.2023
Število ogledov:
1432
Število prenosov:
87
Metapodatki:
Citiraj gradivo
Navadno besedilo
BibTeX
EndNote XML
EndNote/Refer
RIS
ABNT
ACM Ref
AMA
APA
Chicago 17th Author-Date
Harvard
IEEE
ISO 690
MLA
Vancouver
:
ŠUTAR, MATIC, 2023,
Uporaba predvidevanja akcij nasprotnika pri učenju inteligentnega agenta
[na spletu]. Diplomsko delo. [Dostopano 4 maj 2025]. Pridobljeno s: https://repozitorij.uni-lj.si/IzpisGradiva.php?lang=slv&id=149699
Kopiraj citat
Objavi na:
Sekundarni jezik
Jezik:
Angleški jezik
Naslov:
Usage of opponent action prediction in reinforcement learning
Izvleček:
The main concepts of machine learning are presented in the thesis with an emphasis on reinforcement learning. The latter area also covers problems with multi-agent environments. Such problems pose additional challenges to the methods of reinforcement learning. The thesis explores various ways to solve multi-agent problems, using prediction of adversary actions in intelligent agent learning. In the diploma work, the DRON method, which is designed on the basis of deep q-learning, is presented in more detail. It is compared with the basic method of deep q-learning on the selected environment. The work also presents and compares the extension of curiosity-driven exploration methods to a multi-agent environment. The environment was implemented in the game engine Unreal Engine 5. In the end, the presented exploration method did not prove to be noticeably more successful than the basic exploration method. On the other hand, the use of the DRON architecture in combination with the basic deep q-learning method indicated a potential improvement of the basic method. For more concrete conclusions, additional experiments should be carried out.
Ključne besede:
intelligent agent
,
reinforcement learning
,
opponent modeling
,
deep q-learning
,
curiosity-driven exploration
,
unreal engine
Podobna dela
Podobna dela v RUL:
Migracije med NoSQL podatkovnimi bazami
Algoritem kot storitev
Integracija sistemov CRM
Odkrivanje kompleksov QRS elektrokardiograma
Krmilnik LED trakov
Podobna dela v drugih slovenskih zbirkah:
Ni podobnih del
Nazaj