izpis_h1_title_alt

Spodbujevano učenje v vodenju in optimizaciji procesov
KOVAČ, IVAN (Avtor), Mušič, Gašper (Mentor) Več o mentorju... Povezava se odpre v novem oknu

.pdfPDF - Predstavitvena datoteka, prenos (3,24 MB)

Izvleček
Podatki postajajo glavni vir 21 stoletja. Učenje in obdelava vseh teh podatkov presega sposobnosti in zmogljivosti človeka zato je uporaba strojev neizbežna. Med naborom paradigem strojnega učenja je posebej zanimivo spodbujevano učenje vendar kako se to umešča v vodenje procesov, kakšne so posebnosti, delovni okvirji, teh informacij ni na voljo. V okviru naloge smo raziskali in preučili teoretično osnovo paradigme, različne scenarije in problematike ter preizkusili in medsebojno primerjali nekatera delovna okolja. Rezultat je umestitev paradigme v področje vodenja in optimizacije ter pregled strojnega učenja na splošno. Glavni del predstavlja ključne gradnike in teoretično osnovo paradigme s pregledom glavnih algoritmov in njihovih lastnosti in tipičnih scenarijev uporabe in problematik znotraj same paradigme. Vsebinsko so predstavljane tri javno dostopne odprtokodne knjižnice in ena spletna storitev, ki kot take predstavljajo delovna in razvoja okolja. Nakazane so smernice in izhodišča za nadaljevanje študija in raziskovanja. Čeprav so algoritmi spodbujevanega učenja počasnejši v primerjavi z algoritmi v drugih paradigmah učenja, imajo širše področje uporabe in potencial za izgradnjo boljših samo učečih se strojev.

Jezik:Slovenski jezik
Ključne besede:strojno učenje, spodbujevano učenje, Markovski proces odločanja, funkcija vrednosti, optimalna politika
Vrsta gradiva:Diplomsko delo (m5)
Organizacija:FE - Fakulteta za elektrotehniko
Leto izida:2016
Število ogledov:490
Število prenosov:269
Metapodatki:XML RDF-CHPDL DC-XML DC-RDF
 
Skupna ocena:(0 glasov)
Vaša ocena:Ocenjevanje je dovoljeno samo prijavljenim uporabnikom.
:
Objavi na:AddThis
AddThis uporablja piškotke, za katere potrebujemo vaše privoljenje.
Uredi privoljenje...

Sekundarni jezik

Jezik:Angleški jezik
Naslov:Reinforcement learning in process control and optimization
Izvleček:
Data is becoming the prime 21st century resource. Learning and processing all of this data surpasses human capability and capacity, meaning machines are unavoidable. Amongst the many machine learning paradigms, Reinforcement Learning is of especial interest; however, there is no information as to how the latter be included in process management, specifics and frameworks. Within the framework of this thesis, we researched and examined the theoretical basis for this paradigm, the various scenarios and problems, and tested and compared some of work environments, resulting in the paradigm’s inclusion in the area of processes control and optimisation, as well as providing an overview of machine learning in general. The bulk of this work presents the key building blocks and basis for the paradigm, focusing on its main algorithms and their characteristics. It also presents typical use scenarios and inherent problems within the paradigm itself. We present three public open-source libraries and one web-based service as examples of work and development environments. This thesis also presents guidelines and starting points for further study and research. Even though reinforced learning algorithms are slower when compared to other learning paradigms, they have a much wider scope of use and the potential to produce better autonomous learning machines.

Ključne besede:Machine Learning, Reinforcement Learning, Markov Decision Proces, Value Function, Optimal Policy

Podobna dela

Podobna dela v RUL:
Podobna dela v drugih slovenskih zbirkah:

Komentarji

Dodaj komentar

Za komentiranje se morate prijaviti.

Komentarji (0)
0 - 0 / 0
 
Ni komentarjev!

Nazaj