Vaš brskalnik ne omogoča JavaScript!
JavaScript je nujen za pravilno delovanje teh spletnih strani. Omogočite JavaScript ali pa uporabite sodobnejši brskalnik.
Repozitorij Univerze v Ljubljani
Nacionalni portal odprte znanosti
Odprta znanost
DiKUL
slv
|
eng
Iskanje
Brskanje
Novo v RUL
Kaj je RUL
V številkah
Pomoč
Prijava
Podrobno
Strojno učenje v porazdeljenem okolju z uporabo paradigme MapReduce : magistrsko delo
ID
ORAČ, ROMAN
(
Avtor
),
ID
Robnik Šikonja, Marko
(
Mentor
)
Več o mentorju...
,
ID
Lavrač, Nada
(
Komentor
)
PDF - Predstavitvena datoteka,
prenos
(1,93 MB)
MD5: D22E1030CA8CADEFD767786AED062F08
PID:
20.500.12556/rul/6c360582-f842-4ce6-8f27-b3cf6fd1ee34
Galerija slik
Izvleček
Implementacija algoritmov strojnega učenja v porazdeljenem okolju prinaša več prednosti, kot sta zmožnost obdelave velikih množic podatkov in linearna pospešitev izvajanja z dodatnimi računskimi enotami. V magistrski nalogi opišemo paradigmo MapReduce, ki omogoča porazdeljeno računanje na računalniški gruči, in ogrodje Disco, ki ga implementira. Predstavimo sumarno obliko, ki je pogoj za učinkovito implementacijo algoritmov strojnega učenja s paradigmo MapReduce in opišemo implementacije izbranih algoritmov. Poleg tega predstavimo nove različice porazdeljenih naključnih gozdov, ki gradijo model na podmnožicah podatkov. Implementirane algoritme ovrednotimo s primerjavo z uveljavljenimi programi strojnega učenja. Magistrsko delo zaključimo z opisom vključitve implementiranih algoritmov v platformo ClowdFlows, ki omogoča sestavljanje, izvajanje in deljenje interaktivnih delotokov podatkovnega rudarjenja. S tem omogočimo obdelavo velikih paketnih podatkov z vizualnim programiranjem.
Jezik:
Slovenski jezik
Ključne besede:
MapReduce
,
porazdeljeno računanje
,
Disco
,
strojno učenje
,
sumarna oblika
,
DiscoMLL
,
porazdeljeni naključni gozdovi
,
ClowdFlows
,
računalništvo
,
računalništvo in informatika
,
magisteriji
Vrsta gradiva:
Magistrsko delo/naloga
Tipologija:
2.09 - Magistrsko delo
Organizacija:
FRI - Fakulteta za računalništvo in informatiko
Založnik:
R. Orač
Leto izida:
2014
Št. strani:
123 str.
PID:
20.500.12556/RUL-29969
COBISS.SI-ID:
1536017347
Datum objave v RUL:
22.10.2014
Število ogledov:
1799
Število prenosov:
419
Metapodatki:
Citiraj gradivo
Navadno besedilo
BibTeX
EndNote XML
EndNote/Refer
RIS
ABNT
ACM Ref
AMA
APA
Chicago 17th Author-Date
Harvard
IEEE
ISO 690
MLA
Vancouver
:
ORAČ, ROMAN, 2014,
Strojno učenje v porazdeljenem okolju z uporabo paradigme MapReduce : magistrsko delo
[na spletu]. Magistrsko delo. R. Orač. [Dostopano 7 april 2025]. Pridobljeno s: https://repozitorij.uni-lj.si/IzpisGradiva.php?lang=slv&id=29969
Kopiraj citat
Objavi na:
Sekundarni jezik
Jezik:
Angleški jezik
Naslov:
Machine learning algorithms in distributed environment with MapReduce paradigm
Izvleček:
Implementation of machine learning algorithms in a distributed environment ensures us multiple advantages, like processing of large datasets and linear speedup with additional processing units. We describe the MapReduce paradigm, which enables distributed computing, and the Disco framework, which implements it. We present the summation form, which is a condition for efficient implementation of algorithms with the MapReduce paradigm, and describe the implementations of the selected algorithms. We propose novel distributed random forest algorithms that build models on subsets of the dataset. We compare time and accuracy of the algorithms with the well recognized data analytics tools. We end our master thesis by describing the integration of the implemented algorithms into the ClowdFlows platform, which is a web platform for construction, execution and sharing of interactive workflows for data mining. With this integration, we enabled processing of big batch data with visual programming.
Ključne besede:
MapReduce
,
distributed computing
,
Disco
,
machine learning
,
summation form
,
DiscoMLL
,
distributed random forest
,
ClowdFlows
,
computer science
,
computer and information science
,
master's degree
Podobna dela
Podobna dela v RUL:
Vloga prostočasnih aktivnosti pri osebah z demenco
Terapevtska uporaba glasbe pri osebah z demenco
Uporaba metod in tehnik v delovnoterapevtskem procesu pri osebah z demenco
Uporaba aromaterapije pri osebah z demenco
Uporaba prilagojenih oblačil pri osebah z zmanjšanimi zmožnostmi gibanja
Podobna dela v drugih slovenskih zbirkah:
Didaktične gibalne igre, ki jih vzgojitelji uporabljajo za krepitev ravnotežja v zgodnjem otroštvu
Potovanje okoli sveta - didaktični pripomoček za nadarjene učence
Štetje ob didaktičnih igrah v predšolskem obdobju
Štetje s pomočjo didaktičnih iger v predšolskem obdobju
Nazaj