Šibko nadzorovano programsko označevanje učnih primerov z orodjem Snorkel

Bračko, Bjorn

Podrobno

Šibko nadzorovano programsko označevanje učnih primerov z orodjem Snorkel
ID Bračko, Bjorn (Avtor), ID Kukar, Matjaž (Mentor) Več o mentorju... Povezava se odpre v novem oknu

PDF - Predstavitvena datoteka, prenos (2,41 MB)
MD5: B22DD19F4CDD41A729667AC3A5DF559C

Izvleček

V zadnjih letih se je z eksplozijo količine podatkov in kompleksnostjo napovednih problemov povečala potreba po velikih količinah ročno označenih podatkov, kar predstavlja izziv v postopku nadzorovanega strojnega učenja. Zaradi tega se šibki nadzor, ki uporablja šumno ali nenatančno označeno učno množico, izkaže kot privlačna alternativa. Predstavimo širše področje šibkega nadzora, posvetimo pa se ogrodju Snorkel. Zgradimo več napovednih modelov kot šibke označevalce, katere nato uporabimo kot označevalne funkcije za generativni označevalni model Snorkel. Primerjamo točnost končnih modelov naučenih s pravimi oznakami in verjetnostnimi oznakami ogrodja Snorkel. Pokažemo, da imajo končni modeli naučeni z oznakami ogrodja Snorkel, primerljivo ali celo boljšo uspešnost kot modeli naučeni s pravimi oznakami.

Jezik:	Slovenski jezik
Ključne besede:	strojno učenje, šibko nadzorovano učenje, avtomatsko (šibko) označevanje podatkov, ogrodje Snorkel
Vrsta gradiva:	Magistrsko delo/naloga
Tipologija:	2.09 - Magistrsko delo
Organizacija:	FRI - Fakulteta za računalništvo in informatiko
Leto izida:	2023
PID:	20.500.12556/RUL-151801
COBISS.SI-ID:	171797251
Datum objave v RUL:	20.10.2023
Število ogledov:	786
Število prenosov:	376
Metapodatki:
:	BRAČKO, Bjorn, 2023, Šibko nadzorovano programsko označevanje učnih primerov z orodjem Snorkel [na spletu]. Magistrsko delo. [Dostopano 18 maj 2025]. Pridobljeno s: https://repozitorij.uni-lj.si/IzpisGradiva.php?lang=slv&id=151801 Kopiraj citat
Objavi na:

Sekundarni jezik

Izvleček:
Jezik:	Angleški jezik
Naslov:	Weakly supervised programmatic labelling of training data with the Snorkel toolkit
In recent years, the explosion of available data and the complexity of prediction problems has increased the need for large amounts of manually labelled data, posing a challenge to the supervised machine learning process. For this reason, weak supervision using noisy or inaccurately labelled training sets proves to be an attractive alternative. We present the broader area of weak supervision focusing on the Snorkel framework. We construct several predictive models as weak classifiers, which we then use as labelling functions for the Snorkel generative labeling model. We compare the accuracy of the final models learned with the true labels and the Snorkel probabilistic labels. We show that the final models trained with Snorkel labels have comparable or even better performance than the models trained with the true labels.
Ključne besede:	machine learning, weak supervision, automatic (weak) data labeling, Snorkel toolkit

Podobna dela

Podobna dela v RUL:	Elementi totalne ustanove v institucionalnem varstvu starejših Individualizacija starejših oseb Pomoč in podpora svojcem ob odhodu starega človeka v institucionalno varstvo Emocionalna opora v domu za starejše občane Sociološka analiza domov za ostarele in sodobne oblike bivanja starejših
Podobna dela v drugih slovenskih zbirkah:	Institucionalno varstvo kot podjetniški izziv Stiske starejših oseb ob namestitvi v institucionalno varstvo Paliativna oskrba starostnikov z demenco v institucionalnem varstvu Izkušnje starostnika na prehodu iz domačega okolja v institucionalno varstvo Stiske in dileme svojcev starostnika z vidika njihovega vključevanja v oskrbo doma ali v instituciji

Nazaj