<?xml version="1.0"?>
<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:dc="http://purl.org/dc/elements/1.1/"><rdf:Description rdf:about="https://repozitorij.uni-lj.si/IzpisGradiva.php?id=141456"><dc:title>Pomenska detekcija sopomenk in protipomenk s kontekstualnimi vložitvami</dc:title><dc:creator>Pegan,	Jasmina	(Avtor)
	</dc:creator><dc:creator>Robnik Šikonja,	Marko	(Mentor)
	</dc:creator><dc:subject>protipomenke</dc:subject><dc:subject>sopomenke</dc:subject><dc:subject>vektorske vložitve besed</dc:subject><dc:subject>model BERT</dc:subject><dc:subject>procesiranje naravnega jezika</dc:subject><dc:description>Cilj magistrskega dela je razvoj metodologije za določanje protipomenk in sopomenk besed za njihove različne pomene. Zanima nas odogovor na vprašanje, ali sta dani besedi v določenih pomenih sopomenki oziroma ali sta potipomenki. Naš pristop vključuje gručenje množice stavkov z dano besedo po njenih pomenih, določanje ustreznega para pomenov kandidatnega para besed ter dva ločena modela za klasifikacijo parov sopomenk oziroma protipomenk v kontekstu. Pri tem uporabljamo kontekstualne vektorske vložitve besed tipa BERT, ki predstavljajo tako informacije o besedi kot tudi o njenem kontekstu. Vse našteto ima potencialno rabo v slovaropisju, pri strojnem prevajanju besedil, avtomatskem povzemanju besedil in ekstrakciji podatkov iz besedila.
Najbolje ocenjeno gručenje besed po pomenih dosega povprečno oceno ARI 0.30. Najboljša metoda za določanje sopomenskega para pomenov dosega klasifikacijsko točnost 0.78 za sopomenke in 0.73 za protipomenke. Model na osnovi modela CroSloEngual BERT, ki najbolje določa protipomenke, dosega 90-% preciznost in 61-% priklic ter 60-% klasifikacijsko točnost, model, ki najbolje določa sopomenke, pa ima 99-% preciznost, 50-% priklic in 51-% točnost.</dc:description><dc:date>2022</dc:date><dc:date>2022-09-29 13:15:00</dc:date><dc:type>Magistrsko delo/naloga</dc:type><dc:identifier>141456</dc:identifier><dc:language>sl</dc:language></rdf:Description></rdf:RDF>