<?xml version="1.0" encoding="utf-8"?>
<Gradivo ID="141456" NadgradivoID="0" NRID="16608115" OceID="0" DomainUrl="https://repozitorij.uni-lj.si/" IzpisPolniUrl="https://repozitorij.uni-lj.si/IzpisGradiva.php?lang=slv&amp;id=141456" StOgledov="1983" StPrenosov="314" StOcen="0" VsotaOcen="0" DatumIzvoza="2026-05-04 15:30:30" OcenaSkupna="0" StPodgradiv="0" StudijskiProgramEvsID="1000471" JeIndeksirano="0" JeVecAvtorjev="0" DovoliZahtevkeZaDostop="0">
  <PID Url="http://hdl.handle.net/20.500.12556/RUL-141456">20.500.12556/RUL-141456</PID>
  <Naslov>Pomenska detekcija sopomenk in protipomenk s kontekstualnimi vložitvami</Naslov>
  <Podnaslov></Podnaslov>
  <TujJezik_Naslov>Semantic detection of synonyms and antonyms with contextual embeddings</TujJezik_Naslov>
  <TujJezik_Podnaslov></TujJezik_Podnaslov>
  <Opis>Cilj magistrskega dela je razvoj metodologije za določanje protipomenk in sopomenk besed za njihove različne pomene. Zanima nas odogovor na vprašanje, ali sta dani besedi v določenih pomenih sopomenki oziroma ali sta potipomenki. Naš pristop vključuje gručenje množice stavkov z dano besedo po njenih pomenih, določanje ustreznega para pomenov kandidatnega para besed ter dva ločena modela za klasifikacijo parov sopomenk oziroma protipomenk v kontekstu. Pri tem uporabljamo kontekstualne vektorske vložitve besed tipa BERT, ki predstavljajo tako informacije o besedi kot tudi o njenem kontekstu. Vse našteto ima potencialno rabo v slovaropisju, pri strojnem prevajanju besedil, avtomatskem povzemanju besedil in ekstrakciji podatkov iz besedila.
Najbolje ocenjeno gručenje besed po pomenih dosega povprečno oceno ARI 0.30. Najboljša metoda za določanje sopomenskega para pomenov dosega klasifikacijsko točnost 0.78 za sopomenke in 0.73 za protipomenke. Model na osnovi modela CroSloEngual BERT, ki najbolje določa protipomenke, dosega 90-% preciznost in 61-% priklic ter 60-% klasifikacijsko točnost, model, ki najbolje določa sopomenke, pa ima 99-% preciznost, 50-% priklic in 51-% točnost.</Opis>
  <TujJezik_Opis>The goal of this work is to develop a methodology for sense-based synonym and antonym detection. We are seeking to answer the question whether pairs of words in given contexts are synonyms or antonyms.
Our approach includes sense clustering on a set of words in contexts, determining a matching sense of a candidate word pair, and two separate models for contextual synonym and antonym classification. We use contextual word embeddings from BERT models which represent information on words and their context. Everything listed has a potential use in lexicography, machine text translation, automated text summarization and information extraction.
Best scored word sense clustering achieves average ARI score of 0.30. Our best methodology for determining sense pairs reaches classification accuracy of 0.78 on synonyms and 0.73 on antonyms. The best CroSloEngual BERT-based model for antonym detection has 90 % precision, 61 % recall and 60 % accuracy, the best model for synonym detection has 99 % precision, 50 % recall in 51 % accuracy.</TujJezik_Opis>
  <KljucneBesede>
    <Beseda>protipomenke</Beseda>
    <Beseda>sopomenke</Beseda>
    <Beseda>vektorske vložitve besed</Beseda>
    <Beseda>model BERT</Beseda>
    <Beseda>procesiranje naravnega jezika</Beseda>
  </KljucneBesede>
  <TujJezik_KljucneBesede>
    <Beseda>antonyms</Beseda>
    <Beseda>synonyms</Beseda>
    <Beseda>word embeddings</Beseda>
    <Beseda>BERT model</Beseda>
    <Beseda>natural language processing</Beseda>
  </TujJezik_KljucneBesede>
  <Potrjeno>true</Potrjeno>
  <JeZaklenjeno>false</JeZaklenjeno>
  <JeRecenzirano>false</JeRecenzirano>
  <Zaloznik></Zaloznik>
  <Izvor></Izvor>
  <Jezik ID="1060" ISO639-3="slv">Slovenski jezik</Jezik>
  <TujJezik ID="1033" ISO639-3="eng">Angleški jezik</TujJezik>
  <Povezave></Povezave>
  <Pokrivanje></Pokrivanje>
  <CasovnoPokritje></CasovnoPokritje>
  <AvtorskePravice></AvtorskePravice>
  <VrstaGradiva ID="mb22" DRIVER="info:eu-repo/semantics/masterThesis">Magistrsko delo/naloga</VrstaGradiva>
  <DatumVstavljanja>2022-09-29 13:15:00</DatumVstavljanja>
  <DatumObjave>2022-09-29 13:15:02</DatumObjave>
  <DatumSpremembe>2022-10-10 06:58:00</DatumSpremembe>
  <DatumTrajnegaHranjenja>0000-00-00 00:00:00</DatumTrajnegaHranjenja>
  <LetoIzida>2022</LetoIzida>
  <LetoIzidaDo>0</LetoIzidaDo>
  <KrajIzida></KrajIzida>
  <LetoIzvedbe>0</LetoIzvedbe>
  <KrajIzvedbe></KrajIzvedbe>
  <Opomba></Opomba>
  <StStrani></StStrani>
  <StevilcenjeNivo1></StevilcenjeNivo1>
  <StevilcenjeNivo2></StevilcenjeNivo2>
  <Kronologija></Kronologija>
  <Patent_Stevilka></Patent_Stevilka>
  <Patent_DatumVeljavnosti>0000-00-00</Patent_DatumVeljavnosti>
  <VerzijaDokumenta>NiDoloceno</VerzijaDokumenta>
  <StatusObjaveDrugje>NiDoloceno</StatusObjaveDrugje>
  <VrstaStroskaObjave>NiDoloceno</VrstaStroskaObjave>
  <DatumPoslanoVRecenzijo>0000-00-00</DatumPoslanoVRecenzijo>
  <DatumSprejetjaClanka>0000-00-00</DatumSprejetjaClanka>
  <DatumObjaveClanka>0000-00-00</DatumObjaveClanka>
  <EmbargoDo></EmbargoDo>
  <VrstaEmbarga ID="1" Naziv="Takojšnja javna objava" OpenAIREDostop="openAccess"></VrstaEmbarga>
  <Osebe>
    <Oseba ID="88772" Ime="Jasmina" Priimek="Pegan" AltIme="" VlogaID="70" VlogaNaziv="Avtor" ConorID="" Afiliacija="" ArrsID="0" ORCID=""></Oseba>
    <Oseba ID="2857" Ime="Marko" Priimek="Robnik Šikonja" AltIme="Marko Robnik Šikonja; Marko Robnik- Šikonja; Marko Robnik-Šikonja; Marko Robnik; Marko Robnik-Sikonja; Marko Robnik- Sikonja" VlogaID="991" VlogaNaziv="Mentor" ConorID="4190307" Afiliacija="" ArrsID="15295" ORCID=""></Oseba>
  </Osebe>
  <Identifikatorji>
    <Identifikator ID="16" Sifra="VisID" Naziv="VisID" URL="">33482</Identifikator>
    <Identifikator ID="3" Sifra="CobissID" Naziv="COBISS_ID" URL="https://plus.cobiss.net/cobiss/si/sl/bib/124811523">124811523</Identifikator>
  </Identifikatorji>
  <Datoteke>
    <Datoteka ID="162523" DatotekaNRID="12411356" NamenDatotekeID="2" NamenDatoteke="Predstavitvena datoteka" FormatDatotekeID="2" FormatDatoteke=".pdf" MIME="application/pdf" IkonaFormata="pdf.png" IkonaFormataPolniUrl="https://repozitorij.uni-lj.si/teme/rulDev/img/fileTypes/pdf.png" VelikostDatoteke="927839" VelikostDatotekeKratko="906,09 KB" DatumVstavljanja="2022-09-29 13:15:03" JeZbrisana="false" JeJavnoVidna="true" JeIndeksirana="true" JeVidno="true" VidnoOd="01.01.1970" Zaporedje="0">
      <Naziv>Pegan_Jasmina_-_Pomenska_detekcija_sopomenk_in_protipomenk_s_kontekstualnimi_vlozitvami.pdf</Naziv>
      <OrgNaziv>Pegan_Jasmina_-_Pomenska_detekcija_sopomenk_in_protipomenk_s_kontekstualnimi_vlozitvami.pdf</OrgNaziv>
      <URL></URL>
      <Opis></Opis>
      <OpisTujJezik></OpisTujJezik>
      <UrlObdelave></UrlObdelave>
      <FrekvencaAzuriranjaID>1</FrekvencaAzuriranjaID>
      <Verzija></Verzija>
      <MD5>13530DAA652334EA2A72A961761A0E86</MD5>
      <SHA256>aa3420455b83f66465befb0fa54fdca749d892913f9a66ce0d5ce8d3d41b91bc</SHA256>
      <UUID>f45cb492-3fe7-11ed-9c94-00155dcfd717</UUID>
      <PID></PID>
      <PrenosPolniUrl>https://repozitorij.uni-lj.si/Dokument.php?lang=slv&amp;id=162523</PrenosPolniUrl>
      <Vsebine>
        <Vsebina TipVsebine="GoloBesedilo" JezikID="1060" Oznaka="" Dolzina="110692"></Vsebina>
      </Vsebine>
    </Datoteka>
  </Datoteke>
  <Organizacije>
    <Organizacija OrganizacijaID="25" Kratica="FRI" ZavodEvsID="0000066" Logo="" LogoPolniUrl="https://repozitorij.uni-lj.si/teme/rulDev/img/logo/">Fakulteta za računalništvo in informatiko</Organizacija>
  </Organizacije>
  <OrganizacijeVira>
  </OrganizacijeVira>
  <MetodeZbiranjaPodatkov>
  </MetodeZbiranjaPodatkov>
  <TipologijaDela ID="2.09" Koda="2.09" Naziv="Magistrsko delo" SchemaOrg="Thesis"></TipologijaDela>
  <Ostalo>
    <StIrodsDatotek>0</StIrodsDatotek>
    <StDatotekPodTrajnimEmbargom>0</StDatotekPodTrajnimEmbargom>
    <StDatotekZOmejenimDostopom>0</StDatotekZOmejenimDostopom>
  </Ostalo>
</Gradivo>
