<?xml version="1.0" encoding="utf-8"?>
<Gradivo ID="106895" NadgradivoID="0" NRID="11077107" OceID="0" DomainUrl="https://repozitorij.uni-lj.si/" IzpisPolniUrl="https://repozitorij.uni-lj.si/IzpisGradiva.php?lang=slv&amp;id=106895" StOgledov="1986" StPrenosov="422" StOcen="0" VsotaOcen="0" DatumIzvoza="2026-05-03 04:18:01" OcenaSkupna="0" StPodgradiv="0" StudijskiProgramEvsID="1000468" JeIndeksirano="0" JeVecAvtorjev="0" DovoliZahtevkeZaDostop="0">
  <PID Url="http://hdl.handle.net/20.500.12556/RUL-106895">20.500.12556/RUL-106895</PID>
  <Naslov>Vektorske vložitve za prepoznavanje slovenskih glagolskih idiomov</Naslov>
  <Podnaslov></Podnaslov>
  <TujJezik_Naslov>Word embeddings for detection of verbal idioms in Slovene</TujJezik_Naslov>
  <TujJezik_Podnaslov></TujJezik_Podnaslov>
  <Opis>Vektorske vložitve preslikajo besede v visokodimenzionalne vektorje realnih števil, pri čemer imajo besede s podobnimi pomeni podobne vektorje. Preučili smo problem avtomatske prepoznave slovenskih glagolskih idiomov z uporabo značilk, zgrajenih iz vektorskih vložitev skupin besed in vektorskih vložitev posameznih besed. V ta namen smo zgradili dve podatkovni množici, ki vsebujeta primere glagolskih idiomov in naključnih skupin besed, opisanih z zgrajenimi značilkami. Na teh množicah smo ocenili uspešnost klasifikacije glagolskih idiomov z metodo podpornih vektorjev, naključnih gozdov in logistične regresije. Vse tri metode so pri klasifikaciji dokaj uspešne, najbolje se je izkazala metoda naključnih gozdov. Zaradi časovne zahtevnosti in omejitev prepoznave na skupine besed, za katere so znane vektorske vložitve, pa bodo za praktično uporabo potrebne še dodatne izboljšave.</Opis>
  <TujJezik_Opis>Word embeddings map words to a high dimensional vector space, where words with similar meanings have similar vectors. We analyzed the problem of automatic identification of verbal idioms in Slovene using features built from embeddings of single words and groups of words. For this purpose, we built two data sets that contain verbal idioms and random word groups described with corresponding features. Using these data sets we evaluated the classification of verbal idioms with support vector machines, random forests, and logistic regression. All three methods were successful, the best being random forests. Due to large computational time and limitation to only identify groups of words with precomputed word embeddings the approach requires further improvements to be practically useful.</TujJezik_Opis>
  <KljucneBesede>
    <Beseda>obdelava naravnega jezika</Beseda>
    <Beseda>vektorske vložitve</Beseda>
    <Beseda>stalne besedne zveze</Beseda>
    <Beseda>strojno učenje</Beseda>
  </KljucneBesede>
  <TujJezik_KljucneBesede>
    <Beseda>natural language processing</Beseda>
    <Beseda>word embeddings</Beseda>
    <Beseda>multiword expressions</Beseda>
    <Beseda>machine learning</Beseda>
  </TujJezik_KljucneBesede>
  <Potrjeno>true</Potrjeno>
  <JeZaklenjeno>false</JeZaklenjeno>
  <JeRecenzirano>false</JeRecenzirano>
  <Zaloznik></Zaloznik>
  <Izvor></Izvor>
  <Jezik ID="1060" ISO639-3="slv">Slovenski jezik</Jezik>
  <TujJezik ID="1033" ISO639-3="eng">Angleški jezik</TujJezik>
  <Povezave></Povezave>
  <Pokrivanje></Pokrivanje>
  <CasovnoPokritje></CasovnoPokritje>
  <AvtorskePravice></AvtorskePravice>
  <VrstaGradiva ID="mb11" DRIVER="info:eu-repo/semantics/bachelorThesis">Diplomsko delo/naloga</VrstaGradiva>
  <DatumVstavljanja>2019-03-25 12:25:03</DatumVstavljanja>
  <DatumObjave>2019-03-25 12:25:06</DatumObjave>
  <DatumSpremembe>2022-08-19 03:47:17</DatumSpremembe>
  <DatumTrajnegaHranjenja>0000-00-00 00:00:00</DatumTrajnegaHranjenja>
  <LetoIzida>2019</LetoIzida>
  <LetoIzidaDo>0</LetoIzidaDo>
  <KrajIzida></KrajIzida>
  <LetoIzvedbe>0</LetoIzvedbe>
  <KrajIzvedbe></KrajIzvedbe>
  <Opomba></Opomba>
  <StStrani></StStrani>
  <StevilcenjeNivo1></StevilcenjeNivo1>
  <StevilcenjeNivo2></StevilcenjeNivo2>
  <Kronologija></Kronologija>
  <Patent_Stevilka></Patent_Stevilka>
  <Patent_DatumVeljavnosti>0000-00-00</Patent_DatumVeljavnosti>
  <VerzijaDokumenta>NiDoloceno</VerzijaDokumenta>
  <StatusObjaveDrugje>NiDoloceno</StatusObjaveDrugje>
  <VrstaStroskaObjave>NiDoloceno</VrstaStroskaObjave>
  <DatumPoslanoVRecenzijo>0000-00-00</DatumPoslanoVRecenzijo>
  <DatumSprejetjaClanka>0000-00-00</DatumSprejetjaClanka>
  <DatumObjaveClanka>0000-00-00</DatumObjaveClanka>
  <EmbargoDo>1970-01-01</EmbargoDo>
  <VrstaEmbarga ID="1" Naziv="Takojšnja javna objava" OpenAIREDostop="openAccess"></VrstaEmbarga>
  <Osebe>
    <Oseba ID="85227" Ime="TILEN" Priimek="ZELINKA" AltIme="" VlogaID="70" VlogaNaziv="Avtor" ConorID="" Afiliacija="" ArrsID="0" ORCID=""></Oseba>
    <Oseba ID="2857" Ime="Marko" Priimek="Robnik Šikonja" AltIme="Marko Robnik Šikonja; Marko Robnik- Šikonja; Marko Robnik-Šikonja; Marko Robnik; Marko Robnik-Sikonja; Marko Robnik- Sikonja" VlogaID="991" VlogaNaziv="Mentor" ConorID="4190307" Afiliacija="" ArrsID="15295" ORCID=""></Oseba>
  </Osebe>
  <Identifikatorji>
    <Identifikator ID="16" Sifra="VisID" Naziv="VisID" URL="">21900</Identifikator>
  </Identifikatorji>
  <Datoteke>
    <Datoteka ID="117680" DatotekaNRID="10904248" NamenDatotekeID="2" NamenDatoteke="Predstavitvena datoteka" FormatDatotekeID="2" FormatDatoteke=".pdf" MIME="application/pdf" IkonaFormata="pdf.png" IkonaFormataPolniUrl="https://repozitorij.uni-lj.si/teme/rulDev/img/fileTypes/pdf.png" VelikostDatoteke="340037" VelikostDatotekeKratko="332,07 KB" DatumVstavljanja="2019-03-25 12:25:07" JeZbrisana="false" JeJavnoVidna="true" JeIndeksirana="true" JeVidno="true" VidnoOd="01.01.1970" Zaporedje="0">
      <Naziv>Zelinka_Tilen_-_Vektorske_vlozitve_za_prepoznavanje_slovenskih_glagolskih_idiomov.pdf</Naziv>
      <OrgNaziv>Zelinka_Tilen_-_Vektorske_vlozitve_za_prepoznavanje_slovenskih_glagolskih_idiomov.pdf</OrgNaziv>
      <URL></URL>
      <Opis></Opis>
      <OpisTujJezik></OpisTujJezik>
      <UrlObdelave></UrlObdelave>
      <FrekvencaAzuriranjaID>1</FrekvencaAzuriranjaID>
      <Verzija></Verzija>
      <MD5>14C777F11D93FFA50D4E7A6C2A8D3AE7</MD5>
      <SHA256>01db4f5428b35be05440311b9558e66fc7382b40ba031a9b814d6b474e15d9ce</SHA256>
      <UUID>6574d5df-a1b6-11eb-a523-00155dcfd717</UUID>
      <PID></PID>
      <PrenosPolniUrl>https://repozitorij.uni-lj.si/Dokument.php?lang=slv&amp;id=117680</PrenosPolniUrl>
      <Vsebine>
        <Vsebina TipVsebine="GoloBesedilo" JezikID="1060" Oznaka="" Dolzina="46667"></Vsebina>
      </Vsebine>
    </Datoteka>
  </Datoteke>
  <Organizacije>
    <Organizacija OrganizacijaID="25" Kratica="FRI" ZavodEvsID="0000066" Logo="" LogoPolniUrl="https://repozitorij.uni-lj.si/teme/rulDev/img/logo/">Fakulteta za računalništvo in informatiko</Organizacija>
  </Organizacije>
  <OrganizacijeVira>
  </OrganizacijeVira>
  <MetodeZbiranjaPodatkov>
  </MetodeZbiranjaPodatkov>
  <TipologijaDela ID="0" Koda="0" Naziv="Ni določena" SchemaOrg="CreativeWork"></TipologijaDela>
  <Ostalo>
    <StIrodsDatotek>0</StIrodsDatotek>
    <StDatotekPodTrajnimEmbargom>0</StDatotekPodTrajnimEmbargom>
    <StDatotekZOmejenimDostopom>0</StDatotekZOmejenimDostopom>
  </Ostalo>
</Gradivo>
