<?xml version="1.0" encoding="utf-8"?>
<Gradivo ID="179272" NadgradivoID="6782" NRID="28141825" OceID="0" DomainUrl="https://repozitorij.uni-lj.si/" IzpisPolniUrl="https://repozitorij.uni-lj.si/IzpisGradiva.php?lang=slv&amp;id=179272" StOgledov="156" StPrenosov="38" StOcen="0" VsotaOcen="0" DatumIzvoza="2026-05-03 02:46:43" OcenaSkupna="0" StPodgradiv="0" StudijskiProgramEvsID="" JeIndeksirano="0" JeVecAvtorjev="0" DovoliZahtevkeZaDostop="0">
  <PID Url="http://hdl.handle.net/20.500.12556/RUL-179272">20.500.12556/RUL-179272</PID>
  <Naslov>Računalniška analiza čustev in tem v Wikiviru</Naslov>
  <Podnaslov></Podnaslov>
  <TujJezik_Naslov></TujJezik_Naslov>
  <TujJezik_Podnaslov></TujJezik_Podnaslov>
  <Opis>V prispevku predstavimo računalniško analizo tem in čustev v korpusu slovenske književnosti, prosto dostopni v repozitoriju Wikivir. Pri tem predstavimo tako pristop k izgradnji korpusa, ki ga želimo v analizo ponuditi tudi drugim raziskovalcem v okviru platforme SketchEngine in na repozitoriju Clarin, kot tudi metodo za analizo čustev in prevladujočih tematik v obsežnih podatkovnih zbirkah. Pri raziskavi poskušamo izpostaviti glavne tematske poudarke v različnih časovnih obdobjih, žanrih in pri različnih avtorjih ter prevladujoča čustva, pri čemer uporabimo tako leksikonski pristop kot tudi analizo sentimenta. Kljub neprecenljivemu bogastvu digitaliziranega slovenskega leposlovja na Wikiviru je bil ta vir zaradi zapletenosti označevalnika MediaWiki, razpršenosti prenesenih besedil ter zahtevnosti pretvarjanja in procesiranja besedil do zdaj slabo izkoriščen za obsežnejše raziskave, ki bi temeljile na računalniškem procesiranju naravnega jezika. Za namene te raziskave smo pripravili korpus prosto dostopne slovenske književnosti, ki zajema nekaj več kot 62 milijonov besed, nabranih iz 22.919 različnih besedil, ki so v Wikiviru (nekonsistentno) označena z več kot 2000 različnimi kategorijami oz. metapodatki (avtor, leto, stoletje, žanr ipd.). Te podatke poskušamo z uporabo računalniških pristopov tudi sistematizirati ter natančneje predstaviti distribucijo besedil, objavljenih v Wikiviru.</Opis>
  <TujJezik_Opis>This article presents a computational analysis of themes and emotions in the corpus of Slovenian literature, freely available on Wikivir (i.e., the Slovenian Wikisource). It presents the approach used to build the corpus, which is also made freely available to other researchers, as well as the method for analyzing emotions and predominant topics in large databases. The research highlights the main thematic emphases in different time periods, genres, and authors, as well as the predominant emotions, using both a lexical approach and sentiment analysis. Despite the invaluable wealth of the digitized Slovenian literature on Wikivir, this source has been underutilized for more extensive research based on natural language processing due to the complexity of the MediaWiki tagger, the dispersion of transferred texts, and the complexity of text conversion and processing. For the purposes of this research, a corpus of freely accessible Slovenian literature was compiled, comprising just over 62 million words collected from 22,919 texts, which are (inconsistently) annotated on Wikivir with over two thousand categories or metadata (author, year, century, genre, etc.). These data are also being systematized using automatized approaches, thus presenting a more accurate distribution of texts published on Wikivir.</TujJezik_Opis>
  <KljucneBesede>
    <Beseda>slovenska književnost</Beseda>
    <Beseda>Wikivir</Beseda>
    <Beseda>procesiranje naravnega jezika</Beseda>
    <Beseda>LDA</Beseda>
    <Beseda>leksikon čustev</Beseda>
  </KljucneBesede>
  <TujJezik_KljucneBesede>
    <Beseda>Slovenian literature</Beseda>
    <Beseda>Wikisource</Beseda>
    <Beseda>natural language processing</Beseda>
    <Beseda>LDA</Beseda>
    <Beseda>emotion lexicon</Beseda>
    <Beseda>Wikivir</Beseda>
  </TujJezik_KljucneBesede>
  <Potrjeno>true</Potrjeno>
  <JeZaklenjeno>false</JeZaklenjeno>
  <JeRecenzirano>true</JeRecenzirano>
  <Zaloznik></Zaloznik>
  <Izvor></Izvor>
  <Jezik ID="1060" ISO639-3="slv">Slovenski jezik</Jezik>
  <TujJezik ID="1033" ISO639-3="eng">Angleški jezik</TujJezik>
  <Povezave></Povezave>
  <Pokrivanje></Pokrivanje>
  <CasovnoPokritje></CasovnoPokritje>
  <AvtorskePravice></AvtorskePravice>
  <VrstaGradiva ID="" DRIVER="info:eu-repo/semantics/other">Neznano</VrstaGradiva>
  <DatumVstavljanja>2026-02-09 13:18:43</DatumVstavljanja>
  <DatumObjave>2026-02-09 13:18:48</DatumObjave>
  <DatumSpremembe>2026-03-27 13:19:16</DatumSpremembe>
  <DatumTrajnegaHranjenja>0000-00-00 00:00:00</DatumTrajnegaHranjenja>
  <LetoIzida>2025</LetoIzida>
  <LetoIzidaDo>0</LetoIzidaDo>
  <KrajIzida></KrajIzida>
  <LetoIzvedbe>0</LetoIzvedbe>
  <KrajIzvedbe></KrajIzvedbe>
  <Opomba></Opomba>
  <StStrani>Str. 269-278</StStrani>
  <StevilcenjeNivo1></StevilcenjeNivo1>
  <StevilcenjeNivo2></StevilcenjeNivo2>
  <Kronologija></Kronologija>
  <Patent_Stevilka></Patent_Stevilka>
  <Patent_DatumVeljavnosti>0000-00-00</Patent_DatumVeljavnosti>
  <VerzijaDokumenta>Zaloznikova</VerzijaDokumenta>
  <StatusObjaveDrugje>Objavljeno</StatusObjaveDrugje>
  <VrstaStroskaObjave>NiDoloceno</VrstaStroskaObjave>
  <DatumPoslanoVRecenzijo>0000-00-00</DatumPoslanoVRecenzijo>
  <DatumSprejetjaClanka>0000-00-00</DatumSprejetjaClanka>
  <DatumObjaveClanka>0000-00-00</DatumObjaveClanka>
  <Licence>
    <Licenca ID="5" Kratica="CC BY-SA 4.0" Naziv="Creative Commons Priznanje avtorstva-Deljenje pod enakimi pogoji 4.0 Mednarodna" URL="http://creativecommons.org/licenses/by-sa/4.0/deed.sl" Logo="by-sa.png" LogoPolniUrl="https://repozitorij.uni-lj.si/teme/rulDev/img/licence/by-sa.png" DatumZacetkaLicenciranja="" VezanoNa="" VezanoNaAng="" Besedilo="" BesediloAng=""></Licenca>
  </Licence>
  <EmbargoDo></EmbargoDo>
  <VrstaEmbarga ID="1" Naziv="Takojšnja javna objava" OpenAIREDostop="openAccess"></VrstaEmbarga>
  <Osebe>
    <Oseba ID="45364" Ime="Damjan" Priimek="Popič" AltIme="" VlogaID="70" VlogaNaziv="Avtor" ConorID="132972643" Afiliacija="" ArrsID="33783" ORCID=""></Oseba>
  </Osebe>
  <Identifikatorji>
    <Identifikator ID="4" Sifra="UDK" Naziv="UDK" URL="">821.163.6:159.942:004</Identifikator>
    <Identifikator ID="15" Sifra="DOI" Naziv="DOI" URL="http://dx.doi.org/10.4312/Obdobja.44.269-278">10.4312/Obdobja.44.269-278</Identifikator>
    <Identifikator ID="3" Sifra="CobissID" Naziv="COBISS_ID" URL="https://plus.cobiss.net/cobiss/si/sl/bib/259649283">259649283</Identifikator>
    <Identifikator ID="13" Sifra="OceCobissID" Naziv="OceCobissID" URL="https://plus.cobiss.net/cobiss/si/sl/bib/256053251">256053251</Identifikator>
  </Identifikatorji>
  <Datoteke>
    <Datoteka ID="227619" DatotekaNRID="14586781" NamenDatotekeID="2" NamenDatoteke="Predstavitvena datoteka" FormatDatotekeID="2" FormatDatoteke=".pdf" MIME="application/pdf" IkonaFormata="pdf.png" IkonaFormataPolniUrl="https://repozitorij.uni-lj.si/teme/rulDev/img/fileTypes/pdf.png" VelikostDatoteke="477333" VelikostDatotekeKratko="466,15 KB" DatumVstavljanja="2026-02-09 13:18:49" JeZbrisana="false" JeJavnoVidna="true" JeIndeksirana="true" JeVidno="true" VidnoOd="01.01.1970" Zaporedje="0">
      <Naziv>RAZ_Popic_Damjan_2025.pdf</Naziv>
      <OrgNaziv>RAZ_Popic_Damjan_2025.pdf</OrgNaziv>
      <URL></URL>
      <Opis></Opis>
      <OpisTujJezik></OpisTujJezik>
      <UrlObdelave></UrlObdelave>
      <FrekvencaAzuriranjaID>1</FrekvencaAzuriranjaID>
      <Verzija></Verzija>
      <MD5>C1EBDAB88D1B0051D9DFCF305DA14C09</MD5>
      <SHA256>314d849736f3762eab5da4a6a6379933176cf4c08ed31c5b118aa86fc669a945</SHA256>
      <UUID>5a175f26-05b1-11f1-a1ba-0050569b8976</UUID>
      <PID></PID>
      <PrenosPolniUrl>https://repozitorij.uni-lj.si/Dokument.php?lang=slv&amp;id=227619</PrenosPolniUrl>
      <Vsebine>
        <Vsebina TipVsebine="GoloBesedilo" JezikID="1060" Oznaka="" Dolzina="23356"></Vsebina>
      </Vsebine>
    </Datoteka>
    <Datoteka ID="227620" DatotekaNRID="0" NamenDatotekeID="5" NamenDatoteke="Izvorni URL" FormatDatotekeID="56" FormatDatoteke="URL" MIME="text/url" IkonaFormata="url.png" IkonaFormataPolniUrl="https://repozitorij.uni-lj.si/teme/rulDev/img/fileTypes/url.png" VelikostDatoteke="0" VelikostDatotekeKratko="0,00 KB" DatumVstavljanja="2026-02-09 13:19:55" JeZbrisana="false" JeJavnoVidna="true" JeIndeksirana="false" JeVidno="true" VidnoOd="01.01.1970" Zaporedje="2">
      <Naziv></Naziv>
      <OrgNaziv></OrgNaziv>
      <URL>https://centerslo.si/simpozij-obdobja/zborniki/obdobja-44/</URL>
      <Opis></Opis>
      <OpisTujJezik></OpisTujJezik>
      <UrlObdelave></UrlObdelave>
      <FrekvencaAzuriranjaID>0</FrekvencaAzuriranjaID>
      <Verzija></Verzija>
      <MD5></MD5>
      <SHA256></SHA256>
      <UUID>813ff95c-05b1-11f1-a1ba-0050569b8976</UUID>
      <PID></PID>
      <PrenosPolniUrl>https://repozitorij.uni-lj.si/Dokument.php?lang=slv&amp;id=227620</PrenosPolniUrl>
      <Vsebine>
      </Vsebine>
    </Datoteka>
  </Datoteke>
  <Organizacije>
    <Organizacija OrganizacijaID="17" Kratica="FF" ZavodEvsID="0000071" Logo="" LogoPolniUrl="https://repozitorij.uni-lj.si/teme/rulDev/img/logo/">Filozofska fakulteta </Organizacija>
  </Organizacije>
  <OrganizacijeVira>
  </OrganizacijeVira>
  <MetodeZbiranjaPodatkov>
  </MetodeZbiranjaPodatkov>
  <TipologijaDela ID="1.16" Koda="1.16" Naziv="Samostojni znanstveni sestavek ali poglavje v monografski publikaciji" SchemaOrg="Chapter"></TipologijaDela>
  <Ostalo>
    <StIrodsDatotek>0</StIrodsDatotek>
    <StDatotekPodTrajnimEmbargom>0</StDatotekPodTrajnimEmbargom>
    <StDatotekZOmejenimDostopom>0</StDatotekZOmejenimDostopom>
  </Ostalo>
</Gradivo>
