<?xml version="1.0" encoding="utf-8"?>
<Gradivo ID="181444" NadgradivoID="0" NRID="28412810" OceID="0" DomainUrl="https://repozitorij.uni-lj.si/" IzpisPolniUrl="https://repozitorij.uni-lj.si/IzpisGradiva.php?lang=slv&amp;id=181444" StOgledov="14" StPrenosov="3" StOcen="0" VsotaOcen="0" DatumIzvoza="2026-04-10 08:13:42" OcenaSkupna="0" StPodgradiv="0" StudijskiProgramEvsID="" JeIndeksirano="0" JeVecAvtorjev="0" DovoliZahtevkeZaDostop="0">
  <PID Url="http://hdl.handle.net/20.500.12556/RUL-181444">20.500.12556/RUL-181444</PID>
  <Naslov>Razvrščanje sopomenskih kandidatov z uporabo ChatGPT</Naslov>
  <Podnaslov>raziskovalni podatki, obravnavani v doktorskem delu</Podnaslov>
  <TujJezik_Naslov>Sorting synonym candidates using ChatGPT</TujJezik_Naslov>
  <TujJezik_Podnaslov>research data underlying the doctoral dissertation</TujJezik_Podnaslov>
  <Opis>Podatkovna zbirka prikazuje vhodne in izhodne podatke za poskus uporabe sistema ChatGPT za čiščenje strojno pridobljenih sopomenskih kandidatov in njihovo umeščanje pod ustrezne besedne pomene.
Podatki so nastali z uporabo baz Slovarja sopomenk sodobne slovenščine v njegovi prvi (1.0) in drugi (2.0) različici. Kot vhodni podatki so bili iz SSSS 1.0 izluščeni strojno pridobljeni sopomenski kandidati, iz SSSS 2.0 pa podatki o pomenski členitvi posameznih iztočnic. Izhodni podatki prikazujejo rezultate razvrstitve sopomenskih kandidatov, ki jo je opravil API model GPT-4 na podlagi poziva, ki je zabeležen v dnevniški datoteki.
Postopek analize podatkov je podrobneje opisan v članku »Kako dober je ChatGPT pri umeščanju sopomenk pod besedne pomene« (Gapsa, Arhar Holdt in Kosem, 2024).
Timotej Petrič, študent Fakultete za računalništvo in informatiko Univerze v Ljubljani, je med pripravo raziskovalnih podatkov pomagal pri tehničnih vidikih postopka.
Pri pripravi raziskovalnih podatkov je sodeloval Timotej Petrič, študent FRI UL, ki je pomagal pri tehnični izvedbi postopka.</Opis>
  <TujJezik_Opis>The dataset contains the input and output data for an experiment using the ChatGPT system to clean automatically obtained synonym candidates and assign them to appropriate word senses.
The data was compiled using the first (1.0) and second (2.0) versions of the Thesaurus of Modern Slovene (SSSS). Input data include automatically obtained synonym candidates from SSSS 1.0 and word senses of individual headwords from SSSS 2.0. The output data presents the result of the classification of synonym candidates performed by the GPT-4 API model based on the prompt recorded in the log file.
The data analysis process is described in detail in the paper &quot;Kako dober je ChatGPT pri umeščanju sopomenk pod besedne pomene &quot; (Gapsa, Arhar Holdt, and Kosem, 2024).
Timotej Petrič, a student at the Faculty of Computer and Information Science at the University of Ljubljana, assisted with the technical aspects of the process during the preparation of the research data.</TujJezik_Opis>
  <KljucneBesede>
    <Beseda>digitalno slovaropisje</Beseda>
    <Beseda>ChatGPT</Beseda>
    <Beseda>sopomenke</Beseda>
    <Beseda>besedni pomen</Beseda>
    <Beseda>slovenščina</Beseda>
    <Beseda>Slovar sopomenk sodobne slovenščine</Beseda>
    <Beseda>raziskovalni podatki</Beseda>
  </KljucneBesede>
  <TujJezik_KljucneBesede>
    <Beseda>digital lexicography</Beseda>
    <Beseda>ChatGPT</Beseda>
    <Beseda>synonyms</Beseda>
    <Beseda>word senses</Beseda>
    <Beseda>Slovene language</Beseda>
    <Beseda>Thesaurus of Modern Slovene</Beseda>
    <Beseda>research data</Beseda>
  </TujJezik_KljucneBesede>
  <Potrjeno>true</Potrjeno>
  <JeZaklenjeno>false</JeZaklenjeno>
  <JeRecenzirano>false</JeRecenzirano>
  <Zaloznik></Zaloznik>
  <Izvor></Izvor>
  <Jezik ID="1060" ISO639-3="slv">Slovenski jezik</Jezik>
  <TujJezik ID="1033" ISO639-3="eng">Angleški jezik</TujJezik>
  <Povezave></Povezave>
  <Pokrivanje></Pokrivanje>
  <CasovnoPokritje>Podatki ustvarjeni in analizirani v letu 2024.</CasovnoPokritje>
  <AvtorskePravice></AvtorskePravice>
  <VrstaGradiva ID="" DRIVER="info:eu-repo/semantics/other">Neznano</VrstaGradiva>
  <DatumVstavljanja>2026-04-08 09:35:17</DatumVstavljanja>
  <DatumObjave>2026-04-09 22:29:50</DatumObjave>
  <DatumSpremembe>2026-04-10 04:38:51</DatumSpremembe>
  <DatumTrajnegaHranjenja>0000-00-00 00:00:00</DatumTrajnegaHranjenja>
  <LetoIzida>2026</LetoIzida>
  <LetoIzidaDo>0</LetoIzidaDo>
  <KrajIzida></KrajIzida>
  <LetoIzvedbe>0</LetoIzvedbe>
  <KrajIzvedbe></KrajIzvedbe>
  <Opomba></Opomba>
  <StStrani></StStrani>
  <StevilcenjeNivo1></StevilcenjeNivo1>
  <StevilcenjeNivo2></StevilcenjeNivo2>
  <Kronologija></Kronologija>
  <Patent_Stevilka></Patent_Stevilka>
  <Patent_DatumVeljavnosti>0000-00-00</Patent_DatumVeljavnosti>
  <VerzijaDokumenta>NiDoloceno</VerzijaDokumenta>
  <StatusObjaveDrugje>NiDoloceno</StatusObjaveDrugje>
  <VrstaStroskaObjave>NiDoloceno</VrstaStroskaObjave>
  <DatumPoslanoVRecenzijo>0000-00-00</DatumPoslanoVRecenzijo>
  <DatumSprejetjaClanka>0000-00-00</DatumSprejetjaClanka>
  <DatumObjaveClanka>0000-00-00</DatumObjaveClanka>
  <Licence>
    <Licenca ID="6" Kratica="CC BY 4.0" Naziv="Creative Commons Priznanje avtorstva 4.0 Mednarodna" URL="http://creativecommons.org/licenses/by/4.0/deed.sl" Logo="by.png" LogoPolniUrl="https://repozitorij.uni-lj.si/teme/rulDev/img/licence/by.png" DatumZacetkaLicenciranja="" VezanoNa="" VezanoNaAng="" Besedilo="" BesediloAng=""></Licenca>
  </Licence>
  <EmbargoDo></EmbargoDo>
  <VrstaEmbarga ID="1" Naziv="Takojšnja javna objava" OpenAIREDostop="openAccess"></VrstaEmbarga>
  <Osebe>
    <Oseba ID="121713" Ime="Magdalena" Priimek="Gapsa" AltIme="" VlogaID="70" VlogaNaziv="Avtor" ConorID="384433923" Afiliacija="" ArrsID="53628" ORCID=""></Oseba>
  </Osebe>
  <Identifikatorji>
  </Identifikatorji>
  <Datoteke>
    <Datoteka ID="231907" DatotekaNRID="0" NamenDatotekeID="9" NamenDatoteke="Opis podatkov" FormatDatotekeID="45" FormatDatoteke=".docx" MIME="application/msword" IkonaFormata="doc.png" IkonaFormataPolniUrl="https://repozitorij.uni-lj.si/teme/rulDev/img/fileTypes/doc.png" VelikostDatoteke="2739446" VelikostDatotekeKratko="2,61 MB" DatumVstavljanja="2026-04-08 09:38:59" JeZbrisana="false" JeJavnoVidna="true" JeIndeksirana="true" JeVidno="true" VidnoOd="01.01.1970" Zaporedje="0">
      <Naziv>PREBERI_ME-README.docx</Naziv>
      <OrgNaziv>PREBERI_ME-README.docx</OrgNaziv>
      <URL></URL>
      <Opis>PREBERI ME - README</Opis>
      <OpisTujJezik></OpisTujJezik>
      <UrlObdelave></UrlObdelave>
      <FrekvencaAzuriranjaID>1</FrekvencaAzuriranjaID>
      <Verzija></Verzija>
      <MD5>E7C686724AA7234064651F18AAA09168</MD5>
      <SHA256>5c8e34af6af8d8b400b69f3d97c7e0aeca534b2ec22f749d3d1741e5d5b8d3e4</SHA256>
      <UUID>cfc97bfc-331d-11f1-b0ab-0050569b8976</UUID>
      <PID></PID>
      <PrenosPolniUrl>https://repozitorij.uni-lj.si/Dokument.php?lang=slv&amp;id=231907</PrenosPolniUrl>
      <Vsebine>
      </Vsebine>
    </Datoteka>
    <Datoteka ID="231904" DatotekaNRID="0" NamenDatotekeID="9" NamenDatoteke="Opis podatkov" FormatDatotekeID="41" FormatDatoteke=".txt" MIME="text/plain" IkonaFormata="txt.png" IkonaFormataPolniUrl="https://repozitorij.uni-lj.si/teme/rulDev/img/fileTypes/txt.png" VelikostDatoteke="3557" VelikostDatotekeKratko="3,47 KB" DatumVstavljanja="2026-04-08 09:38:58" JeZbrisana="false" JeJavnoVidna="true" JeIndeksirana="true" JeVidno="true" VidnoOd="01.01.1970" Zaporedje="1">
      <Naziv>log_file.txt</Naziv>
      <OrgNaziv>log_file.txt</OrgNaziv>
      <URL></URL>
      <Opis>Log file</Opis>
      <OpisTujJezik></OpisTujJezik>
      <UrlObdelave></UrlObdelave>
      <FrekvencaAzuriranjaID>1</FrekvencaAzuriranjaID>
      <Verzija></Verzija>
      <MD5>A56FA0BF8EE05D59693DEC29FBE9E802</MD5>
      <SHA256>ee56c234269de0661fe0e5ae17612c3f115bd540e8651cbdc41240e2b941b34b</SHA256>
      <UUID>cf376810-331d-11f1-b0ab-0050569b8976</UUID>
      <PID></PID>
      <PrenosPolniUrl>https://repozitorij.uni-lj.si/Dokument.php?lang=slv&amp;id=231904</PrenosPolniUrl>
      <Vsebine>
      </Vsebine>
    </Datoteka>
    <Datoteka ID="231903" DatotekaNRID="0" NamenDatotekeID="7" NamenDatoteke="Raziskovalni podatki" FormatDatotekeID="57" FormatDatoteke=".xlsx" MIME="application/vnd.openxmlformats-officedocument.spreadsheetml.sheet" IkonaFormata="xls.png" IkonaFormataPolniUrl="https://repozitorij.uni-lj.si/teme/rulDev/img/fileTypes/xls.png" VelikostDatoteke="29187" VelikostDatotekeKratko="28,50 KB" DatumVstavljanja="2026-04-08 09:38:58" JeZbrisana="false" JeJavnoVidna="true" JeIndeksirana="false" JeVidno="true" VidnoOd="01.01.1970" Zaporedje="2">
      <Naziv>input_data.xlsx</Naziv>
      <OrgNaziv>input_data.xlsx</OrgNaziv>
      <URL></URL>
      <Opis>Input data XLSX</Opis>
      <OpisTujJezik></OpisTujJezik>
      <UrlObdelave></UrlObdelave>
      <FrekvencaAzuriranjaID>1</FrekvencaAzuriranjaID>
      <Verzija></Verzija>
      <MD5>F6F5EBC5E0C64B645F1F563D4B1542D9</MD5>
      <SHA256>a0bd63ac6ae34b6a009886c5c807a293e8ca3e797f8f0746fbc5446050b537b5</SHA256>
      <UUID>cf1f4fe6-331d-11f1-b0ab-0050569b8976</UUID>
      <PID></PID>
      <PrenosPolniUrl>https://repozitorij.uni-lj.si/Dokument.php?lang=slv&amp;id=231903</PrenosPolniUrl>
      <Vsebine>
      </Vsebine>
    </Datoteka>
    <Datoteka ID="231906" DatotekaNRID="0" NamenDatotekeID="7" NamenDatoteke="Raziskovalni podatki" FormatDatotekeID="57" FormatDatoteke=".xlsx" MIME="application/vnd.openxmlformats-officedocument.spreadsheetml.sheet" IkonaFormata="xls.png" IkonaFormataPolniUrl="https://repozitorij.uni-lj.si/teme/rulDev/img/fileTypes/xls.png" VelikostDatoteke="34311" VelikostDatotekeKratko="33,51 KB" DatumVstavljanja="2026-04-08 09:38:59" JeZbrisana="false" JeJavnoVidna="true" JeIndeksirana="false" JeVidno="true" VidnoOd="01.01.1970" Zaporedje="3">
      <Naziv>output_data.xlsx</Naziv>
      <OrgNaziv>output_data.xlsx</OrgNaziv>
      <URL></URL>
      <Opis>Output data XLSX</Opis>
      <OpisTujJezik></OpisTujJezik>
      <UrlObdelave></UrlObdelave>
      <FrekvencaAzuriranjaID>1</FrekvencaAzuriranjaID>
      <Verzija></Verzija>
      <MD5>E1DF3BCCD7FC2C100784373C7C971495</MD5>
      <SHA256>197a8499ce82a195b195f0e337aaa53a3f8112dc8e3b1e1016e444bed4ddd73b</SHA256>
      <UUID>cfb7ffeb-331d-11f1-b0ab-0050569b8976</UUID>
      <PID></PID>
      <PrenosPolniUrl>https://repozitorij.uni-lj.si/Dokument.php?lang=slv&amp;id=231906</PrenosPolniUrl>
      <Vsebine>
      </Vsebine>
    </Datoteka>
    <Datoteka ID="231902" DatotekaNRID="0" NamenDatotekeID="7" NamenDatoteke="Raziskovalni podatki" FormatDatotekeID="59" FormatDatoteke=".csv" MIME="text/csv" IkonaFormata="csv.png" IkonaFormataPolniUrl="https://repozitorij.uni-lj.si/teme/rulDev/img/fileTypes/csv.png" VelikostDatoteke="33342" VelikostDatotekeKratko="32,56 KB" DatumVstavljanja="2026-04-08 09:38:58" JeZbrisana="false" JeJavnoVidna="true" JeIndeksirana="false" JeVidno="true" VidnoOd="01.01.1970" Zaporedje="4">
      <Naziv>input_data.csv</Naziv>
      <OrgNaziv>input_data.csv</OrgNaziv>
      <URL></URL>
      <Opis>Input data CSV</Opis>
      <OpisTujJezik></OpisTujJezik>
      <UrlObdelave></UrlObdelave>
      <FrekvencaAzuriranjaID>1</FrekvencaAzuriranjaID>
      <Verzija></Verzija>
      <MD5>1621ADDBE7DCCF42492D4A0EF7BEDCD4</MD5>
      <SHA256>537ff96c98e6b98457633c8069623e349d551c5f1de1f793747319a7bef0033e</SHA256>
      <UUID>cf09f19c-331d-11f1-b0ab-0050569b8976</UUID>
      <PID></PID>
      <PrenosPolniUrl>https://repozitorij.uni-lj.si/Dokument.php?lang=slv&amp;id=231902</PrenosPolniUrl>
      <Vsebine>
      </Vsebine>
    </Datoteka>
    <!-- to gradivo ima še več datotek, tukaj jih izpiše največ 5 -->  </Datoteke>
  <Organizacije>
    <Organizacija OrganizacijaID="17" Kratica="FF" ZavodEvsID="0000071" Logo="" LogoPolniUrl="https://repozitorij.uni-lj.si/teme/rulDev/img/logo/">Filozofska fakulteta </Organizacija>
  </Organizacije>
  <OrganizacijeVira>
  </OrganizacijeVira>
  <MetodeZbiranjaPodatkov>
  </MetodeZbiranjaPodatkov>
  <TipologijaDela ID="2.20" Koda="2.20" Naziv="Zaključena znanstvena zbirka raziskovalnih podatkov" SchemaOrg="DataSet"></TipologijaDela>
  <OpenAIRE>
    <OpenAIRE ProjektID="info:eu-repo/grantAgreement/ARIS//P6-0411" Stevilka="P6-0411" Naslov="Jezikovni viri in tehnologije za slovenski jezik" Akronim="" Delez="0"></OpenAIRE>
  </OpenAIRE>
  <Ostalo>
    <StIrodsDatotek>0</StIrodsDatotek>
    <StDatotekPodTrajnimEmbargom>0</StDatotekPodTrajnimEmbargom>
    <StDatotekZOmejenimDostopom>0</StDatotekZOmejenimDostopom>
  </Ostalo>
</Gradivo>
