Vaš brskalnik ne omogoča JavaScript!
JavaScript je nujen za pravilno delovanje teh spletnih strani. Omogočite JavaScript ali pa uporabite sodobnejši brskalnik.
Repozitorij Univerze v Ljubljani
Nacionalni portal odprte znanosti
Odprta znanost
DiKUL
slv
|
eng
Iskanje
Napredno
Novo v RUL
Kaj je RUL
V številkah
Pomoč
Prijava
Podrobno
Razvrščanje sopomenskih kandidatov z uporabo ChatGPT : raziskovalni podatki, obravnavani v doktorskem delu
ID
Gapsa, Magdalena
(
Avtor
)
DOCX - Opis podatkov,
prenos
(2,61 MB)
MD5: E7C686724AA7234064651F18AAA09168
Opis: PREBERI ME - README
TXT - Opis podatkov,
prenos
(3,47 KB)
MD5: A56FA0BF8EE05D59693DEC29FBE9E802
Opis: Log file
XLSX - Raziskovalni podatki,
prenos
(28,50 KB)
MD5: F6F5EBC5E0C64B645F1F563D4B1542D9
Opis: Input data XLSX
To gradivo ima še več datotek. Celoten seznam je na voljo
spodaj
.
Galerija slik
Izvleček
Podatkovna zbirka prikazuje vhodne in izhodne podatke za poskus uporabe sistema ChatGPT za čiščenje strojno pridobljenih sopomenskih kandidatov in njihovo umeščanje pod ustrezne besedne pomene. Podatki so nastali z uporabo baz Slovarja sopomenk sodobne slovenščine v njegovi prvi (1.0) in drugi (2.0) različici. Kot vhodni podatki so bili iz SSSS 1.0 izluščeni strojno pridobljeni sopomenski kandidati, iz SSSS 2.0 pa podatki o pomenski členitvi posameznih iztočnic. Izhodni podatki prikazujejo rezultate razvrstitve sopomenskih kandidatov, ki jo je opravil API model GPT-4 na podlagi poziva, ki je zabeležen v dnevniški datoteki. Postopek analize podatkov je podrobneje opisan v članku »Kako dober je ChatGPT pri umeščanju sopomenk pod besedne pomene« (Gapsa, Arhar Holdt in Kosem, 2024). Timotej Petrič, študent Fakultete za računalništvo in informatiko Univerze v Ljubljani, je med pripravo raziskovalnih podatkov pomagal pri tehničnih vidikih postopka. Pri pripravi raziskovalnih podatkov je sodeloval Timotej Petrič, študent FRI UL, ki je pomagal pri tehnični izvedbi postopka.
Jezik:
Slovenski jezik
Ključne besede:
digitalno slovaropisje
,
ChatGPT
,
sopomenke
,
besedni pomen
,
slovenščina
,
Slovar sopomenk sodobne slovenščine
,
raziskovalni podatki
Tipologija:
2.20 - Zaključena znanstvena zbirka raziskovalnih podatkov
Časovno pokritje:
Podatki ustvarjeni in analizirani v letu 2024.
Organizacija:
FF - Filozofska fakulteta
Leto izida:
2026
PID:
20.500.12556/RUL-181444
Datum objave v RUL:
09.04.2026
Število ogledov:
10
Število prenosov:
0
Metapodatki:
Citiraj gradivo
Navadno besedilo
BibTeX
EndNote XML
EndNote/Refer
RIS
ABNT
ACM Ref
AMA
APA
Chicago 17th Author-Date
Harvard
IEEE
ISO 690
MLA
Vancouver
:
Kopiraj citat
Objavi na:
Licence
Licenca:
CC BY 4.0, Creative Commons Priznanje avtorstva 4.0 Mednarodna
Povezava:
http://creativecommons.org/licenses/by/4.0/deed.sl
Opis:
To je standardna licenca Creative Commons, ki daje uporabnikom največ možnosti za nadaljnjo uporabo dela, pri čemer morajo navesti avtorja.
Sekundarni jezik
Jezik:
Angleški jezik
Naslov:
Sorting synonym candidates using ChatGPT : research data underlying the doctoral dissertation
Izvleček:
The dataset contains the input and output data for an experiment using the ChatGPT system to clean automatically obtained synonym candidates and assign them to appropriate word senses. The data was compiled using the first (1.0) and second (2.0) versions of the Thesaurus of Modern Slovene (SSSS). Input data include automatically obtained synonym candidates from SSSS 1.0 and word senses of individual headwords from SSSS 2.0. The output data presents the result of the classification of synonym candidates performed by the GPT-4 API model based on the prompt recorded in the log file. The data analysis process is described in detail in the paper "Kako dober je ChatGPT pri umeščanju sopomenk pod besedne pomene " (Gapsa, Arhar Holdt, and Kosem, 2024). Timotej Petrič, a student at the Faculty of Computer and Information Science at the University of Ljubljana, assisted with the technical aspects of the process during the preparation of the research data.
Ključne besede:
digital lexicography
,
ChatGPT
,
synonyms
,
word senses
,
Slovene language
,
Thesaurus of Modern Slovene
,
research data
Projekti
Financer:
ARIS - Javna agencija za znanstvenoraziskovalno in inovacijsko dejavnost Republike Slovenije
Številka projekta:
P6-0411
Naslov:
Jezikovni viri in tehnologije za slovenski jezik
Podobna dela
Podobna dela v RUL:
Podobna dela v drugih slovenskih zbirkah:
Datoteke
Podatki se nalagajo...
Nazaj