Vaš brskalnik ne omogoča JavaScript!
JavaScript je nujen za pravilno delovanje teh spletnih strani. Omogočite JavaScript ali pa uporabite sodobnejši brskalnik.
Repozitorij Univerze v Ljubljani
Nacionalni portal odprte znanosti
Odprta znanost
DiKUL
slv
|
eng
Iskanje
Brskanje
Novo v RUL
Kaj je RUL
V številkah
Pomoč
Prijava
Podrobno
Poenostavljanje besedil v slovenščini z velikimi jezikovnimi modeli
ID
Bone, Blaž
(
Avtor
),
ID
Robnik Šikonja, Marko
(
Mentor
)
Več o mentorju...
PDF - Predstavitvena datoteka,
prenos
(403,86 KB)
MD5: 47DD92C39863622A81B991D603A9A146
Galerija slik
Izvleček
V diplomski nalogi smo raziskali poenostavljanje besedil v slovenščini z uporabo velikih jezikovnih modelov. Cilj naloge je bil razviti modele, ki lahko učinkovito poenostavijo slovenska besedila. Uporabili smo obstoječe angleške učne množice, jih strojno prevedli v slovenščino, nato na teh podatkih naučili modele, kot so SloT5, mT5 in mBART. Izvedli smo kvantitativno in kvalitativno analizo rezultatov, pri čemer smo uporabili metrike, kot so BLEU, SARI, BERTScore in LaBSE Similarity. Rezultati so pokazali, da so modeli uspešno poenostavili besedila, ohranili ključne informacije in smiselno poenostavili strukturo in jezik. Kljub uspešnim poenostavitvam so modeli pogosto ponovili izvirne povedi brez večjih sprememb.
Jezik:
Slovenski jezik
Ključne besede:
obdelava naravnega jezika
,
poenostavljanje besedila
,
strojno učenje
,
veliki jezikovni modeli
Vrsta gradiva:
Diplomsko delo/naloga
Tipologija:
2.11 - Diplomsko delo
Organizacija:
FRI - Fakulteta za računalništvo in informatiko
Leto izida:
2024
PID:
20.500.12556/RUL-160702
COBISS.SI-ID:
209156355
Datum objave v RUL:
03.09.2024
Število ogledov:
406
Število prenosov:
57
Metapodatki:
Citiraj gradivo
Navadno besedilo
BibTeX
EndNote XML
EndNote/Refer
RIS
ABNT
ACM Ref
AMA
APA
Chicago 17th Author-Date
Harvard
IEEE
ISO 690
MLA
Vancouver
:
BONE, Blaž, 2024,
Poenostavljanje besedil v slovenščini z velikimi jezikovnimi modeli
[na spletu]. Diplomsko delo. [Dostopano 9 april 2025]. Pridobljeno s: https://repozitorij.uni-lj.si/IzpisGradiva.php?lang=slv&id=160702
Kopiraj citat
Objavi na:
Sekundarni jezik
Jezik:
Angleški jezik
Naslov:
Text simplification for Slovene using large language models
Izvleček:
In this thesis, we explored text simplification in Slovene using large language models. The goal of the thesis was to develop models that can effectively simplify Slovene texts. We used existing English training datasets, which we machine-translated into Slovene, and then trained models such as SloT5, mT5, and mBART on these data. We conducted quantitative and qualitative analysis of the results, using metrics such as BLEU, SARI, BERTScore, and LaBSE Similarity. The results showed that the models can successfully simplify texts, retain key information, and meaningfully simplify the structure and language. Despite the successful simplifications, the models often repeat the original sentences without significant changes.
Ključne besede:
natural language processing
,
text simplification
,
machine learning
,
large language models
Podobna dela
Podobna dela v RUL:
Iščem podobna dela...
Podobna dela v drugih slovenskih zbirkah:
Nazaj