Vaš brskalnik ne omogoča JavaScript!
JavaScript je nujen za pravilno delovanje teh spletnih strani. Omogočite JavaScript ali pa uporabite sodobnejši brskalnik.
Nacionalni portal odprte znanosti
Odprta znanost
DiKUL
slv
|
eng
Iskanje
Brskanje
Novo v RUL
Kaj je RUL
V številkah
Pomoč
Prijava
Evalvacija sistema za strojno prevajanje predavanj
ID
Krek, Luka
(
Avtor
),
ID
Popič, Damjan
(
Mentor
)
Več o mentorju...
PDF - Predstavitvena datoteka,
prenos
(3,74 MB)
MD5: 098645787E7928818AE997F063CF7CB9
XLSX - Priloga,
prenos
(45,94 KB)
MD5: D2D0E07E708D3C3D74D55FE80192F3B7
XLSX - Priloga,
prenos
(68,62 KB)
MD5: 29C95A60523B9D20E90BE4DDBDD5E7E5
To gradivo ima še več datotek. Celoten seznam je na voljo
spodaj
.
Galerija slik
Izvleček
Ob današnjem tehnološkem napredku na področju zagotavljanja jezikovnih in prevajalskih storitev je pomembno, da temu sledi tudi univerzitetno študijsko okolje. Temu je namenjen projekt oz. proces razvoja sistema za strojno prevajanje predavanj Online Notes (ON), ki ga obravnava to magistrsko delo. Namen dela je predstaviti osnovne značilnosti delovanja sistema ON, ugotoviti, kako dobro deluje na trenutni stopnji razvoja in postaviti temelje za nadaljnje ocenjevanje njegove uspešnosti v prihodnje. Analizirano je delovanje sistema, ki je razdeljeno na tri stopnje – razpoznava govora v slovenščini, prevajanje besedila iz slovenščine v angleščino, in prikaz besedila v obliki podnapisov, ki je namenjen končnim uporabnikom. Pri prvi stopnji so analizirane napake v prepoznavanju in pretvorbi govora s pomočjo metode podrobne ročne evalvacije. Enako metodo smo nato uporabili pri evalvaciji prevodov, ki je bila poleg tega opravljena tudi strojno, in sicer z uporabo ocenjevalnih metrik BLEU in METEOR. Odzive končnih uporabnikov pri tretji stopnji smo preverili s pomočjo anketnega vprašalnika. Pokazalo se je, da so pri razpoznavi govora potrebne določene izboljšave, predvsem pri segmentaciji stavkov. Napake so posledično vplivale tudi na slabšo kvaliteto prevodov, kljub temu pa so rezultati prevajalnika znotraj sistema ON v primerjavi s prevajalnikoma Google in DeepL solidni. To potrjujejo tudi odzivi respondentov v anketnem vprašalniku. Rezultati raziskave kažejo, da je razvoj sistema na dobri poti in da lahko ob primernih izboljšavah pričakujemo kvaliteten sistem za strojno prevajanje predavanj, ki bo primeren za uporabo v predavalnicah.
Jezik:
Slovenski jezik
Ključne besede:
Strojno prevajanje
,
ročna evalvacija
,
razpoznava govora
,
avtomatsko podnaslavljanje
,
analiza napak
Vrsta gradiva:
Magistrsko delo/naloga
Organizacija:
FF - Filozofska fakulteta
Leto izida:
2021
PID:
20.500.12556/RUL-133615
COBISS.SI-ID:
102494211
Datum objave v RUL:
04.12.2021
Število ogledov:
1993
Število prenosov:
187
Metapodatki:
Citiraj gradivo
Navadno besedilo
BibTeX
EndNote XML
EndNote/Refer
RIS
ABNT
ACM Ref
AMA
APA
Chicago 17th Author-Date
Harvard
IEEE
ISO 690
MLA
Vancouver
:
Kopiraj citat
Objavi na:
Sekundarni jezik
Jezik:
Angleški jezik
Naslov:
Evaluation of a machine translation system for lectures
Izvleček:
With today's technological advances in language and translation services, it is important that the university learning environment keeps up with the times. This is the aim of the project for the development of Online Notes (ON), an automatic machine translation system for lectures. The purpose of this thesis is to present the basic features of the ON system, to determine how well it is working at its current stage of development and to lay the foundations for further evaluation of performance of the system in the future. The analysis of the system's performance is divided into three stages – automatic speech recognition (ASR) in Slovene, neural machine translation (NMT) from Slovene to English, and display of the text in subtitle form for end-users. At the first stage, errors in automatic speech recognition are analysed using a detailed manual evaluation method. The same method is applied in the evaluation of machine translation, which was also done automatically using the BLEU and METEOR evaluation metrics. Evaluations by the end-users were collected by means of a questionnaire. Results show that improvements are needed in speech recognition, and especially in sentence segmentation. Consequently, segmentation errors resulted in a lower quality of the translations, but the results of the ON system’s translator are solid compared to the Google and DeepL translators. This was also confirmed by the respondents' answers. Final results show that the development of the system is well on track and that, with appropriate improvements, we can expect an effective system for machine translation of lectures that will be suitable for use in lecture theatres.
Ključne besede:
Machine translation
,
manual evaluation
,
speech recognition
,
automatic captioning
,
error analysis
Podobna dela
Podobna dela v RUL:
Podobna dela v drugih slovenskih zbirkah:
Datoteke
Podatki se nalagajo...
Nazaj