Podrobno

Oblikoskladenjsko označevanje slovenskega jezika z globokimi nevronskimi mrežami
ID Belej, Primož (Avtor), ID Robnik Šikonja, Marko (Mentor) Več o mentorju... Povezava se odpre v novem oknu, ID Krek, Simon (Komentor)

.pdfPDF - Predstavitvena datoteka, prenos (4,95 MB)
MD5: 93613CCF380E4F794BB8825859E333F3

Izvleček
V magistrskem delu se ukvarjamo z oblikoskladenjskim označevanjem slovenskega jezika. Pri tej nalogi s področja obdelave naravnega jezika povedim priredimo ustrezno zaporedje oznak, ki opisujejo oblikoskladenjske lastnosti besed. Za razliko od tipičnih pristopov, ki vhodne povedi obravnavajo na nivoju besed, naša rešitev obravnava vhodne povedi kot zaporedja znakov. Nalogo označevanja rešujemo s kombinacijo konvolucijskih in rekurentnih nevronskih mrež. Posebnost našega pristopa je tudi v sami naravi označevanja, saj ga ne obravnavamo kot problem večrazredne klasifikacije, temveč kot večznačno klasifikacijo, kjer primerom dodeljujemo oznake. Z namenom izboljšave rezultatov našo rešitev združimo v ansambel treh označevalnikov, skupaj z dvema obstoječima označevalnikoma za slovenski jezik. Ob primerjavi naše rešitve z obstoječimi ugotovimo, da predlagana rešitev dosega najboljše rezultate pri reševanju zadanega problema.

Jezik:Slovenski jezik
Ključne besede:strojno učenje, oblikoskladenjsko označevanje, globoko učenje, konvolucijske nevronske mreže, rekurentne nevronske mreže, ansambli klasifikatorjev
Vrsta gradiva:Magistrsko delo/naloga
Organizacija:FRI - Fakulteta za računalništvo in informatiko
Leto izida:2018
PID:20.500.12556/RUL-105266 Povezava se odpre v novem oknu
Datum objave v RUL:16.11.2018
Število ogledov:3278
Število prenosov:410
Metapodatki:XML DC-XML DC-RDF
:
BELEJ, Primož, 2018, Oblikoskladenjsko označevanje slovenskega jezika z globokimi nevronskimi mrežami [na spletu]. Magistrsko delo. [Dostopano 14 junij 2025]. Pridobljeno s: https://repozitorij.uni-lj.si/IzpisGradiva.php?lang=slv&id=105266
Kopiraj citat
Objavi na:Bookmark and Share

Sekundarni jezik

Jezik:Angleški jezik
Naslov:Part of speech tagging of slovene language using deep neural networks
Izvleček:
The thesis deals with part of speech tagging of Slovene language. Part of speech tagging is a process of matching sentences in natural language with a sequence of suitable tags, which contain information about parts of speech and morphological properties of words. Our solution uses character-level representation of words, which is different from typical solutions, which process input sentences as sequences of words. Our part of speech tagger is implemented using convolutional and recurrent neural networks. Unlike common approaches that address this problem as multi-class classification, our solution proposes a multi-label classification approach. In order to improve our results we implement an ensemble of three part of speech taggers. When comparing our solution with existing ones, we find that the proposed solution achieves the best results.

Ključne besede:machine learning, part-of-speech tagging, deep learning, convolutional neural networks, recurrent neural networks, ensemble classifiers

Podobna dela

Podobna dela v RUL:
  1. Paradoksi in zmote skozi razvoj teorije o odločanju v razmerah tveganja in v razmerah negotovosti
  2. Izboljšanje standardne simpleks metode z algoritmom za zoženje tabele simpleksov in metodo Potisni in povleci
  3. Sklepanje vezav fizičnih oseb - odobritev dodatka k obrestni meri
  4. Statistical forecasting of high-way traffic jam at a bottleneck
  5. Uporaba teorije iger na primeru slovenskega trga mobilnih telekomunikacij
Podobna dela v drugih slovenskih zbirkah:
  1. Analysis of some experimental time series by Gause
  2. About a modification of May model of parasite-host system dynamics
  3. Analiz dinamiki čislennosti sosnovoj pjadenicy s pomoš'ju diskretnyh matematičeskih modelej
  4. Optimizacija distribucije poštnih pošiljk
  5. About a modification of Beddington-Free-Lawton model of parasite-host system dynamics

Nazaj