izpis_h1_title_alt

Uporaba globokih konvolucijskih nevronskih mrež na jezikovnih problemih : diplomsko delo
ID Pušnik, Žiga (Avtor), ID Robnik Šikonja, Marko (Mentor) Več o mentorju... Povezava se odpre v novem oknu

.pdfPDF - Predstavitvena datoteka, prenos (970,74 KB)
MD5: C368D4487632643A7AF60EED6A179D42
PID: 20.500.12556/rul/1b88f998-bc94-4e93-a167-eda0fd73bb95

Izvleček
Cilj diplomske naloge je preizkusiti učenje jezikovnih problemov s pomočjo globokih konvolucijskih nevronskih mrež. Konvolucijske nevronske mreže so bile razvite predvsem za področje umetnega zaznavanja in delujejo na podlagi konvolucije. Naučili smo jih, da so na podlagi kratkega povzetka besedila napovedale razred, h kateremu spada. Drugi problem, ki smo ga reševali je postavljanje vejic v slovenskem jeziku. Konvolucijsko nevronsko mrežo smo sprogramirali s programskim jezikom python. Uporabili smo knjižnjico Theano. Izhajali smo iz že obstoječih raziskav. Opišemo način, kako smo obdelali podatkovne množice, da so primerne za naš model. Opravili smo več poskusov. Primerjali smo lematizacijo in krnjenje ter predstavitev besedila z vektorizacijo in predstavitev z bitnim poljem. Zadovoljive rezultate smo dobili, če smo besedilo kvantizirali, kjer smo črke vektorizirali z 1 do m kodiranjem. Naši rezultati pri postavljanju vejic so primerljivi z rezultati drugih raziskav.

Jezik:Slovenski jezik
Ključne besede:strojno učenje, obdelava naravnega jezika, nevronska mreža, nevron, konvolucija, konvolucijska nevronska mreža, klasifikacija, klasifikacijski model, klasifikator, klasifikacijska točnost, jezik, besedilo, vejica, lema, krn, moment, gradientni spust, vzratno širjenje napake, jezikovni korpus, atribut
Vrsta gradiva:Diplomsko delo/naloga
Tipologija:2.11 - Diplomsko delo
Organizacija:FRI - Fakulteta za računalništvo in informatiko
Založnik:[Ž. Pušnik]
Leto izida:2015
Št. strani:47 str.
PID:20.500.12556/RUL-72286 Povezava se odpre v novem oknu
COBISS.SI-ID:1536476611 Povezava se odpre v novem oknu
Datum objave v RUL:10.09.2015
Število ogledov:1864
Število prenosov:614
Metapodatki:XML RDF-CHPDL DC-XML DC-RDF
:
Kopiraj citat
Objavi na:Bookmark and Share

Licence

Licenca:CC BY-SA 2.5 SI, Creative Commons Priznanje avtorstva-Deljenje pod enakimi pogoji 2.5 Slovenija
Povezava:https://creativecommons.org/licenses/by-sa/2.5/si/deed.sl
Opis:Dovoljuje kopiranje in razširjanje vsebin v kakršnemkoli mediju in obliki. Dovoljuje remixanje, urejanje, predelava in vključevanje vsebine v lastna dela v vse namene, tudi komercialne. Primerno morate navesti avtorja, povezavo do licence in označiti spremembe, če so kakšne nastale. To lahko storite na kakršenkoli razumen način, vendar ne na način, ki bi namigoval na to, da dajalec licence podpira vas ali vašo uporabo dela. Če vsebino uredite, predelate (remixate) ali gradite na njej, morate svojo različico razširjati pod isto licenco kot izvirnik. Ne smete uporabiti pravnih določil ali tehničnih ukrepov, ki bi pravno omejili ali onemogočilo druge, da bi storili karkoli, kar licenca dovoli.

Sekundarni jezik

Jezik:Angleški jezik
Naslov:Using deep convolutional neural networks on natural language problems
Izvleček:
The thesis examines the learning of language problems with convolutional neural networks. Convolutional neural networks were developed for machine vision. We used them to classify short abstracts and to learn a comma placement in Slovenian language. We programmed our convolutional neural network in programming language python with Theano library. Our work is based on existing research. We describe adaptation of datasets to our model. Several experiments were conducted and we compared lemmatization versus stemming and vector representation of text versus byte array representation. The best results were obtained with text quantized with 1 to m encoding. Comma placing results are comparable with other machine learning approaches.

Ključne besede:machine learning, natural language processing, neural network, neuron, convolution, convolutional neural netvork, clasification, clasification model, clasificator, clasification accuracy, language, text, comma, lemma, stemm, momentum, gradient descent, backpropagation, text corpus, attribute

Podobna dela

Podobna dela v RUL:
Podobna dela v drugih slovenskih zbirkah:

Nazaj