izpis_h1_title_alt

Priprava podatkov za občinskega virtualnega asistenta s pomočjo strojnega učenja
ID Jovan, Leon Noe (Author), ID Kukar, Matjaž (Mentor) More about this mentor... This link opens in a new window, ID Gams, Matjaž (Co-mentor)

.pdfPDF - Presentation file, Download (3,36 MB)
MD5: AE4C644A160DBD60C13C13EE905A7FC5
PID: 20.500.12556/rul/730f226d-6794-48ac-b910-36d6b732672a

Abstract
Cilj magistrskega dela je bil razvoj postopka priprave podatkov za občinskega virtualnega asistenta, ki odgovarja na razna postavljena vprašanja v zvezi z dejavnostmi občin v Sloveniji. Namen postopka je nadomestiti ali olajšati ročno pripravo baze znanja virtualnega asistenta. Zato smo preučili in uporabili različna področja strojnega učenja, kot so večznačna klasifikacija, uporaba šibko označenih podatkov, razvrščanje v skupine in besedilno rudarjenje. V magistrskem delu smo predstavili postopek, ki za različna vprašanja v zvezi z dejavnostjo občin poišče najbolj ustrezne spletne strani, ki dajejo odgovore na ta vprašanja. Parametre postopka smo najprej optimizirali na testnih podatkih, nato pa smo ga na podatkih novih občin ovrednotili tudi ročno. Tako smo pridobili resnično oceno kvalitete delovanja razvitega postopka. Rezultati so pokazali, da ta postopek predlaga bolj ustrezne odgovore, kot jih predlaga komercialni spletni iskalnik. Z razvitim postopkom smo torej učinkovito pospešili in poenostavili pripravo podatkov za občinskega virtualnega asistenta. S tem smo olajšali delo pristojnim zaposlenim na občinah, ki so do sedaj ročno vnašali odgovore v bazo znanja občinskega virtualnega asistenta.

Language:Slovenian
Keywords:občinski virtualni asistent, večznačna klasifikacija, šibko označeni podatki, razvrščanje v skupine, tekstovno rudarjenje
Work type:Master's thesis/paper
Organization:FRI - Faculty of Computer and Information Science
Year:2016
PID:20.500.12556/RUL-83750 This link opens in a new window
Publication date in RUL:28.06.2016
Views:1246
Downloads:541
Metadata:XML RDF-CHPDL DC-XML DC-RDF
:
Copy citation
Share:Bookmark and Share

Secondary language

Language:English
Title:Data preparation for municipal virtual assistant using machine learning
Abstract:
The main goal of this master’s thesis was to develop a procedure that will automate the construction of the knowledge base for a virtual assistant that answers questions about municipalities in Slovenia. The aim of the procedure is to replace or facilitate manual preparation of the virtual assistant's knowledge base. Theoretical backgrounds of different machine learning fields, such as multilabel classification, text mining and learning from weakly labeled data were examined to gain a better understanding of the topic. In this thesis, we present a procedure that finds the most relevant websites to provide answers on various questions relating to the municipality's activities. The procedure's parameters were first optimized using test data, and then the procedure was evaluated manually using data of new municipalities. In this way, we acquired real estimation of the quality of the implemented procedure. The results show that the procedure recommends more relevant answers in comparison to a commercial search engine. The developed procedure therefore effectively speeds up and simplifies data preparation for the municipal virtual assistant. In this way, we facilitate the work of municipality staff who until now had to insert answers into the municipal virtual assistant's knowledge base manually.

Keywords:municipal virtual assistant, multi-label classification, weakly labeled data, clustering, text mining

Similar documents

Similar works from RUL:
Similar works from other Slovenian collections:

Back