izpis_h1_title_alt

Leksikalna analiza razpoloženja za slovenska besedila
ID VOLČANŠEK, MATEJA (Avtor), ID Demšar, Janez (Mentor) Več o mentorju... Povezava se odpre v novem oknu

.pdfPDF - Predstavitvena datoteka, prenos (1,60 MB)
MD5: 1CE05274E5CBB57BBFEA854EBEE677EB
PID: 20.500.12556/rul/12698020-f7af-4da5-ae50-c794dbc6b876

Izvleček
Diplomsko delo vsebuje opis izdelave slovenskega slovarja za zaznavo subjektivnih elementov v besedilu, ki se uporablja v leksikalnih metodah za avtomatsko analizo razpoloženja. Zanima nas, kako učinkovita je uporaba slovarja, ki ga prevedemo iz že obstoječega angleškega slovarja, za ugotavljanje razpoloženja v slovenskih besedilih. Učinkovitost preverimo na korpusu 5000 ročno označenih besedil, ki smo jih zajeli iz glavnih slovenskih spletnih portalov novic. Rezultate primerjamo z alternativno metodo za ne-angleška besedila: korpus prevedemo v angleščino in nato naredimo analizo razpoloženja. V diplomskem delu je najprej predstavljen pojem analize razpoloženja, njena uporabnost in razlogi za razširjenost. V nadaljevanju se osredotočimo na tehnike analize, predstavimo metode, s katerimi si lahko pomagamo, in poudarimo pomembnost leksikalnih virov ter pomanjkljivost prosto dostopnih virov v slovenskem jeziku. Glavni del diplomske naloge predstavlja opis izdelave slovenskega slovarja za zaznavo elementov subjektivnosti s pomočjo prevajalskih orodij in že obstoječega slovarja v drugem jeziku ter opis analize razpoloženja. V okviru dela sta nastala slovar slovenskih besed in korpus slovenskih novic, ki je ročno označen glede na polarnost besedila (pozitivno (angl. positive), negativno (angl. negative), nevtralno (angl. neutral)).

Jezik:Slovenski jezik
Ključne besede:tekstovno rudarjenje, analiza razpoloženja, leksikalna metoda, mnenje, subjektivnost
Vrsta gradiva:Diplomsko delo/naloga
Organizacija:FRI - Fakulteta za računalništvo in informatiko
Leto izida:2015
PID:20.500.12556/RUL-30648 Povezava se odpre v novem oknu
Datum objave v RUL:16.03.2015
Število ogledov:2416
Število prenosov:576
Metapodatki:XML RDF-CHPDL DC-XML DC-RDF
:
Kopiraj citat
Objavi na:Bookmark and Share

Sekundarni jezik

Jezik:Angleški jezik
Naslov:Lexical Sentiment Analysis in Slovenian Texts
Izvleček:
The goal of this thesis is to create a sentiment dictionary for the Slovenian language which can be used in lexical methods for automatic sentiment analysis. We start from a sentiment dictionary for the English language, translate it semi-automatically to Slovenian and curate its content. We test the performance of using the translated dictionary for automated lexical sentiment analysis on a corpus of 5000 manually annotated Slovenian news articles gathered from the main Slovenian news portals. The results of the analysis are compared with the results of an alternative method, where, instead of translating the sentiment dictionary, the documents are translated to English and lexical sentiment analysis is performed. This thesis is organized as follows. First, the concept and motivation for automated sentiment analysis are introduced. Next, the techniques for sentiment analysis are outlined, stressing the importance of sentiment dictionaries in automated sentiment analysis. The main part of the thesis is Chapter 4, in which the process of creating the Slovenian sentiment dictionary is described and explained in detail. Furthermore, the manual article annotation process is described and the experimental evaluation of the two alternative methods is performed. Within the practical part of this thesis, a Slovenian sentiment dictionary and a manually annotated corpus of 5000 Slovenian news articles were created.

Ključne besede:text mining, sentiment analysis, lexicon-based method, opinion, subjectivity

Podobna dela

Podobna dela v RUL:
Podobna dela v drugih slovenskih zbirkah:

Nazaj