Vaš brskalnik ne omogoča JavaScript!
JavaScript je nujen za pravilno delovanje teh spletnih strani. Omogočite JavaScript ali pa uporabite sodobnejši brskalnik.
Repozitorij Univerze v Ljubljani
Nacionalni portal odprte znanosti
Odprta znanost
DiKUL
slv
|
eng
Iskanje
Brskanje
Novo v RUL
Kaj je RUL
V številkah
Pomoč
Prijava
Podrobno
Sistem za analizo sentimenta v komentarjih o mobilnih aplikacijah
ID
Kacil, Luka
(
Avtor
),
ID
Bosnić, Zoran
(
Mentor
)
Več o mentorju...
PDF - Predstavitvena datoteka,
prenos
(2,45 MB)
MD5: C1C07A657BE7D7477EF80FA91FCA9780
PID:
20.500.12556/rul/d6e74c23-eebe-4228-b571-9044e99b8931
Galerija slik
Izvleček
Cilj diplomske naloge je bil implementirati sistem za označevanje komentarjev, ki izražajo navdušenje v spletni trgovini Google Play. Pri tem smo najprej opravili pregled področja analize sentimenta, nato pa analizirali komentarje in se bolje spoznali s problemsko domeno. Opisali smo teoretično podlago vseh metod, ki smo jih nato uporabili pri gradnji sistema. Najprej smo vhodne komentarje pretvorili v žetone besed in jih normalizirali, negi- rali in iz njih ustvarili n-grame. Nato smo uporabili korenjenje, popravljanje črkovanja, dodajanje oblikoslovnih oznak in dodatnih zunanjih atributov in ustvarili osem različnih naborov atributov. Iz vsakega nabora smo izbrali najboljše atribute s pomočjo metode χ2 . Za klasifikacijo smo nato uporabili modele, kot so naivni Bayes, logistična regresija in metoda podpornih vektorjev. Sledilo je ovrednotenje klasifikatorjev s pomočjo notranjega prečnega preverjanja, klasifikacijske točnosti, priklica, preciznosti, mere F1 in statističnih testov. Na koncu smo označevanje komentarjev iz naše problemske domene testirali na obstoječih rešitvah za analizo sentimenta in primerjali rezultate. Ugotovili smo, da obstajajo statistično pomembne razlike med rezultati klasifikatorjev. Prav tako so obstajale statistično pomembne razlike med rezultati nekaterih naborov atributov. Ugotovili smo tudi, da obstajajo statistične pomembne razlike med rezultati obstoječih rešitev in nekaterih naših modelov.
Jezik:
Slovenski jezik
Ključne besede:
analiza sentimenta
,
nadzorovano strojno učenje
,
metoda podpornih vektorjev
,
naivni Bayes
,
logistična regresija
Vrsta gradiva:
Diplomsko delo
Organizacija:
FRI - Fakulteta za računalništvo in informatiko
Leto izida:
2016
PID:
20.500.12556/RUL-83728
Datum objave v RUL:
24.06.2016
Število ogledov:
2227
Število prenosov:
530
Metapodatki:
Citiraj gradivo
Navadno besedilo
BibTeX
EndNote XML
EndNote/Refer
RIS
ABNT
ACM Ref
AMA
APA
Chicago 17th Author-Date
Harvard
IEEE
ISO 690
MLA
Vancouver
:
KACIL, Luka, 2016,
Sistem za analizo sentimenta v komentarjih o mobilnih aplikacijah
[na spletu]. Diplomsko delo. [Dostopano 27 marec 2025]. Pridobljeno s: https://repozitorij.uni-lj.si/IzpisGradiva.php?lang=slv&id=83728
Kopiraj citat
Objavi na:
Sekundarni jezik
Jezik:
Angleški jezik
Naslov:
System for sentiment analysis of comments about mobile applications
Izvleček:
The goal of this thesis was to build a sentiment analysis system, which can tag exuberant reviews in the Google Play store. First we gave an overview of the sentiment analysis field and analysis of input comments to better understand our problem domain. We described theoretical foundations of every method used to build our system. We started by transforming input reviews into tokens which were then normalized, negated and transformed in n-grams. After that we used stemming, spell correction, part of speech tagging and adding other attributes to generate eight different collections of features. We selected best features from every collection with χ2 method. For classification we used naive Bayes, logistic regression and support vector machine to classify reviews. After that we evaluated classifiers by using internal cross-validation and computing classification accuracy, recall, precision, F1 score and statistical tests. In the end we tested tagging reviews from our problem domain with existing solutions for sentiment analysis and compared the results. Results revealed that there were statistically significant differences between classifiers. There were also statistically significant differences between some feature collections. Results also revealed that there were statistically significant differences between existing solutions and some of our models.
Ključne besede:
sentiment analysis
,
supervised machine learning
,
support vector machine
,
naive Bayes
,
logistic regression
Podobna dela
Podobna dela v RUL:
Iščem podobna dela...
Podobna dela v drugih slovenskih zbirkah:
Nazaj