izpis_h1_title_alt

Spletni priporočilni sistem za filmske vsebine
ID CIBER, UROŠ (Avtor), ID Tomažič, Sašo (Mentor) Več o mentorju... Povezava se odpre v novem oknu

.pdfPDF - Predstavitvena datoteka, prenos (1,13 MB)
MD5: 593BD12E5CE65B0062A10437C233BB6C
PID: 20.500.12556/rul/a31486f4-903d-4db9-855f-00033b5af153

Izvleček
Cilj diplomskega dela je bil izdelava spletnega priporočilnega sistema (ang. recommender systems) za filme in njegovo ovrednotenje. Odločili smo se za pristop s skupinskim filtriranjem (ang. collaborative filtering), ki temelji na sodelovanju uporabnikov s podobnim okusom. Za aktivnega uporabnika se poišče njemu podobne uporabnike – najbližje sosede, ki smo jih poimenovali filmski prijatelji. Le-ti s svojim okusom po metodi utežene vsote vplivajo na napoved ocene filma. V prvem delu naloga obsega teoretični del, v katerem so predstavljeni osnovni pojmi in gradniki priporočilnih sistemov. Osrednji del diplomske naloge se posveča praktični izvedbi, kjer je bila izdelana lastna podatkovna baza s 47-imi uporabniki in z naborom 22-ih filmov različnih žanrov, ki so jih uporabniki ocenili s pomočjo 7-stopenjske lestvice (ocene od −3 do 3). Zaradi premajhne zapolnjenosti baze uporabniki : filmi se je sistemu dodalo na spletu dosegljivo podatkovno bazo MovieLens, s čimer se je povečal nabor filmov, ki jih priporočilni sistem priporoča uporabnikom. Iz MovieLensa je bilo izluščenih 83 uporabnikov, ki so ocenili vseh 22 filmov iz nabora. Tako je bilo doseženo zadostno število potrebnih podatkov za zagotovitev delovanja priporočilnega sistema in njegovega ovrednotenja. MovieLens podatkovno bazo smo izkoristili za priporočanje dodatnih filmov, ki jih je omogočil najboljši filmski prijatelj (iz MovieLensa) aktivnega uporabnika (iz naše lastne podatkovne baze), vendar tega dela ni bilo mogoče ovrednotiti. Za ovrednotenje priporočilnega sistema (83 uporabnikov iz MovieLens baze) sta bili uporabljeni dve metodi, in sicer povprečna absolutna napaka MAE (ang. Mean Absolute Error) in mera F (ang. F-measure). MAE je pri največji pokritosti 99,95 % dosegla najnižjo vrednost 0,77 pri mejah Pearsonove korelacije −0,1 in 0,05. V nadaljevanju smo vzeli vrednost števila sosedov pri meji Pearsonove korelacije 0,05 in jo uporabili pri izračunu mere F. Predpostavili smo, da sistem aktivnemu uporabniku priporoči le filme z najvišjo oceno (ocena 3), kar je dalo naslednje rezultate: natančnost 0,743, priklic 0,407 in mera F 0,526. Bistven podatek za ovrednotenje sistema je natančnost, ki določa delež pravilno priporočenih vsebin izmed vseh priporočenih vsebin. Torej sistem pravilno priporoča skoraj 75 % vseh priporočenih vsebin, kar je zadovoljiv podatek in bi sistem lahko uporabili v praksi. Priklic pomeni delež pravilno priporočenih vsebin izmed vseh, ki bi morali biti priporočeni, a niso bili zajeti v priporočila. Priklic je dal nižje rezultate, kar je vplivalo na rezultat mere F, ki je zato nižja, kot bi si želeli.

Jezik:Slovenski jezik
Ključne besede:priporočilni sistemi, skupinsko filtriranje, vsebinsko filtriranje, MAE, mera F, priporočanje filmov
Vrsta gradiva:Diplomsko delo
Organizacija:FE - Fakulteta za elektrotehniko
Leto izida:2016
PID:20.500.12556/RUL-85830 Povezava se odpre v novem oknu
Datum objave v RUL:27.09.2016
Število ogledov:2374
Število prenosov:486
Metapodatki:XML RDF-CHPDL DC-XML DC-RDF
:
Kopiraj citat
Objavi na:Bookmark and Share

Sekundarni jezik

Jezik:Angleški jezik
Izvleček:
The aim of this thesis was to develop and evaluate an online recommender system for movies. We selected a collaborative filtering approach based on the opinion of users with similar tastes. First, it was necessary to find users similar to the active user – the nearest neighbours, termed the movie's friends. Their preferences influence the prediction of the movie rating of the active user according to the weighted sum method. The introduction of the thesis presents the theory of the basic concepts and elements of recommender systems. The main part focuses on the practical implementation. A database of 47 users and a set of 22 movies of different genres were created. Users rated movies on a 7-point scale (rating of -3 to 3). Because the database users : movies was insufficiently filled, the Internet-accessible database MovieLens was added to our system, increasing the number of films recommended to our users. Furthermore, 83 users who rated all 22 films from our set were extracted from the MovieLens database. We thereby obtained sufficient data to ensure the proper functioning of the recommender system and its evaluation. The movie’s best friend from the MovieLens database also recommended additional movies to the active user from our database. However, we were unable to evaluate that function. To evaluate the recommender system (83 users from the MovieLens database), we used two methods: the average absolute error MAE and the F-measure. At the maximum coverage of 99.95 %, the MAE reached the lowest value of 0.77 (Pearson correlation values of -0.1 and 0.05). The Pearson correlation value of 0.05 (for the number of neighbours) was used to calculate the F-measure. It was assumed that the system would recommend only the movies with the highest rating to the active user (rating 3), yielding the following results: precision 0.743, recall 0.407 and F-measure 0.526. The most important information for evaluating the recommender system is precision, which determinates the percentage of accurate recommendations from all recommendations given by the system. The research showed that almost 75 % of all recommended movies were accurately recommended to the active users. Therefore, this recommender system can be used in practice. However, the recall was lower than we expected, which influenced the F-measure.

Ključne besede:recommender systems, collaborative filtering, content based filtering, MAE, F-measure, movie recommendation

Podobna dela

Podobna dela v RUL:
Podobna dela v drugih slovenskih zbirkah:

Nazaj