izpis_h1_title_alt

Identifikacija profilov istih oseb na različnih socialnih omrežjih
ID KERIN, PRIMOŽ (Avtor), ID Bajec, Marko (Mentor) Več o mentorju... Povezava se odpre v novem oknu

.pdfPDF - Predstavitvena datoteka, prenos (528,80 KB)
MD5: D716341A4DD711B3AD5E8C09895156D4
PID: 20.500.12556/rul/d8a45c81-686c-4d1e-b54d-61d6e82b4989

Izvleček
V diplomskem delu sem kombiniral več različnih tehnik za prepoznavo podvojenih oseb, kot so metode, ki temeljijo na pravilih določanja podobnih oseb, klasifikacija parov, sestavljanje gruč in strojnega učenja. Duplicirane osebe sem dodatno prepoznaval s primerjavo profilnih fotografij, saj je njihov vizualni učinek tudi pri človeški prepoznavi v veliko pomoč. Čeprav so podvojeni zapisi shranjeni v eni podatkovni bazi, sem vseeno uporabil tehnike, ki se drugače izkoriščajo tudi za uparjanje več baz z enakimi entitetami. Na koncu sem ocenil časovno zahtevnost in pravilnost deduplikacije.

Jezik:Slovenski jezik
Ključne besede:duplikati, socialno omrežje, spajanje, čiščenje podatkov
Vrsta gradiva:Diplomsko delo/naloga
Organizacija:FRI - Fakulteta za računalništvo in informatiko
Leto izida:2016
PID:20.500.12556/RUL-81108 Povezava se odpre v novem oknu
Datum objave v RUL:29.03.2016
Število ogledov:1806
Število prenosov:303
Metapodatki:XML DC-XML DC-RDF
:
Kopiraj citat
Objavi na:Bookmark and Share

Sekundarni jezik

Jezik:Angleški jezik
Naslov:Identification of profiles belonging to same people at different social networks
Izvleček:
In my thesis I combined multiple duplicate person recognition techniques like rule-based methods to determine similar persons, pair classification, cluster building and machine learning. Extra comparison of profile pictures was used for recognizing person duplicates, because this comparison is the one of the first things that humans use when comparing profiles. I also used techniques for entity resolution on multiple databases. In the end I measured time complexity and success of the deduplication.

Ključne besede:deduplication, social network, merge, data cleaning, record linkage

Podobna dela

Podobna dela v RUL:
Podobna dela v drugih slovenskih zbirkah:

Nazaj