izpis_h1_title_alt

Integracija podatkovnih shem na osnovi analize podatkov z algoritmom arhetipske analize za povzemanje podatkovnih množic
ID Gazvoda, Anton Zvonko (Avtor), ID Jurič, Matjaž Branko (Mentor) Več o mentorju... Povezava se odpre v novem oknu

.pdfPDF - Predstavitvena datoteka, prenos (2,26 MB)
MD5: 2426FAA812D2EEBCA8DE8408DB37E76B
PID: 20.500.12556/rul/8e583973-ab7a-405c-9a05-b4edfb425732

Izvleček
Ključna aktivnost v procesu integracije aplikacij na podatkovnem nivoju je iskanje preslikav med podatkovnimi shemami, kar je osnova za izvedbo ustreznih transformacij podatkov. V ta namen predlagamo novo metodo za integriranje shem, ki deluje na osnovi ocenjevanja podobnosti med podatkovnimi instancami. Metoda temelji na arhetipski analizi, s katero generiramo povzetke podatkov elementov sheme. Njihove približke opišemo s konveksnimi ovojnicami. Za izračun povzetkov definiramo različne pristope za transformacijo podatkov v vektorski prostor in metrike podobnosti. Preslikave iščemo s pomočjo dveh algoritmov za odkrivanje enostavnih in kompleksnih preslikav. Metodo smo ovrednotili na testnih podatkih, ki vključujejo pravilne preslikave med shemami, in jo primerjali z iskalnikom preslikav COMA CE. Uspešnost smo ocenili z občutljivostjo (91%), specifičnostjo (75%), točnostjo (87%) in natančnostjo (91%), pri čemer je naša metoda v povprečju za 20% boljša od COMA CE.

Jezik:Slovenski jezik
Ključne besede:integracija podatkovnih shem na osnovi instanc, iskanje preslikav, arhetipska analiza, konveksna ovojnica, povzetek podatkov
Vrsta gradiva:Magistrsko delo/naloga
Organizacija:FRI - Fakulteta za računalništvo in informatiko
Leto izida:2014
PID:20.500.12556/RUL-29573 Povezava se odpre v novem oknu
Datum objave v RUL:24.09.2014
Število ogledov:1515
Število prenosov:546
Metapodatki:XML RDF-CHPDL DC-XML DC-RDF
:
Kopiraj citat
Objavi na:Bookmark and Share

Sekundarni jezik

Jezik:Angleški jezik
Naslov:Data schemes integration with algorithms for data summarization via archetypal analysis
Izvleček:
Schema mapping discovery is key activity while performing data-level integration process and represents the basis for proper data transformation. For this purpose, we introduce novel instance-based schema matching method by using archetypal analysis in order to generate data summary for each schema element. Summary approximations are represented by convex hulls. We define several approaches for data transformation to vector space, as well as summary-similarity metrics. Two algorithms were developed in order to determine simple and complex matches. Our method was evaluated on the test data including proper mappings between schemas and compared with COMA CE schema matcher. Efficiency of our method was evaluated with sensitivity (91%), specificity (75%), accuracy (87%) and precision (91%). Compared with COMA CE, our method performs on average 20% better.

Ključne besede:instance based schema matching, schema mapping, archetypal analysis, convex hull, data summary

Podobna dela

Podobna dela v RUL:
Podobna dela v drugih slovenskih zbirkah:

Nazaj