izpis_h1_title_alt

Poenostavitev ETL procesa z uporabo platforme Talend : diplomsko delo
ID Čufer, Tomaž (Avtor), ID Lavbič, Dejan (Mentor) Več o mentorju... Povezava se odpre v novem oknu

.pdfPDF - Predstavitvena datoteka, prenos (1,89 MB)
MD5: A21C92945AF02EF64CF0AECCEC7BF2BF
PID: 20.500.12556/rul/b46f4b1b-6e52-4026-82f5-d354b22ee149

Izvleček
ETL proces predstavlja širok pojem pridobivanja, preoblikovanja in nalaganja podatkov. Vsaka izmed faz potrebuje podrobno definiran postopek, ki bo podatke prenesel na drugo lokacijo ali preoblikoval v potrebno obliko. Nestrukturirana oblika podatkov in njihova velika količina, ki sta pogosti danes, proces še dodatno otežujeta, kar podaljšuje njegovo izvedbo. S primernim ETL orodjem lahko poenostavimo implementacijo procesa in zagotovimo boljši nadzor nad izvajanjem. V diplomski nalogi se je s takim orodjem hotelo pokazati, kako to poenostavitev narediti v praksi. Primerjani sta dve komercialni in odprtokodni orodji. Izbrano je bilo orodje Talend in nato podrobneje predstavljeno njeno delovanje. Opisano je reševanje problemov z obvladovanjem ter integracijo podatkov pridobljenih s spletnim luščenjem in iz socialnega omrežja Twitter. Za orodje je na koncu opravljena še SWOT analiza.

Jezik:Slovenski jezik
Ključne besede:opravilo, proces, integracija podatkov, Talend, orodje, podatkovno skladišče, računalništvo, računalništvo in informatika, univerzitetni študij, diplomske naloge
Vrsta gradiva:Diplomsko delo/naloga
Tipologija:2.11 - Diplomsko delo
Organizacija:FRI - Fakulteta za računalništvo in informatiko
Založnik:[T. Čufer]
Leto izida:2015
Št. strani:42 str.
PID:20.500.12556/RUL-30663 Povezava se odpre v novem oknu
COBISS.SI-ID:1536264131 Povezava se odpre v novem oknu
Datum objave v RUL:24.03.2015
Število ogledov:2771
Število prenosov:333
Metapodatki:XML DC-XML DC-RDF
:
Kopiraj citat
Objavi na:Bookmark and Share

Sekundarni jezik

Jezik:Angleški jezik
Naslov:Simplification of ETL processes using Talend Platform
Izvleček:
The ETL process presents a broad concept of extracting, transforming and loading data. Each of these phases needs to be well defined to transfer the data efficiently to a different location or transform it into the demanded form. Unstructured forms of data along with its huge volume, which is common nowadays, makes this process even more difficult, and is reflected in the longer execution time. With a suitable ETL tool it is possible to simplify the implementation process and assure better control over it. The thesis describes how to complete such simplifications using an appropriate tool in practice. Two commercial and open source tools were compared. Talend tool was chosen and its workflow was later presented in detail. Handling management and integration problems of data is described, where the used data came from web scraping and the Twitter social network. At the end, a SWOT analysis was made for Talend tool.

Ključne besede:job, process, data integration, Talend, tool, data warehouse, computer science, computer and information science, diploma

Podobna dela

Podobna dela v RUL:
Podobna dela v drugih slovenskih zbirkah:

Nazaj