Odprtokodna podatkovna jezera in MinIO

ZUPANČIČ, LEV

Podrobno

Odprtokodna podatkovna jezera in MinIO
ID ZUPANČIČ, LEV (Avtor), ID Kukar, Matjaž (Mentor) Več o mentorju... Povezava se odpre v novem oknu

PDF - Predstavitvena datoteka, prenos (1,64 MB)
MD5: 9270383F023875C67D575EB962751799

Izvleček

V diplomski nalogi predstavimo pojme podatkovnih jezer in velepodatkov, ter s pomočjo sistema odprtokodne podatkovne shrame MinIO, vzpostavimo lastno podatkovno jezero. Sistem MinIO podrobno raziščemo in prikažemo njegove prednosti in slabosti. Ogledamo si tudi druge podatkovne shrambe, kot so LakeFS, Ceph, Hadoop in AWS, in jih primerjamo z MinIO. Lastno podatkovno jezero postavimo v praktično okolje, kjer ga preizku- simo in ovrednotimo z vidika samostojnega uporabnika. Med seboj primer- jamo tri različne scenarije uporabe MinIO podatkovnega jezera in izmerimo hitrost prenosa podatkov znotraj njega. Pogledamo si tudi kakšne možnosti razširljivosti ponuja MinIO in ocenimo, kako zahteven je bil proces postavitve lastnega podatkovnega jezera. Ob koncu analiziramo procese polnjenja ter pridobivanja in označevanja podatkov v MinIO podatkovnem jezeru. Ugotovimo, da je sistem MinIO enostaven za uporabo, saj podpira uporabo v različnih okoljih, ima podrobna in razumljiva navodila za njegovo vzpostavitev in ima obsežno dokumentacijo na svoji uradni strani. MinIO se izkaže za uporabno in učinkovito orodje za posameznika, ki dela z obsežnimi količinami različnih tipov podatkov.

Jezik:	Slovenski jezik
Ključne besede:	podatkovna jezera, velepodatki, MinIO.
Vrsta gradiva:	Diplomsko delo/naloga
Tipologija:	2.11 - Diplomsko delo
Organizacija:	FRI - Fakulteta za računalništvo in informatiko
Leto izida:	2024
PID:	20.500.12556/RUL-154593
COBISS.SI-ID:	186713091
Datum objave v RUL:	22.02.2024
Število ogledov:	1309
Število prenosov:	852
Metapodatki:
:	Kopiraj citat
Objavi na:

Sekundarni jezik

Izvleček:
Jezik:	Angleški jezik
Naslov:	Open source data lakes and MinIO
In this thesis we present the concepts of data lakes and big data. With the help of the opensource data storage solution MinIO we setup our own data lake. We take a detailed look at MinIO and showcase its strengths and weaknesses. We also take a look at other data storage solutions like LakeFS, Ceph, Hadoop and AWS and compare them with MinIO. We deploy our data lake into a working environment where we evaluate it from the perspective of an independent user. We compare three diff erent scenarios of using MinIO and track transfer speeds for each of them. We also explore the scalability options MinIO off ers and assess the complexity of setting up our custom data lake. We analize the processes of fi lling, retrieving and tagging the data in our MinIO data lake. We fi nd that MinIO is easy to use, as it can be used in multiple environments and has a detailed documentation on its offi cial website. We conclude that MinIO is an eff ective tool for a user working with large quantities of diff erent types of data.
Ključne besede:	data lake, big data, MinIO.

Podobna dela

Podobna dela v RUL:
Podobna dela v drugih slovenskih zbirkah:

Nazaj