Razvoj dinamičnega programa za gručenje podatkov in detekcijo anomalij z knjižnico ML.NET in storitvijo Azure OpenAI

Temelkovski, Bodan

Podrobno

Razvoj dinamičnega programa za gručenje podatkov in detekcijo anomalij z knjižnico ML.NET in storitvijo Azure OpenAI
ID Temelkovski, Bodan (Avtor), ID Groznik, Vida (Mentor) Več o mentorju... Povezava se odpre v novem oknu

PDF - Predstavitvena datoteka, prenos (948,50 KB)
MD5: C6B28685AAEFFCE042D402F73605B671

Izvleček

Razvoj umetne inteligence in strojnega učenja je bistveno poenostavil analizo podatkov. Ob sočasnem eksponentnem porastu količine podatkov v podjetjih se pojavlja potreba po avtomatiziranih rešitvah, ki lahko nadomestijo ročno analizo. V okviru te diplomske naloge je bil razvit dinamičen sistem za gručenje podatkov in detekcijo anomalij, ki temelji na algoritmu razvrščanja z voditelji (angl. \textit{K-Means}) ter knjižnici ML.NET. Sistem omogoča avtomatsko pripravo podatkov, normalizacijo z različnimi pristopi (npr. min-max normalizacija in robustno skaliranje), iskanje optimalnega števila gruč z metodo komolca in silhuetno metodo ter zaznavanje odstopanj z metodo PCA. V sklepni fazi so bili rezultati interpretirani s pomočjo velikega jezikovnega modela GPT-4o preko platforme Azure OpenAI, kar omogoča boljše razumevanje vzorcev v podatkih. Rešitev je bila preizkušena na realnih anonimiziranih podatkih farmacevtskega podjetja.

Jezik:	Slovenski jezik
Ključne besede:	umetna inteligenca, gručenje, razvrščanje z voditelji, Azure, OpenAI
Vrsta gradiva:	Diplomsko delo/naloga
Tipologija:	2.11 - Diplomsko delo
Organizacija:	FRI - Fakulteta za računalništvo in informatiko
Leto izida:	2025
PID:	20.500.12556/RUL-170337
COBISS.SI-ID:	241388035
Datum objave v RUL:	03.07.2025
Število ogledov:	228
Število prenosov:	44
Metapodatki:
:	Kopiraj citat
Objavi na:

Sekundarni jezik

Izvleček:
Jezik:	Angleški jezik
Naslov:	Development of a dynamic program for data clustering and anomaly detection using the ML.NET library and the Azure OpenAI service
The development of artificial intelligence and machine learning has significantly simplified data analysis. As data volumes in companies continue to grow, the need for automated systems capable of handling complex analysis without human intervention becomes increasingly important. This thesis presents the development of a dynamic system for data segmentation and anomaly detection based on the K-Means algorithm and the ML.NET framework. The system automatically prepares and normalizes data using methods such as Min-Max normalization and Robust Scaling, determines the optimal number of clusters using the Elbow and Silhouette methods, and detects anomalies through Principal Component Analysis (PCA). In the final stage, the results are interpreted using a large language model (GPT-4o) via the Azure OpenAI platform, providing deeper insights into detected patterns. The solution was tested on real but anonymised data from a pharmaceutical company, demonstrating its practical applicability in real-world environments.
Ključne besede:	artificial intelligence, segmentation, K-means, Azure, OpenAI

Podobna dela

Podobna dela v RUL:
Podobna dela v drugih slovenskih zbirkah:

Nazaj