Podrobno

Klasifikacija zvokov živali iz mokrišč z uporabo učenja z malo učnimi primeri
ID Abramovič, Anja (Avtor), ID Marolt, Matija (Mentor) Več o mentorju... Povezava se odpre v novem oknu

.pdfPDF - Predstavitvena datoteka, prenos (1,19 MB)
MD5: A85A580BD756F41B02EC15277F264434

Izvleček
V diplomski nalogi obravnavamo problem avtomatske klasifikacije živalskih zvokov iz mokrišč v pogojih, kjer je na voljo le malo označenih podatkov. Uporabili smo pristope učenja z malo učnimi primeri in samonadzorovanega učenja ter preizkusili tri sodobne modele (CLAP, BYOL-A in M2D) za prepoznavo oglašanja žabe \textit{Rana dalmatina} v zračnih in podvodnih posnetkih. Model M2D je dosegel najboljše rezultate, dodatno treniranje na neoznačenih podatkih pa je F1-mero zvišalo z 0,902 na 0,934. Za boljšo organizacijo velike količine podatkov smo uporabili gručenje z algoritmom HDBSCAN in vizualizacijo z UMAP, kar je omogočilo učinkovito analizo in interpretacijo neoznačenih zvočnih predstavitev.

Jezik:Slovenski jezik
Ključne besede:bioakustika, učenje z malo učnimi primeri, samonadzorovano učenje, klasifikacija zvoka, gručenje
Vrsta gradiva:Diplomsko delo/naloga
Tipologija:2.11 - Diplomsko delo
Organizacija:FRI - Fakulteta za računalništvo in informatiko
Leto izida:2025
PID:20.500.12556/RUL-171259 Povezava se odpre v novem oknu
COBISS.SI-ID:247448323 Povezava se odpre v novem oknu
Datum objave v RUL:21.08.2025
Število ogledov:191
Število prenosov:40
Metapodatki:XML DC-XML DC-RDF
:
Kopiraj citat
Objavi na:Bookmark and Share

Sekundarni jezik

Jezik:Angleški jezik
Naslov:Classification of animal sounds from wetlands using few-shot learning
Izvleček:
In this thesis, we address the problem of automatic classification of animal sounds from wetlands in conditions with limited labeled data. We applied few-shot and self-supervised learning approaches and evaluated three modern models (CLAP, BYOL-A, and M2D) for recognizing the vocalizations of the frog \textit{Rana dalmatina} in both aerial and underwater recordings. The M2D model achieved the best performance, and further training on unlabeled data increased the F1-score from 0.902 to 0.934. To better organize the large amount of data, we employed clustering using the HDBSCAN algorithm and visualization with UMAP, enabling efficient analysis and interpretation of unlabeled audio representations.

Ključne besede:bioacoustics, few-shot learning, self-supervised learning, sound classification, clustering

Podobna dela

Podobna dela v RUL:
Podobna dela v drugih slovenskih zbirkah:

Nazaj