izpis_h1_title_alt

Automatic segmentation of ethnomusicological field recordings
ID Marolt, Matija (Avtor), ID Bohak, Ciril (Avtor), ID Kavčič, Alenka (Avtor), ID Pesek, Matevž (Avtor)

.pdfPDF - Predstavitvena datoteka, prenos (1,12 MB)
MD5: 9C458853EC4E48692D39EFA1248E71FD
URLURL - Izvorni URL, za dostop obiščite https://www.mdpi.com/2076-3417/9/3/439 Povezava se odpre v novem oknu

Izvleček
The article presents a method for segmentation of ethnomusicological field recordings. Field recordings are integral documents of folk music performances captured in the field, and typically contain performances, intertwined with interviews and commentaries. As these are live recordings, captured in non-ideal conditions, they usually contain significant background noise. We present a segmentation method that segments field recordings into individual units labelled as speech, solo singing, choir singing, and instrumentals. Classification is based on convolutional deep networks, and is augmented with a probabilistic approach for segmentation. We describe the dataset gathered for the task and the tools developed for gathering the reference annotations. We outline a deep network architecture based on residual modules for labelling short audio segments and compare it to the more standard feature based approaches, where an improvement in classification accuracy of over 10% was obtained. We also present the SeFiRe segmentation tool that incorporates the presented segmentation method.

Jezik:Angleški jezik
Ključne besede:audio segmentation, field recordings, deep learning, music information retrieval
Vrsta gradiva:Članek v reviji
Tipologija:1.01 - Izvirni znanstveni članek
Organizacija:FRI - Fakulteta za računalništvo in informatiko
Status publikacije:Objavljeno
Različica publikacije:Objavljena publikacija
Leto izida:2019
Št. strani:12 str.
Številčenje:Vol. 9, iss. 3, art. 439
PID:20.500.12556/RUL-131958 Povezava se odpre v novem oknu
UDK:004:78
ISSN pri članku:2076-3417
DOI:10.3390/app9030439 Povezava se odpre v novem oknu
COBISS.SI-ID:1538109123 Povezava se odpre v novem oknu
Datum objave v RUL:07.10.2021
Število ogledov:1171
Število prenosov:163
Metapodatki:XML DC-XML DC-RDF
:
Kopiraj citat
Objavi na:Bookmark and Share

Gradivo je del revije

Naslov:Applied sciences
Skrajšan naslov:Appl. sci.
Založnik:MDPI
ISSN:2076-3417
COBISS.SI-ID:522979353 Povezava se odpre v novem oknu

Licence

Licenca:CC BY 4.0, Creative Commons Priznanje avtorstva 4.0 Mednarodna
Povezava:http://creativecommons.org/licenses/by/4.0/deed.sl
Opis:To je standardna licenca Creative Commons, ki daje uporabnikom največ možnosti za nadaljnjo uporabo dela, pri čemer morajo navesti avtorja.
Začetek licenciranja:01.02.2019

Sekundarni jezik

Jezik:Slovenski jezik
Ključne besede:segmentacija zvočnih posnetkov, terenski posnetki, globoko učenje, pridobivanje informacij iz glasbe

Projekti

Financer:ARRS - Agencija za raziskovalno dejavnost Republike Slovenije
Številka projekta:J7-9426
Naslov:Misliti folkloro: folkloristične, etnološke in računske perspektive in pristopi k narečju

Podobna dela

Podobna dela v RUL:
Podobna dela v drugih slovenskih zbirkah:

Nazaj