Avtomatska transkripcija kitarskih tablatur zaradi omejene količine anotiranih
podatkov z opisi prijemov na vratu kitare ter kompleksnosti pripisovanja
prijema na kitari specifičnim tonom ostaja malo raziskan problem
na področju transkripcije glasbe. V magistrski nalogi predstavljamo globok
transformerski sekvenčno-sekvenčni model za neposredno transkripicijo
iz zvočnega signala v tablaturo. Model je zasnovan na podlagi modela MT3
in napoveduje žetone iz slovarja prilagojenega kitarskim tablaturam brez
vmesne pretvorbe v notni zapis. V delu predstavimo prilagojene sheme za
pretvorbo kitarskih tablatur v žetone ter izvedemo sistematično ablacijsko
študijo, ki analizira vpliv vhodne predstavitve zvoka (CQT proti mel spektrogramu),
dolžine zvočnega odseka ter slovarja. Rezultati kažejo, da je kakovost
transkripcije močno odvisna od dolžine zvočnega izseka ter kompleksnosti
slovarja, medtem ko predstavitev zvoka nima večjega vpliva. Predstavljen
pristop dosega rezultate primerljive obstoječim pristopom za transkripcijo
kitarske glasbe ter tablatur ter jih v določenih metrikah presega, hkrati pa
izpostavlja nadaljnje izzive povezane z omejeno količino podatkov, metodami
učenja ter sposobnostjo generalizacije.
|