izpis_h1_title_alt

Implementacija vtičnika Vamp za segmentacijo zvočnih posnetkov
ID FARTEK, TIMOTEJ (Avtor), ID Marolt, Matija (Mentor) Več o mentorju... Povezava se odpre v novem oknu

.pdfPDF - Predstavitvena datoteka, prenos (3,04 MB)
MD5: 28B50D4528896C6843BEE5690ED21956
PID: 20.500.12556/rul/a626688a-db5f-4507-85ad-3534f935dd5b

Izvleček
Za arhive zvočnih posnetkov je zelo pomembna digitalizacija, saj se s tem povečuje trajnost hranjenih podatkov. Pri tem se odpre mnogo poti za njihovo semantično obdelavo. Ta naloga se ukvarja s segmentacijo zvočnih posnetkov, torej s smiselnim ločevanjem med govorom in glasbo v zvočnih posnetkih, kar je lahko koristno na primer za radijske postaje ali spletne glasbene knjižnice, kot sta Spotify in Netflix. Tekom te diplomske naloge je bil razvit delujoč algoritem za segmentacijo zvočnih posnetkov, ki za vhod prejme zvočni signal v frekvenčni domeni (to pomeni, da je transformiran z Diskretno Fourierjevo transformacijo), kot izhod pa vrne seznam značilk z določenim časovnim žigom in verjetnostjo, da je na mestu posameznega časovnega žiga zvok klasificiran v razred glasba. Implementiran je v obliki vtičnika Vamp in s pomočjo ovojnega vtičnika Vampy sprogramiran v programskem jeziku Python. Analizirala se je tudi hitrost vtičnika v primerjavi z drugimi, že obstoječimi implementacijami segmentacijskega algoritma.

Jezik:Slovenski jezik
Ključne besede:digitalno procesiranje zvoka, digitalno procesiranje signalov, Vamp, Vampy, segmentacija, Sonic Visualiser
Vrsta gradiva:Diplomsko delo/naloga
Organizacija:FRI - Fakulteta za računalništvo in informatiko
Leto izida:2018
PID:20.500.12556/RUL-99956 Povezava se odpre v novem oknu
Datum objave v RUL:26.02.2018
Število ogledov:1235
Število prenosov:467
Metapodatki:XML RDF-CHPDL DC-XML DC-RDF
:
Kopiraj citat
Objavi na:Bookmark and Share

Sekundarni jezik

Jezik:Angleški jezik
Naslov:Implementation of a Vamp plugin for segmentation of audio recordings
Izvleček:
Digitalization is very important for audio data archives as it increases the lifespan and persistence of stored data. In the process multiple options for semantic analysis emerge. This thesis is about segmentation of audio data, specifically the separation between speech and music in audio files which can be useful for instance for radio stations or streaming services such as Spotify and Netflix. Within the scope of this thesis a working segmentation algorithm, which takes a frequency-domain (meaning it is transformed using a discrete fourier transform) input and returns a list of features with their appropriate time stamps and probablities that the input signal at that specific time belongs to the class music, was developed. It is implemented as a Vamp plugin and with the help of Vampy, a wrapper plugin, it is programmed in Python. Performance of the developed plugin was also analysed and compared to other pre-existing implementations in Matlab and C#.

Ključne besede:digital audio processing, digital signal processing, Vamp, Vampy, segmentation, Sonic Visualiser

Podobna dela

Podobna dela v RUL:
Podobna dela v drugih slovenskih zbirkah:

Nazaj