Implementacija vtičnika Vamp za segmentacijo zvočnih posnetkov

FARTEK, TIMOTEJ

Repository of the University of Ljubljana

Details

Implementacija vtičnika Vamp za segmentacijo zvočnih posnetkov
ID FARTEK, TIMOTEJ (Author), ID Marolt, Matija (Mentor) More about this mentor... This link opens in a new window

PDF - Presentation file, Download (3,04 MB)
MD5: 28B50D4528896C6843BEE5690ED21956
PID: 20.500.12556/rul/a626688a-db5f-4507-85ad-3534f935dd5b

Abstract

Za arhive zvočnih posnetkov je zelo pomembna digitalizacija, saj se s tem povečuje trajnost hranjenih podatkov. Pri tem se odpre mnogo poti za njihovo semantično obdelavo. Ta naloga se ukvarja s segmentacijo zvočnih posnetkov, torej s smiselnim ločevanjem med govorom in glasbo v zvočnih posnetkih, kar je lahko koristno na primer za radijske postaje ali spletne glasbene knjižnice, kot sta Spotify in Netflix. Tekom te diplomske naloge je bil razvit delujoč algoritem za segmentacijo zvočnih posnetkov, ki za vhod prejme zvočni signal v frekvenčni domeni (to pomeni, da je transformiran z Diskretno Fourierjevo transformacijo), kot izhod pa vrne seznam značilk z določenim časovnim žigom in verjetnostjo, da je na mestu posameznega časovnega žiga zvok klasificiran v razred glasba. Implementiran je v obliki vtičnika Vamp in s pomočjo ovojnega vtičnika Vampy sprogramiran v programskem jeziku Python. Analizirala se je tudi hitrost vtičnika v primerjavi z drugimi, že obstoječimi implementacijami segmentacijskega algoritma.

Language:	Slovenian
Keywords:	digitalno procesiranje zvoka, digitalno procesiranje signalov, Vamp, Vampy, segmentacija, Sonic Visualiser
Work type:	Bachelor thesis/paper
Organization:	FRI - Faculty of Computer and Information Science
Year:	2018
PID:	20.500.12556/RUL-99956
Publication date in RUL:	26.02.2018
Views:	2301
Downloads:	561
Metadata:
:	Copy citation
Share:

Secondary language

Abstract:
Language:	English
Title:	Implementation of a Vamp plugin for segmentation of audio recordings
Digitalization is very important for audio data archives as it increases the lifespan and persistence of stored data. In the process multiple options for semantic analysis emerge. This thesis is about segmentation of audio data, specifically the separation between speech and music in audio files which can be useful for instance for radio stations or streaming services such as Spotify and Netflix. Within the scope of this thesis a working segmentation algorithm, which takes a frequency-domain (meaning it is transformed using a discrete fourier transform) input and returns a list of features with their appropriate time stamps and probablities that the input signal at that specific time belongs to the class music, was developed. It is implemented as a Vamp plugin and with the help of Vampy, a wrapper plugin, it is programmed in Python. Performance of the developed plugin was also analysed and compared to other pre-existing implementations in Matlab and C#.
Keywords:	digital audio processing, digital signal processing, Vamp, Vampy, segmentation, Sonic Visualiser

Similar works from RUL:
Similar works from other Slovenian collections:

Details

Secondary language

Similar documents