Implementacija govorne prepoznave številk na vgrajenem sistemu STMicroelectronics 32F769IDISCOVERY

Rifel, Gašper

Repository of the University of Ljubljana

Details

Implementacija govorne prepoznave številk na vgrajenem sistemu STMicroelectronics 32F769IDISCOVERY
ID Rifel, Gašper (Author), ID Bulić, Patricio (Mentor) More about this mentor... This link opens in a new window

PDF - Presentation file, Download (11,22 MB)
MD5: FA8617F53DD1BB572F2BBD3AFDB0E3F3

Abstract

V diplomski nalogi smo obravnavali zasnovo in izvedbo preproste govorne prepoznave števk (0–9) na mikrokrmilniku STM32F769I. Zajemali smo zvočne posnetke pri 16 kHz na plošči STM32F769I-DISCOVERY ter izvedli predobdelavo signala (odstranitev enosmerne (DC) komponente in normalizacija kvadratne srednje vrednosti (RMS)), učenje modela na predobdelanem signalu ter prenos naučenega modela v vgrajeno okolje. Implementirali smo lastno nevronsko mrežo (model) za prepoznavo govornih števk. Model smo zasnovali in učili v Pythonu, izvoz v ONNX pa je omogočil optimizacijo in generiranje kode z uporabo orodja ST Edge AI Developer Cloud. Na napravi smo zvočne posnetke zajemali z uporabo časovnika TIM2, analogno-digitalnega pretvornika (Analog-to-digital converter (ADC)) in krmilnika za neposreden dostop do pomnilnika (DMA - Direct memory access), rezultate pa nazadnje izpisovali prek serijskega univerzalnega asinhronega vmesnika (UART). Za učenje smo pripravili lasten nabor 400 enosekundnih posnetkov (po 40 na posamezno števko), enako predobdelanih, kar po prenosu na napravo zagotavlja, da je vsak posnet vzorec obdelan enako kot vsi posnetki, uporabljeni pri učenju modela. Preizkus na strojni opremi je pokazal 70-odstotno uspešnost pri zaporedno izgovorjenih števkah. Natančnost omejujejo predvsem majhen nabor posnetkov za učenje, uporaba le enega govornika za snemanje vseh posnetkov in kakovost mikrofona. Kot izboljšave predlagamo razširitev nabora na več govorcev, več posnetkov ter uporabo kakovostnejšega mikrofona.

Language:	Slovenian
Keywords:	mikrokrmilnik, STM32H7, strojno učenje, nevronske mreže, razpoznava govora
Work type:	Bachelor thesis/paper
Typology:	2.11 - Undergraduate Thesis
Organization:	FRI - Faculty of Computer and Information Science
Year:	2025
PID:	20.500.12556/RUL-173252
COBISS.SI-ID:	250562051
Publication date in RUL:	15.09.2025
Views:	135
Downloads:	36
Metadata:
:	Copy citation
Share:

Secondary language

Abstract:
Language:	English
Title:	Implementation of Spoken Digit Recognition on the Embedded System STMicroelectronics 32F769I-DISCOVERY
We deployed a machine learning model for recognizing spoken digits (0–9) on an STM32 microcontroller. This work covers the complete end-to-end process, including one-second audio capture at 16 kHz on the STM32F769I-DISCOVERY board, signal preprocessing (DC offset removal, root mean square normalization, and clipping), implementing and training the neural network on raw waveforms, and deployment of the trained model to the embedded device. The model was developed and trained in Python, exported to the Open Neural Network Exchange (ONNX) format, and converted into C code using STMicroelectronics’ Edge AI Developer Cloud. On the device, a chain of Timer 2 (TIM2), Analog-to-Digital Converter (ADC), and Direct Memory Access (DMA) is configured to stream audio samples, with inference results reported over the Universal Asynchronous Receiver-Transmitter (UART) interface. A custom dataset of 400 recordings (40 per digit) was collected and normalized to ensure consistent behavior between the training environment and the embedded runtime. Hardware testing achieved 70\% accuracy on sequences of spoken digits. Performance is primarily limited by the small, single-speaker dataset and the microphone quality. Potential improvements include expanding the dataset with recordings from multiple speakers and upgrading the recording hardware.
Keywords:	microcontroller, STM32H7, machine learning, neural networks, speech recognition

Similar works from RUL:
Similar works from other Slovenian collections:

Details

Secondary language

Similar documents