Podrobno

Implementacija govorne prepoznave številk na vgrajenem sistemu STMicroelectronics 32F769IDISCOVERY
ID Rifel, Gašper (Avtor), ID Bulić, Patricio (Mentor) Več o mentorju... Povezava se odpre v novem oknu

.pdfPDF - Predstavitvena datoteka, prenos (11,22 MB)
MD5: FA8617F53DD1BB572F2BBD3AFDB0E3F3

Izvleček
V diplomski nalogi smo obravnavali zasnovo in izvedbo preproste govorne prepoznave števk (0–9) na mikrokrmilniku STM32F769I. Zajemali smo zvočne posnetke pri 16 kHz na plošči STM32F769I-DISCOVERY ter izvedli predobdelavo signala (odstranitev enosmerne (DC) komponente in normalizacija kvadratne srednje vrednosti (RMS)), učenje modela na predobdelanem signalu ter prenos naučenega modela v vgrajeno okolje. Implementirali smo lastno nevronsko mrežo (model) za prepoznavo govornih števk. Model smo zasnovali in učili v Pythonu, izvoz v ONNX pa je omogočil optimizacijo in generiranje kode z uporabo orodja ST Edge AI Developer Cloud. Na napravi smo zvočne posnetke zajemali z uporabo časovnika TIM2, analogno-digitalnega pretvornika (Analog-to-digital converter (ADC)) in krmilnika za neposreden dostop do pomnilnika (DMA - Direct memory access), rezultate pa nazadnje izpisovali prek serijskega univerzalnega asinhronega vmesnika (UART). Za učenje smo pripravili lasten nabor 400 enosekundnih posnetkov (po 40 na posamezno števko), enako predobdelanih, kar po prenosu na napravo zagotavlja, da je vsak posnet vzorec obdelan enako kot vsi posnetki, uporabljeni pri učenju modela. Preizkus na strojni opremi je pokazal 70-odstotno uspešnost pri zaporedno izgovorjenih števkah. Natančnost omejujejo predvsem majhen nabor posnetkov za učenje, uporaba le enega govornika za snemanje vseh posnetkov in kakovost mikrofona. Kot izboljšave predlagamo razširitev nabora na več govorcev, več posnetkov ter uporabo kakovostnejšega mikrofona.

Jezik:Slovenski jezik
Ključne besede:mikrokrmilnik, STM32H7, strojno učenje, nevronske mreže, razpoznava govora
Vrsta gradiva:Diplomsko delo/naloga
Tipologija:2.11 - Diplomsko delo
Organizacija:FRI - Fakulteta za računalništvo in informatiko
Leto izida:2025
PID:20.500.12556/RUL-173252 Povezava se odpre v novem oknu
COBISS.SI-ID:250562051 Povezava se odpre v novem oknu
Datum objave v RUL:15.09.2025
Število ogledov:136
Število prenosov:36
Metapodatki:XML DC-XML DC-RDF
:
Kopiraj citat
Objavi na:Bookmark and Share

Sekundarni jezik

Jezik:Angleški jezik
Naslov:Implementation of Spoken Digit Recognition on the Embedded System STMicroelectronics 32F769I-DISCOVERY
Izvleček:
We deployed a machine learning model for recognizing spoken digits (0–9) on an STM32 microcontroller. This work covers the complete end-to-end process, including one-second audio capture at 16 kHz on the STM32F769I-DISCOVERY board, signal preprocessing (DC offset removal, root mean square normalization, and clipping), implementing and training the neural network on raw waveforms, and deployment of the trained model to the embedded device. The model was developed and trained in Python, exported to the Open Neural Network Exchange (ONNX) format, and converted into C code using STMicroelectronics’ Edge AI Developer Cloud. On the device, a chain of Timer 2 (TIM2), Analog-to-Digital Converter (ADC), and Direct Memory Access (DMA) is configured to stream audio samples, with inference results reported over the Universal Asynchronous Receiver-Transmitter (UART) interface. A custom dataset of 400 recordings (40 per digit) was collected and normalized to ensure consistent behavior between the training environment and the embedded runtime. Hardware testing achieved 70\% accuracy on sequences of spoken digits. Performance is primarily limited by the small, single-speaker dataset and the microphone quality. Potential improvements include expanding the dataset with recordings from multiple speakers and upgrading the recording hardware.

Ključne besede:microcontroller, STM32H7, machine learning, neural networks, speech recognition

Podobna dela

Podobna dela v RUL:
Podobna dela v drugih slovenskih zbirkah:

Nazaj