Razvoj govornega vmesnika za vnos podatkov pri terenskem delu

SEVER, VID

Podrobno

Razvoj govornega vmesnika za vnos podatkov pri terenskem delu
ID SEVER, VID (Avtor), ID Dobrišek, Simon (Mentor) Več o mentorju... Povezava se odpre v novem oknu

PDF - Predstavitvena datoteka, prenos (1,48 MB)
MD5: 5C7AA42581B52863EF068CDE2558A48C
PID: 20.500.12556/rul/2a16d64a-44ef-416c-a336-8e47cdfde282

Izvleček

Cilj dela v diplomski nalogi je razviti govorni vmesnik, ki bo uspešno reševal probleme z vnašanjem podatkov v informacijske sisteme med terenskim delom. V prvem delu naloge smo raziskali področje razpoznavanja govora in pregledali možne govorne vmesnike ter orodja, katere bi lahko uporabili pri svojem delu V drugem delu naloge smo se osredotočili na samo izvedbo govornega vmesnika v programskem jeziku Python. Pri obdelavi posnetkov govora smo uporabili nekaj nestandardnih Python knjižnic. Za razpoznavanje govora smo uporabili Googlov govorni programski vmesnik Google Speech API. Razpoznano besedilo smo oblikovali v HTML formatu. Razvili smo tudi grafični vmesnik. Delovanje govornega vmesnika smo preizkusili v okoljih z različno ravnijo hrupa. Ugotovili smo, da zadovoljivo dobro deluje tudi pri posnetkih, narejenih v naravnem okolju, v katerem terensko delo navadno poteka.

Jezik:	Slovenski jezik
Ključne besede:	razpoznavanje govora, govorni vmesnik, Google Speech API
Vrsta gradiva:	Diplomsko delo
Organizacija:	FE - Fakulteta za elektrotehniko
Leto izida:	2016
PID:	20.500.12556/RUL-85659
Datum objave v RUL:	20.09.2016
Število ogledov:	2409
Število prenosov:	633
Metapodatki:
:	Kopiraj citat
Objavi na:

Sekundarni jezik

Izvleček:
Jezik:	Angleški jezik
Naslov:	The development of a speech interface for data entry in fieldwork
Main goal of the thesis was to develop a speech interface for solving problems with data entry during fieldwork. In first part of the thesis we did an overview of speech recognition field, tools and speech interfaces which we cloud use in development of my own speech interface. In the second part of the thesis we focused on developing speech interface with python programing language. We used some nonstandard python libraries for audio processing. Speech recognition was performed by Google Speech API. We used HTML format to achieve the desired text structure of the output. We also developed a graphical user interface. We tested the speech interface in different environments with different noise volumes. We concluded that it performs well with voice recordings that were recorded in a natural environment, where fieldwork is usually performed. Performance drops only in environments with a really loud noise.
Ključne besede:	speech recognition, speech interface, Google Speech API

Podobna dela

Podobna dela v RUL:
Podobna dela v drugih slovenskih zbirkah:

Nazaj