izpis_h1_title_alt

Razvoj govornega vmesnika za vnos podatkov pri terenskem delu
SEVER, VID (Avtor), Dobrišek, Simon (Mentor) Več o mentorju... Povezava se odpre v novem oknu

.pdfPDF - Predstavitvena datoteka, prenos (1,48 MB)

Izvleček
Cilj dela v diplomski nalogi je razviti govorni vmesnik, ki bo uspešno reševal probleme z vnašanjem podatkov v informacijske sisteme med terenskim delom. V prvem delu naloge smo raziskali področje razpoznavanja govora in pregledali možne govorne vmesnike ter orodja, katere bi lahko uporabili pri svojem delu V drugem delu naloge smo se osredotočili na samo izvedbo govornega vmesnika v programskem jeziku Python. Pri obdelavi posnetkov govora smo uporabili nekaj nestandardnih Python knjižnic. Za razpoznavanje govora smo uporabili Googlov govorni programski vmesnik Google Speech API. Razpoznano besedilo smo oblikovali v HTML formatu. Razvili smo tudi grafični vmesnik. Delovanje govornega vmesnika smo preizkusili v okoljih z različno ravnijo hrupa. Ugotovili smo, da zadovoljivo dobro deluje tudi pri posnetkih, narejenih v naravnem okolju, v katerem terensko delo navadno poteka.

Jezik:Slovenski jezik
Ključne besede:razpoznavanje govora, govorni vmesnik, Google Speech API
Vrsta gradiva:Diplomsko delo (m5)
Organizacija:FE - Fakulteta za elektrotehniko
Leto izida:2016
Število ogledov:642
Število prenosov:375
Metapodatki:XML RDF-CHPDL DC-XML DC-RDF
 
Skupna ocena:(0 glasov)
Vaša ocena:Ocenjevanje je dovoljeno samo prijavljenim uporabnikom.
:
Objavi na:AddThis
AddThis uporablja piškotke, za katere potrebujemo vaše privoljenje.
Uredi privoljenje...

Sekundarni jezik

Jezik:Angleški jezik
Naslov:The development of a speech interface for data entry in fieldwork
Izvleček:
Main goal of the thesis was to develop a speech interface for solving problems with data entry during fieldwork. In first part of the thesis we did an overview of speech recognition field, tools and speech interfaces which we cloud use in development of my own speech interface. In the second part of the thesis we focused on developing speech interface with python programing language. We used some nonstandard python libraries for audio processing. Speech recognition was performed by Google Speech API. We used HTML format to achieve the desired text structure of the output. We also developed a graphical user interface. We tested the speech interface in different environments with different noise volumes. We concluded that it performs well with voice recordings that were recorded in a natural environment, where fieldwork is usually performed. Performance drops only in environments with a really loud noise.

Ključne besede:speech recognition, speech interface, Google Speech API

Podobna dela

Podobna dela v RUL:
Podobna dela v drugih slovenskih zbirkah:

Komentarji

Dodaj komentar

Za komentiranje se morate prijaviti.

Komentarji (0)
0 - 0 / 0
 
Ni komentarjev!

Nazaj