Vaš brskalnik ne omogoča JavaScript!
JavaScript je nujen za pravilno delovanje teh spletnih strani. Omogočite JavaScript ali pa uporabite sodobnejši brskalnik.
Repozitorij Univerze v Ljubljani
Nacionalni portal odprte znanosti
Odprta znanost
DiKUL
slv
|
eng
Iskanje
Brskanje
Novo v RUL
Kaj je RUL
V številkah
Pomoč
Prijava
Podrobno
Avtomatsko postavljanje ločil v surovem tekstu
ID
Rizvič, Mitja
(
Avtor
),
ID
Bajec, Marko
(
Mentor
)
Več o mentorju...
,
ID
Lebar Bajec, Iztok
(
Komentor
)
PDF - Predstavitvena datoteka,
prenos
(2,13 MB)
MD5: 8D102980466C30869A1C58226A5ED481
Galerija slik
Izvleček
Razpoznava govora je sistem, ki omogoča avtomatsko pretvorbo govora v besedilo. Izhod takšnega sistema je surovo besedilo brez velikih začetnic, ločil in ostalih oblikovnih lastnosti. Ker je takšno besedilo nepregledno, ročno urejanje pa zahteva veliko dela, so se uveljavile različne metode, ki omenjene težave rešujejo avtomatsko. Takšni sistemi lahko temeljijo na različnih metodah, vendar so se v zadnjem času predvsem zaradi dobrih rezultatov uveljavili različni tipi nevronskih mrež. Tako smo v sklopu magistrskega dela implementirali sistem, ki za svoje delovanje uporablja rekurenčne nevronske mreže. Preizkusili smo ga z različnimi vektorskimi vložitvami, kot so GloVe, ELMO in BERT. Implementirali smo tudi spletno storitev, ki omogoča, da sistem enostavno integriramo v različne storitve, kot je npr. že prej omenjena avtomatska razpoznava govora.
Jezik:
Slovenski jezik
Ključne besede:
strojno učenje
,
nevronske mreže
,
postavljanje ločil
Vrsta gradiva:
Magistrsko delo/naloga
Tipologija:
2.09 - Magistrsko delo
Organizacija:
FRI - Fakulteta za računalništvo in informatiko
Leto izida:
2020
PID:
20.500.12556/RUL-117687
COBISS.SI-ID:
32307203
Datum objave v RUL:
22.07.2020
Število ogledov:
3048
Število prenosov:
282
Metapodatki:
Citiraj gradivo
Navadno besedilo
BibTeX
EndNote XML
EndNote/Refer
RIS
ABNT
ACM Ref
AMA
APA
Chicago 17th Author-Date
Harvard
IEEE
ISO 690
MLA
Vancouver
:
RIZVIČ, Mitja, 2020,
Avtomatsko postavljanje ločil v surovem tekstu
[na spletu]. Magistrsko delo. [Dostopano 26 marec 2025]. Pridobljeno s: https://repozitorij.uni-lj.si/IzpisGradiva.php?lang=slv&id=117687
Kopiraj citat
Objavi na:
Sekundarni jezik
Jezik:
Angleški jezik
Naslov:
Automatic punctuation in raw word sequences
Izvleček:
Speech recognition is a system that allows for automatic conversion of speech into written text. Such systems typicaly return raw text without any formatting such as capital letters or punctuation symbols. Because such text is unreadable and it also requires a lot of work to edit manually, various methods have been introduced that solve these problems automatically. Such systems can be based on a variety of methods. However, due to good results they provide, different types of neural networks are mainly used nowdays. As part of the master's thesis, we have implemented a system that uses recurrent neural network to predict punctuation symbols in raw unpunctuated text. We have tried it with different word embeddings such as GloVe, ELMO and BERT. We have also implemented a web service that allows us to easily integrate the system into various other services, such as automatic speech recognition.
Ključne besede:
machine learning
,
neural networks
,
punctuation restoration
Podobna dela
Podobna dela v RUL:
Modeliranje 3D struktur interakcij med proteini in RNA
Modeliranje interakcij protein-RNA z uporabo globokih konvolucijskih nevronskih mrež nad grafi
Sledenje objektov s segmentacijo in napovedovanjem globinskih barvnih slik
Izboljšava kvalitete zajetega slikovnega gradiva s konvolucijskimi nevronskimi mrežami
Upravljanje kvadrokopterja z gestami
Podobna dela v drugih slovenskih zbirkah:
Ni podobnih del
Nazaj