Uporaba globokih nevronskih mrež za ločevanje avtomatsko generiranih in ročno napisanih člankov

STOPINŠEK, AMON

Uporaba globokih nevronskih mrež za ločevanje avtomatsko generiranih in ročno napisanih člankov
ID STOPINŠEK, AMON (Avtor), ID Kononenko, Igor (Mentor) Več o mentorju... Povezava se odpre v novem oknu

PDF - Predstavitvena datoteka, prenos (1,46 MB)
MD5: 9629A500E136A5AC9AB333C4A8FD7C50

Izvleček

V diplomskem delu se ukvarjamo s klasifikacijo besedil na problemu ločevanja člankov, ki jih je napisal človek, od člankov, ki jih je napisal stroj. Na problemu smo preizkusili različne arhitekture konvolucijskih in rekurenčnih globokih nevronskih mrež ter različne predstavitve besedil. Modele smo testirali na podatkovni zbirki ročno napisanih in generiranih člankov o hujšanju. Najboljše rezultate smo dosegli z uporabo arhitekture BLSTM z besednimi vložitvami word2vec. S tem modelom smo dosegli 96,71% klasifikacijsko točnost na testni podatkovni množici na ročno napisanih člankih, 100% klasifikacijsko točnost na člankih, generiranih s slabim modelom in 97,41% klasifikacijsko točnost na člankih, generiranih z dobrim modelom.

Jezik:	Slovenski jezik
Ključne besede:	umetna inteligenca, globoke nevronske mreže, klasifikacija besedil, procesiranje naravnega jezika
Vrsta gradiva:	Diplomsko delo/naloga
Organizacija:	FRI - Fakulteta za računalništvo in informatiko
Leto izida:	2019
PID:	20.500.12556/RUL-106122
Datum objave v RUL:	30.01.2019
Število ogledov:	1305
Število prenosov:	202
Metapodatki:
:	Kopiraj citat
Objavi na:

Sekundarni jezik

Izvleček:
Jezik:	Angleški jezik
Naslov:	Using deep neural networks for differentiating automatically generated from manually written articles
This thesis deals with the text classification on the problem of classifying manually written and automatically generated articles. We tested various convolutional and recurrent deep neural network architectures and various text representations. Models were tested on a dataset of manually written and automatically generated articles about weight loss. Best results were achieved with a model using the BLSTM architecture and word2vec word embeddings. With this model, we achieved 96,71% classification accuracy on the test dataset of manually written articles, 100% classification accuracy on articles generated with the bad model and 97,41% classification accuracy on articles generated with the good model.
Ključne besede:	artifical inteligence, deep neural networks, text classification, natural language processing

Podobna dela

Podobna dela v RUL:
Podobna dela v drugih slovenskih zbirkah:

Nazaj