izpis_h1_title_alt

Več glav več ve : uporaba množičenja za čiščenje sloWNeta
ID Fišer, Darja (Avtor), ID Tavčar, Aleš (Avtor)

.pdfPDF - Predstavitvena datoteka, prenos (875,38 KB)
MD5: 1733FEBDBEB555A8E2081AB76FA602A7
URLURL - Izvorni URL, za dostop obiščite https://centerslo.si/simpozij-obdobja/zborniki/obdobja-32/ Povezava se odpre v novem oknu

Izvleček
V prispevku predstavljamo projekt čiščenja avtomatsko generiranega semantičnega leksikona sloWNet. Napake, ki se v leksikonu pojavljajo zaradi napačne avtomatske disambiguacije večpomenskih besed, smo odpravili s pomočjo orodja sloWCrowd, ki je zasnovano tako, da odgovore za problematične literale zbira iz široke množice uporabnikov - prostovoljcev. Naloga je oblikovana kot spletna igra, v kateri uporabniki tekmujejo, kdo bo zbral več točk (prispeval več pravilnih odgovorov). Glede na to, da tekmovalci niso izurjeni leksikografi, njihovi odgovori niso nujno zanesljivi, zato orodje omogoča merjenje njihove natan~nosti in pri vsakem vprašanju upošteva večinski odgovor, s čimer zagotavlja, da posamezni napačni odgovori sicer zanesljivih uporabnikov ter vsi odgovori nezanesljivih uporabnikov ne vplivajo na dokončno odločitev, ali se določen literal iz leksikona izbriše ali ne.

Jezik:Slovenski jezik
Ključne besede:slovenščina, množičenje, leksikalna semantika, večpomenskost, sloWNet
Vrsta gradiva:Članek v reviji
Tipologija:1.16 - Samostojni znanstveni sestavek ali poglavje v monografski publikaciji
Organizacija:FF - Filozofska fakulteta
Leto izida:2013
Št. strani:Str. 125-132
PID:20.500.12556/RUL-147646 Povezava se odpre v novem oknu
UDK:811.163.6'374'371'322
COBISS.SI-ID:53227362 Povezava se odpre v novem oknu
Datum objave v RUL:10.07.2023
Število ogledov:973
Število prenosov:48
Metapodatki:XML DC-XML DC-RDF
:
Kopiraj citat
Objavi na:Bookmark and Share

Gradivo je del monografije

Naslov:Družbena funkcijskost jezika : (vidiki, merila, opredelitve)
Uredniki:Andreja Žele
Kraj izida:Ljubljana
Založnik:Znanstvena založba Filozofske fakultete
Leto izida:2013
ISBN:978-961-237-609-3
COBISS.SI-ID:269357568 Povezava se odpre v novem oknu
Naslov zbirke:Obdobja
Številčenje v zbirki:32
ISSN zbirke:1408-211X

Sekundarni jezik

Jezik:Angleški jezik
Izvleček:
The paper presents the cleaning of the automatically generated semantic lexicon sloWNet. Errors that occurred due to inappropriate disambiguation of polysemous words were eliminated with a tool called sloWCrowd, which is designed in such a way that it collects multiple answers for problematic literals from a wide number of volunteer users. The task is designed as a web game in which users compete who will collect the highest number of points (contribute the most correct answers). Since the users are not trained lexicographers, the reliability of their answers is questionable, which is whythe tool has been designed to measure the usersʼ accuracy and relies on themajority vote for each literal. This means that the individual incorrect answers from otherwise reliable users and all the answers from unreliable users do not affect the final decision whether or not the literal is to be deleted from the lexicon.

Ključne besede:Slovenian language, crowdsourcing, lexical semantics, polysemy, sloWNet

Podobna dela

Podobna dela v RUL:
Podobna dela v drugih slovenskih zbirkah:

Nazaj