Vaš brskalnik ne omogoča JavaScript!
JavaScript je nujen za pravilno delovanje teh spletnih strani. Omogočite JavaScript ali pa uporabite sodobnejši brskalnik.
Nacionalni portal odprte znanosti
Odprta znanost
DiKUL
slv
|
eng
Iskanje
Brskanje
Novo v RUL
Kaj je RUL
V številkah
Pomoč
Prijava
Več glav več ve : uporaba množičenja za čiščenje sloWNeta
ID
Fišer, Darja
(
Avtor
),
ID
Tavčar, Aleš
(
Avtor
)
PDF - Predstavitvena datoteka,
prenos
(875,38 KB)
MD5: 1733FEBDBEB555A8E2081AB76FA602A7
URL - Izvorni URL, za dostop obiščite
https://centerslo.si/simpozij-obdobja/zborniki/obdobja-32/
Galerija slik
Izvleček
V prispevku predstavljamo projekt čiščenja avtomatsko generiranega semantičnega leksikona sloWNet. Napake, ki se v leksikonu pojavljajo zaradi napačne avtomatske disambiguacije večpomenskih besed, smo odpravili s pomočjo orodja sloWCrowd, ki je zasnovano tako, da odgovore za problematične literale zbira iz široke množice uporabnikov - prostovoljcev. Naloga je oblikovana kot spletna igra, v kateri uporabniki tekmujejo, kdo bo zbral več točk (prispeval več pravilnih odgovorov). Glede na to, da tekmovalci niso izurjeni leksikografi, njihovi odgovori niso nujno zanesljivi, zato orodje omogoča merjenje njihove natan~nosti in pri vsakem vprašanju upošteva večinski odgovor, s čimer zagotavlja, da posamezni napačni odgovori sicer zanesljivih uporabnikov ter vsi odgovori nezanesljivih uporabnikov ne vplivajo na dokončno odločitev, ali se določen literal iz leksikona izbriše ali ne.
Jezik:
Slovenski jezik
Ključne besede:
slovenščina
,
množičenje
,
leksikalna semantika
,
večpomenskost
,
sloWNet
Vrsta gradiva:
Članek v reviji
Tipologija:
1.16 - Samostojni znanstveni sestavek ali poglavje v monografski publikaciji
Organizacija:
FF - Filozofska fakulteta
Leto izida:
2013
Št. strani:
Str. 125-132
PID:
20.500.12556/RUL-147646
UDK:
811.163.6'374'371'322
COBISS.SI-ID:
53227362
Datum objave v RUL:
10.07.2023
Število ogledov:
973
Število prenosov:
48
Metapodatki:
Citiraj gradivo
Navadno besedilo
BibTeX
EndNote XML
EndNote/Refer
RIS
ABNT
ACM Ref
AMA
APA
Chicago 17th Author-Date
Harvard
IEEE
ISO 690
MLA
Vancouver
:
Kopiraj citat
Objavi na:
Gradivo je del monografije
Naslov:
Družbena funkcijskost jezika : (vidiki, merila, opredelitve)
Uredniki:
Andreja Žele
Kraj izida:
Ljubljana
Založnik:
Znanstvena založba Filozofske fakultete
Leto izida:
2013
ISBN:
978-961-237-609-3
COBISS.SI-ID:
269357568
Naslov zbirke:
Obdobja
Številčenje v zbirki:
32
ISSN zbirke:
1408-211X
Sekundarni jezik
Jezik:
Angleški jezik
Izvleček:
The paper presents the cleaning of the automatically generated semantic lexicon sloWNet. Errors that occurred due to inappropriate disambiguation of polysemous words were eliminated with a tool called sloWCrowd, which is designed in such a way that it collects multiple answers for problematic literals from a wide number of volunteer users. The task is designed as a web game in which users compete who will collect the highest number of points (contribute the most correct answers). Since the users are not trained lexicographers, the reliability of their answers is questionable, which is whythe tool has been designed to measure the usersʼ accuracy and relies on themajority vote for each literal. This means that the individual incorrect answers from otherwise reliable users and all the answers from unreliable users do not affect the final decision whether or not the literal is to be deleted from the lexicon.
Ključne besede:
Slovenian language
,
crowdsourcing
,
lexical semantics
,
polysemy
,
sloWNet
Podobna dela
Podobna dela v RUL:
Podobna dela v drugih slovenskih zbirkah:
Nazaj