izpis_h1_title_alt

Odvisnostno površinskoskladenjsko označevanje slovenščine: specifikacije in označeni korpusi
ID Ledinek, Nina (Avtor), ID Erjavec, Tomaž (Avtor)

.pdfPDF - Predstavitvena datoteka, prenos (427,06 KB)
MD5: B9368A4673705789AB232BC568E6D310
URLURL - Izvorni URL, za dostop obiščite https://centerslo.si/simpozij-obdobja/zborniki/obdobja-28/ Povezava se odpre v novem oknu

Izvleček
Prispevek predstavi prve rezultate projektov JOS in SSJ s področja skladnje, in sicer nabor oznak za odvisnostno površinskoskladenjsko označevanje ter dva skladenjsko označena korpusa. Korpusa sta bila vzorčena iz referenčnega korpusa FidaPLUS ter imata ročno označene oz. pregledane leme, oblikoskladenjske ter površinskoskladenjske oznake. Viri bodo kot podatkovna zbirka na voljo za raziskovalne namene po licenci Creative Commons, namenjeni pa so zlasti razvoju jezikovnih tehnologij za slovenščino.

Jezik:Slovenski jezik
Ključne besede:skladenjsko označavenje, korpusi slovenskega jezika, Creative Commons
Vrsta gradiva:Članek v reviji
Tipologija:1.08 - Objavljeni znanstveni prispevek na konferenci
Organizacija:FF - Filozofska fakulteta
Leto izida:2009
Št. strani:Str. 219-224
PID:20.500.12556/RUL-150902 Povezava se odpre v novem oknu
UDK:821.163.6;367:811.163.6'322
COBISS.SI-ID:30665261 Povezava se odpre v novem oknu
Datum objave v RUL:25.09.2023
Število ogledov:505
Število prenosov:31
Metapodatki:XML DC-XML DC-RDF
:
Kopiraj citat
Objavi na:Bookmark and Share

Gradivo je del monografije

Naslov:Infrastruktura slovenščine in slovenistike
Uredniki:Marko Stabej
Kraj izida:Ljubljana
Založnik:Znanstvena založba Filozofske fakultete
Leto izida:2009
ISBN:978-961-237-333-7
COBISS.SI-ID:248431360 Povezava se odpre v novem oknu
Naslov zbirke:Obdobja
Številčenje v zbirki:28

Sekundarni jezik

Jezik:Angleški jezik
Izvleček:
The paper introduces the first results of the JOS and SSJ projects from the area of syntax, comprising the framework for surface dependency annotation of Slovene texts and two annotated corpora. The corpora have been sampled from the Slovene reference corpus FidaPLUS and contain hand validated lemmas, morphosyntactic and surface-syntactic annotations. These resources will be made available as downloadable datasets under a Creative Commons licence, targeted primarily at language technology research for Slovene.

Ključne besede:syntactic annotation, Slovene corpora, Creative Commons

Podobna dela

Podobna dela v RUL:
Podobna dela v drugih slovenskih zbirkah:

Nazaj