Podrobno

Šolar, the developmental corpus of Slovene
ID Arhar Holdt, Špela (Avtor), ID Kosem, Iztok (Avtor)

.pdfPDF - Predstavitvena datoteka, prenos (722,30 KB)
MD5: 16D72EDD153423C19B7CF6118E56D1B4
URLURL - Izvorni URL, za dostop obiščite https://link.springer.com/article/10.1007/s10579-024-09758-4 Povezava se odpre v novem oknu

Izvleček
The paper presents the Šolar developmental corpus of Slovene, comprising the written language production of students in Slovene elementary and secondary schools, along with teacher feedback. The corpus consists of 5485 texts (1,635,407 words) and includes linguistically categorized teacher corrections, making the corpus unique in reflecting authentic classroom correction practices. The paper addresses the corpus compilation, content and format, annotation, availability, and its applicative value. While learner corpora are abundant, developmental corpora are less common. The paper bridges the gap by introducing the evolution from Šolar 1.0 to 3.0, emphasizing improvements in text collection, error and correction annotation, and categorization methodology. It also underlines the challenges and unresolved issues of compiling developmental corpora, most notably the lack of openly available tools and standards for different steps of the compilation process. Overall, the Šolar corpus offers valuable insights into language learning and teaching, contributing to teacher training, empirical studies in applied linguistics, and natural language processing tasks.

Jezik:Angleški jezik
Ključne besede:Šolar, developmental corpus, Slovene language, student writing, teacher feedback
Vrsta gradiva:Članek v reviji
Tipologija:1.01 - Izvirni znanstveni članek
Organizacija:FF - Filozofska fakulteta
FRI - Fakulteta za računalništvo in informatiko
Status publikacije:Objavljeno
Različica publikacije:Objavljena publikacija
Leto izida:2025
Št. strani:Str. 1151-1177
Številčenje:Vol. 59, iss. 2
PID:20.500.12556/RUL-169224 Povezava se odpre v novem oknu
UDK:004.85:81'322
ISSN pri članku:1574-020X
DOI:10.1007/s10579-024-09758-4 Povezava se odpre v novem oknu
COBISS.SI-ID:204228867 Povezava se odpre v novem oknu
Datum objave v RUL:19.05.2025
Število ogledov:351
Število prenosov:69
Metapodatki:XML DC-XML DC-RDF
:
Kopiraj citat
Objavi na:Bookmark and Share

Gradivo je del revije

Naslov:Language resources and evaluation
Založnik:Springer Nature
ISSN:1574-020X
COBISS.SI-ID:224002304 Povezava se odpre v novem oknu

Licence

Licenca:CC BY 4.0, Creative Commons Priznanje avtorstva 4.0 Mednarodna
Povezava:http://creativecommons.org/licenses/by/4.0/deed.sl
Opis:To je standardna licenca Creative Commons, ki daje uporabnikom največ možnosti za nadaljnjo uporabo dela, pri čemer morajo navesti avtorja.

Sekundarni jezik

Jezik:Slovenski jezik
Ključne besede:Šolar, razvojni korpus, slovenščina, šolsko pisanje, učiteljski popravki

Projekti

Financer:ARIS - Javna agencija za znanstvenoraziskovalno in inovacijsko dejavnost Republike Slovenije
Številka projekta:P6-0411
Naslov:Jezikovni viri in tehnologije za slovenski jezik

Financer:ARIS - Javna agencija za znanstvenoraziskovalno in inovacijsko dejavnost Republike Slovenije
Številka projekta:J7-3159
Naslov:Empirična podlaga za digitalno podprt razvoj pisne jezikovne zmožnosti

Podobna dela

Podobna dela v RUL:
Podobna dela v drugih slovenskih zbirkah:

Nazaj