Korpus učbenikov za učenje slovenščine kot drugega in tujega jezika

Klemen, Matej; Arhar Holdt, Špela; Pollak, Senja; Kosem, Iztok; Huber, Damjan; Lutar, Mateja

Korpus učbenikov za učenje slovenščine kot drugega in tujega jezika
ID Klemen, Matej (Avtor), ID Arhar Holdt, Špela (Avtor), ID Pollak, Senja (Avtor), ID Kosem, Iztok (Avtor), ID Huber, Damjan (Avtor), ID Lutar, Mateja (Avtor)

	PDF - Predstavitvena datoteka, prenos (268,52 KB) MD5: ABF36CDDA4B4DBB50D57976A720C9D67
	URL - Izvorni URL, za dostop obiščite https://ebooks.uni-lj.si/ZalozbaUL/catalog/book/374

Izvleček

V prispevku prikažemo, kako je potekalo oblikovanje korpusa učbenikov za učenje slovenščine kot drugega in tujega jezika – KUUS, ki je nastal kot vzporedni projekt priprave stopenjskih beril na Centru za slovenščino kot drugi in tuji jezik. KUUS v trenutni različici vključuje 17 učbenikov, obsega 691.003 pojavnice oz. 491.022 besed in je skladno z načeli priprave tovrstnih jezikovnih virov opremljen z metapodatki in oznakami, ki omogočajo uporabo jezikovnih podatkov za različne namene. Predstavimo metodološke odločitve, ki smo jih sprejeli pri pripravi korpusa, trenutno različico korpusa in prvi primer uporabe korpusnih podatkov. Opišemo, kako smo podatke uporabili za pripravo pogostnostnih seznamov besed, ki so prvi korak do korpusno podprtega nabora jedrnega besedišča za slovenščino kot drugi ali tuji jezik in omogočajo primerjavo z drugimi seznami besed. Prispevek zaključimo z načrti za nadaljnji razvoj korpusa in seznamov.

Jezik:	Slovenski jezik
Ključne besede:	slovenščina, slovenščina kot drugi jezik, slovenščina kot tuji jezik, korpus učbenikov, KUUS, seznam besed, Skupni evropski jezikovni okvir
Vrsta gradiva:	Članek v reviji
Tipologija:	1.16 - Samostojni znanstveni sestavek ali poglavje v monografski publikaciji
Organizacija:	FF - Filozofska fakulteta
Status publikacije:	Objavljeno
Različica publikacije:	Objavljena publikacija
Leto izida:	2022
Št. strani:	Str. 165-174
PID:	20.500.12556/RUL-143990
UDK:	811.163.6'243:37.091.64
DOI:	10.4312/Obdobja.41.165-174
COBISS.SI-ID:	129975811
Avtorske pravice:	Licenca navedena na pristajalni strani zbornika.
Datum objave v RUL:	26.01.2023
Število ogledov:	1501
Število prenosov:	114
Metapodatki:
:	Kopiraj citat
Objavi na:

Gradivo je del monografije

Naslov:	Na stičišču svetov : slovenščina kot drugi in tuji jezik
Uredniki:	Nataša Pirih Svetina, Ina Ferbežar
Kraj izida:	Ljubljana
Založnik:	Založba Univerze
Leto izida:	2022
ISBN:	978-961-297-026-0
COBISS.SI-ID:	128310531
Naslov zbirke:	Zbirka Obdobja
Številčenje v zbirki:	41
ISSN zbirke:	1408-211X

Licence

Licenca:	CC BY-NC-SA 4.0, Creative Commons Priznanje avtorstva-Nekomercialno-Deljenje pod enakimi pogoji 4.0 Mednarodna

Povezava:	http://creativecommons.org/licenses/by-nc-sa/4.0/deed.sl
Opis:	Licenca Creative Commons, ki prepoveduje komercialno uporabo in zahteva, da uporabnik predelana dela objavi z enako licenco.

Sekundarni jezik

Izvleček:
Jezik:	Angleški jezik
This article describes the creation of a corpus of textbooks for learning Slovenian as a second and foreign language. The KUUS corpus was created as a parallel project for developing graded readers at the Center for Slovenian as a Second and Foreign Language. In its current version, KUUS includes seventeen textbooks, comprises 691,003 tokens or 491,022 words, and, in line with the principles of preparing language resources of this kind, is equipped with metadata and annotations that allow the linguistic data to be used for various purposes. The methodological decisions made in preparing the corpus, the current version of the corpus, and a first example of the use of corpus data are presented. The paper describes how the data were used to compile word frequency lists, which are the first step toward a corpus-based core vocabulary for Slovenian as a second or foreign language and allow comparison with other word lists. The article concludes with plans for further development of the corpus and lists.
Ključne besede:	Slovene, Slovene as a second language, Slovene as a foreign language, textbook corpus, KUUS, word list, Common European Framework of Reference for Languages

Projekti

Financer:	ARRS - Agencija za raziskovalno dejavnost Republike Slovenije
Številka projekta:	P6-0411-2019
Naslov:	Jezikovni viri in tehnologije za slovenski jezik

Financer:	ARRS - Agencija za raziskovalno dejavnost Republike Slovenije
Številka projekta:	J7-3159-2021
Naslov:	Empirična podlaga za digitalno podprt razvoj pisne jezikovne zmožnosti

Financer:	ARRS - Agencija za raziskovalno dejavnost Republike Slovenije
Številka projekta:	P2-0103-2022
Naslov:	Tehnologije znanja

Podobna dela

Podobna dela v RUL:
Podobna dela v drugih slovenskih zbirkah:

Nazaj