Podrobno

Comparing the nonstandard language of Slovene, Croatian and Serbian tweets
ID Fišer, Darja (Avtor), ID Erjavec, Tomaž (Avtor), ID Ljubešić, Nikola (Avtor), ID Miličević, Maja (Avtor)

.pdfPDF - Predstavitvena datoteka, prenos (80,14 KB)
MD5: 1FA99CE2BAA662F31A82BE0B0FE6BB87
URLURL - Izvorni URL, za dostop obiščite https://centerslo.si/simpozij-obdobja/zborniki/obdobja-34-1-del/ Povezava se odpre v novem oknu

Izvleček
In this paper we carry out a cross-lingual comparison of nonstandard features in the language of social media for Slovene, Croatian and Serbian. The goal of the analysis is twofold: (1) we try to establish the extent to which the observed phenomena are universal rather than language-specific, and (2) we propose an approach for automatic scoring of (non)standardness levels of user-generated content, which can be used as a separate annotation layer in corpora. Quantitative and qualitative analyses of the results show that the majority of the language used on Twitter is fairly standard, especially in Slovene and Croatian. The prevalent characteristic of nonstandard Slovene tweets is nonstandard orthography, while nonstandard lexis is more typical of Serbian tweets, possibly due to a younger user profile.

Jezik:Angleški jezik
Ključne besede:user-generated content, nonstandard language, web corpora, corpus annotation, South Slavic languages
Tipologija:1.16 - Samostojni znanstveni sestavek ali poglavje v monografski publikaciji
Organizacija:FF - Filozofska fakulteta
Leto izida:2015
Št. strani:Str. 225-231
Številčenje:Del 1
PID:20.500.12556/RUL-166571 Povezava se odpre v novem oknu
UDK:81'276=163.6=163.42=163.41:004.738.52
COBISS.SI-ID:59028578 Povezava se odpre v novem oknu
Datum objave v RUL:17.01.2025
Število ogledov:404
Število prenosov:75
Metapodatki:XML DC-XML DC-RDF
:
Kopiraj citat
Objavi na:Bookmark and Share

Gradivo je del monografije

Naslov:Slovnica in slovar - aktualni jezikovni opis
Uredniki:Mojca Smolej
Kraj izida:Ljubljana
Založnik:Znanstvena založba Filozofske fakultete
Leto izida:2015
ISBN:978-961-237-787-8
COBISS.SI-ID:281920512 Povezava se odpre v novem oknu
Naslov zbirke:Obdobja
Številčenje v zbirki:34
ISSN zbirke:1408-211X

Sekundarni jezik

Jezik:Slovenski jezik
Izvleček:
V prispevku predstavimo večjezično primerjavo nestandardnih jezikovnih prvin v družbenih medijih za slovenščino, hrvaščino in srbščino. Cilj analize je dvojen: (1) ugotoviti želimo, do katere mere so identificirani pojavi univerzalni za to zvrst komunikacije in katere so tiste prvine, ki so jezikovno specifične, ter (2) predlagati pristop za avtomatsko ocenjevanje stopnje (ne)standardnosti spletnih uporabniških vsebin, ki ga lahko kot dodatno oznako s pridom uporabimo pri označevanju korpusov. Kvantitativna in kvalitativna analiza rezultatov kažeta, da je jezik, ki se uporablja na Twitterju, pravzaprav precej standarden, še posebej v Sloveniji in na Hrvaškem. Prevladujoča značilnost nestandardnih slovenskih tvitov je nestandardna ortografija, medtem ko je za srbske tvite tipična nestandardna leksika, ki nakazuje na mlajši profil uporabnikov tega družbenega medija v Srbiji.

Ključne besede:uporabniške spletne vsebine, nestandardni jezik, spletni korpusi, označevanje korpusov, južnoslovanski jeziki

Podobna dela

Podobna dela v RUL:
Podobna dela v drugih slovenskih zbirkah:

Nazaj