Podrobno

Luščenje kolokacij iz korpusa uporabniških spletnih vsebin
ID Pollak, Senja (Avtor)

.pdfPDF - Predstavitvena datoteka, prenos (79,97 KB)
MD5: 141AA9154254EF6D4536F432E9327184
URLURL - Izvorni URL, za dostop obiščite https://centerslo.si/simpozij-obdobja/zborniki/obdobja-34-2-del/ Povezava se odpre v novem oknu

Izvleček
Prispevek obravnava kolokacije v slovenščini uporabniških spletnih vsebin, natančneje v tvitih, forumih in blogih. Za luščenje kolokacij novega besedišča uporabimo orodje za izdelavo besednih skic, za luščenje za splet specifičnih kolokacij ustaljenega besedišča pa metodo za primerjanje kolokacij med dvema korpusoma. Kolokacijske kandidate analiziramo, obenem pa preučimo razloge za težavnost luščenja.

Jezik:Slovenski jezik
Ključne besede:kolokacije, uporabniške spletne vsebine, besedne skice, neologizmi, jezikovne tehnologije
Vrsta gradiva:Članek v reviji
Tipologija:1.16 - Samostojni znanstveni sestavek ali poglavje v monografski publikaciji
Organizacija:FF - Filozofska fakulteta
Status publikacije:Objavljeno
Različica publikacije:Objavljena publikacija
Leto izida:2015
Št. strani:Str. 601-607
Številčenje:Del 2
PID:20.500.12556/RUL-180767 Povezava se odpre v novem oknu
UDK:81'374
COBISS.SI-ID:29051687 Povezava se odpre v novem oknu
Datum objave v RUL:16.03.2026
Število ogledov:86
Število prenosov:21
Metapodatki:XML DC-XML DC-RDF
:
Kopiraj citat
Objavi na:Bookmark and Share

Gradivo je del monografije

Naslov:Slovnica in slovar - aktualni jezikovni opis
Uredniki:Mojca Smolej
Kraj izida:Ljubljana
Založnik:Znanstvena založba Filozofske fakultete
Leto izida:2015
ISBN:978-961-237-787-8
COBISS.SI-ID:281920512 Povezava se odpre v novem oknu
Naslov zbirke:Obdobja
Številčenje v zbirki:34
ISSN zbirke:1408-211X

Sekundarni jezik

Jezik:Angleški jezik
Izvleček:
This paper presents a study of collocations in Slovene user generated content (UGC): in tweets, forums and blog posts. For extracting collocations of newly coined words word sketches are used, while UGC-specific collocations of general vocabulary are extracted using a method for comparing collocations of two corpora. In addition to analyzing collocations the key obstacles in the extraction process are identified.

Ključne besede:collocations, user-generated content, word sketches, neologisms, language technologies

Projekti

Financer:ARRS - Agencija za raziskovalno dejavnost Republike Slovenije
Številka projekta:J6-6842
Naslov:Viri, orodja in metode za raziskovanje nestandardne spletne slovenščine

Podobna dela

Podobna dela v RUL:
Podobna dela v drugih slovenskih zbirkah:

Nazaj