izpis_h1_title_alt

Izdelava korpusa starejših slovenskih besedil v okviru projekta IMPACT
ID Erjavec, Tomaž (Avtor), ID Vodopivec, Ines (Avtor), ID Oliver, Maša (Avtor)

.pdfPDF - Predstavitvena datoteka, prenos (169,70 KB)
MD5: D797A1AB3EDBE1886ED683C85010A716
URLURL - Izvorni URL, za dostop obiščite https://centerslo.si/simpozij-obdobja/zborniki/obdobja-30/ Povezava se odpre v novem oknu

Izvleček
Institut "Jožef Stefan" in Narodna in univerzitetna knjižnica Ljubljana od leta 2010 sodelujeta pri evropskem projektu IMPACT (Improving Access to Text), katerega cilj je razviti tehnologije, ki bodo uporabniku in bralcu omogočale uspešnejši dostop do polnega besedila digitaliziranih starejših tiskanih besedil v slovenskem jeziku. V članku predstavimo postopek izdelave korpusa slovenskih besedil in izpostavimo težave, na katere smo naleteli med delom in ki med drugim izvirajo iz zgodovinskih in strukturnih značilnosti slovenskega jezika in črkopisa, ki smo ga uporabljali v preteklosti.

Jezik:Slovenski jezik
Ključne besede:slovenščina, starejša slovenska besedila, digitalizacija, projekt IMPACT, digitalizacija, arhaični slovenski jezik, OCR
Vrsta gradiva:Članek v reviji
Tipologija:1.16 - Samostojni znanstveni sestavek ali poglavje v monografski publikaciji
Organizacija:FF - Filozofska fakulteta
Leto izida:2011
Št. strani:Str. 121-127
PID:20.500.12556/RUL-149206 Povezava se odpre v novem oknu
UDK:004.9:811.163.6"14/18"
COBISS.SI-ID:25362727 Povezava se odpre v novem oknu
Datum objave v RUL:05.09.2023
Število ogledov:396
Število prenosov:36
Metapodatki:XML DC-XML DC-RDF
:
Kopiraj citat
Objavi na:Bookmark and Share

Gradivo je del monografije

Naslov:Meddisciplinarnost v slovenistiki
Uredniki:Simona Kranjc
Kraj izida:Ljubljana
Založnik:Znanstvena založba Filozofske fakultete
Leto izida:2011
ISBN:978-961-237-461-7
COBISS.SI-ID:258646784 Povezava se odpre v novem oknu
Naslov zbirke:Obdobja
Številčenje v zbirki:30

Sekundarni jezik

Jezik:Angleški jezik
Izvleček:
Since 2010 the Jožef Stefan Institute and the National and University Library have been collaborating on the project EU IMPACT (Improving Access to Text), which has as its goal the development of technologies that will enable better full-text access to digitised printed historical Slovene texts. The paper presents the work-flow of the corpus compilation and highlights the problems that we have had to face, which stem also from the historical and structural characteristics of Slovene.

Ključne besede:Slovene, digitisation, OCR, historical printed Slovene texts, historical Slovene, IMPACT project

Podobna dela

Podobna dela v RUL:
Podobna dela v drugih slovenskih zbirkah:

Nazaj