Podrobno

Measuring catastrophic forgetting in cross-lingual classification : transfer paradigms and tuning strategies
ID Koloski, Boshko (Avtor), ID Škrlj, Blaž (Avtor), ID Robnik Šikonja, Marko (Avtor), ID Pollak, Senja (Avtor)

.pdfPDF - Predstavitvena datoteka, prenos (2,13 MB)
MD5: 45A7548CE216F471D14CF068A4431CA2
URLURL - Izvorni URL, za dostop obiščite https://ieeexplore.ieee.org/document/10892119 Povezava se odpre v novem oknu

Izvleček
Cross-lingual transfer leverages knowledge from a resource-rich source language, commonly English, to enhance performance in less-resourced target languages. Two widely used strategies are: Cross-Lingual Validation (CLV), which involves training on the source language and validating on the target language, and Intermediate Training (IT), where models are first fine-tuned on the source language and then further trained on the target language. While both strategies have been studied, their effects on encoder-based models for classification tasks remain underexplored. In this paper, we systematically compare these strategies across six multilingual classification tasks, evaluating downstream performance, catastrophic forgetting, and both zero-shot and full-shot scenarios. Additionally, we contrast parameter-efficient adapter methods with full-parameter fine-tuning. Our results show that IT generally performs better in the target language, whereas CLV more effectively preserves source-language knowledge across multiple cross-lingual transfers. These findings underscore the trade-offs between optimizing target performance and mitigating catastrophic forgetting.

Jezik:Angleški jezik
Ključne besede:cross-lingual transfer, cross-lingual learning, catastrophic-forgetting, document classification
Vrsta gradiva:Članek v reviji
Tipologija:1.01 - Izvirni znanstveni članek
Organizacija:FRI - Fakulteta za računalništvo in informatiko
Status publikacije:Objavljeno
Različica publikacije:Objavljena publikacija
Leto izida:2025
Št. strani:Str. 33509-33520
Številčenje:Vol. 13
PID:20.500.12556/RUL-178163 Povezava se odpre v novem oknu
UDK:004.8
ISSN pri članku:2169-3536
DOI:10.1109/ACCESS.2025.3543608 Povezava se odpre v novem oknu
COBISS.SI-ID:227115523 Povezava se odpre v novem oknu
Datum objave v RUL:20.01.2026
Število ogledov:131
Število prenosov:41
Metapodatki:XML DC-XML DC-RDF
:
Kopiraj citat
Objavi na:Bookmark and Share

Gradivo je del revije

Naslov:IEEE access
Založnik:Institute of Electrical and Electronics Engineers
ISSN:2169-3536
COBISS.SI-ID:519839513 Povezava se odpre v novem oknu

Licence

Licenca:CC BY 4.0, Creative Commons Priznanje avtorstva 4.0 Mednarodna
Povezava:http://creativecommons.org/licenses/by/4.0/deed.sl
Opis:To je standardna licenca Creative Commons, ki daje uporabnikom največ možnosti za nadaljnjo uporabo dela, pri čemer morajo navesti avtorja.

Sekundarni jezik

Jezik:Slovenski jezik
Ključne besede:medjezikovno učenje, medjezikovni prenos, globoko učenje, strojno učenje

Projekti

Financer:ARIS - Javna agencija za znanstvenoraziskovalno in inovacijsko dejavnost Republike Slovenije
Številka projekta:P2-0103
Naslov:Tehnologije znanja

Financer:ARIS - Javna agencija za znanstvenoraziskovalno in inovacijsko dejavnost Republike Slovenije
Številka projekta:P6-0411
Naslov:Jezikovni viri in tehnologije za slovenski jezik

Financer:ARIS - Javna agencija za znanstvenoraziskovalno in inovacijsko dejavnost Republike Slovenije
Številka projekta:J6-2581
Naslov:Računalniško podprta večjezična analiza novičarskega diskurza s kontekstualnimi besednimi vložitvami

Financer:ARIS - Javna agencija za znanstvenoraziskovalno in inovacijsko dejavnost Republike Slovenije
Številka projekta:J5-3102
Naslov:Sovražni govor v sodobnih konceptualizacijah nacionalizma, rasizma, spola in migracij

Financer:ARIS - Javna agencija za znanstvenoraziskovalno in inovacijsko dejavnost Republike Slovenije
Številka projekta:L2-50070
Naslov:Tehnike vektorskih vložitev za medijske aplikacije

Financer:ARIS - Javna agencija za znanstvenoraziskovalno in inovacijsko dejavnost Republike Slovenije
Številka projekta:GC-0002
Naslov:Veliki jezikovni modeli za digitalno humanistiko

Financer:ARIS - Javna agencija za znanstvenoraziskovalno in inovacijsko dejavnost Republike Slovenije
Številka projekta:J6-60109
Naslov:Čezjezikovna analiza za zaznavanje kognitivnih motenj v jezikih z manj viri

Financer:ARIS - Javna agencija za znanstvenoraziskovalno in inovacijsko dejavnost Republike Slovenije
Program financ.:Young researchers
Številka projekta:PR-12394

Financer:EC - European Commission
Program financ.:HE
Številka projekta:101186647
Naslov:Centre of Excellence in Artificial Intelligence for Digital Humanities
Akronim:AI4DH

Financer:EC - European Commission
Številka projekta:C3.K8.IB
Akronim:PoVeJMo

Podobna dela

Podobna dela v RUL:
Podobna dela v drugih slovenskih zbirkah:

Nazaj