Sodobni veliki jezikovni modeli kažejo visoko zmogljivost pri povzemanju besedil, vendar se njihova učinkovitost med jeziki z omejenimi viri precej razlikuje. To delo obravnava izziv ciljnega povzemanja besedil v slovenščini, jeziku z omejeno razpoložljivostjo označenih učnih množic in orodij za vrednotenje. Predstavljamo novo ogrodje za ciljno povzemanje besedil (QFS - query-focused summarization), QFS-Composer, ki združuje dekompozicijo poizvedb, generiranje vprašanj (QG), odgovarjanje na vprašanja (QA) in abstraktno povzemanje za povečanje skladnosti povzetka s ciljem povzemanja. Da bi omogočili kakovosten nadzor in vrednotenje učenja, smo razvili slovenske modele QA in QG na podlagi velikega jezikovnega modela GaMS-9B-Instruct, in prilagojene metrike QAGS, QuestEval in RQUGE za vrednotenje povzetkov v slovenščini. Eksperimentalni rezultati kažejo, da sistem za povzemanje, usmerjen z QA, zagotavlja izboljšano doslednost in ustreznost v primerjavi z osnovnimi velikimi jezikovnimi modeli. Raziskava vzpostavlja razširljivo metodologijo za izboljšanje QFS v jezikih z manj viri.
|