Vaš brskalnik ne omogoča JavaScript!
JavaScript je nujen za pravilno delovanje teh spletnih strani. Omogočite JavaScript ali pa uporabite sodobnejši brskalnik.
Repozitorij Univerze v Ljubljani
Nacionalni portal odprte znanosti
Odprta znanost
DiKUL
slv
|
eng
Iskanje
Brskanje
Novo v RUL
Kaj je RUL
V številkah
Pomoč
Prijava
Podrobno
Similarity of arbitrarily long legal documents
ID
Vranješ, Luka
(
Avtor
),
ID
Robnik Šikonja, Marko
(
Mentor
)
Več o mentorju...
PDF - Predstavitvena datoteka,
prenos
(1,22 MB)
MD5: D6AD17D9AD32AAC209B64BC36F58F805
Galerija slik
Izvleček
The penetration of modern language technologies into the legal industry is necessary for it to deal with large amounts of texts it produces. Search is a core feature allowing users to perform their work better and faster. The use of modern context-aware approaches can aid in many features related to search, by better quantifying similarity between text. As a solution, we propose a transformer-based model for creating document embeddings using two interlaced encoders. We train three models with various levels of interlacing and also inform one model of the relative location of each segment within the document. As no differences were detected in the training stage, the most feature rich model was selected and compared in human evaluation to a baseline doc2vec model on a task of recommending similar documents. Based on the results, doc2vec proved to be a better and more suitable model for the selected task. The testing outlined some key problems with the proposed model in terms of its concept of similarity, which does not match the requirements of legal document recommendation.
Jezik:
Angleški jezik
Ključne besede:
document similarity
,
document recommendation
,
legal documents
,
long documents
,
natural language processing
,
transformer neural networks
Vrsta gradiva:
Magistrsko delo/naloga
Tipologija:
2.09 - Magistrsko delo
Organizacija:
FRI - Fakulteta za računalništvo in informatiko
Leto izida:
2022
PID:
20.500.12556/RUL-141628
COBISS.SI-ID:
125574147
Datum objave v RUL:
03.10.2022
Število ogledov:
862
Število prenosov:
118
Metapodatki:
Citiraj gradivo
Navadno besedilo
BibTeX
EndNote XML
EndNote/Refer
RIS
ABNT
ACM Ref
AMA
APA
Chicago 17th Author-Date
Harvard
IEEE
ISO 690
MLA
Vancouver
:
VRANJEŠ, Luka, 2022,
Similarity of arbitrarily long legal documents
[na spletu]. Magistrsko delo. [Dostopano 3 maj 2025]. Pridobljeno s: https://repozitorij.uni-lj.si/IzpisGradiva.php?lang=slv&id=141628
Kopiraj citat
Objavi na:
Sekundarni jezik
Jezik:
Slovenski jezik
Naslov:
Podobnost poljubno dolgih pravnih besedil
Izvleček:
Uporaba sodobnih jezikovnih tehnologij v pravni industriji je potrebna, da se ta lažje spopade z velikimi količinami besedila, ki ga proizvede. Učinkovito iskanje je ena izmed ključnih rešitev, ki dovoljuje uporabnikom, da svoje delo upravljajo bolje in hitreje. Z boljšim zavedanjem konteksta lahko moderni pristopi izboljšajo mnogo funkcij povezanih z iskanjem. Kot rešitev predlagamo arhitekturo na osnovi nevronske mreže transformer, ki z uporabo dveh prekritih kodirnikov ustvari predstavitev dokumenta. Testirali smo tri modele z različnimi nivoji prekrivanja in eden model katerega informiramo o relativni lokaciji segmenta znotraj dokumenta. Med njimi na validacijski množici nismo zaznali razlik, zato smo za ročno testiranje uporabili najbolj dodelan model. V ročnem testiranju na nalogi predlaganja podobnih dokumentov, primerjamo naš izbrani model z modelom doc2vec. Rezultati kažejo, da je model doc2vec primerenejši za uporabo na testiranem problemu. Testiranje je pokazalo pomanjkljivosti predlaganega modela, še posebej v smislu predstavitve podobnosti, ki se ne ujema z zahtevanim v kontekstu priporočanja podobnih pravnih besedil.
Ključne besede:
podobnost dokumentov
,
predlaganje dokumentov
,
pravni dokumenti
,
dolgi dokumenti
,
procesiranje naravnega jezika
,
nevronske mreže transformer
Podobna dela
Podobna dela v RUL:
Razvoj nove generacije polževega zobniškega prenosa za kuhinjske aparate
Belokranjske kuhinjske krpe iz lanenega blaga
Nizkocenovni modularni robotski manipulator z absolutnim magnetnim dajalnikom zasuka
Snovanje naprave za otresanje sadnega drevja
Kuhinjski aparati za uporabnike z različnimi opravilnimi sposobnostmi
Podobna dela v drugih slovenskih zbirkah:
Analiza gibanja oči med branjem pri bolnikih z različnimi stopnjami kognitivnega upada
Vpliv življenjskega sloga voznikov avtobusov na pojav zdravstvenih težav in absentizma
Slovenski programi za pomoč pri spremljanju nezdravega življenjskega sloga
Odnos vzgojiteljev izbranih vrtcev do zdravega življenjskega sloga
Spremembe življenjskega sloga in čustveno doživljanje v času epidemije
Nazaj