<?xml version="1.0" encoding="utf-8"?>
<Gradivo ID="183358" NadgradivoID="37" NRID="28744957" OceID="0" DomainUrl="https://repozitorij.uni-lj.si/" IzpisPolniUrl="https://repozitorij.uni-lj.si/IzpisGradiva.php?lang=slv&amp;id=183358" StOgledov="45" StPrenosov="22" StOcen="0" VsotaOcen="0" DatumIzvoza="2026-06-18 18:50:53" OcenaSkupna="0" StPodgradiv="0" StudijskiProgramEvsID="" JeIndeksirano="0" JeVecAvtorjev="0" DovoliZahtevkeZaDostop="0">
  <PID Url="http://hdl.handle.net/20.500.12556/RUL-183358">20.500.12556/RUL-183358</PID>
  <Naslov>Comparative analysis of text similarity algorithms and their practical applications in computer science</Naslov>
  <Podnaslov></Podnaslov>
  <TujJezik_Naslov>Primerjalna analiza algoritmov za podrobnost besedil in njihove praktične uporabe v računalništvu</TujJezik_Naslov>
  <TujJezik_Podnaslov></TujJezik_Podnaslov>
  <Opis>In an era defined by vast volumes of digital text, the capacity to compare, interpret, and quantify textual similarity is a cornerstone of modern computational linguistics and natural language processing (NLP). Text similarity algorithms support critical applications in information retrieval, plagiarism detection, sentiment analysis, text summarization, and beyond. This paper provides a comprehensive survey and comparative analysis of established text similarity algorithms, including edit-distance-based metrics (Levenshtein and DamerauLevenshtein), character-based measures (Jaro and Jaro-Winkler), local sequence alignment (Smith-Waterman), vector-based semantic measures (Cosine similarity), and methods reliant on subsequence statistics (N-gram similarity). Each algorithm is analyzed in terms of its underlying theoretical foundations, computational complexity, performance characteristics, and domain-specific suitability. While traditional approaches excel in correcting typographical errors or identifying subtle lexical variations, more robust methods handle semantically rich corpora, larger text bodies, and intricate linguistic phenomena. Moreover, potential avenues for improvement are explored, including hybridization of existing approaches and the integration of emerging machine learning and deep neural models. This holistic examination aims to inform the selection and development of text similarity measures for diverse real-world applications and to guide future research directions in computational linguistics.</Opis>
  <TujJezik_Opis>Primerjava in merjenje podobnosti med digitalnimi besedili sta ključna za računalniško lingvistiko in obdelavo naravnega jezika. Algoritmi za podobnost se uporabljajo pri iskanju informacij, zaznavanju plagiatorstva, analizi sentimenta in povzemanju besedil. Prispevek predstavlja primerjalno analizo uveljavljenih metod, kot so Levenshteinova razdalja, Jaro-Winkler, SmithWaterman, kosinusna podobnost in N-grami. Ocenjene so glede na teoretične osnove, računsko zahtevnost, učinkovitost in primernost za različna področja. Tradicionalne metode so učinkovite pri zaznavanju napak in leksikalnih razlik, naprednejše pa pri obravnavi semantično bogatih in daljših besedil. Raziskane so tudi možnosti izboljšav z združevanjem pristopov in uporabo metod strojnega učenja. Namen analize je usmerjati uporabo in nadaljnji razvoj teh algoritmov.</TujJezik_Opis>
  <KljucneBesede>
    <Beseda>text similarity algorithms</Beseda>
    <Beseda>natural language processing</Beseda>
    <Beseda>computational linguistics</Beseda>
  </KljucneBesede>
  <TujJezik_KljucneBesede>
    <Beseda>digitalno besedilo</Beseda>
    <Beseda>računalniška lingvistika</Beseda>
    <Beseda>naravni jezik</Beseda>
    <Beseda>Levenshteinova razdalja</Beseda>
    <Beseda>strojno učenje</Beseda>
  </TujJezik_KljucneBesede>
  <Potrjeno>true</Potrjeno>
  <JeZaklenjeno>false</JeZaklenjeno>
  <JeRecenzirano>false</JeRecenzirano>
  <Zaloznik></Zaloznik>
  <Izvor></Izvor>
  <Jezik ID="1033" ISO639-3="eng">Angleški jezik</Jezik>
  <TujJezik ID="1060" ISO639-3="slv">Slovenski jezik</TujJezik>
  <Povezave></Povezave>
  <Pokrivanje></Pokrivanje>
  <CasovnoPokritje></CasovnoPokritje>
  <AvtorskePravice></AvtorskePravice>
  <VrstaGradiva ID="dk_c" DRIVER="info:eu-repo/semantics/article">Članek v reviji</VrstaGradiva>
  <DatumVstavljanja>2026-06-11 15:15:45</DatumVstavljanja>
  <DatumObjave>2026-06-11 15:15:58</DatumObjave>
  <DatumSpremembe>2026-06-12 04:18:45</DatumSpremembe>
  <DatumTrajnegaHranjenja>0000-00-00 00:00:00</DatumTrajnegaHranjenja>
  <LetoIzida>2025</LetoIzida>
  <LetoIzidaDo>0</LetoIzidaDo>
  <KrajIzida></KrajIzida>
  <LetoIzvedbe>0</LetoIzvedbe>
  <KrajIzvedbe></KrajIzvedbe>
  <Opomba></Opomba>
  <StStrani>Str. 151-156</StStrani>
  <StevilcenjeNivo1>št. 3</StevilcenjeNivo1>
  <StevilcenjeNivo2>Letn. 92</StevilcenjeNivo2>
  <Kronologija>2025</Kronologija>
  <Patent_Stevilka></Patent_Stevilka>
  <Patent_DatumVeljavnosti>0000-00-00</Patent_DatumVeljavnosti>
  <VerzijaDokumenta>NiDoloceno</VerzijaDokumenta>
  <StatusObjaveDrugje>NiDoloceno</StatusObjaveDrugje>
  <VrstaStroskaObjave>NiDoloceno</VrstaStroskaObjave>
  <DatumPoslanoVRecenzijo>0000-00-00</DatumPoslanoVRecenzijo>
  <DatumSprejetjaClanka>0000-00-00</DatumSprejetjaClanka>
  <DatumObjaveClanka>0000-00-00</DatumObjaveClanka>
  <EmbargoDo></EmbargoDo>
  <VrstaEmbarga ID="1" Naziv="Takojšnja javna objava" OpenAIREDostop="openAccess"></VrstaEmbarga>
  <Osebe>
    <Oseba ID="160958" Ime="Josip" Priimek="Poljak" AltIme="" VlogaID="70" VlogaNaziv="Avtor" ConorID="473179651" Afiliacija="" ArrsID="" ORCID=""></Oseba>
    <Oseba ID="160763" Ime="Dražen" Priimek="Crčić" AltIme="" VlogaID="70" VlogaNaziv="Avtor" ConorID="473179907" Afiliacija="" ArrsID="" ORCID=""></Oseba>
    <Oseba ID="160959" Ime="Tomislav" Priimek="Horvat" AltIme="" VlogaID="70" VlogaNaziv="Avtor" ConorID="466720771" Afiliacija="" ArrsID="" ORCID=""></Oseba>
  </Osebe>
  <Identifikatorji>
    <Identifikator ID="4" Sifra="UDK" Naziv="UDK" URL="">004.912:81&#039;322</Identifikator>
    <Identifikator ID="9" Sifra="ISSN-clanka" Naziv="ISSN pri članku" URL="">0013-5852</Identifikator>
    <Identifikator ID="3" Sifra="CobissID" Naziv="COBISS_ID" URL="https://plus.cobiss.net/cobiss/si/sl/bib/280478723">280478723</Identifikator>
  </Identifikatorji>
  <Datoteke>
    <Datoteka ID="235376" DatotekaNRID="14707642" NamenDatotekeID="2" NamenDatoteke="Predstavitvena datoteka" FormatDatotekeID="2" FormatDatoteke=".pdf" MIME="application/pdf" IkonaFormata="pdf.png" IkonaFormataPolniUrl="https://repozitorij.uni-lj.si/teme/rulDev/img/fileTypes/pdf.png" VelikostDatoteke="565427" VelikostDatotekeKratko="552,17 KB" DatumVstavljanja="2026-06-11 15:16:00" JeZbrisana="false" JeJavnoVidna="true" JeIndeksirana="true" JeVidno="true" VidnoOd="01.01.1970" Zaporedje="0">
      <Naziv>RAZ_Poljak_Josip_2025.pdf</Naziv>
      <OrgNaziv>RAZ_Poljak_Josip_2025.pdf</OrgNaziv>
      <URL></URL>
      <Opis></Opis>
      <OpisTujJezik></OpisTujJezik>
      <UrlObdelave></UrlObdelave>
      <FrekvencaAzuriranjaID>1</FrekvencaAzuriranjaID>
      <Verzija></Verzija>
      <MD5>33525AE74D35B4A3E03D1C30E85EF0DB</MD5>
      <SHA256>80a26696583f531a16882537d3b6f29ceca5645fe6e075d8602554af112d2c79</SHA256>
      <UUID>ab6581ab-6597-11f1-9b0d-0050569b8976</UUID>
      <PID></PID>
      <PrenosPolniUrl>https://repozitorij.uni-lj.si/Dokument.php?lang=slv&amp;id=235376</PrenosPolniUrl>
      <Vsebine>
        <Vsebina TipVsebine="GoloBesedilo" JezikID="1033" Oznaka="" Dolzina="32190"></Vsebina>
      </Vsebine>
    </Datoteka>
    <Datoteka ID="235377" DatotekaNRID="0" NamenDatotekeID="5" NamenDatoteke="Izvorni URL" FormatDatotekeID="56" FormatDatoteke="URL" MIME="text/url" IkonaFormata="url.png" IkonaFormataPolniUrl="https://repozitorij.uni-lj.si/teme/rulDev/img/fileTypes/url.png" VelikostDatoteke="0" VelikostDatotekeKratko="0,00 KB" DatumVstavljanja="2026-06-11 15:16:38" JeZbrisana="false" JeJavnoVidna="true" JeIndeksirana="false" JeVidno="true" VidnoOd="01.01.1970" Zaporedje="2">
      <Naziv></Naziv>
      <OrgNaziv></OrgNaziv>
      <URL>https://ev.fe.uni-lj.si/3-2025/Poljak.pdf</URL>
      <Opis></Opis>
      <OpisTujJezik></OpisTujJezik>
      <UrlObdelave></UrlObdelave>
      <FrekvencaAzuriranjaID>0</FrekvencaAzuriranjaID>
      <Verzija></Verzija>
      <MD5></MD5>
      <SHA256></SHA256>
      <UUID>c26f79ce-6597-11f1-9b0d-0050569b8976</UUID>
      <PID></PID>
      <PrenosPolniUrl>https://repozitorij.uni-lj.si/Dokument.php?lang=slv&amp;id=235377</PrenosPolniUrl>
      <Vsebine>
      </Vsebine>
    </Datoteka>
  </Datoteke>
  <Organizacije>
    <Organizacija OrganizacijaID="27" Kratica="FE" ZavodEvsID="0000060" Logo="" LogoPolniUrl="https://repozitorij.uni-lj.si/teme/rulDev/img/logo/">Fakulteta za elektrotehniko</Organizacija>
  </Organizacije>
  <OrganizacijeVira>
  </OrganizacijeVira>
  <MetodeZbiranjaPodatkov>
  </MetodeZbiranjaPodatkov>
  <TipologijaDela ID="1.04" Koda="1.04" Naziv="Strokovni članek" SchemaOrg="Article"></TipologijaDela>
  <Ostalo>
    <StIrodsDatotek>0</StIrodsDatotek>
    <StDatotekPodTrajnimEmbargom>0</StDatotekPodTrajnimEmbargom>
    <StDatotekZOmejenimDostopom>0</StDatotekZOmejenimDostopom>
  </Ostalo>
</Gradivo>
