<?xml version="1.0"?>
<metadata xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:dc="http://purl.org/dc/elements/1.1/"><dc:title>Optična razpoznava znakov v slikah naravnih scen</dc:title><dc:creator>PETEK,	ROK	(Avtor)
	</dc:creator><dc:creator>Šajn,	Luka	(Mentor)
	</dc:creator><dc:subject>optična razpoznava znakov</dc:subject><dc:subject>OCR</dc:subject><dc:subject>naravne scene</dc:subject><dc:subject>računalniški vid</dc:subject><dc:subject>HOG</dc:subject><dc:subject>PHOG</dc:subject><dc:subject>Co-HOG</dc:subject><dc:subject>SVM</dc:subject><dc:subject>ANN</dc:subject><dc:subject>K-NN</dc:subject><dc:subject>računalništvo</dc:subject><dc:subject>računalništvo in informatika</dc:subject><dc:subject>visokošolski strokovni študij</dc:subject><dc:subject>diplomske naloge</dc:subject><dc:description>V magistrskem delu so predstavljene in opisane sodobne metode optične razpoznave znakov v slikah naravnih scen. Izbrane so bile metode, ki dosegajo visoko točnost in so robustne na osvetlitev ter ostale geometrijske spremembe. Naše delo temelji na implementaciji treh različnih metod za pridobivanje značilk. Osnovna metoda HOG, na kateri temeljita tudi ostali dve metodi je ena izmed bolj popularnih metod pridobivanja značilk. Metoda HOG je bila primarno uporabljena pri detekciji ljudi, vendar je pri razpoznavi znakov v slikah naravnih scen modificirana, za doseganje boljših rezultatov. Na metodi HOG bazira metoda PHOG, ki pretvori osnovni HOG v piramidalni sistem, ter obenem vključuje bilinearno interpolacijo. Zaradi piramidne strukture PHOG-a, je ta metoda počasnejša od metode HOG, vendar bolj natančna, saj je tudi vektor značilk večji. Tretja metoda, ki smo jo implementirali je metoda Co-HOG, ki od metode HOG podeduje vse dobre lastnosti, kot je invariantnost na različno svetlost in lokalne geometrijske spremembe. Co-HOG se razlikuje po tem, da značilke vsebujejo tudi prostorska razmerja med slikovnimi elementi, s čimer se znak bolj natančno opiše in razpozna, med drugim je tudi hitrejša metoda pridobivanja značilk.

Zaradi različnih naravnih faktorjev v znakih naravnih scen je razpoznava znakov s tradicionalnimi sistemi optične razpoznave znakov nenatančna, saj ti predpostavljajo, da se znaki ne razlikujejo v pisavi in barvi, ter na monotono ozadje znaka. Pri pridobivanju robustnih značilk znakov naravnih scen se uporablja metode, ki so invariantne na velikost znaka, šum ozadja, tip pisave ter na vizualne efekte, ki pritegnejo pozornost, kot je npr. prelivanje barv v posameznem znaku. Zgoraj opisane metode ne potrebujejo klasičnega predprocesiranja in binarizacije slike znaka, kot to počnejo tradicionalni sistemi, saj te zajemajo značilke z metodami, ki opišejo videz objekta in obliko z intenziteto gradientov ter smermi robov.

Metode pridobivanja značilk so bile evalvirane na različnih podatkovnih bazah, kot so ICDAR, Chars74K, CVL OCR DB. Generirali smo tudi sintetično podatkovno bazo, ki imitira znake v naravnih scenah, tako da vključuje množico različnih pisav ter šumov v slikah. Sintetična podatkovna baza znakov je bila generirana z namenom povečanja učne množice, ter izboljšanja rezultata klasifikacijske točnosti.</dc:description><dc:publisher>R. Petek</dc:publisher><dc:date>2016</dc:date><dc:date>2016-04-11 14:40:08</dc:date><dc:type>Magistrsko delo/naloga</dc:type><dc:identifier>81522</dc:identifier><dc:identifier>VisID: 15343</dc:identifier><dc:identifier>COBISS_ID: 9405780</dc:identifier><dc:language>sl</dc:language></metadata>
