Nedavni razvoj na področju pomorske robotike je privedel do ustanovitve novega tipa majhnih robotskih čolnov brez posadke (USV). Takšna plovila so cenovno ugodna in zlahka prenosljiva, uporabljajo pa se predvsem za zbiranje vodnih vzorcev in nadzor v težko dostopnih območjih (npr. blizu jezov), kjer bi plovba lahko predstavljala nevarnost človeškemu operaterju. Za učinkovito in nemoteno plovbo v takih okoljih je potrebna visoka stopnja avtonomije, ki temelji na pravočasnem zaznavanju in izogibanju bližnjim oviram. Kljub temu, da lahko ovire zaznamo s pomočjo različnih senzorjev, se bomo v tej doktorski disertaciji osredotočili le na pristop, ki združuje vizualne kamere z algoritmi semantične segmentacije. Vizualne kamere so se namreč izkazale kot cenovno dostopen in informacijsko bogat senzor, medtem, ko nam algoritmi semantične segmentacije omogočajo posredno zaznavanje poljubnih artefaktov (tj. ovir) in splošno razumevanje okolice. V prvem delu disertacije razširimo v literaturi najsodobnejši ročno izdelan grafični model za semantično segmentacijo s tem, da vanj vključimo meritve naklona in nagiba čolna, pridobljene iz vgrajene inercialne merilne enote (IMU). Odčitki IMU-ja se uporabljajo za pozicioniranje horizonta v sliki in samodejno prilagajanje napovednih ocen v modelu verjetnostne semantične segmentacije. Ta postopek izboljša natančnost segmentacije vode, zlasti ob prisotnosti vizualnih nejasnostih, in posledično vodi k robustnejši detekciji ovir. Kljub temu, lahko predlagana metoda proži številne lažne alarme, ki so posledica vodnih odbleskov. Za konsolidacijo takšnih detekcij predlagamo dodatno razširitev grafičnega modela z uporabo večih kamer, ki poskrbi, da je slikovnemu elementu v vsaki kameri dodeljen isti semantični razred, če ta slikovni element pripada istemu delu 3D scene. Ta proces poenoti posteriorne verjetnosti semantičnih razredov in posledično zmanjša količino lažnih alarmov. V drugem delu disertacije predlagamo novo arhitekturo globoke kodirno-dekodirne nevronske mreže, ki je posebej zasnovana za segmentacijo pomorskega okolja. Globoki kodirnik z atrous konvolucijami je sposoben izluščiti iz slike bogate vizualne značilke, kar omogoča natančno segmentacijo tudi ob prisotnosti sončnih odbleskov in odsevov okoliša. Po drugi strani pa nov dekoder postopoma združuje vizualne značilke z inercijskimi meritvami, kar močno izboljša natančnost segmentacije vodne komponente ob prisotnosti vizualnih nejasnostih, kot je npr. megla. Poleg tega predlagamo še novo cenilno funkcijo, ki spodbuja ločevanje različnih semantičnih komponent za nadaljnje povečanje robustnosti segmentacije. V zadnjem delu te disertacije predstavimo novo bazo podatkov morskega okoliša, ki vsebuje približno 81.000 stereo slik, sinhroniziranih z inercijskimi meritvami, z več kot 60.000 označenimi ovirami različnih izgledov in velikosti. Poleg baze podatkov predlagamo še nov protokol za ocenjevanje uspešnosti algoritmov detekcije ovir, ki odraža natančnost zaznavanja na način, ki je smiseln za praktično navigacijo USV-ja. Na predstavljeni bazi podatkov evalviramo naše predlagane metode in primerjamo njihovo učinkovitost s trinajstimi najsodobnejšimi metodami segmentacije. Rezultati kažejo, da naš pristop, ki temelji na globokem učenju, prekaša druge metode, zlasti v neposredni bližini USV-ja oz. v tako imenovanem nevarnem pasu.
|