Natačna detekcija ovir je pomembna za uspešno navigacijo avtonomnih plovil. Nedavna dela uporabljajo semantično segmentacijo za boljšo generalizacijo na še ne videnih primerih. Vendar večina predlaganih metod ne upošteva računskih zahtevnosti in omejitev, zaradi česar je modele nemogoče pognati na robnih napravah z vgrajenim VPU. V tem delu razvijemo novo arhitekturo osnovano na najsodobnješi arhitekturi za segmentacijo vodnih ovir, WaSR, in dodatno raziščemo številne kodirnike in modifikacije dekodirnikov. Na podlagi WaSR, TopFormerja, narejenega za hitro semantično segmentacijo, in abstrakcije transformerjev MetaFormerja, za katerega predlagamo še neuporabljene mešalnike žetonov, predstavimo WaSRFormer. Le-ta uporablja dekodirnik osnovan na TopFormerju, v katerega za pospešitev vgradimo MetaFormerje, dodatno pa uporabimo dobre prakse iz WaSR za obdelovanje raznolikih značilk vode. Na zahtevni množici MODS, WaSRFormer doseže 92.98% in 86.27% F1 gledano v celoti in znotraj nevarnega območja. V primerjavi z WaSR je to le 0.51% in 0.25% slabši F1. Na modernem GPU je WaSRFormer več kot 10x hitrejši (115.45 FPS) kot WaSR (10.94 FPS). Da poudarimo praktični prispevek, WaSRFormer poženemo na robni napravi OAK-D z nizko porabo energije. Medtem ko WaSR sploh ni mogoče pognati, WaSRFormer doseže 5.45 FPS.
|