Štetje objektov z malo učnimi primeri naslavlja problem ocenjevanja števila objektov na sliki, kjer so kategorije objektov v času inference neznane (tj. niso bile prisotne v času treniranja). Velik izziv za sodobne števce objektov z malo učnimi primeri so goste regije z majhnimi objekti. Čeprav globalni števci, ki temeljijo na gostotnih mapah, običajno dobro ocenijo skupno število objektov v takšnih situacijah, je njihova uporabnost omejena zaradi slabe lokalizacijske sposobnosti. Ta problem bolje naslavljajo metode za zaznavanje točke, ki temeljijo na poizvedovalnih detektorjih. Vendar pa zaradi omejenega števila vnaprej naučenih poizvedb te metode dosegajo slabše rezultate na slikah z zelo velikim številom objektov in se zatekajo h tehnikam, kot sta povečava in razdeljevanje slike na več delov. V tem delu predlagamo CoDi, prvi števec za štetje objektov z malo učnimi primeri, ki temelji na latentnih difuzijskih modelih in generira visokokakovostne gostotne mape, na katerih je možno razbrati lokacije objektov z enostavnim iskanjem lokalnih maksimumov. Naš glavni prispevek je nov modul za pogojevanje na podlagi podanih primerkov objektov, ki izlušči in prilagaja prototipe objektov na vsaki plasti difuzijske mreže. To pripelje do bolj natančnih napovedi lokacij objektov. Na podatkovni zbirki FSC147, CoDi presega trenutno najboljše metode za 15% MAE v scenarijih štetja objektov z malo učnimi primeri, za 13% MAE v scenarijih z enim podanim primerkom in 10% MAE v scenarijih brez podanih primerkov. Poleg tega preseže trenutno najsodobnejšo metodo na podatkovni zbirki MCAC za 44% MAE in s tem postane nov najsodobnejši števec.
|