Tehnike zmanjševanja dimenzij, kot je t-SNE, nam omogočajo gradnjo informativnih vizualizacij visokorazsežnih naborov podatkov. Pri analizi več naborov podatkov hkrati te metode pogosto ne uspejo odkriti pomenljive skupine, temveč izpostavijo nezaželene razlike med podatkovnimi viri. Da bi odstranili vplive posameznih podatkovnih virov in odkrili strukture skupne vsem podatkom, predlagamo teoretično utemeljeno metodo za dodajanje novih primerov v obstoječo vložitev t-SNE. Metodo vključimo v našo odprtokodno implementacijo metode t-SNE in pokažemo na uporabnost predlagane metode na analizi šestih nedavno objavljenih podatkovnih naborov genskih izrazov posameznih celic. Rezultati so presenetljivi; predlagana metoda namreč povsem odstrani vplive različnih podatkovnih virov, ki so eden temeljnih izzivov pri analizi podatkov s področja molekularne biologije. Predlagana tehnika poleg tega tudi omogoča uporabo vnaprej zgrajenih vložitev t-SNE, kar odpira nove možnosti uporabe interpretabilnih vizualizacij visokorazsežnih naborov podatkov.
|