Sorodstveno razlikovanje (KD) je sposobnost razlikovanja posameznikov na podlagi njihovega (filo)genetskega sorodstva, kar je značilno za organizme, kot je po Gramu pozitivna bakterija Bacillus subtilis. V tej študiji smo opravili podrobno analizo 40 sevov B. subtilis, z namenom iskanja genetskih elementov značilnih za 12 sorodstvenih skupin. Sorodstvene skupine so bile ugotovljene na podlagi interakcij med sevi ob rojenju na agarskih ploščah. Analiza 40 zaključenih genomov B. subtilis, ki je vključevala uporabo orodij za anotacijo genomov, kot so Prokka, PGAP, PredicTF in BioAutoML, ter ročno urejanje lokusa comQXP, je pripomogla k ustvarjanju nove podatkovne množice z binarnimi podatki. Ta nabor podatkov je omogočil odkritje genetskih označevalcev, ki so edinstveni za vsako sorodstveno skupino, in s tem razkril raznoliko genetsko sestavo B. subtilis. Identificirani genetski elementi so bili večinoma povezani s sintezo celične stene, odzivom na stres in antibiotičnimi/protimikrobnimi lastnostmi. V študiji so bili poleg tega uporabljeni algoritmi strojnega učenja skupaj z analizo filogenije preko poravnave jedrnih genov in povprečne identitete nukleotidov (ANI). Razvit je bil postopek za razvrščanje sevov, ki imajo neznano sorodstveno povezavo, ki kombinira obe tehniki. Trenutno ANI v učinkovitosti prekaša metodologijo strojnega učenja. Vendar pa je za identifikacijo edinstvenih genetskih označevalcev potreben večji podatkovni nabor z večjim številom genomov, prav tako so nujne dodatne laboratorijske raziskave, ki bi potrdile točnost obeh metod in identificiranih označevalcev.
|