<?xml version="1.0"?>
<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:dc="http://purl.org/dc/elements/1.1/"><rdf:Description rdf:about="https://repozitorij.uni-lj.si/IzpisGradiva.php?id=87166"><dc:title>Primerjava skupin pri podatkih z visokim deležem nakopičenih vrednosti</dc:title><dc:creator>KUSTEC,	MARUŠA	(Avtor)
	</dc:creator><dc:creator>Lusa,	Lara	(Mentor)
	</dc:creator><dc:subject>spremenljivke z nakopičenimi vrednostmi</dc:subject><dc:subject>primerjava skupin</dc:subject><dc:subject>model sorazmernih obetov</dc:subject><dc:subject>model Tobit</dc:subject><dc:subject>Mann-Whitneyev test</dc:subject><dc:subject>kombiniran pristop logistične in linearne regresije</dc:subject><dc:subject>sorazmerni obeti</dc:subject><dc:subject>skladnost razlik</dc:subject><dc:description>V tej magistrski nalogi preučujemo pristope za analizo posebne vrste podatkov, ki se pogosto pojavijo pri raziskavah v genomiki. Primer takšnih podatkov so obravnavani podatki o virusih, kjer nas zanima primerjava koncentracije posameznega virusa v vzorcu med skupinami otrok, ki so bili predhodno različno diagnosticirani. Spremenljivke, ki opisujejo koncentracijo virusov, imajo del vrednosti nakopičen pri eni točki, kar predstavlja problem pri analizi podatkov. Takšne spremenljivke poimenujemo spremenljivke z nakopičenimi vrednostmi. 

Za ugotavljanje povezanosti skupin otrok s koncentracijo virusa, smo izbrali štiri metode: model sorazmernih obetov, model Tobit, kombiniran pristop logistične in linearne regresije (model Log+Lin) in Mann-Whitneyev test. Prve tri metode omogočajo vključitev dodatnih pojasnjevalnih spremenljivk v analizo. Spremenljivka z nakopičenimi vrednostmi je obravnavana kot odvisna spremenljivka.

S simulacijami smo preučevali delovanje izbranih metod v različnih situacijah. Izkaže se, da imata velik vpliv na delovanje metod skladnost razlik in sorazmernost v podatkih. Model sorazmernih obetov, model Tobit in Mann-Whitneyev test imajo primerljive moči v večini situacij, le model Tobit pa ohrani ustrezno velikost testa v vseh situacijah. Edini obravnavani dvodelni pristop, model Log+Lin, ima bistveno prednost pred omenjenimi enodelnimi pristopi ob prisotnosti neskladnih razlik in nesorazmerij. Ker v podatkih o virusih pričakujemo oboje, dvodelni pristop prepoznamo kot najbolj primeren pristop za analizo. 

Dodatno preučimo še delovanje testa, ki preverja veljavnost predpostavke o sorazmernih obetih. Test je anti-konzervativen in ima majhno moč pri majhnem vzorcu.</dc:description><dc:date>2016</dc:date><dc:date>2016-11-28 08:35:06</dc:date><dc:type>Magistrsko delo/naloga</dc:type><dc:identifier>87166</dc:identifier><dc:language>sl</dc:language></rdf:Description></rdf:RDF>