Podrobno

Sodobna uporaba analize moči pri testiranju hipotez : magistrsko delo
ID Žižek Lebeničnik, Maja (Avtor), ID Krajcsi, Attila (Mentor) Več o mentorju... Povezava se odpre v novem oknu

.pdfPDF - Predstavitvena datoteka, prenos (1,15 MB)
MD5: 237FC1C37CC9245B11B5B7FAE582ED04

Izvleček
Raziskave z nizko ravnjo moči spodkopavajo ponovljivost rezultatov znanstvenih raziskav. Kljub temu, da sodobna metodološka literatura jasno opisuje negativne posledice zanemarjanja moči in ponuja številne smernice za izvajanje analiz moči, ostaja razširjenost študij s prenizko ravnjo moči pereč problem. V magistrskem delu preučujemo stanje praks analize moči v sodobnih raziskavah na različnih metodoloških pod področjih kognitivne znanosti. Osredotočimo se predvsem na pogostost izvajanja analiz moči, njihovo jasnost in doslednost ter utemeljenost uporabljenih parametrov, zlasti v povezavi s konvencionalnimi vrednostmi parametrov. Fisher je v začetku 20. stoletja prvič predstavil metodo testiranja hipotez, ki je služila kot izhodišče za nadaljnje delo Neymana in Pearsona. Ta sta kasneje oblikovala bolj sistematičen okvir testiranja hipotez z jasno opredelitvijo napak tipa I in tipa II ter uvedbo koncepta statistične moči. Osrednji element njunega pristopa ni le nadzor verjetnosti lažno pozitivnih rezultatov (napaka tipa I), temveč tudi zmanjševanje verjetnosti lažno negativnih rezultatov (napaka tipa II), kar posledično poveča raven statistične moči. Kljub temu, da metodološka literatura vedno znova opozarja na negativne posledice nizke statistične moči, problem nezadostne moči v sodobnih empiričnih študijah še vedno vztraja. Glede na razširjenost smernic in dostopnost orodij za izračun analize moči ostaja vzrok za vztrajnost problema nejasen. V pričujočem magistrskem delu predlagamo, da je nizka statistična moč sodobnih empiričnih študij vsaj deloma posledica neustrezne ali popolne neuporabe analize moči. Z namenom raziskovanja te predpostavke, smo v prvem delu magistrskega dela pregledali sodobne metodološke smernice in učna gradiva za izvajanje analize moči. V nadaljevanju smo preverjali ali sodobne empirične raziskave upoštevajo zbrane smernice s pomočjo sistematičnega pregleda. Za namen sistematičnega pregleda smo izbrali študije s področja kognitivne znanosti, ki se razlikujejo glede na ubrane metodološke pristope. Razvrstili smo jih v tri skupine in sicer vedenjske, nevro-slikovone in nevropsihološke raziskave. Vsako študijo smo ovrednotili na podlagi kodirnega postopka, ki smo ga zasnovali glede na smernice metodološke literature. Postopek je preverjal prisotnost in vrsto analize moči, pogostost poročanja parametrov ter njihovo utemeljitev. Ugotovili smo, da je iz celotnega vzorca sodobnih empiričnih študij (N = 355), le 18.31% (N = 65) poročalo o uporabi analize moči. Razlike med metodološkimi skupinami so bile precejšnje. V skupini vedenjskih raziskav je 30.72% študij poročalo o izvedbi analize moči, medtem ko sta v nevropsihološki in nevro-slikovni skupini le 8.42% oziroma 6.31% študij navedli izračune moči. Spodbudno je, da so raziskovalci, ki so poročali o uporabi analize moči, pogosto poročali tudi o uporabljenih parametrih, predvsem v vedenjski kategoriji. Kljub temu so bile eksplicitne utemeljitve izbir parametrov redke, razen za velikost učinka, ki je bila utemeljena v 90.00% primerov. Nadaljnja analiza je pokazala, da so bile izbrane vrednosti moči in velikosti učinka pogosto konvencionalne, saj je 64.15% vrednosti moči temeljilo na konvencionalni vrednosti .80, 42.31% utemeljitev vrednosti učinka pa se je sklicevalo na Cohenove mejnike. Ugotovitve sistematičnega pregleda kažejo, da je analiza moči dokaj poredko uporabljena. Ta ugotovitev je skladna z našo izhodiščno predpostavko, ki kot razlog za nizko statistično moč sodobnih raziskav navaja neuporabo analize moči. Rezultati neuporabe analize moči so bili predvsem razvidni na področjih nevro-slikovnih in nevropsiholoških raziskav. Poleg tega pogosto navajanje parametrov, uporaba konvencionalnih vrednosti in pomanjkanje dodatnih utemeljitev kaže na nadaljnjo odvisnost od arbitrarnih mejnikov. Za izboljšanje zanesljivosti in informativnosti znanstvenih rezultatov predlagamo uporabo 95-odstotne statistične moči kot nadomestilo za konvencionalni 80-odstotni prag. To rešitev predlagamo takrat, ko druge utemeljitve za določitev vrednosti moči ni na voljo. Pričujoče magistrsko delo izpostavi razkorak med metodološkimi priporočili in dejanskimi raziskovalnimi praksami ter ponuja implikacije za povečanje robustnosti in ponovljivosti znanstvenih ugotovitev. S tem prispeva k širši razpravi o kakovosti raziskav in reformah, saj opozarja na vztrajajoče pomanjkljivosti prakse analize moči ter podaja priporočila usklajena s sodobnimi metodološkimi smernicami. Z izboljšanjem kakovosti načrtovanja in poročanja o znanstvenih izsledkih lahko znanstvena skupnost stremi k bolj pregledni in zaupanja vredni kumulativni znanosti.

Jezik:Angleški jezik
Ključne besede:Vrednotenje znanstveno raziskovalnega dela, Kognitivna znanost, meta znanost, testiranje hipotez, analiza moči, statistična moč, empirične raziskave
Vrsta gradiva:Magistrsko delo/naloga
Tipologija:2.09 - Magistrsko delo
Organizacija:PEF - Pedagoška fakulteta
Kraj izida:Ljubljana
Založnik:M. Žižek Lebeničnik
Leto izida:2025
Št. strani:77 str.
PID:20.500.12556/RUL-175103 Povezava se odpre v novem oknu
UDK:001:165.194(043.2)
COBISS.SI-ID:253763587 Povezava se odpre v novem oknu
Datum objave v RUL:16.10.2025
Število ogledov:184
Število prenosov:30
Metapodatki:XML DC-XML DC-RDF
:
Kopiraj citat
Objavi na:Bookmark and Share

Sekundarni jezik

Jezik:Slovenski jezik
Naslov:Contemporary use of power analysis in hypothesis testing in cognitive science
Izvleček:
Low-powered research continues to undermine the replicability of research findings. Although contemporary methodological literature clearly outlines the negative consequences of neglecting power and offers numerous guidelines for performing power analyses, the prevalence of underpowered studies remains a persistent issue. This thesis investigates the current state of power analysis practices in contemporary research across different methodological subfields of cognitive science. Specifically, it examines how frequently power analyses are conducted, how transparently and consistently they are reported, and whether the rationale behind the chosen parameters is provided – especially in relation to conventional parameter thresholds. The method of hypothesis testing was first introduced by Fisher in the early 20th century, but it was Neyman and Pearson who developed a systematic framework incorporating both Type I and Type II errors, which introduced the possibility of calculating power. Central to their approach is not only controlling the probability of false positive results (Type I error) but also minimising the probability of false negatives (Type II error), thus maximising statistical power. Despite extensive warnings from methodological literature about the consequences of low power and its neglect – starting notably with Cohen’s work in the 1969s – contemporary empirical literature continues to suffer from low power. The reason for this is puzzling given the widespread availability of power analysis tools and accessible guidelines. In this thesis, we suggest that one of the reasons for the low power of contemporary research is the non-utilisation of power analysis. To explore this, we review contemporary methodological guidelines and teaching materials for performing power analysis. In the second part, we investigate whether suggestions from the literature are adhered to by conducting a systematic review of contemporary empirical research. We gathered studies from subfields of cognitive science differing in methodological approaches and categorised them into three groups – behavioural, neuroimaging, and neuropsychological. We evaluated each study using a coding procedure designed to evaluate the presence and type of power analysis, the frequency of parameter reporting, and the rationale provided for parameter selection. We found that from a total sample of N = 355 studies, only 18.31% (N = 65) reported the use of power analysis. Differences between methodological groups were substantial. In the behavioural studies group, 30.72% of studies reported conducting power analysis. In contrast, only 8.42% neuropsychological and 6.31% neuroimaging studies reported power calculations. Encouragingly, researchers who opted for power analysis calculations also frequently reported specific parameters used in power analysis calculations – especially in the behavioural category. However, explicit justifications for these choices were rare apart from effect size, which was justified in 90.00% of cases. On further exploration, we found that power and effect size choices were often guided by conventions, as 64.15% of power values adopted the conventional .80 value, and 42.31% of effect size justifications referred to Cohen’s qualitative effect size benchmarks. These findings suggest that power analysis remains significantly underutilised, supporting our proposal that low statistical power in contemporary research might stem from the non-utilization of power analysis – particularly within the neuropsychological and neuroimaging fields. Moreover, the frequent specification of power analysis parameters, the common use of conventional values, and the lack of further justification suggest continued reliance on arbitrary benchmarks. To address this, we propose 95% power as a substitute for the traditional .80 standard when no other rationale for setting power is available, with the aim of improving reliability and informativeness of scientific findings. This master’s thesis highlights a gap between methodological recommendations and actual research practices, offering implications for enhancing the robustness and replicability of scientific findings. Overall, it contributes to the broader conversation on research quality and reform by highlighting the ongoing deficiencies in power analysis practices and offers recommendations that align with current methodological guidelines. By improving the quality and rigor of study planning and reporting, the field can move toward a more transparent and trustworthy cumulative science.

Ključne besede:Metascience, hypothesis testing, power analysis, statistical power, empirical research

Podobna dela

Podobna dela v RUL:
Podobna dela v drugih slovenskih zbirkah:

Nazaj