izpis_h1_title_alt

Posplošitve modelov parnih primerjav : doktorska disertacija
ID Krese, Blaž (Avtor), ID Štrumbelj, Erik (Mentor) Več o mentorju... Povezava se odpre v novem oknu

.pdfPDF - Predstavitvena datoteka, prenos (1,43 MB)
MD5: 81AE7CF5117CCE0EDA2A859308D8F59D

Izvleček
V disertaciji se osredotočimo na modele parnih primerjav. Ti modeli so dobro uveljavljeni v statistiki in so zelo uporabni na številnih področjih, zlasti v športu, ki je bil motivacija za naše delo. Predstavimo več posplošitev dobro znanega Bradley-Terryjevega modela za parne primerjave. Najpomembnejša razširitev, ki jo predlagamo, je modeliranje časovno spremenljivih latentnih moči z Gaussovimi procesi. Kot alternativo uporabimo tudi baricentrično racionalno interpolacijo. Izid parnih primerjav pogosto ni odvisen samo od latentne moči, ampak tudi od različnih zunanjih spremenljivk. Iz tega razloga razširimo naše modele tako, da omogočajo vključitev dodatnih kovariatov. V športu so pogosto na voljo podatki o stavnicah. Znano je, da so stavne kvote vir natančnih verjetnosti izida, saj so tako stavnice kot javnost motivirani, da upoštevajo vse razpoložljive informacije. Naši modeli omogočajo vključitev teh informacij v obliki verjetnosti izida. V empiričnem delu primerjamo več modelov in inferenčnih metod na športnih podatkih. Pokažemo, da z uporabo Gaussovih procesov dosežemo boljše rezultate v primerjavi z baricentrično racionalno interpolacijo, ker so Gaussovi procesi bolj prilagodljivi pri modeliranju naglih sprememb v latentni moči. Pri uporabi baricentrične racionalne interpolacije se je izkazalo, da z bayesovskim pristopom dobimo boljše rezultate kot z oceno največjega verjetja. V primeru Gaussovih procesov pa z bayesovskim pristopom dobimo podobne rezultate kot pri uporabi Laplaceove aproksimacije, če hiper-parametre slednje določimo s križno validacijo in ne z robnim verjetjem. S primeri iz športa smo potrdili, da uporaba informacij o verjetnosti izida iz stavnih kvot dodatno izboljša napovedi modelov in tako dobimo najboljše rezultate. Z uporabo teh dodatnih informacij zmanjšamo negotovost cenilk parametrov. Implementirali smo tudi več algoritmov Monte Carlo z markovskimi verigami, posebej prilagojenih za Gaussove procese. Algoritem Metropolis-Hastings in različice Gibbsovega algoritma smo primerjali s Hamiltonskim Monte Carlo algoritmom. Slednji algoritem, v različici, ki je implementirana v Stanu, vrne boljše rezultate v smislu efektivne velikosti vzorca in časovne učinkovitosti.

Jezik:Slovenski jezik
Ključne besede:Parne primerjave, Bradley-Terryjev model, Gaussovi procesi, Bayesova statistika.
Vrsta gradiva:Doktorsko delo/naloga
Tipologija:2.08 - Doktorska disertacija
Organizacija:FMF - Fakulteta za matematiko in fiziko
Leto izida:2022
PID:20.500.12556/RUL-137589 Povezava se odpre v novem oknu
UDK:519.2
COBISS.SI-ID:113736707 Povezava se odpre v novem oknu
Datum objave v RUL:23.06.2022
Število ogledov:820
Število prenosov:119
Metapodatki:XML DC-XML DC-RDF
:
Kopiraj citat
Objavi na:Bookmark and Share

Sekundarni jezik

Jezik:Angleški jezik
Naslov:Generalizations of pairwise comparison models
Izvleček:
In this thesis we focus on pairwise comparison models. These models are well established in the field of statistics and are highly applicable in many areas, in particular in sports which motivated our work. We present several generalizations of the famous Bradley-Terry model for pairwise comparisons. The main extension we propose is to model the underlying time-varying latent strengths as Gaussian processes. Alternatively, we also apply barycentric rational interpolation and compare the two approaches. The outcome of pairwise comparisons are often not dependent solely on latent strengths but also on various external variables. For this reason we also extend our models to allow additional covariates. In sports there are often bookmaker odds data available. Bookmaker odds are known to be a source of accurate outcome probabilities, because bookmakers and the public are incentivized to use all available information. Our models allow for the inclusion of the information in the form of outcome probabilities. The empirical part of our research consists of comparing several models and inference methods on various sports data sets. We demonstrated that using Gaussian processes is advantageous compared to barycentric rational interpolation as they are more flexible in modelling sudden changes in the underlying latent strengths. When using barycentric rational interpolation, Bayesian inference gives better results than maximum likelihood estimation. In the case of Gaussian processes, Bayesian inference will give similar results as using Laplace approximation if hyper-parameters of the latter are determined by cross-validation rather than by marginal likelihood. With examples from sports we confirmed that using information from outcome probabilities from bookmaker odds further improves models' predictions and gives the best results. Using this additional information also results in less uncertainty in parameter estimates. We also implemented several Markov chain Monte Carlo algorithms specifically adapted for inference for Gaussian processes. We compared the Metropolis-Hastings algorithm and variants of the Gibbs algorithm with the Hamiltonian Monte Carlo algorithm. The latter algorithm as implemented in Stan gives superior results with respect to effective sample size and time efficiency.

Ključne besede:Pairwise comparison, Bradley-Terry model, Gaussian processes, Bayesian statistics

Podobna dela

Podobna dela v RUL:
Podobna dela v drugih slovenskih zbirkah:

Nazaj