Eliteseriemodellen 2017

I helgen starter Eliteserien igjen, og også i år har jeg laget en modell for å prøve å beregne sannsynlige utfall av serien. Jeg har tatt utgangspunkt i samme metodikken som ble brukt i 2015 og 2016, men har gjort et par viktige endringer som jeg mener gjør modellen bedre. Kortversjonen er at sesongpausen behandles annerledes, modellen reagerer raskere på formendring, samt at den ikke beregner fremtidige resultat kun på nåværende form, men også på simulert resultat i kampene frem til det punktet. (Langversjonen kan leses i bunn av artikkelen). I tillegg har jeg som vanlig justert sannsynligheten for uavgjort og hjemmebanefordelen ved å inkludere fjorårssesongen. De nye beregningene gjør at dette er ELO-tabellen før sesongstart:

170328 ELO før seriestart

ELO-rating før sesongstart

Rosenborg troner naturligvis suverent på topp, før det er ni lag som er forholdsvis jevne og over 2000 i rating. Deretter er det de fire nederste lagene som overlevde sist sesong, før de nyopprykkete klubbene kommer et godt stykke bak, hovedsakelig som følge av Starts elendige sesong i fjor. De hadde vært enda lavere ratet og med tilsvarende dårlige utsikter for sesongen dersom den tidligere modellen fremdeles var i bruk, men som jeg påpekte før sesongstart i fjor så fungerte det ekstra dårlig for de nyopprykkete lagene noe Branns sesong også beviste.

Basert på denne tabellen, de nye sannsynlighetene for uavgjort (generelt litt høyere), en noe redusert hjemmebanefordel, samt at hver simulerte kamp påvirker fremtidig simulerte kamper ble alle kampene i sesongen simulert 10 000 ganger. Det gir følgende snittpoeng i løpet av sesongen i følge modellen:

170328 Forventet poeng før seriestart

Denne er naturlig nok ganske lik ELO-tabellen, og vi ser at Rosenborg er klare favoritter til å vinne med omtrent 11 poeng til neste lag i snitt. Deretter er det uhyre jevnt og kun fire poeng skiller Odd på andre og Viking på tiende. Spredd ut over alle simuleringene så er sannsynlighetene for medalje og nedrykk som følger:

170328 Medalje før seriestart

170328 Nedryk før seriestart

Rosenborg tar altså gull i 46% av simuleringene, sølv i 19% og bronse i 11%. Men de rykker ned i 0,2% av tiden og må spille kvalifisering i 0,2% også.  Måten kampene simuleres på har stor innflytelse på disse sannsynlighetene, med den gamle metoden ville Rosenborg med ca. 60% sannsynlighet tatt gullet og mange ville hatt tilnærmet 0% sjanse til gull eller medaljer.

Overraskelsen her er at Aalesund er rangert som laget med fjerde størst sannsynlighet for å vinne og litt over 25% sannsynlighet for medalje, selv om de havnet på niendeplass i fjor. Grunnen til dette er at de hadde en mildt talt imponerende sesongavslutning der de vant 7 av de siste 8 kampene og tok 22 av 24 mulige poeng. Siden de lå på direkte nedrykk da seiersrekken begynte var det kun nok til å få niendeplass til slutt. Derimot var det en jevn sluttabell rundt de, og et byks fra 1928 i rating til 2038 var nok til å sende de opp på fjerdeplass rett bak Brann og Odd.

Modellen gir generelt sett et vidt spekter av utfall og mange mulige scenario, noe som viser seg i oversikten på hvilke sluttplassering hvert lag sannsynligvis får:

170328 Sannsynlig plassering før seriestart

Hvert lags sannsynlighet for å ende på de forskjellige plassene.

Haugesund varierer for eksempel mellom 3% for sisteplass, via 5% for gull, til 8% for det som er mest sannsynlig, nemlig 5. plass. Med andre ord; Rosenborg er store gullfavoritter, de nyopprykkede lagene må kjempe for å overleve, ellers er det veldig åpent.

 

Endringer i modellen:

De siste sesongene har lagene som har rykket ned hatt veldig lav rating. Siden de nyopprykkede lagene “arver” ratingen har dette hatt stor innvirkning på sjansene deres før sesongstart, men også påvirket sesongen som helhet. Fjorårssesongen til Brann er således en veldig god pekepinn på dette, og selv om det var overraskende med sølv hadde de nok større enn 0,1% sjanse. Brann har dog ikke vært unike i å gjøre det bedre enn laget de erstattet, og man begynner med noenlunde blanke ark hver sesong og alle lag er litt likere hverandre. På fagspråket er dette “regression to the mean”, eller at man over tid har en tendens til å nærme seg gjennomsnittet (et godt eksempel er en spiss som scorer jevnt og trutt, deretter har måltørke noen kamper før han scorer hat-trick og så scorer jevnt og trutt igjen.) Derfor blir alle lags rating justert i sesongpausen med 1/3 mot snittet på 2000. (Rosenborg avsluttet sesongen med 2177 i rating som blir justert ned til 2118, mens Sogndal går fra 1940 til 1960.)

I tillegg til dette spiller nå alle kamper like mye inn på endring i ratingen i stedet for at sesongstart har litt større påvirkning, og generelt sett er det justert slik at ratingen er mer sensitiv til formendringer. (For de matematisk anlagte betyr det at K-verdien er justert opp og jevn i hele sesongen.) Med disse to endringene for utregning av ELO-rating så ble ratingen beregnet på nytt basert på resultater fra og med 2009-sesongen. Dette har til dels stort utslag i topp og bunn, og gamle meritter har ikke like mye å si lengre. Til sammenligning er dette ELO-tabellen etter siste serierunde i fjor, med endring i rating i den nye modellen i parentes. (Kristiansund erstatter Bodø/Glimt og Sandefjord erstatter Start):170328 ELO etter forrige sesong gammelt

Dette er endringer som påvirker utregningen av rating, men i tillegg er det gjort en endring på hvordan sesongen simuleres. Tidligere beregnet modellen det slik at alle lag kom til å ha samme rating som på nåværende tidspunkt når kampene spilles. Det vil si at modellen beregnet at Brann fremdeles vil ha 2031 i rating og Tromsø 1963 når de møtes i siste serierunde. Det gjorde at sannsynligheten for formlag og overraskende sesonger ble undervurdert (tenk Brann og Start i fjor, Stabæk i 2015, Tromsø i 2013 osv.) Derfor er det gjort en endring i simuleringen som gjør at ratingen endres etter hver simulerte kamp som påvirker sannsynligheten for påfølgende kamper, og her er K-verdien satt til halvparten av det den er i en faktisk kamp. For eksempel: Kristiansund har 1922 i rating og Molde har 2016. Dersom Kristiansund vinner kampen vil ratingen endres til henholdsvis 1941 og 1997, og dette vil da påvirke sannsynlige resultater i runde 2. Før ville modellen spilt runde 2 som om Kristiansund og Molde fremdeles hadde 1922 og 2016 i rating, mens den nå bruker 1932 og 2006 som rating for runde to i de simuleringene Kristiansund vinner kampen, deretter vil runde to påvirke runde tre og så videre. Dette øker sannsynligheten for at lag av og til får formoppgang eller formnedgang, og dermed gir større varians i sannsynlige utfall, samt øker sannsynligheten for at sjeldne ting skjer. Som f.eks. at Rosenborg kollapser fullstendig og rykker ned, eller har en kanonsesong der de tar 84 poeng (som skjer i 3 av 10 000 simuleringer). Denne type beregning endrer ikke antall poeng hvert lag tar i snitt (største forskjell var 0,3 poeng), men den påvirker sluttplasseringene. Dette går spesielt ut over Rosenborgs sannsynlighet til å ta gull, siden det er ett fett om man vinner på målforskjell eller med 15 poeng. Så om Rosenborg har en bedre enn forventet sesong vil de likevel vinne, men om de har en dårligere enn forventet og/eller et annet lag har mye bedre enn forventet så vil de ikke vinne. Og de har uansett større sjanse for å ta gull enn noe annet lag har for å ta medalje.

This entry was posted in Fotball, Models and tagged , , , , , , , , , , , , , , , , . Bookmark the permalink.

5 Responses to Eliteseriemodellen 2017

  1. Pingback: Analyse av sesongstart i Eliteserien 2017 | Analytic Minds

  2. Pingback: Toppseriemodellen 2017 | Analytic Minds

  3. Pingback: Eliteserien 2017: Oppsummering etter 5 runder | Analytic Minds

  4. Pingback: Initial Evaluation of Eliteserien Prediction Models | Analytic Minds

  5. Pingback: Hva skjedde Strømsgodset? Oppsummering Eliteserien 2017 etter 10 runder. | Analytic Minds

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s