Kredit:Pixabay/CC0 Public Domain
Mens australske cricket-fans fejrer deres holds triumf ved 2021 ICC Men's T20 World Cup, har turneringens resultater vakt en debat om, hvorvidt det hold, der slår nummer to, har en potentielt matchvindende fordel, før en bold overhovedet bliver kastet.
Af de 45 kampe, der blev spillet ved turneringen, blev 29 (omkring 64%) vundet af holdet, der slog nummer to. Sagt på en anden måde vandt hold, der slog nummer to, næsten dobbelt så mange kampe som hold, der slog først.
Den anden sideslag har vundet hver kamp i Dubai i #T20WC &15 af de sidste 16 i alle turneringer. Det gør lodtrækningen afgørende, hvilket betyder, at Australien kommer til at vinde. Hvilken latterlig situation. En finale, hvor evner altid overtrumfes af held og på et 90 % tomt stadion.
— Lord of the Pies (@jamesclossick) 14. november 2021
Nogle kritikere er gået så langt som at foreslå, at hold kan "vinde på et møntkast", når de skal beslutte, hvilken side der skal slå først.
Der er en række foreslåede fordele ved at slå nummer to, især i kortere former for cricket. Måske er den vigtigste blandt dem at vide præcis, hvilken score der vil vinde spillet, og at være i stand til at planlægge omgangene i overensstemmelse hermed. Efterhånden som eftermiddagen eller aftenen skrider frem, kan der også dannes dug på jorden, hvilket gør det sværere for bowlere at gribe bolden og for markspillere at hente den, og lettere for battere at slå bolde, der "skrider på battet" i stedet for at ændre retning.
Men hvad siger statistikken egentlig? Giver møntkastet virkelig en afgørende fordel? Lad os se på tallene.
Tid til nogle statistikker
Det første spørgsmål, der skal stilles, er, om det resultatmønster, man så under verdensmesterskabet, kunne være opstået rent tilfældigt. Det gør vi ved at bruge statistiske test til at beregne "p-værdien", som fortæller os sandsynligheden for at opnå 29 eller flere "slagsekund"-sejre ud af 45 kampe, hvis den sande vinderchance var 50-50.
I dette tilfælde kommer vi frem til en "p-værdi" på omkring 0,04 eller 4%. Denne sandsynlighed er rimelig lille, hvilket tyder på, at der faktisk er nogle beviser for, at det var gavnligt at slå andenpladsen ved denne verdensmesterskab, og at mønsteret af resultater måske ikke er opstået tilfældigt.
Men da vores datasæt kun indeholder 45 matches, har vores test ikke meget statistisk kraft, hvilket betyder, at disse beviser langt fra er overvældende.
Med andre ord er der en ikke ubetydelig sandsynlighed (4%) for, at dette resultatmønster opstod ved en tilfældighed, og at slag nummer to ikke giver en afgørende fordel alligevel.
Hvilke andre faktorer spiller ind?
Hvad mere er, når man ser på de overordnede resultater på denne måde, undlader man at overveje andre faktorer, der kan påvirke resultatet, såsom den specifikke bane, tidspunktet på dagen, hvor kampen blev spillet, og holdenes relative styrke.
For at undersøge dette mere detaljeret, lavede jeg en statistisk model for at undersøge, hvordan disse forskellige faktorer påvirkede sandsynligheden for at vinde, når jeg slog andenpladsen i disse 45 kampe.
Kampe ved verdensmesterskabet i 2021 blev spillet på fire forskellige spillesteder og på to forskellige tidspunkter af dagen (eftermiddag og aften). Jeg har også taget hensyn til holdenes ICC T20-rangeringer, som et mål for forskellen i overordnet kvalitet mellem de to hold i en given kamp.
Min analyse fandt, at tidspunktet for kampen ikke statistisk havde indflydelse på vindersandsynligheden for, at holdet slog nummer to. Fordelen ved at slå først eller anden afhang med andre ord ikke af, om kampen blev afviklet i løbet af eftermiddagen eller aftenen.
Det efterlader to variabler, der kunne tænkes at påvirke situationen:spillestedet, der er vært for kampen, og om det hold, der slår nummer to, har en højere eller lavere placering end sin modstander. Det giver otte mulige kombinationer (fire spillesteder gange to muligheder for slagrækkefølge), som den statistiske model kan generere resultater for.
Fordi der kun er en håndfuld kampe i hver kategori, kan vi styrke vores statistiske analyse ved hjælp af et koncept kaldet "95 % konfidensintervallet." I stedet for kun at generere et enkelt sandsynlighedsestimat, kan vi også beregne en øvre og nedre grænse for vores estimat, mellem hvilke vi kan være 95 % sikre på, at den sande sandsynlighed er fundet.
Hvad siger resultaterne?
Resultaterne er vist nedenfor. Det mest slående resultat er den meget høje estimerede sandsynlighed for at vinde, når man slår andenpladsen i Dubai (hvor Australien triumferede i turneringens finale). Selv når holdet på andenpladsen var rangeret lavere end dets modstander, var der stadig en høj estimeret sandsynlighed for sejr.
Dubais cricketbane ser ud til at have givet det stærkeste løft til hold, der slår nummer to. Kredit:Christopher Drovandi, Forfatter leveret
Men bemærk, at der er meget usikkerhed i dette estimat, med et 95% interval, der stadig inkluderer 0,5 (hvilket repræsenterer tilfældig tilfældighed). Går vi tilbage til de rå data, vandt det hold, der slog andenpladsen, 10 ud af 11 kampe i Dubai. Finalen og en af semifinalerne blev spillet i Dubai, hvor det hold, der slog nummer to, vandt begge gange.
De andre tre baner gav resultater, der var mere som det, vi kunne forvente:Holdene var mere tilbøjelige til at vinde batting nummer to, hvis de var det højere rangerede hold, og mere tilbøjelige til at tabe batting andet, hvis de var det lavere rangerede hold.
Selvom Abu Dhabi-banen også så ud til at favorisere hold, der slog nummer to, afslører min analyse, at det var resultaterne fra Dubai, der skævede de samlede resultater.
Dette tyder på, at de specifikke forhold i Dubai kan være bedre egnet til at slå nummer to. Men det er også muligt, at Dubai-resultaterne kun var en statistisk anomali.
Analysen afslørede nogle beviser på, at det var gavnligt at slå nummer to i denne verdensmesterskab, men det afhænger sandsynligvis meget af forholdene. Hvis vi antager, at en kamp spilles på en tilfældigt udvalgt bane fra de fire anvendte spillesteder, og der er en 50 % chance for, at det højere rangerede hold slår nummer to, så estimerer min model sandsynligheden for at vinde, når der slår andenpladsen, er omkring 0,6, med en 95 % konfidensinterval på 0,48 til 0,71.
Så der er en sandsynlig fordel ved at slå nummer to, men det er langt fra en given konklusion.
Min analyse inkluderede kun data fra verdensmesterskabet i 2021, men T20 cricket spilles under alle mulige forhold over hele verden. En mere stringent analyse vil inkludere data fra mange turneringer og overveje mere information såsom vindermarginen, størrelsen af forskellen mellem holdenes placeringer, deres seneste form, vejrforhold og turneringsstadiet.
De mulige faktorer og permutationer er næsten uendelige, hvilket er en af grundene til, at folk elsker cricket. Det skader selvfølgelig ikke, hvis deres hold også vinder.