De loting

Kwartfinales KNVB-beker

We zijn inmiddels gevorderd tot de laatste acht in de strijd om de KNVB-beker. Er zijn dus nog acht ploegen in de strijd: Feyenoord, Roda, NAC, Heracles, Zwolle, Dordrecht, Haarlem en Quick Boys. Een mooi octet. En zoals dat dan altijd zo gaat: er wordt geloot wie tegen wie moet in de volgende ronde. En de loting gaf een buitengewoon resultaat: de vier eredivisieploegen werden niet aan elkaar gekoppeld. Ze spelen allevier tegen een ploeg uit de lagere regionen. Toeval of gemanipuleerd?

Laten we voor de aardigheid eens uitrekenen hoe groot de kans is op een dergelijke uitslag bij een a-selecte trekking. Niet dat dat iets bewijst of zo, maar gewoon voor de fun.

We kunnen voor die berekening het volgende model opzetten: we nemen een pot met vier witte balletjes (de eredivisieploegen) en vier rode balletjes (de overige). We trekken vier keer twee balletjes uit een pot. De onderzoeksvraag laat zich dan vertalen in de vraag: hoe groot is de kans op vier stelletjes van twee verschillende kleuren.

Het eerste stelletje: nadat het eerste balletje is getrokken komt het eropaan dat het tweede balletje van een andere kleur is. Er zitten dan nog zeven ballen in de pot, waarvan drie van dezelfde kleur en vier van de andere kleur. De kans op twee verschillende kleuren is dus 4/7.

Het tweede stelletje: nadat het eerste balletje is getrokken komt het eropaan dat het tweede balletje van een andere kleur is. Er zitten dan nog vijf ballen in de pot, waarvan twee van dezelfde kleur en drie van de andere kleur. De kans op twee verschillende kleuren is dus 3/5.

Het derde stelletje: nadat het eerste balletje is getrokken komt het eropaan dat het tweede balletje van een andere kleur is. Er zitten dan nog drie ballen in de pot, waarvan één van dezelfde kleur en twee van de andere kleur. De kans op twee verschillende kleuren is dus 2/3.

En het vierde stelletje kán dan alleen nog maar uit twee balletjes van verschillende kleuren bestaan, want dat zijn dan nog maar de enige balletjes in de pot.

Het komt er dus op neer dat de kans op vier stelletjes van verschillende kleuren gelijk is aan 4/7 * 3/5 * 2/3 = 24/105 = 23%. Dat is niet verwaarloosbaar klein. Met andere woorden, niet direct een argument voor de stelling dat deze loting gemanipuleerd is.

We kunnen de bovenstaande berekening veralgemeniseren. Indien bij de loting 2n ploegen aan elkaar worden gekoppeld, en er zitten nog n eredivisieploegen in en er doen ook nog n niet-eredivisieploegen mee, dan geldt voor de kans p dat geen twee eredivisieploegen elkaar treffen:

p = 2n * n!2 / (2n)!

Kwartfinales

  • Haarlem - Heracles (26 feb)
  • Dordrecht - Roda (26 feb)
  • Quick Boys - NAC (27 feb)
  • Feyenoord - Zwolle (28 feb)

Reacties

Anoniem zei…
Altijd leuk die statistiek.
En als je toch bezig bent; hier een andere actuele case;

De kans op overlijden als gevolg van een bepaalde aandoening van de alvleesklier is 10%. At random worden 296 patienten ingedeeld in 2 groepen van 148. Groep A krijgt een testgeneesmiddel; groep B een placebo. Vervolgens sterven er 24 patienten in groep A en 9 in groep B. Is dit een signifikant verschil (ten opzichte van elkaar en ten opzichte van het gemiddelde)? Met andere woorden: deugt dat testgeneesmiddel echt niet?

Populaire posts van deze blog

kersen keren

5th Dimension Television

Het wonder van Haarlem