Dit is een vroege versie van het artikel dat uiteindelijk werd gepubliceerd door De Correspondent. De geweldige illustraties zijn gemaakt door Suus Hessling.


Veel van de sporten die straks te zien zijn op de Olympische Winterspelen in Pyeongchang kampen met hetzelfde probleem: ze zijn te snel. Daardoor is bijna niet meer te zien wie de beste atleten zijn.

Tijdens het Wereldkampioenschap reuzenslalom in het Oostenrijkse Lienz op 29 december vorig jaar finishte de top-drie binnen acht honderdste van een seconde. Nul komma nul acht seconde – één keer met je ogen knipperen duurt al langer.1

De ‘close finish’ in Lienz is helemaal bijzonder als je bedenkt hoe hard de alpineskiërs gaan. Vanaf vandaag kun je hen op de Olympische Winterspelen de berg af zien komen met 120 tot 155 kilometer per uur. Toch finishen ze vaak binnen enkele honderdste seconden van elkaar. Bobsleeërs halen snelheden tot 200 kilometer per uur, maar ook daar finishte de top-vijf op de vorige Winterspelen toch binnen een halve seconde (nadat ze elk opgeteld 3,5 minuut hadden geracet).

Snowboarden, bobsleeën, schaatsen, langlaufen en skiën – bij veel van de sporten die je kunt zien tijdens deze Olympische Winterspelen gaat het om hoge snelheden en hele kleine verschillen. Dat is indrukwekkend, maar het is ook een probleem. Professionele sporters zijn zó goed geworden en de verschillen tussen hun prestaties zó klein, dat je eigenlijk niet meer kunt zien wie de beste is. Lasers, computers die gesynchroniseerd zijn met atoomklokken en zelfs high-definition-fotofinishes kunnen lang niet meer altijd uitsluitsel geven over wie de medaille verdient.2

Veel sporten hebben met dat probleem te maken. De Amerikaan Stephen Jay Gould bedacht een verklaring voor hoe dat komt. Gould was behalve beroemd evolutionair bioloog een groot honkbalfan. Het viel hem op dat een van zijn wetenschappelijke theorieën over biologische evolutie ook opging voor zijn geliefde sport: als een sport volwassen wordt, neemt de variatie in prestaties aan de top af.

Tot in de jaren twintig van de vorige eeuw had je in het honkbal nog regelmatig slagmannen die over een heel seizoen meer dan 40 procent van de ballen raak sloegen. Dat komt niet meer voor. In zijn essay “Why No One Hits .400 Anymore” legt Gould uit dat niet komt doordat de sporters slechter worden, maar juist omdat de gemiddelde speler steeds beter presteert, waardoor het moeilijker is om een batting average van 0,400 te halen.3

De prestaties worden steeds beter, maar de onderlinge verschillen alsmaar kleiner. Daardoor komen buitengewone prestaties, waarbij één atleet alle anderen overvleugelt, minder vaak voor.

Goulds stelling gaat ook op voor het schaatsen, schreven drie Nederlandse econometristen vorig jaar.4 Emeritus hoogleraar Gerard Sierksma, één van de onderzoekers, ziet het bij veel meer sporten. “Op het EK en WK voetbal eindigt meer dan 30 procent van de wedstrijden met maximaal één doelpunt verschil. Dat betekent dat beslissingen en fouten van de scheidsrechter belangrijker worden voor het verloop van de wedstrijd. Wedstrijden in de Champions League zijn al bijna jurysport geworden.”5

Commentatoren zoeken betekenis in de foutmarge

De commentator van Eurosport noemde de nek-aan-nek-race bij de reuzenslalom in Lienz een ‘uniek feit’, om zich direct daarop te herinneren dat bij dezelfde wedstrijd in Sölden in 2002 drie vrouwen ex aequo eerste werden. Als je het verslag van die wereldbekerwedstrijd moet geloven, dan was een achterstand op de drie winnaressen van anderhalve seconde (op een winnende tijd van 109,9 seconden) al een behoorlijke afgang. De wereldkampioene van het jaar daarvoor, de Oostenrijkse Michaela Dorfmeister, had volgens een sportjournalist van de BBC een ‘slechte eerste run’ waarna ze ‘slechts’ twaalfde werd. De olympisch kampioene Janica Kostelic ‘also failed to perform,’ aldus de BBC omdat zij als elfde eindigde – 1,37 seconde langzamer dan de drie winnaressen. Bepaald geen zeeën van tijd, maar in de moderne sport zijn dat de marges waarbinnen de dramatische gevechten zich afspelen.

In 2015 voegde de internationale skifederatie FIS een nieuwe discipline toe aan de kalender: de parallelle reuzenslalom.6

Die wedstrijden zijn nóg flitsender dan de reuzenslaloms die op de Olympische Winterspelen te zien zullen zijn. Twee aan twee racen de skiërs binnen twintig seconden langs vijftien tot achttien poortjes om over de finishlijn te komen, met tijden die hooguit een paar honderdste seconden uit elkaar liggen. Het is een knockout-systeem: steeds gaan er twee skiërs tegelijk naar beneden, en wie als eerste beneden is mag door naar de volgende ronde.7

Maar het is ontzettend lastig te zien wie de eerste is. Je moet twee parcours tegelijk in de gaten houden, en het gaat zó gelijk op dat je echt de officiële tijdmeting moet zien om te weten wie als eerste over de streep ging. De sporters moeten zelf ook omkijken naar de grote schermen om te weten of ze gewonnen of verloren hebben.

Ondanks de praktisch gelijktijdige afdaling, deinzen de commentatoren er niet voor terug om de race te analyseren alsof het een strategisch spel is. ‘Hier zie je dat ze in het eerste deel wel heel veel tijd verliest,’ zegt een tv-commentator over een van de deelnemers tijdens het parallel slalommen in Oslo. “Ze lijkt een kleine voorsprong te hebben”, zeggen de twee commentatoren ook vaak.

Volgens experimenteel psycholoog Stefan van der Stigchel van de Universiteit Utrecht slaan zulke analyses menselijkerwijs gesproken nergens op.“Als je naar het parallel slalommen kijkt, gaan je ogen continu heen en weer. Zulke oogbewegingen kosten tijd. Je hebt minimaal 80 milliseconden nodig om van de ene naar de andere plek te gaan. Dat is heel snel, maar hiervoor niet snel genoeg. In die tijd gebeurt er gewoon heel veel.”

Een van de commentatoren zei, na alweer een afdaling die slechts met enkele honderdste was beslist: “Het verschil onderaan is bijna te klein om met het blote oog te zien”. Dat is terechte bescheidenheid, én een understatement. Er is namelijk geen enkele kans dat iemand het verschil goed kan zien, weet Van der Stigchel. “Ze finishen soms op een paar honderdsten van elkaar. Dat is niet waar te nemen. Je kijkt er ook nog eens schuin op. Alleen als de camera exact haaks op het parcours staat, kun je misschien zien wie de eerste is, net als bij een fotofinish.”8

Ook de finishfoto faalt

Maar zelfs op finishfoto’s is vaak niet meer te zien wie echt eerste was. Bij een wereldbekerwedstrijd langlaufen eind vorige maand in Oostenrijk kon op basis van de fotofinish geen winnaar worden aangewezen. Hetzelfde gebeurde aan het eind van de zevende etappe in de Tour de France afgelopen zomer. Volgens de organisatie was de Duitser Marcel Kittel 0,0003 seconde sneller dan de Noor Edvald Boasson Hagen, dus drie tienduizendste. Een verschil dat absurd klein is, en niet alleen vanwege de mate van precisie in de tijdmeting die ervoor nodig zou zijn, meent Sierksma. ‘De eindstreep die ze trekken, staat die wel recht op de rijrichting? Nee, natuurlijk niet, er is altijd wel een paar millimeter verschil. Precies het verschil dus waarmee Kittel won.’

Ilustraties: Suus Hessling

De commentatoren zien wel meer dan de gemiddelde kijker, denkt Van der Stigchel. ‘Zij kunnen de juiste bewegingen herkennen, en die interpreteren ze als een voorsprong. Zo kunnen ze beoordelen wat een goede afzet is, dus het commentaar is niet helemaal nutteloos.’ Maar ze overschatten hun eigen visuele waarneming wel. ‘Als ze zelf denken dat ze net zo goed kunnen zien als de officiële tijdwaarneming, overschatten ze zichzelf.’

Er zullen steeds vaker winnaars zijn, wier afstand tot nummer twee kleiner is dan de foutmarge van de meetsystemen

Volgens de econometristen bevinden de ‘snelle’ sporten zich in een crisis. Hoe dichter de prestaties op elkaar zitten, des te vaker zullen sporters hun plek op het podium moeten delen. Er zullen ook steeds vaker winnaars worden uitgeroepen, terwijl hun afstand tot de nummer twee niet groter is dat de foutmarge van de meetsystemen.

De selectie van sporters zal ook steeds moeilijker worden omdat er steeds meer potentiële medaillewinnaars zijn. Gerard Sierksma: ‘De 500-, 1000- en 1500-meter-wedstrijden bij het schaatsen zijn tegenwoordig eigenlijk ongeschikt om ranglijsten bij op te stellen, en om goud en zilver bij uit te reiken. Deskundigen op het gebied van tijdmeting zeggen dat de foutmarge drie duizendste seconde bedraagt De resultaten liggen daar binnen die foutmarges. Je kunt gewoon niet meer vergelijken wie winnaars zijn.”

Een van bekendste voorbeelden hiervan is de 1.500 meter van Koen Verweij tijdens de vorige Olympische Winterspelen in 2014 in Sotsji. Hij kreeg zilver omdat hij volgens de tijdmeting drieduizendste van een seconde langzamer was dan de Pool Zbigniew Bródka. Ze reden niet tegen elkaar, dus er was geen finishfoto. Sierksma: ‘Voor hetzelfde geld was het onderlinge verschil wel zes duizendste geweest. Hij had ex aequo goud moeten hebben. Straks in Pyeongchang meet de ISU de tijden ook weer in duizendsten. Als iemand weer een verschil rijdt van een paar duizendste: god weet wie gewonnen heeft.”

Objectief de beste

Ondanks de fantastisch kleine verschillen in eindtijden, maakt de Fédération Internationale de Ski (FIS) er nog wat van met een heel eigen puntensysteem, om zo elke twee jaar een wereldkampioen te kunnen uitroepen. Maar die puntentelling vertekent de cijfers enorm – zozeer zelfs, dat het alpineskiën in de literatuur een voorbeeld is geworden van hoe het niet moet. Het handboek Statistics in Psychology Using R and SPSS gebruikt de puntentelling bij het wereldkampioenschap alpineskiën als voorbeeld van foutief gebruik van meetniveaus.

In plaats van de tijden van skiërs over een heel seizoen te vergelijken en de wereldbeker te geven aan de snelste atleet, doet de FIS dat op basis van verdiende punten. De winnaar van een race krijgt 100 punten, de nummer twee 80, de derde 60, enzovoorts. Daardoor kan een skiër die gemiddeld de snelste is toch het wereldkampioenschap verliezen van iemand die vaker eerste werd.

De auteurs van het statistiekboek schrijven: ‘Het is irrelevant dat die schaalverdeling zo oneerlijk is, zolang atleten en kijkers vrijelijk instemmen met zulke autoritaire regels omwille van het amusement. Wetenschappelijk onderzoek vraagt echter om eerlijkheid en objectiviteit.’ Als je ook objectief zou willen vaststellen wie de beste sporter is, dan zou je meerdere metingen moeten doen, zegt statisticus Casper Albers van de Rijksuniversiteit Groningen. ‘De wetenschappelijke benadering zou zijn om te zeggen ‘Nummers één tot en met vijf waren ongeveer even snel. We moeten iedereen nog minstens tien keer van die berg af laten racen om te weten of de nummer één ook significant beter is dan de nummer twee’. Maar dat levert natuurlijk geen interessante sportbeelden op.”

Opmerkelijke resultaten

Bij de parallelle reuzenslalom zorgt het knockout-systeem voor nog meer opmerkelijke resultaten.9 Tijdens de parallelle reuzenslalom voor mannen, 17 en 18 december vorig jaar in Alta Badia in Italië, werd de Zwitser Justin Murisier zevende met een tijd van 19,31 seconden.10 Dat was sneller dan de winnaar van de wedstrijd én de drie skiërs die boven hem eindigden. De nummers drie en vier waren allebei bijna een halve seconde eerder over de streep dan de nummers één en twee. Toch krijgt Murisier maar 36 punten voor het wereldkampioenschap, tegen 50, 60, 80 en 100 voor de nummers vier tot en met één.

Is degene die wint dan nog wel beter dan de andere deelnemers? Als de resultaten zó dicht bij elkaar liggen, dan is het toeval mogelijk belangrijker dan wie het beste kan presteren, legt Albers uit. ‘Toeval is in wezen onderdeel van de sport. Als je in een voetbalwedstrijd een minuut voor tijd een penalty mag nemen en je schiet raak, heb je gewonnen. Een goede speler zal zo’n strafschop misschien drie van de vier keer erin schieten en een slechte één keer. Maar pas als teams of sporters het vaker tegen elkaar opnemen en de ene net wat vaker wint dan die andere, kun je concluderen dat het ene team dan wel beter zal zijn. Anders kan het toeval zijn. Zeker als de verschillen tussen spelers heel klein zijn, gaat toeval het spel domineren.”11

Hoe komt het dan dat we toch denken te kijken naar een wedstrijd die uitmaakt wie de beste sporter is? Wat niet helpt, is dat het lastig is te begrijpen hoe weinig een honderdste of duizendste van een seconde is. Mensen hebben niet door hoe klein die verschillen zijn, en juist daarom nemen ze de verschillen zo serieus.

De verschillen zijn beter voor te stellen als we de race vertalen naar een denkbeeldige wedstrijd die veel langer duurt. Als de reuzenslalom voor dames in Lienz niet (in totaal) twee minuten maar 3,5 uur zou duren, waarbij de atlete geen 44 maar ruim vierduizend poortjes voorbij skiet, zouden de finalisten nog steeds binnen 8 seconden van elkaar eindigen.

En die cijfers achter de komma wekken de indruk dat het allemaal erg exact is. Dat is een denkfout die ‘precision bias’ of ‘valse precisie’ heet. Mensen hebben veel vertrouwen in cijfers die met meer precisie worden gepresenteerd dan gerechtvaardigd is.12 Albers: ‘Deze sporten zijn daar een goed voorbeeld van. Als tijden worden genoteerd met vier cijfers achter de komma, denken we ‘wat weten wij dat goed’. Maar die precisie heeft niks meer met de prestatie van de sporters te maken.’

Wie rekening houdt met meetfouten en de invloed van toeval kan na sommige wedstrijden niet meer met statistische zekerheid zeggen wie de beste sporter is. Misschien gaan de Olympische Winterspelen daar ook vooral om: niet objectief de beste sporters aanwijzen, maar gewoon spannende wedstrijden laten zien en knappe prestaties, volgens de regels van het spel.

 


 

  1. Met je ogen knipperen duurt meestal 100 tot 150 milliseconden, volgens dit Britse onderzoek.
  2. In dit document kun je mooi zien hoe ver de organisatoren van wedstrijden van skifederatie FIS moeten gaan om het allemaal meetbaar te houden.
  3. Gould over baseball op Youtube, zie 3’07.
  4. The growing problem of comparing elite sport performances is de titel van een paper dat de Nederlandse econometristen Gerard Sierksma, Bertus Talsma en Marcel Turkensteen afgelopen jaar publiceerden. Ze onderzochten Goulds hypothese voor het schaatsen. De tijden in die sport worden steeds sneller, vooral door technologische innovaties zoals de klapschaats, indoor ijsbanen en strakke schaatspakken. Andere factoren zijn nieuwe trainingsmethodieken, betere voeding, het eerder herkennen en opleiden van schaatstalenten en sporters die zich meer specialiseren. Het resultaat is dat er zó veel schaatsers zó goed zijn, dat hun tijden gemeten moeten worden in duizendste seconden om te kunnen zien wie recht heeft op welke medaille.
  5. In de jaren negentig toonde de Noorse statisticus Nils Lid Hjort aan dat schaatsers die op de 500 meter in de binnenbaan starten een voordeel hebben van 0,05 seconde – een levensgroot voordeel bij een sport die vaak op milliseconden wordt beslist.
  6. Alpineskiën is een verzamelnaam voor verschillende disciplines. Op de Olympische Winterspelen zijn dat: afdaling (het oudste en snelste nummer bij het alpineskiën), slalom (langs een parcour van gekleurde paaltjes skiën), reuzenslalom (met poortjes die wat verder uit elkaar staan dan bij de slalom), Super Giant Slalom of Super-G (met wat nog extra bochten), en Combiné (een combinatie van afdaling en slalom). De parallelle reuzenslalom is op de Olympische Winterspelen geen onderdeel van het alpineskiën, maar wel bij het snowboarden.
  7. Volgens de FIS is de parallelle reuzenslalom bedoeld als een ‘geweldige show’ en een ‘heel compact, tv-vriendelijk product’ met ‘veel actie en plezier voor toeschouwers’.
  8. Van der Stighel schreef een paar jaar geleden mee aan een wetenschappelijk artikel van oud-schaatser en neurowetenschapper Beorn Nijenhuis. Ze concludeerden toen dat het startschot geautomatiseerd moest worden, omdat dit nu op oneerlijke wijze gebeurt. De starters bij de verschillende heats wachten niet allemaal exact even lang voordat ze het startschot lossen, wat de tijden van de schaatsers beïnvloedt.
    Sportliefhebbers en sporters reageerden geërgerd op het onderzoek naar de starters van Van der Stigchel en zijn collega’s. ‘Erben Wennemars zei op tv dat zulk toeval erbij hoort, en ‘dat is dan maar zo’. Dat is angst voor verandering. Bij voetbal zie je dat ook, met de discussie over videoscheidsrechters. Dat zou de charme uit de sport halen. Tja, dan kun je ook een dobbelsteentje opgooien en zeggen dat dát de charme van de sport is.’
  9. Het woord ‘slalom’ komt van een Noors dialectwoord ‘slalåm’. ‘Sla’ betekent lichte helling, en ‘låm’ betekent spoor (zoals achter ski’s).
  10. De hele wedstrijd parallelle reuzenslalom in Alta Badia kijken kan op YouTube.
  11. Het gaat er dus niet om dat sporters maar wat doen of dat het niet heel knap is wat ze doen, maar dat hun sport geen goede manier is om hun kwaliteiten te meten. Lees in het stuk van van sport-correspondent Michiel de Hoog waarom sporten wat dat betreft van elkaar verschillen.
  12. Het beroemde boekje How to lie with statistics (1954) legt uit hoe mensen te veel heisa kunnen maken van ‘een verschil dat mathematisch echt en aantoonbaar is, maar zo klein is dat het geen betekenis heeft’. Een tijdschrift liet een laboratorium uitzoeken welke sigaretten de meeste ongezonde stoffen bevatten. De uitkomst was dat alle merken praktisch identiek waren. Maar in het lijstje van bijna identieke hoeveelheden nicotine en andere ongezonde stoffen stond natuurlijk toch één merk onderaan. Dat merk, Old Gold, pakte uit met een grote reclamecampagne waarin het een flink nummer maakte van het feit dat het tijdschrift had aangetoond dat hun sigaret de minste schadelijke stoffen bevatte. In de advertenties werden de grafieken en andere hints dat het verschil verwaarloosbaar was weggelaten.