Dit is een vroege versie van het artikel dat uiteindelijk werd gepubliceerd door De Correspondent. De geweldige illustraties zijn gemaakt door Suus Hessling.
Veel van de sporten die straks te zien zijn op de Olympische Winterspelen in Pyeongchang kampen met hetzelfde probleem: ze zijn te snel. Daardoor is bijna niet meer te zien wie de beste atleten zijn.
Tijdens het Wereldkampioenschap reuzenslalom in het Oostenrijkse Lienz op 29 december vorig jaar finishte de top-drie binnen acht honderdste van een seconde. Nul komma nul acht seconde – één keer met je ogen knipperen duurt al langer.
De ‘close finish’ in Lienz is helemaal bijzonder als je bedenkt hoe hard de alpineskiërs gaan. Vanaf vandaag kun je hen op de Olympische Winterspelen de berg af zien komen met 120 tot 155 kilometer per uur. Toch finishen ze vaak binnen enkele honderdste seconden van elkaar. Bobsleeërs halen snelheden tot 200 kilometer per uur, maar ook daar finishte de top-vijf op de vorige Winterspelen toch binnen een halve seconde (nadat ze elk opgeteld 3,5 minuut hadden geracet).
Snowboarden, bobsleeën, schaatsen, langlaufen en skiën – bij veel van de sporten die je kunt zien tijdens deze Olympische Winterspelen gaat het om hoge snelheden en hele kleine verschillen. Dat is indrukwekkend, maar het is ook een probleem. Professionele sporters zijn zó goed geworden en de verschillen tussen hun prestaties zó klein, dat je eigenlijk niet meer kunt zien wie de beste is. Lasers, computers die gesynchroniseerd zijn met atoomklokken en zelfs high-definition-fotofinishes kunnen lang niet meer altijd uitsluitsel geven over wie de medaille verdient.
Veel sporten hebben met dat probleem te maken. De Amerikaan Stephen Jay Gould bedacht een verklaring voor hoe dat komt. Gould was behalve beroemd evolutionair bioloog een groot honkbalfan. Het viel hem op dat een van zijn wetenschappelijke theorieën over biologische evolutie ook opging voor zijn geliefde sport: als een sport volwassen wordt, neemt de variatie in prestaties aan de top af.
Tot in de jaren twintig van de vorige eeuw had je in het honkbal nog regelmatig slagmannen die over een heel seizoen meer dan 40 procent van de ballen raak sloegen. Dat komt niet meer voor. In zijn essay “Why No One Hits .400 Anymore” legt Gould uit dat niet komt doordat de sporters slechter worden, maar juist omdat de gemiddelde speler steeds beter presteert, waardoor het moeilijker is om een batting average van 0,400 te halen.
De prestaties worden steeds beter, maar de onderlinge verschillen alsmaar kleiner. Daardoor komen buitengewone prestaties, waarbij één atleet alle anderen overvleugelt, minder vaak voor.
Goulds stelling gaat ook op voor het schaatsen, schreven drie Nederlandse econometristen vorig jaar. Emeritus hoogleraar Gerard Sierksma, één van de onderzoekers, ziet het bij veel meer sporten. “Op het EK en WK voetbal eindigt meer dan 30 procent van de wedstrijden met maximaal één doelpunt verschil. Dat betekent dat beslissingen en fouten van de scheidsrechter belangrijker worden voor het verloop van de wedstrijd. Wedstrijden in de Champions League zijn al bijna jurysport geworden.”
Commentatoren zoeken betekenis in de foutmarge
De commentator van Eurosport noemde de nek-aan-nek-race bij de reuzenslalom in Lienz een ‘uniek feit’, om zich direct daarop te herinneren dat bij dezelfde wedstrijd in Sölden in 2002 drie vrouwen ex aequo eerste werden. Als je het verslag van die wereldbekerwedstrijd moet geloven, dan was een achterstand op de drie winnaressen van anderhalve seconde (op een winnende tijd van 109,9 seconden) al een behoorlijke afgang. De wereldkampioene van het jaar daarvoor, de Oostenrijkse Michaela Dorfmeister, had volgens een sportjournalist van de BBC een ‘slechte eerste run’ waarna ze ‘slechts’ twaalfde werd. De olympisch kampioene Janica Kostelic ‘also failed to perform,’ aldus de BBC omdat zij als elfde eindigde – 1,37 seconde langzamer dan de drie winnaressen. Bepaald geen zeeën van tijd, maar in de moderne sport zijn dat de marges waarbinnen de dramatische gevechten zich afspelen.
In 2015 voegde de internationale skifederatie FIS een nieuwe discipline toe aan de kalender: de parallelle reuzenslalom.
Die wedstrijden zijn nóg flitsender dan de reuzenslaloms die op de Olympische Winterspelen te zien zullen zijn. Twee aan twee racen de skiërs binnen twintig seconden langs vijftien tot achttien poortjes om over de finishlijn te komen, met tijden die hooguit een paar honderdste seconden uit elkaar liggen. Het is een knockout-systeem: steeds gaan er twee skiërs tegelijk naar beneden, en wie als eerste beneden is mag door naar de volgende ronde.
Maar het is ontzettend lastig te zien wie de eerste is. Je moet twee parcours tegelijk in de gaten houden, en het gaat zó gelijk op dat je echt de officiële tijdmeting moet zien om te weten wie als eerste over de streep ging. De sporters moeten zelf ook omkijken naar de grote schermen om te weten of ze gewonnen of verloren hebben.
Ondanks de praktisch gelijktijdige afdaling, deinzen de commentatoren er niet voor terug om de race te analyseren alsof het een strategisch spel is. ‘Hier zie je dat ze in het eerste deel wel heel veel tijd verliest,’ zegt een tv-commentator over een van de deelnemers tijdens het parallel slalommen in Oslo. “Ze lijkt een kleine voorsprong te hebben”, zeggen de twee commentatoren ook vaak.
Volgens experimenteel psycholoog Stefan van der Stigchel van de Universiteit Utrecht slaan zulke analyses menselijkerwijs gesproken nergens op.“Als je naar het parallel slalommen kijkt, gaan je ogen continu heen en weer. Zulke oogbewegingen kosten tijd. Je hebt minimaal 80 milliseconden nodig om van de ene naar de andere plek te gaan. Dat is heel snel, maar hiervoor niet snel genoeg. In die tijd gebeurt er gewoon heel veel.”
Een van de commentatoren zei, na alweer een afdaling die slechts met enkele honderdste was beslist: “Het verschil onderaan is bijna te klein om met het blote oog te zien”. Dat is terechte bescheidenheid, én een understatement. Er is namelijk geen enkele kans dat iemand het verschil goed kan zien, weet Van der Stigchel. “Ze finishen soms op een paar honderdsten van elkaar. Dat is niet waar te nemen. Je kijkt er ook nog eens schuin op. Alleen als de camera exact haaks op het parcours staat, kun je misschien zien wie de eerste is, net als bij een fotofinish.”
Ook de finishfoto faalt
Maar zelfs op finishfoto’s is vaak niet meer te zien wie echt eerste was. Bij een wereldbekerwedstrijd langlaufen eind vorige maand in Oostenrijk kon op basis van de fotofinish geen winnaar worden aangewezen. Hetzelfde gebeurde aan het eind van de zevende etappe in de Tour de France afgelopen zomer. Volgens de organisatie was de Duitser Marcel Kittel 0,0003 seconde sneller dan de Noor Edvald Boasson Hagen, dus drie tienduizendste. Een verschil dat absurd klein is, en niet alleen vanwege de mate van precisie in de tijdmeting die ervoor nodig zou zijn, meent Sierksma. ‘De eindstreep die ze trekken, staat die wel recht op de rijrichting? Nee, natuurlijk niet, er is altijd wel een paar millimeter verschil. Precies het verschil dus waarmee Kittel won.’

Ilustraties: Suus Hessling
De commentatoren zien wel meer dan de gemiddelde kijker, denkt Van der Stigchel. ‘Zij kunnen de juiste bewegingen herkennen, en die interpreteren ze als een voorsprong. Zo kunnen ze beoordelen wat een goede afzet is, dus het commentaar is niet helemaal nutteloos.’ Maar ze overschatten hun eigen visuele waarneming wel. ‘Als ze zelf denken dat ze net zo goed kunnen zien als de officiële tijdwaarneming, overschatten ze zichzelf.’
Er zullen steeds vaker winnaars zijn, wier afstand tot nummer twee kleiner is dan de foutmarge van de meetsystemen
Volgens de econometristen bevinden de ‘snelle’ sporten zich in een crisis. Hoe dichter de prestaties op elkaar zitten, des te vaker zullen sporters hun plek op het podium moeten delen. Er zullen ook steeds vaker winnaars worden uitgeroepen, terwijl hun afstand tot de nummer twee niet groter is dat de foutmarge van de meetsystemen.
De selectie van sporters zal ook steeds moeilijker worden omdat er steeds meer potentiële medaillewinnaars zijn. Gerard Sierksma: ‘De 500-, 1000- en 1500-meter-wedstrijden bij het schaatsen zijn tegenwoordig eigenlijk ongeschikt om ranglijsten bij op te stellen, en om goud en zilver bij uit te reiken. Deskundigen op het gebied van tijdmeting zeggen dat de foutmarge drie duizendste seconde bedraagt De resultaten liggen daar binnen die foutmarges. Je kunt gewoon niet meer vergelijken wie winnaars zijn.”
Een van bekendste voorbeelden hiervan is de 1.500 meter van Koen Verweij tijdens de vorige Olympische Winterspelen in 2014 in Sotsji. Hij kreeg zilver omdat hij volgens de tijdmeting drieduizendste van een seconde langzamer was dan de Pool Zbigniew Bródka. Ze reden niet tegen elkaar, dus er was geen finishfoto. Sierksma: ‘Voor hetzelfde geld was het onderlinge verschil wel zes duizendste geweest. Hij had ex aequo goud moeten hebben. Straks in Pyeongchang meet de ISU de tijden ook weer in duizendsten. Als iemand weer een verschil rijdt van een paar duizendste: god weet wie gewonnen heeft.”
Objectief de beste
Ondanks de fantastisch kleine verschillen in eindtijden, maakt de Fédération Internationale de Ski (FIS) er nog wat van met een heel eigen puntensysteem, om zo elke twee jaar een wereldkampioen te kunnen uitroepen. Maar die puntentelling vertekent de cijfers enorm – zozeer zelfs, dat het alpineskiën in de literatuur een voorbeeld is geworden van hoe het niet moet. Het handboek Statistics in Psychology Using R and SPSS gebruikt de puntentelling bij het wereldkampioenschap alpineskiën als voorbeeld van foutief gebruik van meetniveaus.
In plaats van de tijden van skiërs over een heel seizoen te vergelijken en de wereldbeker te geven aan de snelste atleet, doet de FIS dat op basis van verdiende punten. De winnaar van een race krijgt 100 punten, de nummer twee 80, de derde 60, enzovoorts. Daardoor kan een skiër die gemiddeld de snelste is toch het wereldkampioenschap verliezen van iemand die vaker eerste werd.
De auteurs van het statistiekboek schrijven: ‘Het is irrelevant dat die schaalverdeling zo oneerlijk is, zolang atleten en kijkers vrijelijk instemmen met zulke autoritaire regels omwille van het amusement. Wetenschappelijk onderzoek vraagt echter om eerlijkheid en objectiviteit.’ Als je ook objectief zou willen vaststellen wie de beste sporter is, dan zou je meerdere metingen moeten doen, zegt statisticus Casper Albers van de Rijksuniversiteit Groningen. ‘De wetenschappelijke benadering zou zijn om te zeggen ‘Nummers één tot en met vijf waren ongeveer even snel. We moeten iedereen nog minstens tien keer van die berg af laten racen om te weten of de nummer één ook significant beter is dan de nummer twee’. Maar dat levert natuurlijk geen interessante sportbeelden op.”
Opmerkelijke resultaten
Bij de parallelle reuzenslalom zorgt het knockout-systeem voor nog meer opmerkelijke resultaten. Tijdens de parallelle reuzenslalom voor mannen, 17 en 18 december vorig jaar in Alta Badia in Italië, werd de Zwitser Justin Murisier zevende met een tijd van 19,31 seconden. Dat was sneller dan de winnaar van de wedstrijd én de drie skiërs die boven hem eindigden. De nummers drie en vier waren allebei bijna een halve seconde eerder over de streep dan de nummers één en twee. Toch krijgt Murisier maar 36 punten voor het wereldkampioenschap, tegen 50, 60, 80 en 100 voor de nummers vier tot en met één.
Is degene die wint dan nog wel beter dan de andere deelnemers? Als de resultaten zó dicht bij elkaar liggen, dan is het toeval mogelijk belangrijker dan wie het beste kan presteren, legt Albers uit. ‘Toeval is in wezen onderdeel van de sport. Als je in een voetbalwedstrijd een minuut voor tijd een penalty mag nemen en je schiet raak, heb je gewonnen. Een goede speler zal zo’n strafschop misschien drie van de vier keer erin schieten en een slechte één keer. Maar pas als teams of sporters het vaker tegen elkaar opnemen en de ene net wat vaker wint dan die andere, kun je concluderen dat het ene team dan wel beter zal zijn. Anders kan het toeval zijn. Zeker als de verschillen tussen spelers heel klein zijn, gaat toeval het spel domineren.”
Hoe komt het dan dat we toch denken te kijken naar een wedstrijd die uitmaakt wie de beste sporter is? Wat niet helpt, is dat het lastig is te begrijpen hoe weinig een honderdste of duizendste van een seconde is. Mensen hebben niet door hoe klein die verschillen zijn, en juist daarom nemen ze de verschillen zo serieus.
De verschillen zijn beter voor te stellen als we de race vertalen naar een denkbeeldige wedstrijd die veel langer duurt. Als de reuzenslalom voor dames in Lienz niet (in totaal) twee minuten maar 3,5 uur zou duren, waarbij de atlete geen 44 maar ruim vierduizend poortjes voorbij skiet, zouden de finalisten nog steeds binnen 8 seconden van elkaar eindigen.
En die cijfers achter de komma wekken de indruk dat het allemaal erg exact is. Dat is een denkfout die ‘precision bias’ of ‘valse precisie’ heet. Mensen hebben veel vertrouwen in cijfers die met meer precisie worden gepresenteerd dan gerechtvaardigd is. Albers: ‘Deze sporten zijn daar een goed voorbeeld van. Als tijden worden genoteerd met vier cijfers achter de komma, denken we ‘wat weten wij dat goed’. Maar die precisie heeft niks meer met de prestatie van de sporters te maken.’
Wie rekening houdt met meetfouten en de invloed van toeval kan na sommige wedstrijden niet meer met statistische zekerheid zeggen wie de beste sporter is. Misschien gaan de Olympische Winterspelen daar ook vooral om: niet objectief de beste sporters aanwijzen, maar gewoon spannende wedstrijden laten zien en knappe prestaties, volgens de regels van het spel.