Overslaan en naar de inhoud gaan

A Fieldguide to Lies and Statistics - D.Levitin (samenvatting)

A Field Guide To Lies and Statistics

In zijn boek A Fieldguide to Lies and Statistics, helpt Daniel Levitin ons om gepubliceerde cijfers beter te begrijpen zonder ons te laten misleiden door representatie van de schrijver. Dit artikel staat stil bij twee van de onderwerpen die uitgebreid aan bod komen in dit boek: het representeren van data in onder anderen gemiddelden en grafieken, en het kwadrant voor kritisch denken dat helpt bij het interpreteren van cijfers.

Het internet heeft ervoor gezorgd dat informatie toegankelijk is geworden voor iedereen. Daarnaast kan iedereen informatie interpreteren, omschrijven tot nieuwe content en weer op internet publiceren.
Onderzoeksresultaten worden aan de lopende band gepubliceerd en gulzige lezers kopiëren zonder nadenken de resultaten of leiden er volstrekt onterecht andere conclusies uit af. Levitin beschrijft hoe wij als individuen beter met de informatie om kunnen gaan door de onderzoeksresultaten beter te in een kader te plaatsen. Het is hiervoor belangrijk dat wij ons regelmatig afvragen hoe een cijfer tot stand is gekomen, hoe het wordt gepresenteerd, en wat het cijfer nu eigenlijk echt betekent.

 

Er zijn verschillende manier om de DATA TE BEOORDELEN, te beginnen met de context. Waar is het onderzoek gedaan? Hoeveel mensen deden mee? Hoe kleiner de groep, hoe onzekerder het resultaat. Wanneer 20% van de kinderen die geboren worden in een ziekenhuis in een maand vrouwelijk zijn lijkt dat op het eerste gezicht laag. Wanneer dit echter een klein ziekenhuis is op het platteland waar wellicht gemiddeld maar 20 kinderen per maand geboren worden, is de sample van 20 kinderen wellicht te klein om een conclusie te kunnen trekken over de verrassende uitkomst.
Door het gebruik van termen als gemiddelde kunnen ook snel verkeerde aannamen worden gedaan. Wanneer een gemiddeld gezin 3 kinderen heeft, hoeveel broers of zussen heeft een gemiddeld kind dan? Het antwoord, anders dan meestal verwacht, is niet altijd 2. Wanneer we het aantal kinderen per gezin tellen, vergelijken we gezinnen en tellen we elk kind één keer. Wanneer we echter het gemiddelde aantal broers en zussen tellen, vergelijken we kinderen. Hoe groter het gezin, hoe vaker 1 kind wordt meegeteld als broer of zus. Een gezin van 10 kinderen telt één keer mee bij de gezinsvergelijking, maar telt 10 keer mee bij de aantal broers en zussen vergelijking. Daarnaast tellen gezinnen die helemaal geen kinderen hebben in de tweede vergelijking helemaal niet meer mee.
Het gemiddelde is daarnaast ook een gevaarlijke waarde, omdat 1 groot afwijkend getal het gemiddelde radicaal kan veranderen. Daarom zijn de waarden mediaan en mode in het leven geroepen. De mediaan is de middelste waarde in een gesorteerde rij van nummers. 50% van de cijfers zijn groter dan dit mediaan, en 50% is kleiner dat de mediaan. De Mode beschrijft de waarde die het meest voor komt in een reeks.
Naast de context waarin data is verzameld en hoe de waarden worden geïnterpreteerd, kan ook de representatie van de data je op het verkeerde been zetten. Wanneer assen niet zijn benoemd bijvoorbeeld, of nog slimmer, wanneer er 2 verticale assen zijn met verschillende schaal, waardoor een stijging van 10% van variabele A er net zo stijl uit kan zien dan een stijging van 5% bij variabele B.
Assen kunnen ook voor een gedeelte weggelaten worden. Wanneer je een daling van 90% naar 85% wilt laten uitblinken, laat dan niet de volle 100% op een verticale as zien, maar bijvoorbeeld alleen de range 75-100%. De 5% oogt nu opeens vier keer zo groot!
Tot slot is er nog de truc van het cumulatief laten stijgen van een grafiek. Wanneer je bijvoorbeeld voor 20 kwartalen de verkoopcijfers hebt, maar het 20e kwartaal heeft een halvering van het aantal verkopen, laat dan een cumulatieve grafiek zien over alle 20 kwartalen. De havering wordt nu beperkt tot een iets minder steile lijn in de grafiek in plaats van een halvering van een balk.
 

 

Het tweede grote thema dat in dit boek veel terug komt is het begrijpen van kansberekening. Levitin raadt aan om een KWADRANT VOOR KRITISCH DENKEN te creëren met op elke as een variabele. In de volgende voorbeeld blijkt, dat het maken van dit kwadrant helpt kritisch te denken. Een Levitin beschrijft het voorbeeld van vrouwen en borstkanker. Een artikel kopt met een spannende statistiek: 93% van borst kankerpatiënten vallen in de hoge risicogroep. Wat betekent deze uitspraak? Het tellen van hoge risicogroep vrouwen binnen een sample van borstkanker patiënten is niet hetzelfde als het tellen van borstkanker patiënten in een hoge risicogroep. Om die kans te berekenen hebben we meer informatie nodig: de kans dat een vrouw borstkanker heeft is 0,8% en 57% van de vrouwen valt in de hogere risico groep.
We kunnen aan de hand van de drie bekende waarden het kwadrant van afbeelding 1 hieronder invullen.

  • Stap 1: 0,8% van de vrouwen hebben borstkanker, dat zijn 8 van de 1000 vrouwen. (zie afbeelding 1 links)
  • Stap 2: 93% van 8 vrouwen die borstkanker hebben vallen 7.44, (afgerond 7) vrouwen in de hoge risicogroep (zie afbeelding 1 midden).
  • Stap 3: 57% van de vrouwen vallen in de hoge risicogroep, dus het totaalaantal vrouwen van kolom 1 is 570. (zie afbeelding 1rechts)
  • Stap 4: de kans dat een vrouw uit de hoge risico groep borstkanker heeft is 7/570= 1,2%

Figuur 1: Het kwadrant voor kritisch denken

 

Het invullen van het kwadrant aan de hand van het stellen van de juiste vragen geeft ons meer inzicht in de kansen van een vrouw op borstkanker. Een vrouw die in de hoge risicogroep valt, heeft 1,2% kans om borstkanker te hebben in plaats van 0,8% voor vrouwen in het algemeen. ondanks dat het verschil tussen 0.8 en 1.2 relatief groot is, klinkt het al een stuk minder alarmerend als de 93% die het artikel had gepubliceerd.

 

Statistiek is een interessant vakgebied en de persoon die statistieken samenstelt kan zijn publiek beïnvloeden door slechts een gedeelte van het kwadrant voor kritisch denken te beschrijven in een artikel, of om door middel van grafische weergaven een probleem groter (of kleiner) te doen lijken dan het daadwerkelijk is.
Levitin helpt de lezer de juiste vragen te stellen bij wat hij leest. Wanneer wij allemaal leren af en toe wat kritischer naar de nieuwskoppen te kijken, kunnen we wellicht de hoeveelheid incomplete of zelfs valse informatie die over het internet verspreid wordt beperken.

Ga verder naar:

Gratis Geld voor iedereen - R.Bregman (samenvatting)

BRON:

Levitin, D., 2016, A Fieldguide to Lies and Statistics - A Neuroscienetist on how to Make Sense of a Complex World, London: Viking (bestel dit boek)