Marmos Bodemmanagement

Statistiek


There are lies, there are damned lies and there are statistics...

Jaren geleden werd in Denemarken een onderzoek gehouden. Er bleken op het platteland meer kinderen te worden geboren dan in de steden. Ook bleken er op het platteland meer ooievaars voor te komen dan in de steden. Een interessant statistisch verband... welke conclusie kun je daaruit trekken?

Zodra je een grotere hoeveelheid getallen wilt interpreteren ontkom je niet aan statistiek. In de praktijk worden er echter ook weleens lichtzinnige conclusies getrokken uit ogenschijnlijke statistische verbanden.

Wat te denken van de opiniepeiler, die daags na een televisie-interview van een lijsttrekker meldt dat de partij hierdoor één zetel gewonnen of verloren heeft. Reken voor de aardigheid eens uit hoeveel personen uit zijn responsgroep 1 zetel vormen. Zou je echt 1 zetel meer of minder statistisch significant kunnen aantonen op basis van een responsgroep van ca. 900 personen?

Gooi op een regenachtige zondagmiddag eens 900 keer met een dobbelsteen. Het meest waarschijnlijk is, dat je 150 keer een zes gooit. En als je dit 100 keer herhaalt zul je gemiddeld 150 keer een zes gooien. Maar je zult ook regelmatig minder dan 140 of juist meer dan 160 keer een zes gooien... welke conclusie kun je daaruit trekken over dagelijkse opiniepeilingen in de aanloop van verkiezingen?

 

 

Maar statistiek móet als je grotere hoeveelheden data wilt interpreteren

Zoals gezegd, we ontkomen niet aan statistiek, zodra we grotere hoeveelheden data willen interpreteren. Belangrijk is daarbij steeds om zorgvuldig en met gezond verstand met statistiek om te gaan: is de methode wel toepasbaar op de dataset? Is de methode niet te academisch geavanceerd voor de (kwalitatief en/of kwantitatief) beperkte dataset of deugt de rekenmethode juist methodisch totaal niet? Welke betekenis hebben de uitkomsten al of niet? Verworden aannames niet ergens gaandeweg de rit tot feiten ter onderbouwing van diezelfde aannames? Uitkomsten van statistische berekeningen hebben altijd een bepaalde betrouwbaarheid (of onbetrouwbaarheid). Die betrouwbaarheid is vaak ook te kwantificeren.

Marmos Bodemmanagement heeft ruime ervaring met verschillende statistische toepassingen, waaronder geostatistiek. Naast het toepassen van statistische technieken kan Marmos Bodemmanagement u ook adviseren, een second opinion geven, over de betekenis van de uitkomsten van statistisch onderzoek.

Statistische berekeningen vormen een belangrijk onderdeel van het opstellen van een bodemkwaliteitskaart. Met name spelen percentielwaarden in bodemkwaliteitskaarten een belangrijke rol en de betekenis ervan is makkelijk uit te leggen. Bijvoorbeeld: de 95-percentielwaarde is de waarde waar 95% van de waarnemingen onder ligt en 5% van de waarnemingen boven ligt. Maar wist u dat er in de literatuur verschillende manieren zijn om percentielwaarden te berekenen, elk met net iets andere uitkomsten? Bij de mediaan (oftewel 50-percentielwaarde) treden geen of kleine verschillen op, terwijl de verschillen tussen berekeningswijzen het grootst worden bij hoge percentielwaarden als de 95-percentielwaarde. Aan de andere kant hoeven we daar ook niet al te zeer van wakker te liggen: het verschil is in de orde van het verschil dat optreedt door één waarneming meer of minder aan de dataset toe te voegen (danwel erbuiten te laten als uitbijter).

Een voorbeeld van Monte Carlo-simulaties

Om terug te komen op het voorbeeld van de opiniepeiling en van de dobbelsteen. In plaats van zelf 100 x 900 = 90.000 maal met een dobbelsteen te gooien kun je een dergelijke proef ook automatiseren. Marmos Bodemmanagement heeft in MS-Access een rekenmodule gemaakt om dergelijke simulaties uit te voeren. Als dergelijke simulaties worden uitgevoerd voor modellen met meerdere variabelen dan worden deze ook wel Monte Carlo-simulaties genoemd.

Laten we als voorbeeld de Achtergrondwaarden nemen zoals deze zijn bepaald op basis van het project AW2000. In het project AW2000 zijn op 100 meetpunten in het buitengebied verspreid over Nederland grondmonsters genomen en vervolgens geanalyseerd op heel veel verschillende stoffen. Vervolgens is de 95-percentielwaarde van de bovengrondmonsters bepaald als basis voor de Achtergrondwaarde van deze stof (voorzover voldoende meetwaarden boven de detectiegrens waren). Afronding van de 95-percentielwaarde naar boven op een getal eindigend op 0 of 5 levert de Achtergrondwaarde op zoals opgenomen in de Regeling bodemkwaliteit.

Maar hoe betrouwbaar is een 95-percentielwaarde van 100 waarnemingen, of het nu de AW2000 betreft of een zone in een bodemkwaliteitskaart?

Om dat te bepalen heb ik een rekenmodel in MS-Access gemaakt, waarin steeds een set van 100 random getallen wordt getrokken tussen 0 en 100. En die set met 100 random getallen heb ik 10.000 keer achtereen laten bepalen. Met andere woorden: er zijn 10.000 datasets met elk 100 random getallen tussen 0 en 100. Als je elke dataset oplopend sorteert, dan verwacht je op het eerste gezicht dat gemiddeld alle 95e waarnemingen bij elkaar ongeveer 95 bedragen. Niet precies 95, want de 95-percentielwaarde ligt eigenlijk ergens tussen de 95e en 96e waarneming in, afhankelijk van welke berekeningsmethode je verkiest. (om precies te zijn: als ik van deze simulatie alle 95e waarnemingen bij elkaar neem, dan bedragen deze gemiddeld 94,01 en als ik alle 96e waarnemingen bij elkaar neem, dan bedragen deze gemiddeld 95,01; de helft van de 95e waarnemingen is lager dan 94,33 en de andere helft is hoger dan 94,33. Idem voor de 96e waarnemingen bedraagt de mediaan 95,29).

De 96e waarneming ligt dichter bij de 95-percentielwaarde dan de 95e waarneming, dus we gaan nu even verder met die 96e waarnemingen. Gemiddeld ligt die dan wel in de buurt van de 95, maar dat is lang niet voor elke trekking het geval. In één van die 10.000 trekkingen bedroeg de 96e waarneming minder dan 85. Met andere woorden, er is een kans van 1:10000 oftewel 0,01% dat de 95-percentielwaarde die je voor een bestand met 100 waarnemingen bepaalt in werkelijkheid de 85-percentielwaarde van de populatie betreft.

Resultaat Monte Carlo-simulatie betrouwbaarheid 95-percentielwaarde van 100 waarnemingen:

96e waarneming van steekproef met 100 meetpunten
(=ongeveer 95-percentielwaarde steekproef)
Percentielwaarde in werkelijke populatie Percentage trekkingen
< 85
85-percentielwaarde
0,01 %
<90
90-percentielwaarde
2,6 %
<91
91-percentielwaarde
5,3 %
<92
92-percentielwaarde
9,4 %
<93
93-percentielwaarde
16,7 %
<94
94-percentielwaarde
28,1 %
<94,5
94,5-percentielwaarde
35,5 %
<95
95-percentielwaarde
44,2 %
<95,5
95,5-percentielwaarde
53,8 %
<96
96-percentielwaarde
63,3 %
<97
97-percentielwaarde
82,6 %
<98
98-percentielwaarde
95,3 %
<99
99-percentielwaarde
99,7 %

Het resultaat valt lang niet tegen. De kans is groot dat de 95-percentielwaarde van onze steekproef ongeveer in de buurt ligt van de 95-percentielwaarde van de werkelijke populatie. Tegelijk moeten we altijd in het achterhoofd houden, dat er ook altijd een statistische kans is dat we er wat verder naast zitten. En een andere kanttekening is, dat we nu even voorbij zijn gegaan aan de onnauwkeurigheid in de bodemtypecorrectie en het effect van een striktere of minder strikte verwijdering van uitbijters.

De kans is groot, dat de Achtergrondwaarden zoals bepaald in AW2000 ongeveer overeenkomen met de werkelijke 95-percentielwaarde van de bovengrond van de relatief onbelaste bodems in Nederland. Tegelijk is er ook een kans, dat deze voor een enkele stof wat meer afwijkt van de werkelijkheid. In het standaard stoffenpakket worden die stoffen opgenomen, waarvoor de 95-percentielwaarde in een databestand van hergebruiksgrond hoger is dan de Achtergrondwaarde. Voor de meeste stoffen is evident of ze al of niet in het stoffenpakket thuishoren. Tegelijk is niet uitgesloten, dat het al of niet opnemen in het standaard stoffenpakket voor een enkel metaal het resultaat is van statistisch toeval.

Terug naar hoofdpagina

Laatste wijziging 27 januari 2008