In 2011 schreef Steven Pinker 'The Better Angels of Our Nature'. In dat boek observeert Pinker dat de mensheid steeds minder gewelddadig wordt. Het aantal oorlogsdoden, moorden en folteringen gaat erop achteruit. Vrouwen, kinderen en dieren worden beter behandeld, net als homoseksuelen en andere minderheden. Vooral de observatie dat het aantal oorlogsdoden sterk is afgenomen in de periode sinds 1945 wordt vaak aangehaald in de media. Vaak verandert die vaststelling van Pinker dan in een voorspelling. Er zijn minder oorlogsdoden, dus zullen er ook in de toekomst minder oorlogsdoden zijn. Dat klopt niet, want het aantal oorlogsdoden is niet normaal verdeeld.

Normale verdeling?

Beeld je een kamer in met 100 willekeurig gekozen Vlamingen van wie je de lengte meet. (Vanaf nu zijn alle Vlamingen in dit stuk willekeurig gekozen.) Wie ook in die kamer belandt, je zal altijd ongeveer dezelfde resultaten krijgen. Een groep van 100 Vlamingen heeft ongeveer dezelfde gemiddelde lengte als een andere groep met 100 andere Vlamingen. Ook wanneer er toevallig vijf dwergen bij zo'n groep zitten, is het effect daarvan verwaarloosbaar. Extremen hebben nauwelijks impact op de gemiddelde lengte van een groep, en dus lijkt de gemiddelde lengte van elke groep op elkaar. Lengte is normaal verdeeld.

Neem nu dezelfde kamer met 100 Vlamingen, maar meet er de rijkdom van. Je zal zien dat het nu heel veel uitmaakt wie toevallig bij die honderd Vlamingen beland is. Zitten er een paar miljonairs bij, dan is je gemiddelde veel hoger dan wanneer dat niet het geval is. En zit Marc Coucke erbij, dan maakt het niet meer uit wie die andere 99 zijn. Eén Marc Coucke vertekent heel de groep. En een groep met Marc Coucke heeft een totaal andere gemiddelde rijkdom dan één zonder Marc Coucke. Rijkdom is niet normaal verdeeld, maar volgt een 'fat tails'-verdeling.

Een voorbeeld van een 'fat tails'-verdeling is de Paretoverdeling, ook gekend als de 80/20 regel. Bijvoorbeeld, 80% van een tekst bestaat uit de 20% meest frequent gebruikte woorden in een taal. 20% van de wereldbevolking bezit 80% van de rijkdom. Ook de term 'power law' (machtsfunctie) wordt hier vaak gebruikt. Het draait erom dat een beperkt aantal extreme waarnemingen, of zelfs één enkele waarneming, een groot effect heeft op het gemiddelde. Dit in tegenstelling tot een normale verdeling, waar het effect van extreme waarnemingen op het gemiddelde verwaarloosbaar is.

Oorlogsdoden

We keken naar de lengte van één Vlaming en de gemiddelde lengte van een groep van honderd Vlamingen. Zo kunnen we ook kijken naar het aantal wereldwijde oorlogsdoden: we hebben het aantal oorlogsdoden in één jaar, en het gemiddelde aantal oorlogsdoden over een periode (=groep) van honderd jaar.

Is de variabele 'aantal oorlogsdoden per jaar' normaal verdeeld of niet? Anders verwoord: kan één jaar een enorme impact hebben op het gemiddelde in een bepaalde periode? En kan dus het gemiddelde van de ene periode volledig anders zijn dan dat van een andere?

Het antwoord op de twee laatste vragen is duidelijk "ja".
Nemen we bijvoorbeeld alle oorlogsdoden sinds 1946. In 1950 vielen er ongeveer 600.000 oorlogsdoden. In 2005 waren dat er 11.000, bijna 50 keer minder. En dat is dan binnen een relatief kalme periode. In één jaar in de Tweede Wereldoorlog vielen meer doden dan in de 70 jaar erna (!). Het gemiddelde aantal oorlogsdoden in de afgelopen 70 jaar is compleet anders dan dat in de 70 jaar ervoor, een periode die twee Wereldoorlogen omvat. En de impact van één extreme waarneming (1945) kan het gemiddelde over een periode van 70 jaar compleet vertekenen.

We hebben gezien dat het aantal oorlogsdoden een 'fat tails'-verdeling volgt (zoals rijkdom), en dat 'fat tails'-verdelingen inhouden dat één waarneming een grote impact kan hebben op het gemiddelde. Dit heeft twee gevolgen:

  1. Het gemiddelde in een bepaalde periode (groep) is een slechte schatting van het echte gemiddelde.
    De gemiddelde rijkdom van een groep van 70 Vlamingen zegt weinig over de gemiddelde rijkdom van alle Vlamingen. Zit Marc Coucke in die groep, is het gemiddelde te hoog. Zit hij er niet in, is het te laag. Hetzelfde geldt voor oorlogsdoden. Zit Wereldoorlog II (of een ander dramatisch conflict) in de periode waar je naar kijkt, dan is het gemiddelde te hoog. Indien niet, zoals bij de afgelopen 70 jaar, is het te laag.

  2. De meeste geobserveerde jaren en periodes zullen een lager gemiddelde kennen dan het echte gemiddelde.
    De meeste observaties zijn, haast per definitie, niet extreem. Maar extreme observaties hebben wel een grote impact op het gemiddelde. Dat betekent dat de meeste observaties onder het gemiddelde moeten liggen. Net zoals de meeste Vlamingen minder rijk zijn dan de gemiddelde Vlaming, zijn er in de meeste jaren minder oorlogsslachtoffers dan gemiddeld. Wat voor jaren geldt, geldt ook voor periodes: voor de meeste periodes van 70 jaar (of eender welk aantal) geldt dat ze minder oorlogsslachtoffers hebben dan gemiddeld.

Terug naar Pinker

We verwachten dus veel jaren met een laag aantal oorlogsdoden te zien, en af en toe jaren met een heel groot aantal oorlogsdoden. Een lange periode van relatieve kalmte is de perfecte aanleiding om mensen (onterecht) te laten denken dat er iets ten gronde veranderd is, dat grote oorlogen minder waarschijnlijk zijn dan ervoor. Neem bijvoorbeeld dit citaat over oorlog:

"That this barbarous pursuit is, in the progress of society, steadily declining, must be evident, even to the most hasty reader of European history. If we compare one country with another, we shall find that for a very long period wars have been becoming less frequent (...) The question arises, as to what share our moral feelings have had in bringing about this great improvement."

Dit citaat komt uit 'History of Civilization in England' van H.T. Buckle, een 19de eeuwse historicus. Een kleine eeuw later bewezen de Wereldoorlogen, helaas, hoe voorbarig zijn optimisme was.

Wanneer we naar de afgelopen 70 jaar kijken, zien we duidelijk minder oorlogsdoden dan gemiddeld. Dat betekent echter niet dat het echte gemiddelde daarom is afgenomen. Misschien is dat inderdaad zo. Of misschien is er over tien jaar Wereldoorlog III, dodelijker dan ooit. Misschien hebben de optimisten gelijk, misschien zijn ze de volgende H.T. Buckle. Op dit punt is het simpelweg te vroeg om daarover iets uit de data te kunnen afleiden.


Hieronder nog een aantal opmerkingen voor de nog steeds geïnteresseerde lezer, en mijn bronnen.

Ik kwam in contact met deze redenering door een artikel van Mark Buchanan, fysicus en auteur, dat zeker het lezen waard is. Deze quote is onverbeterbaar en stond enkel niet in het stuk vanwege het technische Engels:

The sample mean over any period is NOT a very useful statistic for estimating the TRUE mean of the underlying statistical process. For example, it turns out that, for a process following this statistical pattern, one should expect fully 96% of all observations to fall below the true mean of the process. This brings home just how non-Gaussian and non-normal this process is. We’re used to thinking that, if we observe instances from some random process, we ought to (very crudely) see events about half above and half below the mean. Instead, in this process, one should expect that almost all observations will be below, and even far below, the actual mean. We almost always see fewer wars than we, in a sense, should. The process is set up almost perfectly to make an observer complacent about the possibility of large events.

Ik heb Steven Pinker unfair behandeld. Hijzelf zegt namelijk meermaals dat hij gewoon een daling van het aantal oorlogsdoden beschrijft, en dat de data van de afgelopen zeventig jaar geen voorspelling voor de toekomst inhouden. Hij denkt wel dat het onderliggende proces veranderd is (en oorlogsdoden dus minder waarschijnlijk zijn dan vroeger), maar is er duidelijk over dat het ook gewoon een statistische illusie kan zijn. Helaas gaat die nuance verloren wanneer anderen Steven Pinker aanhalen. Iets waar hij weinig aan kan doen natuurlijk, maar het zijn wel die artikels en quotes waar de meeste mensen mee in contact komen. Niet zijn turf van 800 bladzijden.

De kritiek hierboven gaat ook enkel op voor wanneer hij het over oorlogsdoden heeft. Het aantal moorden, bijvoorbeeld, is wel normaal verdeeld. De geobserveerde daling ervan kan geen statistische illusie zijn, er is iets ten gronde veranderd.

Het artikel van Mark Buchanan handelt over deze paper van Taleb en Cirillo.

Een antwoord van Steven Pinker op de kritiek van Taleb en Cirillo vind je hier. Kort samengevat zegt Pinker dat Taleb een arrogante combattieve eikel is die The Better Angels Of Our Nature bewust verkeerd voorstelt. Ik kan Pinker daarin geen ongelijk geven.

De cijfers over oorlogsdoden in de laatste 70 jaar komen van The Human Security Report Project.