Plots had vorige week iedereen een mening over statistiek. Wie beschrijvende statistiekjes met absolute percentages oplepelde, was een ophitser. Wie verklarende statistieken over achterliggende oorzaken besprak, was een wegkijker met heimelijke politieke bedoelingen. De discussie laaide op na een nieuw optreden in DWDD van historicus Leo Lucassen en commentator Sywert van Lienden over het verband tussen vluchtelingen en criminaliteit. De discussie werd vervolgens overgenomen op Twitter. Zelfs het wetenschappelijk bureau van GeenStijl wijdde er een bijdrage aan, die de onduidelijkheid alleen maar vergrootte door mechanismes en schijnverbanden op een hoop te gooien en te politiseren.
De hele discussie over de statistieken is een merkwaardige, verwarrende schijntegenstelling. Het laat vooral zien hoe gepolariseerd het vluchtelingendebat inmiddels is. Daarom zal ik in deze bijdrage de discussie wat ontrafelen. Hoewel het gaat om tamelijk basale statistieken is dat blijkbaar hard nodig.
De eerste les van vorige week was: gebruik alleen correcte statistieken en extrapoleer niet van tweede-generatie Antillianen naar vluchtelingen uit Syrië. Vandaag volgt de tweede les: creëer geen tegenstelling tussen beschrijvende en verklarende statistiek, maar gebruik beide. En politiseer het gebruik van statistiek niet.
Beschrijvende statistiek van criminele vluchtelingen
Er is één belangrijk argument waarom we de absolute percentages (over bijvoorbeeld het percentage vluchtelingen dat crimineel zou zijn) niet moeten ‘wegcijferen’. Dat argument is dat het niet uitmaakt of het niet uitmaakt of die criminaliteit komt door het overschot aan mannen van jonge leeftijd onder de groep vluchtelingen of door hun oorlogstrauma’s. Wat de oorzaken ook zijn, de ontvangende samenleving heeft simpelweg te maken met de instroom van een groep nieuwkomers die een hogere kans heeft om crimineel gedrag te vertonen. Dat de criminaliteit niet hoger is dan onder een groep Nederlanders met vergelijkbare kenmerken, zoals het waardevolle onderzoek van WODC, WRR, en SCP toont, maakt in principe niet uit voor de mensen die naast hen komen te wonen.
Toch is het van groot belang om voorbij deze beschrijvende statistieken en absolute percentages te kijken. Het klopt namelijk alleen maar in zoverre dat de oorzaken van criminaliteit statisch en niet context-afhankelijk zouden zijn. Hoe meer de oorzaken van criminaliteit zouden zijn ingegeven door de context waarin vluchtelingen leefden en leven, hoe minder je beschrijvende statistieken zou kunnen extrapoleren en hoe meer het mogelijk is om beleid te voeren om de oorzaken van criminaliteit weg te nemen. Evenzo geldt: hoe sterker criminaliteit een levensloop-traject kent (waar jongeren overheen groeien wanneer zij ouder worden en zich bijvoorbeeld settelen), hoe minder absoluut de beschrijvende statistieken zijn. Het zou de beschrijvende statistieken niet irrelevant maken, maar wel impliceren dat problemen tijdelijk zijn.
Kortom, alleen al om de beschrijvende statistieken te snappen hebben we verklarende statistieken nodig.
Verklarende statistiek naar de oorzaken van criminaliteit
Het belang van verklarende statistiek is evident: we willen begrijpen wat er achter die de samenhang tussen vluchtelingen en criminaliteit schuilgaat. Dat is niet alleen belangrijk voor beleidsmakers die hierdoor aanknopingspunten vinden om criminaliteit bestrijden. Ook gewone burgers die direct te maken krijgen met een AZC in hun omgeving hebben er wat aan de informatie dat eventuele problemen structureel of context-gebonden zijn.
Toch kan ook verklarende statistiek niet zonder de beschrijvende statistiek. Dat we weten waarom bepaalde groepen oververtegenwoordigd zijn in de criminaliteitscijfers, neemt het reële probleem op korte termijn niet weg. Een scherp onderscheid tussen schijnverbanden en verklarende mechanismes is van groot belang om werkelijk te begrijpen wat er schuilgaat achter de beschrijvende statistiek. De meeste verklarende analyses die voorbijkomen weten dat overigens zorgvuldig te scheiden.
Kortom, maak onderscheid tussen de volgende stadia in statistische analyses:
- Beschrijvende statistiek: zijn vluchtelingen oververtegenwoordigd in criminaliteitscijfers?
- Verklarende statistiek (schijnverbanden): zijn vluchtelingen oververtegenwoordigd in criminaliteitscijfers omdat zij vluchteling zijn (of bijvoorbeeld omdat zij eerder jonger en mannelijk zijn)?
- Verklarende statistiek (mechanismes): Als vluchtelingen oververtegenwoordigd zijn in criminaliteitscijfers omdat zij vluchteling zijn, waarom is dit dan het geval? Zitten hier bijvoorbeeld economische (slechte arbeidsmarktpositie) of culturele (religieuze) verklaringen achter?
Statistiek, geen politiek
De discussie van afgelopen weken is vooral treurig doordat de tegenstander vaak buiten het debat wordt geplaatst. Het meest voorkomende verwijt is dat verklarende statistiek per definitie politiek is. Dit verwijt kwam afgelopen week steeds weer terug; op tv, radio en internet. Verklarende statistiek zou een ‘politieke keuze’ zijn, een ‘goedpraat-pavlov’ met ‘wegpoetscorrecties’ in ‘politiek geladen modellen’.
Zulke uitspraken zijn even belachelijk als hypocriet. Zowel beschrijvende als verklarende statistieken zijn nodig, zeker in een tijdsgeest wanneer criminaliteit op voorhand gekoppeld wordt aan afkomst of cultuur. De controle-variabelen in verklarende statistiek (in de huidige gepolitiseerde discussie ook wel omschreven als ‘wegmasseren’) bestaan veelal uit achtergrondkenmerken (als leeftijd, geslacht) en omgevingsvariabelen (als woonomgeving), die proberen rekening te houden met schijnverbanden. Veel van de keuzes zijn niet politiek, maar wel politiek relevant.
Bovendien, wie werkelijk gelooft dat de eigen statistiek de feiten biedt en de analyses van de ander niet, heeft een bord voor de kop. Als de keuze voor verklarende statistiek inherent politiek is, is de keuze voor beschrijvende statistiek dat evenzeer. Beschrijvende statistieken hebben pas zin als je weet wat ze betekenen.
arjan zegt
En nog steeds dezelfde truc al 40 jaar lang. ‘Je moet de criminaliteitscijfers van de immigranten vergelijken met een vergelijkbare groep Nederlanders’.
Daar staat niets anders dan. Immigranten zijn net zo crimineel als criminelen in Nederland. Dat is voor sommige blijkbaar een hele geruststelling.
Net als de voorspelling dat als ze bejaard zijn, dat ze dan minder crimineel zullen zijn. Lijkt mij ook weer een hele geruststelling voor de slachtoffers. Maar hun criminele competenties zullen ze dan wel op hun nakomelingen hebben overgedragen. Maar gelukkig die raken uiteindelijk ook bejaard. Enz.
Tom van der Meer zegt
Dat is precies waarom het stuk beschrijft dat je beide moet doen: De absolute cijfers (beschrijvende statistieken) én de oorzakelijke analyse (verklarende statistiek). Ik kies niet voor het een of voor de ander, maar pleit voor beide. Beide zijn relevant en legitiem, vooral in samenhang. Pas dan kan je goede beleidskeuzes maken. Wat die keuzes zijn, dat is aan de kiezer en beleidsmaker. Maar het ontkennen dat beschrijvende statistiek of verklarende statistiek in dit geval relevant zijn, is onzinnig.
Dirk Nieuwland zegt
Uit het verhaal van Tom vd Meer begrijp ik dat de hoogste criminaliteits cijfers samenhangen met jonge mannen, onafhankelijk van hun nationaliteit, maar vooral afhankelijk van hun leefomgeving en achtergrond. Als er echter bij immigranten relatief veel mensen met deze achtergrond zitten, dan is de kans op crimineel gedrag in die groep navenant hoog. Ze (de criminelen) kunnen het dus eigenlijk niet helpen, ze zijn het slachtoffer van statistieken.