Eerder ging Jaap hier in discussie met UvA-socioloog Thijs Bol over de ranglijsten van basisscholen die RTL Nieuws in samenwerking met Jaap heeft gepubliceerd. Deze bijdrage betreft de schoolcijfers voor het voortgezet onderwijs.
Deze bijdrage is een reactie op de blog van Wouter van Joolingen, waarin hij kanttekeningen plaatst bij mijn wijze van berekenen van cijfers voor scholen, waarmee ik in 1997 begonnen ben (zie hier en het boek Het oog der natie: scholen op rapport. Standaarden voor de publicatie van schoolprestaties[i], dat een overzicht geeft van de debatten over het publiceren van schoolkwaliteit na 1997). Ik loop in deze bijdrage zijn belangrijkste kanttekeningen langs. Daaruit zal blijken dat wij het op een aantal punten niet eens zijn, maar ik ben Wouter van Joolingen dankbaar voor het lezen van mijn toelichting en zijn geregelde wijze van oppositie. Dat vormt op internet helaas eerder de uitzondering dan de regel.
Tellen alleen cijfers?
Wouter van Joolingen schrijft dat “voor mij het enige doel van een school is om zoveel mogelijk leerlingen met zo hoog mogelijke cijfers te laten slagen”. Daarmee doet hij onrecht aan het doel van mijn berekeningen en mijn aanpak.
Het belangrijkste onderdeel van het cijfer voor scholen meet de minimum kwaliteit van scholen niet met het hoogste cijfer op het eindexamen bij een school. Integendeel: ik meet het aantal eindexamenvakken waarop het merendeel van de geslaagde leerlingen een te laag cijfer heeft. Dat aantal vakken met een gemiddeld cijfer lager dan 5,9 vormt mijn enige criterium voor de minimum kwaliteit van de school en wordt in mijn berekening niet gecompenseerd door de hoge cijfers voor andere vakken. Hoge cijfers spelen dus, in tegenstelling tot wat Wouter van Joolingen beweert, geen centrale rol in mijn berekening. Het zijn juist de lage cijfers die bij mij de hoofdrol spelen.
Eindexamens staan centraal
Waarom staan dat eindexamen zo centraal in mijn berekening? Dat is het enige moment in het voortgezet onderwijs, waarop het niveau van de afstuderende leerlingen op een vergelijkbare manier nationaal wordt gecontroleerd. Zo wordt voorkomen dat door scholen onvergelijkbare diploma’s worden uitgereikt. Dat eindexamen is een belangrijk ankerpunt in het Nederlandse onderwijsbestel, omdat het bijvoorbeeld toelatingsexamens voor vervolgstudies overbodig maakt. Uiteraard weet ik ook wel dat de vergelijkbaarheid van examens tussen scholen en over jaren niet perfect is, maar het is wel de beste maatstaf die wij hebben. Alternatieven zoals intervisie tussen docenten en scholen lijken mooi, maar op termijn ontstaan dan er grote kwaliteitsverschillen tussen scholen en regio’s. Uit onderzoek[ii] blijkt steeds opnieuw weer hoe belangrijk eindexamens zijn voor het niveau van de afgestudeerden en voor het tegengaan van ongelijkheid in het onderwijs.[iii]
De regels, die de politiek heeft gemaakt voor de minimumkwaliteit van afgestudeerden, pas ik in mijn berekening ook toe op scholen. Dat is een noodgreep, omdat er nergens in Nederland een duidelijke en openbare set criteria bestaat voor de kwaliteit van scholen.[iv] De inhoud van het eindexamen is daardoor het enige vaste punt dat publiek beschikbaar is. Voor het slagen van leerlingen telt het aantal onvoldoende (kern)vakken, niet het gemiddelde cijfer. Er zijn drie kernvakken, waarvan maar één onvoldoende mag zijn. Ik pas de zelfde regel op scholen toe. Alle eindexamenvakken tellen bij mijn berekening mee, behalve de allerkleinste (Fries, Russisch, Arabisch, Turks).
Sociale vaardigheden
Ik hoop dat er op scholen meer geleerd wordt dan alleen de eindexamenvakken. Sociale vaardigheden en organisatievaardigheden[v] kunnen daarvan voorbeelden zijn, maar er is geen enkele poging om de mate waarin dat gebeurt vast te stellen. Noch in het eindexamen, noch op andere momenten worden leerlingen daarop beoordeeld. Zelfs in Nederlandse wetenschappelijke databestanden (zoals VOCL) worden sociale en organisatievaardigheden van leerlingen niet gemeten, want de meting van deze vaardigheden is tamelijk ingewikkeld en politiek omstreden.
Het lijkt er op dat het leren van sociale en organisatievaardigheden op scholen alleen wordt aangeprezen in hooggestemde toespraken door politici en schoolbestuurders en in reclames van scholen, maar in de dagelijkse praktijk van het Nederlands onderwijs wordt het genegeerd. Het is dus onterecht mij te verwijten het niet opgenomen te hebben in mijn berekening: de gegevens ontbreken en er is geen serieuze wil daarover systematische informatie te verzamelen. Zodra die gegevens wel beschikbaar zijn, zal ik ze onmiddellijk verwerken in mijn berekeningen.
Wouter van Joolingen merkt terecht op dat mijn berekeningen erg gevoelig zijn voor cijfers rond de grens van 5,899. Maar diezelfde gevoeligheid voor cijfers rond de grens is er bij de beslissing van het al dan niet halen van het diploma door de afzonderlijke leerling. Die gevoeligheid geldt voor elke grens die men stelt, vanaf het promille alcohol in het bloed bij autorijders tot de leeftijdsgrens bij toelating tot het basisonderwijs. Die gevoeligheid is dus niets speciaals van mijn aanpak, maar eerder inherent aan het vaststellen van een grens tussen voldoende en onvoldoende.
Het cijfer dat uit mijn berekening voortvloeit is dus juist wel een schoolcijfer: er is een duidelijke onvoldoende grens (5) en je kunt erboven of eronder uitkomen, gegeven het aantal onvoldoende vakken. Het argument van Wouter van Joolingen dat het geen continue schaal is omdat een 6- of 7,3 onmogelijk is, is onzin. Een continue schaal behoeft geen gebroken getallen te bevatten om toch continue te zijn.
Toegevoegde waarde
Wouter van Joolingen heeft gelijk dat de verklaarde variantie van het bovenbouwrendement op grond van leerlingkenmerken niet hoog is (tabel 6 van mijn toelichting). Toevoeging van schoolkenmerken zoals percentages bevoegde en goedgeschoolde leerkrachten[vi] kan zonder twijfel die verklaarde variantie verder verhogen, maar dergelijke schoolkenmerken horen niet thuis in een berekening van toegevoegde waarde. Bij de berekening van toegevoegde waarde gaat het immers om scholen te vergelijken met dezelfde leerlingpopulatie, niet om scholen met dezelfde schoolkenmerken te vergelijken.
Wouter van Joolingen merkt terecht op dat de toegevoegde waarde van scholen niet erg stabiel is. Dit is geen kenmerk van mijn berekening, maar van scholen. Vaak zijn zij niet meer dan een federatie van secties en docenten en worden ze niet sterk centraal gestuurd. Die losse organisatiestructuur hoeft niet erg te zijn en kan zelfs de kwaliteit ten goede komen, maar het betekent wel dat toevalligheden (ruzie; een plotseling groot verloop) een grote rol in de kwaliteitsverschillen tussen scholen spelen.[vii] Deze zwakke centrale organisatie van scholen verklaart ook waarom de samenhang tussen de schoolcijfers van het ene jaar niet sterk samenhangen met die van het jaar daarop, vooral voor VMBO-k en VMBO-b[viii] (tabel 11 van de toelichting). Ook de samenhang tussen de schoolcijfers van verschillende schooltypen op dezelfde locatie is niet hoog (tabel 12 van de toelichting), met name niet van weinig verwante schooltypen (zoals tussen VWO en VMBO-k of VMBO-b).
Het verschil tussen CE en SE[ix]
Uiteraard meet het schoolexamen niet hetzelfde als het centraal examen. Maar ook als zij verschillende aspecten van een vak meten, is het niet logisch dat de becijfering van die aspecten die in de schoolexamens aan de orde komen voor alle vakken gemiddeld altijd hoger is dan de becijfering van die aspecten die in de centrale examens aan de orde komen. Zelfs als men zou beweren dat op het schoolexamen de praktijk getoetst wordt en op het centraal examen altijd de theorie getoetst wordt, dan nog is het niet logisch dat de becijfering van die praktijk hoger moet uitvallen dan die van de theorie. Meestal is iets in de praktijk uitvoeren moeilijker dan in theorie (bijvoorbeeld een oorlog winnen).
Deze onbetrouwbaarheid van het cijfer voor het schoolexamen is mijn belangrijkste reden om het SE cijfer buiten beschouwing te laten. Ik heb er overigens al vaak op gewezen (ook in de toelichting boven tabel 8) dat het probleem niet is dat scholen met een groot SE-CE verschil te hoge SE cijfers geven, maar dat de CE cijfers op die scholen laag uitvallen. Ook heb ik laten zien dat gedurende de eerste 10 jaar van de 21ste eeuw het verschil tussen SE en CE cijfers steeds groter werd.[x]
Vervolgens gebruik ik in mijn berekening de door inspectie al erg lang geleden vastgestelde grenswaarde van 0.5 punten verschil tussen SE-CE. Uiteraard treedt dan weer de al gesignaleerde gevoeligheid van net boven of net onder de grens op, maar opnieuw is deze gevoeligheid geen gevolg van mijn aanpak, maar van het stellen van grenzen.
Tot slot
Het door mijn berekende schoolcijfer is uiteraard een inhoudelijke keuze. Je kunt er ook voor kiezen om andere keuzes te maken, zoals ik in de inleiding van de toelichting schrijf. Ik heb mij bij deze keuzes zoveel mogelijk laten leiden door politiek vastgestelde criteria (aantal onvoldoende vakken, kernvakken, toelaatbare verschil SE-CE cijfers). In plaats van abstract betogen dat het anders zou kunnen, is het vruchtbaarder te laten zien dat het ook echt anders kan. Dat zal nog moeilijk zijn door gebrek aan gegevens over alternatieve indicatoren (zie boven), maar ook omdat het niet zeker is dat scholen op de ene dimensie (zeg veiligheid) heel anders scoren dan op een andere dimensie (zeg geleerde kennis en vaardigheden).[xi]
Tenslotte maak ik geen ranglijstjes van scholen. Net als scholen doen met hun leerlingen, maak ik groepen van scholen die hetzelfde niveau bereiken. Geslaagde leerlingen op scholen die in een bepaald jaar een vijf of lager krijgen, hebben volgens democratisch overeengekomen criteria te weinig kennis en vaardigheden. Het lijkt mij erg nuttig voor ouders en beleidsmakers om dat te weten. Scholen kunnen het jaar daarop weer beter scoren, maar dat is gezien de positieve samenhangen tussen schoolcijfers bepaald niet zeker. Dit klemt te meer omdat de leerlingen met onvoldoende kennis en vaardigheden die later heel moeilijk kunnen inhalen en dus daarvan last ondervinden in vervolgopleiding en op de arbeidsmarkt.
[i] Onder redactie A. B. Dijkstra, S. Karsten, R. Veenstra & A. J. Visscher en gepubliceerd door Koninklijke van Gorcum. Assen (2001).
[ii] Zie bijvoorbeeld T. Bol, J. Witschge, H.G. van de Werfhorst & J. Dronkers. Curricular Tracking and Central Examinations: Counterbalancing the Impact of Social Background on Student Achievement in 36 Countries. AMCIS Working Paper 2013/1.
[iv] Het protocol dat de inspectie hanteert om zeer zwakke scholen vast te stellen voldoet niet aan de eisen van duidelijkheid en openbaarheid en de uitkomsten van de toepassing van dat protocol zijn nauwelijks te reconstrueren. Bovendien worden in dat protocol doelen en middelen op een hoop gegooid.
[v] Wouter van Joolingen noemde deze twee vaardigheden, maar mijn argument gaat ook op voor allerlei andere vaardigheden waarover men claimt dat scholen die zouden leren.
[vi] Praktisch is dit echter onmogelijk omdat een convenant tussen de VO-raad en de minister vastlegde dat dit niet meer centaal zou gebeuren, maar dat scholen deze gegevens zelf zouden publiceren, hetzij op hun website, hetzij in Vensters van Verantwoording. Het percentage scholen dat dit daadwerkelijk doet ligt laag en de kwaliteit van dat gegeven wordt door niets gegarandeerd.
[vii] Zie verder over dit onderwerp het klassieke werk, afkomstig uit Twente: Scheerens, J., en Bosker, R. (1997). The Foundations of Educational Effectiveness. Kidlington/New York/Toyko: Pergamon.
[viii] Een aanvullende verklaring voor deze lage samenhang bij VMBO-k en VMBO-b is dat in dit onderwijstype pas recent centrale examens zijn ingevoerd.
[ix] In deze paragraaf maak ik veel gebruik van tabellen en grafieken die ik op een landelijke AOB conferentie in 2012 presenteerde.
[x] M. de Lange & J. Dronkers. Hoe gelijkwaardig blijft het eindexamen tussen scholen? Discrepanties tussen de cijfers voor het schoolonderzoek en het centraal examen in het voortgezet onderwijs tussen 1998 en 2005. EUI working paper 2007/03.
[xi] Zie voor een poging meerdere dimensie te vergelijken: Dronkers, J. & M. F. Warnaar, 1999. ‘Ze leren er niks maar er is een waanzinnig goede sfeer op deze school‘. Over de samenhang tussen kwaliteiten van scholen. VBSchrift 25:7-16.
Bob Lagaaij zegt
Ik reageer op Dronkers, hoewel ik ,,algemeen” bedoel.
Beste wensen voor 2014, interessante site (blog) en zeker waard om ook komend jaar te volgen.
Het ga u allen goed!