Deze bijdrage is mede een directe reactie op de bijdragen van Thijs Bol en Lex Borghans. Hoewel ik het lang niet op alle punten met hen eens ben, geven zij beiden een goed voorbeeld hoe onder wetenschappers gediscussieerd behoort te worden.
Ik geef hieronder elf observaties met betrekking tot het meten van kwaliteit van scholen.
- De taak van de wetenschap is niet uitsluitend mooie wetenschappelijke artikelen of boeken te schrijven. De taak van de wetenschap is ook ten dienste van de samenleving te zijn: dat staat zowel in de wet en wordt in bijna alle promotieformules herhaald. Het berekenen van toegevoegde waarde met behulp van de beschikbare administratieve data kan zo’n vorm van maatschappelijke dienstverlening door een wetenschapper zijn. Bij een dergelijke dienstverlening door de wetenschap moet het instrument voor de meting van toegevoegde waarde door goedwillende en normaal onderlegde personen nog te begrijpen zijn. Er moeten dus bij maatschappelijke dienstverlening door wetenschappers andere criteria toegepast worden dan die voor een artikel in een peer-reviewed wetenschappelijk tijdschrift.
- Er is weinig twijfel dat de cito score een redelijke voorspeller van bereikt onderwijsniveau is (en ook van het latere beroep). Het is dus niet alleen maar een momentopname, zoals velen zonder nader bewijs beweren. Dat betekent niet dat het bereikte onderwijsniveau goed voorspeld kan worden door een cito score. De verklarende variantie is hoogstens 40% en dus bij 60% van de leerlingen voorspelt de cito score niet precies het eindniveau. Maar andere meetinstrumenten (IQ test, motivatie-test, etc.) hebben zeker geen hogere voorspellende kracht. Dat ligt niet zozeer aan die meetinstrumenten, maar aan de wisselvalligheid en toevalligheid van het menselijk leven (bijvoorbeeld scheiding door ouders). Alleen het advies van de basisschool heeft nog een iets hogere voorspellende waarde dan de cito score. Dat komt omdat de leraar impliciet rekening houdt met die wisselvalligheid en dus de extra hulpbronnen van de leerling laat meewegen in het advies. Dat betekent dat leerlingen met hoger opgeleide, niet-gescheiden ouders een hoger advies krijgen, ook als zij dezelfde cito (of IQ) score hebben. De objectieve toets is daarom een eerlijker indicator van het eindniveau van basisschool dan het advies van de leerkracht.
- De toegepaste waarde van scholen is geen uitvinding van mij, maar een centraal begrip in de onderwijswetenschappen. De vraag daarbij is: “welke verschillen in uitkomsten van schoolprestaties zijn er als men rekening houdt met verschillen tussen de leerlingen in die scholen?” De vraag is niet: “met welke leerling en schoolkenmerken kunnen onderwijsprestaties verklaard worden?” De laatste vraag is legitiem, maar is bij de vaststelling van toegevoegde waarde niet aan de orde. Een standaard werk op het gebied van toegepaste waarde en de effecten van schoolkenmerken is: Scheerens, J. and Bosker, R. (1997). The Foundations of Educational Effectiveness. Kidlington/New York/Toyko: Pergamon. Ook is er een apart tijdschrift aan gewijd: School Effectiveness and School Improvement.
- Door de postcode van de leerlingen te koppelen aan de status van die postcode (= het aandeel niet-werkende werkzoekenden; het aantal inkomens tot 2x modaal; het aandeel minimuminkomens; het aandeel inkomens meer dan 2x modaal; het aandeel niet-westerse allochtonen; aandeel hoogopgeleiden) en bij berekening van de toegevoegde waarde van de school daarmee rekening te houden, hoop ik de cito scores te corrigeren voor de verschillen tussen de leerlingkenmerken van scholen en het impliciete aanname beleid van de scholen. Ook betrek ik de gewichten van de leerlingen bij deze correctie (indicatoren van laaggeschoolde ouders) en de etnische herkomst van de leerlingen (zie tabel 4 toelichting). Effecten van opleidings- en inkomstenniveau van de ouders en financiële bijdragen zijn daarmee redelijk gedekt zijn, maar zeker niet perfect. Selectie op leerstoornissen en andere gedragsproblemen van leerlingen wordt daar bijvoorbeeld niet door gedekt. Maar er zijn geen indicatoren daarvan beschikbaar, die het beter zouden kunnen doen.
- Een kritiekpunt van Thijs Bol klopt niet. Hij zegt namelijk: “het valt op dat vooral hoge sociaal-economische status erg matig gemeten wordt, alleen als de status van de buurt (uitgedrukt als 4-cijferige postcode). Maar mensen die in een bepaalde buurt wonen hoeven natuurlijk helemaal niet naar een basisschool in die buurt te gaan.” Maar ik gebruik de gemiddelde status van alle postcodes waar de leerlingen wonen, en niet de postcode van de school. Bovendien is een verklaarde variantie van 35% (tabel 2 toelichting) zo laag nog niet in vergelijking met de gebruikelijke verklaarde variantie.
- Ik deel de zorg van Thijs Bol dat de bovenkant van de samenleving met de beschikbare bevolkingsdimensie uit de Leefbaarheid monitor onvoldoende gemeten wordt. Beleidsmakers en daardoor ook sociologen zijn ten onrechte alleen in de onderkant van de samenleving geïnteresseerd (zo beperkt de SCP-buurtenstatus zich alleen tot variantie tussen achterstandswijken en behandelt de overige wijken als homogeen). Het is inderdaad een veeg teken dat scholen in de gemeenten Bussum, Blaricum, Wassenaar en Ouder-Amstel de hoogste gemiddelde toegevoegde waarde hebben (tabel 9 toelichting). Maar dat hoeft niet te wijzen op ongemeten schoolcompositie of de ontoereikendheid van de SES-meting. Het kan ook komen doordat deze scholen in goed bestuurde gemeenten liggen (mede dankzij de hoge opleiding van de burgers), waarbij bestuurders extra voorzichtig zijn om met het onderwijs rare dingen uit te halen. Kortom, ik deel het wantrouwen van Thijs Bol tegen de Bussum, Blaricum, Wassenaar en Ouder-Amstel uitkomst, maar ik zoek de verklaring elders.De lijst van de gemeenten met de scholen met de laagste toegevoegde waarde (tabel 9 toelichting) steunt Thijs Bols verklaring van ongemeten schoolcompositie of ontoereikendheid van de SES meting overigens niet. De genoemde gemeenten zijn niet de armste gemeenten, want je zou eerder gemeenten in Oost-Groningen of de Friese Wouden verwachten. Daarentegen zijn het Noord-Hollandse gemeenten, slaapgemeenten in de noordelijke Randstad zoals Purmerend, Heerhugowaard, Zijpe, Beverwijk, Langedijk en Alkmaar, waar scholen gemiddeld de laagste toegevoegde waarde hebben. Ik heb daarvoor geen verklaring, maar dit wijst niet op ontoereikendheid van de SES-meting. Ook scholen op de drie waddeneilanden (Texel, Terschelling en Schiermonnikoog) hebben gemiddeld de laagste toegevoegde waarde. Dit zou een compositie effect kunnen zijn: de laatste twee Waddeneilanden hebben op die eilanden alleen vmbo onderwijs en de betrokken basisscholen mikken daar in hoofdzaak op (en dus daardoor onderpresteren).Tenslotte, de verschillen tussen de gemiddelde toegevoegde waarde van de scholen in de vier grote gemeenten (tabel 9 toelichting) steunen de ongemeten compositie verklaring ook niet. Drie van de vier grote gemeenten scoren ongeveer even hoog: iets boven het gemiddelde (0.35). Alleen de gemeente Amsterdam (inclusief Zuid-Oost) scoort flink hoger. Zou het stringente beleid van Asscher, die steeds op het belang van goede cito scores hamerde en die al veel vroeger voor Amsterdam openbaar maakte, niet een betere verklaring zijn dan ongemeten schoolcompositie?
- Het is jammer dat Lex Borghans in zijn bijdrage geen indicatie geeft van de feitelijke impact van zijn methodische bezwaren. Nu kunnen mensen te gemakkelijk in zijn commentaar lezen dat er van de uitkomsten helemaal niets van klopt. De ene poging van Thijs Bol om een beter model te maken laat zien dat een ander model niet automatisch leidt tot een andere uitkomst.
- Terecht zegt Lex Borghans in het slot van zijn stuk dat ik creatieve oplossingen heb moeten bedenken om het gebrek aan goede gegevens te compenseren. Ik heb daarbij de afweging gemaakt dat suboptimaal vastgestelde toegevoegde waarde beter is dan een publicatie van alleen ruwe scores. En dat laatste was gebeurd, als niemand RTL had willen helpen bij de berekening. Media (ongeacht schrijvend of op tv) hebben niet de capaciteit in huis om zonder hulp van buiten toegepaste waardes te berekenen. Ook hebben zij daarvoor niet de financiële middelen. Engeland is een beste voorbeeld van wat er gebeurt als wetenschappers niet bereid zijn te helpen, maar net als Thijs Bol zeggen: of helemaal goed of niet. Maar toen de Engelse wetenschappers eindelijk bereid waren mee te werken, was er al een traditie van publiceren van ruwe scores ontstaan en konden zij dat niet meer veranderen.
- Met het publiceren van resultaten over scholen in het Nederlandse voortgezet onderwijs in 1997 is het net zo gegaan. Door gelijk bij de eerste publicatie in te zetten op toegevoegde waarde in plaats van absolute scores (de meting van toegevoegde waarde was toen nog veel meer suboptimaal dan nu; ik had alleen het % allochtonen als indicator van sociaal milieu van de ouders; de vrijgegeven gegevens waren niet uitgesplitst naar de verschillende vestigingen binnen een school) zijn wij in Nederland gespaard gebleven voor ranglijsten, die alleen gebaseerd zijn op absolute scores. Daarom zijn de gebruikelijke verwijzingen naar Engeland over de negatieve gevolgen van het publiceren van onderwijsresultaten voor Nederland misplaatst: daar gaat het om absolute scores, niet om toegevoegde waarde.
- De onderwijsinspectie meet veel minder scherp de toegevoegde waarde in hun rapporten (alleen de leerling-gewichten; geen status of etnische herkomst). Bovendien betrekt de inspectie in haar oordeel allerlei procesaspecten, die misschien wel belangrijk zijn, maar die ook de feitelijke opbrengst van scholen verhullen. Daardoor kunnen scholen met een positieve toevoegde waarde toch volgens de inspectie zwak zijn (een voorbeeld).
- De minister heeft alleen de scores van de testen voor 2010, 2011 en 2012 vrijgegeven. Door het juridisch verweer van de scholen zijn de meest recente gegevens (2013) nog niet vrijgegeven. RTL of ik hebben zelf geen enkel getal verzameld. De gegevens komen rechtstreeks van het ministerie van OC&W en ze zijn aangeleverd door de scholen zelf in het kader van het normale verantwoordingsproces van de scholen voor de besteding van hun geld. Fouten in de gegevens zijn de schuld van verantwoordelijke autoriteiten of scholen en dienen daarom ook door hen hersteld te worden.
Tom van der Meer zegt
Bedankt voor deze uitvoerige reactie en beschouwing.
Een belangrijk dilemma vind ik het door Dronkers meermalen aangehaalde vraagstuk of een gedeeltelijke meting van ’toegevoegde waarde’ inderdaad beter is dan de ruwe ranglijst. Met andere woorden: moeten wetenschappers meewerken aan zulke projecten?
Dronkers verdedigt hier de stelling dat “suboptimaal vastgestelde toegevoegde waarde beter is dan een publicatie van alleen ruwe scores”. Ik ben het daar niet mee eens.
Enerzijds is die toegevoegde waarde in absolute maar ook in relatieve zin blijkbaar gevoelig gebleken voor de modelschatting (juiste controle-variabelen, vermeende lineariteit van de effecten). Anderzijds is de RTL-ranglijst nu wel groots aangekondigd als schoolkwaliteit, terwijl daar dus vele haken en ogen aan zitten. De discussie is nu moeilijk, doordat de ranglijst een halffabricaat is. Dat de toegevoegde waarde niet goed wordt gemeten, is niet alleen een technische vraag (betere informatie nodig van overheid, roept RTL), maar voor veel scholen wel een praktische realiteit. Zie oa het voorbeeld van Thijs Bol. We kunnen er bovendien van uitgaan dat de meeste lezers/kijkers niet de onderzoeksverantwoording gaan lezen, wanneer ze de tool van RTL gebruiken.
Nu zou dit allemaal vooral een academische discussie zijn, als we weten dat het onvolledige model de werkelijke ’toegevoegde waarde’ redelijk goed benadert.
Ik zou, zeker voor kleine scholen en kleine typen scholen, niet durven beweren dat het huidige model zo goed werkt, dat de RTL-ranglijst inderdaad veel van hun toegevoegde waarde juist oppikt. Door de uitgangspositie (en dus toegevoegde waarde) van individuele scholen te baseren op een algemeen regressiemodel dat groepsscores voorspelt, zullen kleine typen en kleine scholen al snel een relatief radicale score krijgen.
Jan Tishauser zegt
Eerlijk gezegd ben ik niet zo onder de indruk van deze verdediging van Jaap Dronkers.
Ronduit grappig vind ik zijn opmerking:
“Alleen het advies van de basisschool heeft nog een iets hogere voorspellende waarde dan de cito score. Dat komt omdat de leraar impliciet rekening houdt met die wisselvalligheid en dus de extra hulpbronnen van de leerling laat meewegen in het advies. Dat betekent dat leerlingen met hoger opgeleide, niet-gescheiden ouders een hoger advies krijgen, ook als zij dezelfde cito (of IQ) score hebben. De objectieve toets is daarom een eerlijker indicator van het eindniveau van basisschool dan het advies van de leerkracht.”
Wat hij hier zegt is, dat de leerkracht controleert voor de SES. Precies wat hij ook probeert te doen. Alleen de leerkracht doet dat “op gevoel” en bereikt daar een beter voorspellend resultaat mee dan alle andere methodes. Waarom dan de cito (na berekening toegevoegde waarde van Dronkers) een eerlijker indicator van het eindniveau is dan het advies van de basisschool, ontgaat mij.
De methodische kern van zijn betoog is te vinden in de alinea, die begint met de woorden “Ik deel de zorg van Thijs Bol”. Ik moet constateren, dat deze alinea nogal wat aannames en speculaties bevat. Het begint eigenlijk al met de mededeling, dat beleidsmakers en daardoor sociologen alleen geïnteresseerd zijn in de onderkant van de samenleving. Als voorbeeld haalt Dronkers de SCP buurtenstatus aan. Het zij zo, maar dat is verre van een bewijs omtrent de interesse van beleidsmakers en nog verder van een bewijs, dat sociologen zich in hun belangstelling laten leiden door de interesses van beleidsmakers.
De aanname, dat de kwaliteit van het bestuur een verklaring kan geven voor de hoge scores van Bussum, Blaricum, Wassenaar en Ouder-Amstel, komt mij onaannemelijk voor: de variantie in leeropbrengsten, die toegerekend kan worden aan de kwaliteit van het bestuur is daar gewoon veel te klein voor.
De speculatie omtrent de waddeneilanden komt mijook niet zo waarschijnlijk voor. Naar mijn mening speelt ook hier de SES een rol: op de waddeneilanden verdient men hoge inkomens, terwijl scholing minder belangrijk is voor maatschappelijk succes. Anders gezegd: de leerlingen op de waddeneilanden vinden, ondanks het gemiddeld hoge inkomen van hun ouders, schoolprestaties minder belangrijk dan de leerlingen in Wassenaar.
Dronkers vraagt zich af of de hogere scores in Amsterdam zijn toe te rekenen aan het beleid van Asscher. Dat komt mij onwaarschijnlijk voor, om dezelfde reden als de invloed van het bestuur in Wassenaar cs: de variantie in leeropbrengsten, die toegerekend kan worden aan het bestuur is gewoon te gering. Ik zou eerder kijken naar de selectiepolitiek van het VO in Amsterdam: die negeren massaal het schooladvies en richten zich vrijwel uitsluitend op de cito scores. Dit schept een incentive voor de scholen om op cito scores te gaan sturen: het vermaledijde “teaching to the test”.
Als ik alle speculaties, aannames en eigen opvattingen van Jaap Dronkers uit de tekst filter, dan blijft er niet veel overeind.
Op het moment, dat hij zijn uitkomsten zag, had Jaap Dronkers zelf nog eens kritisch zijn methode tegen het licht moeten houden en desnoods moeten besluiten om geen medewerking te verlenen aan het publiceren van de lijst. Het is niet de taak van de wetenschap om het publiek te misleiden.
Dick van der Wateren zegt
In deze discussie blijft de betrouwbaarheid van ’toegevoegde waarde’ enigszins onderbelicht. Voor mijn bijdrage aan het boek ‘Het Alternatief’ onder redactie van René Kneyber en Jelmer Evers heb ik zowel de methode Dronkers (voor het VO) als de berekening van toegevoegde waarde kritisch bekeken. In de VS is ‘value added assesment’ al langer een pijler van het onderwijsbeleid. Scholen en individuele docenten worden beoordeeld op de toegevoegde waarde van hun onderwijs en hun salaris, eventuele bonus en zelfs hun voortbestaan hangen ervan af. Toegevoegde waarde is een middel geworden om openbare scholen te sluiten, die op basis van de scores voor standaardtoetsen en daaruit berekende toegevoegde waarde bestempeld worden als ‘slechte scholen’.
Inmiddels worden er grote vraagtekens gezet bij de betrouwbaarheid van de methoden waarmee die toegevoegde waarde wordt berekend. Het is interessant dat juist de experts die deze methoden hebben ontwikkeld heel kritisch zijn over het beleidsmatige gebruik ervan. Daniel Koretz, auteur van ‘Measuring Up’, stelt dat beleidsmakers veel te zorgeloos doen over de effecten van toegevoegde waarde en dat er nog veel te weinig over bekend is om daarop verantwoord beleid te baseren. Een studie door collega’s van Koretz (geciteerd in ‘Het Alternatief’) stelt vast dat het bepalen van de toegevoegde waarde van een docent sterk afhankelijk is van het gebruikte model. 9 % van de leraren, die door de ene methode als beste worden beoordeeld, worden door een andere, even redelijke methode tot de slechtste gerekend.
Het lijkt erop dat onze overheid de zelfde rampzalige weg gaat volgen waar, als de tekenen niet bedriegen, de VS langzaam op terugkeert. Scholen en docenten vergelijken en afrekenen op basis van aanvechtbare rekenmodellen heeft daar inmiddels grote schade aangericht. Die weg moeten we niet inslaan. Wetenschappers hebben hierbij de opdracht de modellen, waarop het onderwijsbeleid is gebaseerd, kritisch tegen het licht te houden.
Jaap Dronkers zegt
Nog een paar korte reacties op sommige kritiekpunten hierboven:
– De parameters uit de OLS regressie, gebruikt voor de berekening van de toegevoegde waarde, verschillen nauwelijks voor kleine en grote scholen (van der Meer).
– een groter gewicht van de scholen met de hoogste status (het kwadraat van status) verbetert niet het model, want het is niet significant.
– Thijs Bol vindt wel significante effecten van de kwadraten van de leerlinggewichten (indicatoren voor het % laaggeschoolden ouders). Zijn (impliciete) verklaring van die twee termen is dat scholen ingespeeld raken op hoge percentages laag-geschoolde ouders. Deze impliciete verklaring is voor mij juist de reden die kwadratische termen niet op te nemen: zij indiceren geen leerling kenmerken meer, maar schoolkenmerken.
– Gegeven mijn kennis van de relevant gebleken leerling-kenmerken mis ik vooral het % leerlingen in eenoudergezinnen per school, omdat het opleidingsniveau en inkomensniveau van de ouders is geen goede proxy het kenmerk het % leerlingen in eenoudergezinnen per school (zie verder M. de Lange, J. Dronkers & M. Wolbers, 2011. “Eenoudergezinnen en onderwijsprestaties vanuit een vergelijkend perspectief: de invloed van het percentage eenoudergezinnen per school” pp. 189-202 in Goede bedoelingen in het onderwijs. Kansen en missers, redactie J. Dronkers. Amsterdam: Amsterdam University Press; http://www.eui.eu/Personal/Dronkers/articles/Lange2011.pdf).
– Ik deel het standpunt over het grote belang professioneel vertrouwen en ben een tegenstander van te veel toetsen. Maar een eindtoets (liefst zo breed mogelijk en goed afgenomen) per fase (basis, voortgezet) lijkt mij noodzakelijk om zowel meer gelijkheid als hogere prestaties in het onderwijs te bevorderen. Uit internationaal vergelijkend onderzoek blijkt dat dergelijke toets punten goed zijn voor het onderwijs (zie bv T. Bol, J. Witschge, H.G. van de Werfhorst & J. Dronkers. Curricular Tracking and Central Examinations: Counterbalancing the Impact of Social Background on Student Achievement in 36 Countries. AMCIS Working Paper 2013/1: http://www.eui.eu/Personal/Dronkers/English/AMCIS2013.pdf)
– Het is niet waar dat Finland die toetsen niet kent. Finland kent toelatingsexamens tot de universiteit, gecombineerd met quota voor het aantal studentenplaatsen per studierichting en universiteitsstad.
– De breedheid van het te toetsen eindniveau van het basisonderwijs is door het veld zelf versmald tot taal en rekenen. Wereld-orientatie is met opzet niet toegelaten tot de finale toets. De versmalling tot alleen taal en rekenen is dus niet het gevolg van de meting, maar een gevolg van de keuzen van het onderwijsveld.
SF zegt
Thijs en Jaap hebben samen gepubliceerd? Maakt deze discussie op het scherpst van de snede alleen maar interessanter wat mij betreft.
De kritiek op het begrip ’toegevoegde waarde’ blijft overigens nog wel staan. Hoewel het een verbetering is tov de ruwe score dient de waarde ervan niet geabsolutiseerd te worden.
Dit is tegelijkertijd ook een van de grootste nadelen van de scientifisering van de samenleving: uitstekende wetenschappelijke modellen worden contextarm in de praktijk gebracht en richten zo, ondanks (of juist dankzij) het wetenschappelijke sausje, onbedoeld schade aan.
André van Delft zegt
Ik krijg steeds meer waardering voor het werk van Dronkers, maar ik denk dat, als het in zijn mogelijkheden lag, hij meer had moeten waarschuwen voor de beperkingen van zijn resultaten. Nu heeft RTL er een vreselijk potje van gemaakt met alle publiciteit voor de toegevoegde waarde, zonder de absolute scores mee te nemen.
Er zijn meer kwantitatieve modellen die gigantisch veel maatschappelijke schade aanrichten. Een voorbeeld is de stress testen van banken. Door te vertrouwen op onbetrouwbare modellen, en vooral ook door vertrouwen te veinzen, is er veel te veel risico genomen, op kosten van belastingbetalers natuurlijk. We waren goedgelovig en mogen daar nu voor boeten.
Binnenkort komt er weer een klimaatalarmrapport uit van de IPCC. Volgens de klimaatmodellen zou de temperatuur door het CO2 broeikaseffect vreselijk stijgen, en er is in politieke paniek gigantisch veel geld uitgegeven om CO2 uitstoot tegen te gaan, hetgeen helemaal is mislukt. Maar terwijl de CO2 concentratie in de atmosfeer gewoon steeg, bleef de temperatuur de afgelopen 17 jaar steken. Erger nog, de gepubliceerde temperatuurreeksen blijken uit te gaan van gecorrigeerde data, in plaats van uit de ruwe data, en het lijkt erop dat ook de opwarming in de jaren 80 en 90 voor een groot deel uit die correctie komt.
Zie http://scienceandpublicpolicy.org/images/stories/papers/originals/frauds.pdf
Jaap Dronkers zegt
Ik ben nog een kritiek punt vergeten te bespreken, namelijk het punt dat Jan Tishauser grappig vond in mijn bijdrage. Zijn kritiek punt berust op een misverstand.
De leerling kenmerken die gebruikt worden bij de berekening van de toegevoegde waarde zijn bedoeld als proxies van het startniveau van de leerlingen van een school (daarom moeten er ook geen schoolkenmerken in de berekening van toegevoegde waarde meegenomen worden). Die proxies zijn nodig omdat wij het aanvangsniveau van de leerlingen in groep 1 niet kennen (ik ben tegen een landelijke meting van dat startniveau in groep 1, omdat de kosten daarvan veel groter zijn dan de baten). Het gebruik van achtergrond as proxy is dus iets geheel anders dan het feit dat leerkrachten bij hun advies ook de achtergronden van de leerlingen verdisconteren, naast het eindniveau van de leerlingen in groep 8. Het eerste is een middel om tot een eerlijke vergelijking van scholen te komen, het tweede is een uitdrukking van het ontstaan van sociale ongelijkheid in het onderwijs en de samenleving. Het grappige daaraan ontgaat mij.
Daniel Oberski zegt
Beste discussanten,
Hier (http://www.statslife.org.uk/opinion/947-the-perennial-problem-of-publishing-accurate-school-league-tables) nog een bijdrage aan deze discussie vanuit een land waar ze ook volop woedt: de UK. De UK statistics authority heeft zich hierin gemengd.
Vr gr Daniel
Jaap Dronkers zegt
Gezien het commentaar van Andre van Delft, Lex Borghals en Thijs Bol heb ik de toelichting bij mijn berekeningen (www.schoolcijferlijst.nl/basis/Toelichting.pdf) herschreven. Er zijn tabellen bij gekomen (over de stabiliteit van de toegevoegde waarde in de periode 2010-2012; lijsten van scholen met zowel een negatieve toegevoegde waarde als een lage ruwe score; een met leerling-aantal gewogen regressie). Maar belangrijker is nog dat ik duidelijker de beperkingen van mijn berekeningen aangeef (de nu best mogelijke, maar niet de best wenselijke) en de overwegingen bij de verschillende keuzen in de berekening.