zaterdag 7 mei 2016

Beoordelen bij LO - enquête deel 1

Beoordelen. Ik vind het maar lastig. Omdat het subjectief is bijvoorbeeld. Hoe we ons best ook doen, met niveaubeschrijvingen bijvoorbeeld, er blijft nogal wat te interpreteren. Dat is in sommige gevallen prima op te lossen, vooral bij meetbare onderdelen. Je kunt namelijk heel objectief een gelopen tijd, een gesprongen hoogte of geworpen afstand meten. Maar is die tijd, hoogte of afstand niet meer een resultaat van aanleg dan van wat er in de les geleerd is? Ik vind beoordelen ook complex. We willen leerlingen een eerlijk beeld geven van wat ze kunnen, maar ook of ze zijn vooruitgegaan, of ze zich hebben ingezet, of ze sportief waren, of ze anderen hebben geholpen, of ze altijd op tijd in de les waren, of ze enzovoort. In hoeverre is een cijfer dan nog een handige representatie? Maar, als belangrijkste, ik vind dat beoordelen regelmatig het leren, het plezier, het DOEL van bewegingsonderwijs in de weg staat. Bijvoorbeeld op dat moment dat ik een meisje (heel angstig bij het kastspringen, na vier lessen toch een wendsprongetje) omstandig sta uit te leggen hoe trots ze moet zijn op haar 6. Dat alles bij elkaar, was ik wel benieuwd hoe collega's dat aanpakken! Met dank aan de vele retweets van mijn oproep via twitter is mijn enquête hierover uiteindelijk 33 keer ingevuld. De enquête bestaat uit grofweg twee delen. In het eerste deel heb ik gevraagd naar het wat, wie, waarom van beoordelen en in het tweede deel heb ik gevraagd naar concrete voorbeelden. In dit blog een weergave en interpretatie van de resultaten van het eerste deel.

Respondenten
De enquête is door 33 mensen ingevuld. Het merendeel werkt op het vmbo (19), maar dat wordt door een aantal gecombineerd met het havo en vwo (8), het havo (1) en het mbo (1). De rest van het onderwijs lijkt ook vertegenwoordigd met leraren uit alleen het havo en vwo (6), het speciaal onderwijs (1), het praktijkonderwijs (2), het mbo (1) en het po (4). Uit onderstaande afbeelding blijkt dat alle academies vertegenwoordigd zijn. Eindhoven springt er uit, maar dat zal misschien te maken hebben met de retweets door verschillende Fontys accounts! Het nadeel van het verspreiden via Twitter en Facebook blijkt wellicht uit de vertegenwoordiging van de verschillende leeftijdsgroepen (of eigenlijk ervaringsgroepen). Het merendeel (19) is tot 10 jaar actief als docent LO, 13 docenten geven al tussen de 10 en 20 jaar LO. Gelukkig heeft er ook iemand gereageerd die al langer dan 20 jaar in het onderwijs zit (held!).


"Hebben jullie gezamenlijke afspraken over de beoordeling?"
Dit vind ik een interessante vraag in verband met de subjectiviteit van beoordelen bij ons vak. Kan ik er bij mezelf al niet vanuit gaan dat ik een leerling twee keer hetzelfde cijfer zou geven voor dezelfde prestatie, als ik er een andere docent naar laat kijken is de kans helemaal groot dat het iets anders wordt...

Het merendeel van de docenten (16) beoordeelt met behulp van vaste criteria. Een deel daarvan (6) combineert dat met afspraken over de situatie waarin getoetst wordt. De overige docenten hebben zich aardig verdeeld over de andere opties: 6 docenten geven aan afspraken te hebben over de toetssituatie, 3 docenten passen de beoordeling aan aan het niveau van de klas, bij 5 docenten hangt het heel erg van de docent af wat en hoe er getoetst wordt.

"Wat zijn in jouw les de functies van beoordelen?"
Deze vraag heb ik gesteld vanwege mijn gevoel dat beoordelen niet altijd per definitie gunstig is voor het leren en de ontwikkeling van leerlingen. Dat is niet alleen een gevoel van mij trouwens, dat stelt ook bijvoorbeeld Dominique Sluijsmans in haar artikel over duurzaam beoordelen (2008). Uit datzelfde artikel haal ik de indeling voor de antwoorden op deze vraag. Sluijsmans onderscheidt naast summatief beoordelen (functie: certificering en selectie) en formatief beoordelen (zinvolle informatie over prestaties om zo het leerpad verder vorm te kunnen geven) een derde functie. De functie van duurzaam beoordelen is het helpen vaardigheden te ontwikkelen waar een leerling nog het hele leven plezier van kan hebben (bijv. doelen stellen, zelfassessment). Om dat te versterken stelt Sluijsmans een ipsatief beoordelingsmodel voor, waarbij de prestaties van een leerling worden vergeleken met de eigen prestaties in de tijd en het uitgangspunt zijn voor nieuwe doelen.

Ik wilde de antwoorden indelen in summatief, formatief en ipsatief. Bij het bekijken van de antwoorden viel het al snel op dat een groot gedeelte niet in te delen was. Als het antwoord "feedback geven" is, ligt het nogal aan de manier waarop en waarom die feedback gegeven wordt wat de functie is. Datzelfde geldt voor een antwoord als "geven van een niveauindicatie". Wordt die indicatie gegeven als een cijfer voor een eindproduct of wordt deze gebruikt om een persoonlijk leerdoel te stellen? De functie van de niveauindicatie blijft onduidelijk. Andere reacties (3) die ik niet kan plaatsen hebben te maken met het gebruik van cijfers om leerlingen te motiveren: "Inzet bevorderen" bijvoorbeeld.

De vraag is door 30 respondenten beantwoord. Daarvan zijn 6 antwoorden in te delen als summatief beoordelen. Dit zijn antwoorden als "Eindproduct", "rapportcijfer produceren", "het geven van een niveauindicatie en daarmee een cijfer voor het rapport". Er is 1 antwoord formatief: "Formatief" (dat was makkelijk!). Er zijn ook 6 antwoorden in te delen als ipsatief. Dit zijn "Leerlingen bewust betrekken bij het proces om je leerdoel te halen" en "het vaststellen van de progressie van de individuele leerling".

"Wat wordt er beoordeeld?"
Dit vind ik een erg interessante vraag. Anders dan bij bijvoorbeeld wiskunde, worden er bij lichamelijke opvoeding zaken als inzet en werkhouding regelmatig meegenomen in de beoordeling (eigen ervaring). Dat maakt de beoordeling een stuk complexer. En subjectiever.

Op deze vraag konden meerdere antwoorden aangevinkt worden. Zoals in onderstaande grafiek te zien is, heeft het merendeel dat ook gedaan. Slechts 2 docenten beoordelen alleen op niveau van bewegen, de overige docenten (27) combineren dat met andere factoren óf laten het niveau van bewegen zelfs helemaal buiten de beoordeling (4). De factoren 'niveau van bewegen' en 'houding' komt het vaakst samen voor (25), gevolgd door de combinatie 'niveau van bewegen' en 'inzet' (23). Als 'overig' werden bijvoorbeeld 21st century skills en omgang met docent en medeleerlingen genoemd.


"Wie beoordeelt er?"
Deze vraag komt voort uit een aanname van mijzelf. Op de meeste scholen zal lichamelijke opvoeding gewoon met een cijfer op het rapport staan. Regelmatig tellen die cijfers mee in de determinatie (die vraag had ik eigenlijk ook nog willen stellen). Voor de docent een reden om de beoordeling zoveel mogelijk in eigen hand te houden. Gebeurt dat ook?

In onderstaande grafiek is te zien dat de docent duidelijk de grootste rol heeft bij de beoordeling.
In 18 gevallen is de docent de enige die beoordeelt. In de overige gevallen doet de docent dat samen met de leerling (4), met de leerling én medeleerling (6) of alleen samen met de medeleerling (3). Er is 1 docent die aangeeft zelf niet te beoordelen.


"Een beoordeling bestaat uit..."
Bij de vraag over het wat van de beoordeling valt uit de antwoorden af te leiden dat er veel beoordeeld wordt. Ik vind het zelf ondoenlijk om dat allemaal in één cijfer te vangen, maar hoe doen collega's dat?

Er zijn 19 docenten die de beoordeling weergeven in een cijfer. 6 docenten geven cijfers én (iets als) een O, V of G. 4 docenten laten het bij een O, V of G. 3 beoordelingen worden weergegeven middels een kruisjesrapport i.c.m. een geschreven deel, een niveauindicatie en een evaluatie van het persoonlijke doel. Er is 1 docent die geen oordeel geeft.

Discussie / conclusie
Met 33 respondenten kreeg ik eigenlijk meer dan ik in eerste instantie verwacht had. Het is natuurlijk bij lange na niet genoeg om een representatieve weergave te krijgen van de beoordelingspraktijk bij lichamelijke opvoeding, maar het geeft wel een idee. Het was wel mooi geweest als er veel meer antwoorden waren geweest, om bijvoorbeeld naar verschillen tussen de academies, leeftijdsgroepen of type onderwijs te kijken.

De antwoorden op de (m.i. de interessantste) vraag over de functie van beoordelen zijn eigenlijk onbruikbaar, omdat de vraag kennelijk niet goed is gesteld. Hier had ik waarschijnlijk beter een gesloten vraag van kunnen maken met een beschrijving van de verschillende functies. Wat vooral opvalt bij het wat van beoordelen is dat docenten lichamelijke opvoeding het inderdaad belangrijk vinden om naar meer te kijken dan het trucje alleen. Wat daarna opvalt is dat het toch vooral de docent is die de beoordeling doet, ondanks dat er blijkbaar heel veel beoordeeld moet worden. Beoordelingen zijn uiteindelijk vrij klassiek, het leeuwendeel van de docenten vangt de prestaties, progressie, houding, inzet (etcetera) in een cijfer. Dat is heel begrijpelijk (want alles zelf doen kost tijd!), maar daar zit wat mij betreft een verbeterpunt in de beoordeling. Dominique Sluijsmans tipte mij via twitter het boekje 'Vijfen en Zessen' van Adriaan de Groot, met een foto van de volgende passage:
De cijferschaal heeft maar één dimensie. Heeft men, behalve de waardering voor geleverde prestaties, waarvoor een cijfer meestal in de eerste plaats wordt gebruikt, nog andere dingen aan de leerling of zijn/haar ouders mee te delen, dan zijn daar andere uitdrukkingsmiddelen voor. Vroeger waren sommige van die uitdrukkingsmiddelen ook in cijfervorm gestandaardiseerd: cijfers voor vlijt en gedrag. Maar er bestaat ook nu nog een heel goed uitdrukkingsmiddel voor wat men bovendien nog wil meedelen: de gewone Nederlandse taal (de Groot, 1966, p. 24).
 Prikkelend op z'n minst, ook nu nog! Maar dan... Hoe krijg je het wel voor elkaar om alles wat je de aandacht en het beoordelen waard vindt, met het juiste uitdrukkingsmiddel weer te geven? Een woordrapport? Ik geef het je te doen (al is het te doen, op het Leon van Gelder in Groningen schreven alle docenten voor alle leerlingen iets op het woordrapport). Nu even terug naar het duurzaam beoordelen zoals Sluijsmans dat beschreef, daar gaat het om vaardigheden waar een leerling de rest van het leven wat aan heeft. Vaardigheden als doelen stellen en zelfassessment. Toch doen we als docent wat dat betreft nog steeds het meeste werk. Zit daar 'em de kneep?

Hier laat ik het voorlopig even bij! Ik kan nog wel een tijd doorschrijven, maar dan ga ik voorbij aan het primaire doel: de resultaten van de enquête weergeven. In een volgend blog probeer ik een goede samenvatting te geven van de antwoorden op de 'praktijkvragen'. Hoe ga bij het beoordelen om met zwakke bewegers of juist excellente bewegers? Hoe beoordeel je zoiets als de duurloop?

Verder beloof ik iets te schrijven over de plannen voor mijn eigen praktijk én het onderzoek dat ik daarin ga doen.

In de opmerkingen bij de enquête werd duidelijk dat er ook het nodige gemist werd aan vragen. De antwoorden op één van de mooiste zou ik graag terugzien in de comments bij dit blog. Dus: Waar ben je tevreden over en zou je anderen aanbevelen? Hoe ben je tot die vorm van beoordelen gekomen?


Bronnen:
de Groot, A. D. (1966). Vijven en zessen. Groningen: Wolters.

Massink, M., van Mossel, G., Swinkels, E, & Witsiers, D. (2013). LO2 toetsvoorbeelden van praktische opdrachten. SLO. Verkregen van http://downloads.slo.nl/Repository/lo2-toetsvoorbeelden-van-praktische-opdrachten.pdf

Sluijsmans, D. (2008). Betrokken bij beoordelen. Intreerede. Hogeschool van Arnhem en Nijmegen, 6 juni 2008.






2 opmerkingen:

  1. Deze reactie ontving ik per mail:

    Instituut SHS adviseert de bij haar aangesloten onderwijsinstellingen te werken met een ipsatief beoordelingssysteem. Door een systematische
    aanpak wordt hiermee op een zo objectief mogelijke wijze veel inzicht verworven worden in de progressie van individuele leerlingen, maar ook in het prestatieniveau van de individuele leerling ten opzichte van de
    groep en in de effectiviteit van de gymnastiekles.

    De door Instituut SHS gepromote beoordelingsmethodiek start met een nulmeting. Deze nulmeting wordt afgenomen ten tijde van de inschrijving van de leerlingen, vaak in combinatie met een (sport)medisch onderzoek door de schoolarts en/of de toelatingsexamens. De nulmeting bestaat uit een aantal kwantificeerbare oefeningen zoals het aantal keer opdrukken, een coopertest en het scoren met een basketbal. Op deze wijze verzamelt de docent gegevens over het LO-niveau van de leerling waarmee de
    prestaties gedurende de schoolcarrière kunnen worden vergeleken. Door tijdens het schooljaar de test regelmatig te herhalen kan worden beoordeeld of de leerling ten opzichte van de voorafgaande test progressie heeft geboekt, op het zelfde niveau is blijven functioneren
    of slechter presteert. De nulmeting is vooral van belang voor de beoordeling aan het eind van het eerste trimester omdat het dan, zonder deze nulmeting, zou ontbreken aan data om de prestaties mee te vergelijken.

    Door per klas de prestaties van de individuele leerlingen op te tellen en te middelen wordt ook een beeld gevormd van het prestatieniveau per groep. Dit geeft een maatstaf aan de hand waarvan beoordeeld kan worden of individuele leerlingen achterblijven bij de groep of juist extra
    presteren ten opzichte van hun klasgenoten.

    Daarnaast geeft het groepsgemiddelde inzicht in de effectiviteit van de gymnastieklessen. Waar nodig kan de lesopbouw op basis van deze uitkomsten aangepast worden en kunnen bepaalde subdoelen extra benadrukt worden door daar meer aandacht aan te besteden bij de selectie van de
    oefeningen.

    BeantwoordenVerwijderen
    Reacties
    1. En mijn antwoord:

      Dank voor het invullen van de enquête en de uitgebreide toelichting via de mail. Wat ik nog niet helemaal snap: Heeft u de enquête ingevuld als docent lichamelijke opvoeding of als afgevaardigde van instituut SHS?

      Wat ik er nu verder van begrijp, is dat jullie vooral beoordelen op basis van kwantificeerbare oefeningen? Hoe doen jullie dat bijvoorbeeld met zaken gerelateerd aan spelinzicht? Vrijlopen, veldspel bij softbal, ...? Mooi dat jullie die gegevens ook gebruiken om naar de effectiviteit van de gymles te kijken.

      Waar ik vraagtekens bij heb is het afzetten van het individu tegen het gemiddelde van de klas. Als je als zwakke beweger in een sterke klas zit? Dan blijf je altijd achter bij het gemiddelde. Wat doet dat met je beoordeling?

      Verwijderen