Nakijken met AI? Het kan!

Docenten doen het vaak: tot diep in de nacht toetsen van leerlingen nakijken. Wij, Kars en Bas, studenten aan de Universiteit Utrecht, hebben een oplossing ontwikkeld. Nakijken, ondersteund met AI. Zo worden lange nachten korte sessies, met ook nog eens een beter resultaat. Lees hier hoe wij dit doen en hoe we omgaan met de potentiële risico's van AI-ondersteund nakijken.

De Aanleiding

Vraag je docenten wat ze het minst leuk vinden aan hun werk, dan komt één antwoord telkens terug: nakijken. En dat is niet verrassend. Nakijkwerk is repetitief, tijdrovend en niet altijd effectief. Leerlingen zijn vooral benieuwd naar hun cijfer, en zodra dat boven de magische grens van 5,5 ligt, verdwijnt de uitgebreide feedback vaak ongezien in de prullenbak. Daarnaast kost nakijken serieus veel tijd. Alleen al in het Nederlandse voortgezet onderwijs wordt er jaarlijks 17.000.000 uur aan corrigeren besteed! Inderdaad, dat zijn punten en geen komma’s, het gaat hier om 17 miljoen uur nakijken. Als je dat in je eentje moet doen ben je daar bijna 2000 jaar mee bezig. 

Ook wij liepen hier tegenaan.
Toen Kars voor de klas stond, merkte hij hoe hoog de werkdruk was. Lange dagen en stapels toetsen maakten het vrijwel onmogelijk om alle leerlingen van goede, persoonlijke feedback te voorzien. Bas zag hetzelfde gebeuren bij zijn huisgenoten, die in het onderwijs werkten. De nakijkstress liep zo hoog op dat Bas uiteindelijk zelf werd betaald om toetsen voor hen na te kijken!

Dat moet beter kunnen, vinden wij.
Met de inzet van AI kan nakijkwerk niet alleen sneller en efficiënter, maar ontstaat er ook ruimte voor meer waardevolle feedback. Minder werkdruk voor de docent en een beter resultaat voor de leerling dus!

Hoe?

Samen begonnen we onze reis van automatisch nakijken begin dit jaar. Tijdens de cursus Science Based Entrepreneurship aan de UU begonnen we met de probleemobservatie. Nakijken bleef maar terugkeren als een arbeidsintensief onderdeel van de docentenbaan. Zo is ToetsTester geboren.

ToetsTester verlaagt de werkdruk door toetsen gedeeltelijk automatisch na te kijken. Dit werkt voor digitale én handgeschreven toetsen. In tegenstelling tot bestaande systemen die zich beperken tot meerkeuzevragen, gebruikt ToetsTester kunstmatige intelligentie om ook complexe open antwoorden te analyseren. Met de vernieuwende technologie lukt het ons het handgeschreven antwoorden te herkennen, te lezen en deze vervolgens te vergelijken met het modelantwoord. Zo helpen we docenten tijd te besparen.

Voordelen

Wij geloven dat er, grofweg, drie redenen zijn om te toetsen: om te beoordelen, om te leren en om te differentiëren. ToetsTester ondersteunt alle drie deze pijlers

Beoordeling. Met ToetsTester hopen we die 17.000.000 uur aan beoordeling tenminste te halveren. Zo winnen we veel tijd, die besteed kan worden aan wat echt belangrijk is: goed onderwijs geven. Dit komt de docent en de leerling ten goede. Docenten houden meer tijd over en leerlingen ontvangen eerder hun beoordeling.

Leren. Daarnaast geeft ToetsTester uitgebreide, gepersonaliseerde, feedback. Waar de feedback op een normale toets vaak beperkt blijft tot een enkele zin en wat krulletjes en vinkjes, geeft ToetsTester uitgebreide feedback.  Zo leren leerlingen efficiënter én doelgerichter!

Differentiëren. Toetsen zijn ook bedoeld om te onderscheiden. Wat kan de klas al wel? En wat kunnen ze nog niet? Met behulp van AI genereert ToetsTester overzichtelijke rapportages die duidelijk maken welke onderwerpen al goed beheerst worden en welke onderdelen extra aandacht verdienen. Zo krijgen docenten praktische handvatten om hun lessen beter af te stemmen op de leerbehoeften van hun leerlingen.

Maar... Privacy?

Veel docenten vragen zich (terecht) af hoe het dan zit met privacy. Toetsen kunnen gevoelige data bevatten. Logischerwijs wil je liever niet dat deze data gebruikt wordt om AI modellen te trainen.

Daarnaast zijn er twijfels over de AI-Act. De AI-Act is nieuwe Europese wetgeving die komende jaren geïmplementeerd zal worden. Binnen deze wetgeving worden AI-systemen ingedeeld in verschillende categorieën van risico: onacceptabel, hoog, gelimiteerd en minimaal. AI in het onderwijs wordt aangemerkt als ‘hoog risico’, met als gevolg dat je aan strenge eisen moet voldoen.

Natuurlijk is het gooien van toetsen in ChatGPT en op een cijfer wachten om dit vervolgens direct te uploaden op Magister gevaarlijk en niet ethisch verantwoord. Echter, wanneer de AI ondersteunend werkt, zoals omschreven in ‘Overweging 53’ van de AI-act, dan is dit een veel minder groot risico. De ‘human-in-the-loop’ houden (lees: er moet een mens naar blijven kijken) is hier van belang. Net zoals we dat zien bij studenten, zullen ook docenten kritisch moeten blijven op het resultaat. Docenten moeten niet klakkeloos de scores van het model overnemen, maar ook de antwoorden controleren. Zo blijft de mens eindverantwoordelijk. 

AI kan hierin dus functioneren in een ondersteunende rol. Daarnaast wordt de toetsdata goed afgeschermd opgeslagen (in Europa) en blijft deze in handen van de docent, geheel in lijn met de privacy wetgeving. 

Wanneer voldaan wordt aan deze eisen, kan automatisch ondersteund nakijken een enorme bijdrage leveren aan het onderwijs. Het is zonde om de mogelijkheid links te laten liggen.

Pilots

"Holy shit" was de eerlijke reactie van één van de eerste ToetsTesters. De eerste mensen zijn dus erg blij met ToetsTester, wat super leuk is om te horen.

Momenteel zijn we op verschillende scholen in Nederland onze software aan het testen. Dagelijks wordt ons platform gebruikt om leerlingen in Nederland steeds een beetje sneller en beter feedback te geven.

Al deze docenten geven ons onwijs nuttige feedback en veel belangrijke inzichten. Zo wordt niet alleen het nakijkproces, maar ook ToetsTester dagelijks beter!

We zijn altijd op zoek naar enthousiaste mensen uit het onderwijs die met ons in gesprek willen. Lijkt het je dus tof om een keer ToetsTester uit te proberen? Of heb je een andere leuke samenwerking? Neem vooral contact met ons op via karstenbergeo@gmail.com!

Nakijken met AI - Bas en Kars

Auteur

Reacties

Dit artikel heeft 9 reacties

Reactie van Hollants, Peter

Mooi initiatief.
Misschien een idee voor de toekomst? Zoals je plagiaatscanners zoals die van Turitin in software kunt integreren zou je wellicht ook ToetsTester kunnen integreren (via api of LTI). Dan sla je heel wat vliegen in één klap want dat nakijken van open vragen en verslagen gebeurt daar uitsluitend met de hand.En met bezuinigingen en lerarentekorten op de loer zou dit een interessante optie kunnen zijn om te onderzoeken.

Als antwoord op door Hollants, Peter

Reactie van Berge, C.H. te…

Hi Peter, thanks voor je goede suggestie! We denken inderdaad na over integraties via API, zodat ToetsTester makkelijker in bestaande systemen ingepast kan worden. Het zou geweldig zijn als we docenten daarmee nog meer werk uit handen kunnen nemen.
Met het oog op de toenemende werkdruk en het lerarentekort lijkt ons dit zeker een richting om verder te verkennen. Mocht je hier ideeën over hebben of willen meedenken, dan horen we dat natuurlijk heel graag! Stuur gerust een mailtje :)

Als antwoord op door Berge, C.H. te…

Reactie van Hollants, Peter

Hoi Karst, aan goede ideëen geen gebrek, maar het moet dan wel gerealisseerd worden. Ik denk dat je dan beter contact kunt opnemen met de makers/leveranciers van die software zoals GradeWork, Onstage (Xebic) of TestVision (Teelen) om te kijken of men daar warm voor loopt.

Reactie van Hoen, AJM (Ad)

Hallo, op welke manier kan ik als HBO-docent een goede indruk krijgen van ToetsTester?

Reactie van Helma de Boer

Andere overweging: is het acceptabel om de toetsantwoordmodellen in AI op te voeren? Daar kan intellectueel eigendom op rusten van leveranciers.

Als antwoord op door Helma de Boer

Reactie van Berge, C.H. te…

Hi Helma, goede vraag! Ik ben benieuwd wat jij er van vind. Momenteel leggen we deze verantwoordelijkheid bij de docenten zelf. We slaan de modellen wel op (de docent moet er immers bij kunnen), maar dit blijft verbonden aan het account van de docent. Dit is dus voor niemand anders zichtbaar.

Mocht je het interessant vinden, laten we het je graag een keer zien. Stuur gerust een mailtje naar karstenbergeo@gmail.com, dan plannen we een demo in!

Reactie van Erwin de Beer

Ik heb wel mijn twijfels, vooral m.b.t. hoe te blijven voldoen aan de AI Act.
Bij de Hanze werkt momenteel een afstudeerder, student HBO Rechten, aan een onderzoek naar de implicaties van de AI Act voor AI gebruik in de Hanze (en daarmee vast ook in andere hogescholen ;-) Hij, David van Haren, zegt:

Laat ik vooropstellen dat een AI-systeem voor deze doeleinden zeker heel handig kan zijn binnen het onderwijs en ik geloof dat dit uiteindelijk positieve voordelen kan opleveren voor studenten als het op de juiste manier gebruikt wordt.

In het artikel wordt overweging 53 van de AI-verordening genoemd en daarin staat dat als een AI-systeem ondersteunend werkt dat het dan een veel minder groot risico oplevert. Hier kan sprake van zijn als het aan één of meer van de volgende voorwaarden is voldaan:

1. Het AI-systeem moet bedoeld zijn om enige procedurele taak uit te voeren.
2. Het AI-systeem moet bedoeld zijn om het resultaat te verbeteren van een eerder voltooide menselijke activiteit. Het AI-systeem voegt slechts een extra laag toe aan een menselijke activiteit.
3. Het AI-systeem moet bedoeld zijn om besluitvormingspatronen of afwijkingen van eerdere besluitvormingspatronen op te sporen. Het risico zou in dergelijke gevallen lager liggen omdat het AI-systeem wordt gebruikt na een eerdere afgeronde menselijke beoordeling en het niet de bedoeling is dat het AI-systeem deze vervangt of wijzigt zonder gedegen menselijke toetsing.
4. Het AI-systeem moet bedoeld zijn om een taak uit te voeren die slechts dient ter voorbereiding van een beoordeling die erop volgt.

Een AI-systeem zoals ToetsTester voldoet dan denk ik aan de vierde voorwaarde. Maar zoals Kars terecht al zegt, er moet een mens naar blijven kijken.

ToetsTester kan dus een toets beoordelen, maar het is dan erg van belang dat de docent daarna er zelf ook nog kritisch naar gaat kijken. Dit zou kunnen, alleen mocht ToetsTester na enige verloop van tijd naar behoren werken, schat ik de kans aanzienlijk hoog in dat docenten op een gegeven moment die laatste kritische blik overslaan. Dat levert dan wel de nodige risico’s op, want hoe controleer je dat bijvoorbeeld?

Ik geloof daarentegen wel dat een programma zoals deze veel veiliger is dan bijvoorbeeld ChatGPT. In het artikel wordt vermeld dat de data goed afgeschermd wordt opgeslagen en in handen blijft van de docent.

Concluderend, denk ik dat in dit geval ToetsTester iets waardevols kan zijn voor de toekomst, maar daarvoor moet er eerst nog wel kritisch naar gekeken worden door de personen die verstand hebben van AI, Privacy, etc.

Reactie van Bunk, J.H.C. (Jorn)

De mens blijft eindverantwoordelijk. Betalen voor software en nog steeds niet op kunnen vertrouwen... Klinkt als 'Human-as-a-shield' in plaats van 'Human-in-the-loop'.

Hoe maken we de software eindverantwoordelijk, maar wel met Human-in-the-loop?

Gerelateerde artikelen