Vurdering av muntlige eksamensprestasjoner i høyere utdanning: En studie av interbedømmer reliabilitet ved eksamen i Etterforskning på Politihøgskolen
Abstract
I dette prosjektet undersøker jeg hvordan interne sensorer i emnet Etterforskning ved Politihøgskolen (PHS) vurderer muntlige eksamensprestasjoner. Emnet utgjør 18 studiepoeng og består av fem fag. Selv om det er et lovfestet krav at studentenes læringsutbytte skal prøves på en rettferdig og upartisk måte som sikrer utdanningskvaliteten, har vi lite kunnskap om hvordan muntlige eksamensprestasjoner vurderes på tvers av sensorer ved PHS. Det finnes også lite forskning om temaet, både nasjonalt og internasjonalt. Karakterer brukes i utstrakt grad i høyere utdanning, og fungerer som seleksjonsfiltre ved ansettelser. De kan ha stor betydning for den enkeltes studie- og jobbmuligheter, og for arbeidsgiveres mulighet til å sikre seg ønskede kandidater. Kunnskap om hvordan vi vurderer er dermed nødvendig for å kunne fatte kvalifiserte slutninger om utdanningskvaliteten.
Våren 2018 fikk jeg samtykke fra to studenter til å filme deres muntlige eksamensprestasjoner. Opptakene ble vist til 29 interne sensorer, som – ved å besvare spørsmål i et digitalt spørreskjema – vurderte og karaktersatte prestasjonene. I forlengelsen av de individuelle vurderingene gjennomførte jeg fire fokusgruppeintervjuer, hvert bestående av tre sensorer med ulik fagtilknytning, som til sammen utgjorde en eksamenskommisjon. I intervjuene ble kommisjonsmedlemmene bedt om å enes om en felles karakter, slik de ville gjort ved en reell eksamensgjennomføring.
Funnene viser at sensorene vurderer ulikt – i karakterer, begrunnelser, spørsmålsstilling og i bruken av kriterier. Mens noen har en holistisk tilnærming, er andre mer analytisk orientert. Mange baserer vurderingen på sitt profesjonelle skjønn og på implisitte kriterier, heller enn på eksplisitte kriterier. Karakterene varierer i spennet A til C/D for oppgave 1, og C/D til F for oppgave 2. Spennet er nesten like stort innad i samme fag som på tvers av fagene. Vurderingene gjøres som hovedregel med utgangspunkt i det faget sensor representerer, og kommisjonskarakteren synes å bli satt et sted midt imellom kommisjonsmedlemmenes individuelle vurderinger. Forhold ved kommunikasjonen – både i argumentasjon, innhold og rekkefølge – synes å ha betydning i samspillet når karakter skal settes. Begrunnelsene som karakteren bygger på kjennetegnes tidvis av å være lite utdypet. Dermed kan det være vanskelig å forstå hva som konkret var styrker og svakheter ved prestasjonen.
Funnene gir grunn til å rette større oppmerksomhet mot vurderingsfeltet for å sikre rettferdig, gyldig og pålitelig bedømming av studentenes kompetanser.
Description
Master i yrkespedagogikk