“Studieplanen forteller hva lærerne gjør; eksamenssystemet forteller hva studentene gjør.” Denne uttalelsen fra en
erfaren lærer poengterer eksamens betydning. Hvis vi ønsker å ha kontroll over studiekvalitet i grunn- og
spesialistutdanningene, må vi kjenne målemetodene vi bruker. Når det gjelder medisinsk forskning og praksis krever vi
dokumentasjon av metoders reliabilitet og validitet - det vil si at observerte forskjeller skal være reelle, og
måleresultatene skal fortelle om det vi ønsker å måle. Mye tyder på at vi forholder oss mindre kritisk til eksamen som
instrument. Hva vet vi for eksempel om sammenhengen mellom eksamensresultater og senere yrkeskompetanse, og om våre
eksameners innvirkning på studieatferd og holdninger? Jeg tror dessverre at for de fleste av oss blir svaret “svært
lite”. Det finnes imidlertid nå omfattende forskning på de eksamensformene som vanligvis brukes ved medisinske skoler,
som kan hjelpe oss i fremtidige valg (1-3).
Eksamen har to ansikter. Det ene gjelder sertifisering, dvs. en formell test som forteller om kandidaten har nådd
målene for utdanningen. Det andre gjelder eksamenens påvirkning av arbeid og innlæringsmåte. Det er viktig å skille
mellom disse aspektene, fordi sterk betoning av det ene kan få konsekvenser for det andre.
Eksamen for sertifisering
Ideelt sett bør en sertifiseringseksamen ligge ved slutten av utdanningen og ha høy reliabilitet og validitet (dvs.
validitet i forhold til kompetanse som lege). Det er for så vidt uinteressant fra et sertifiseringssynspunkt hvordan
kandidaten har gjort det underveis - store kunnskaper i anatomi ved eksamen for fem år siden sier lite om situasjonen
når kunnskapene skal brukes. De store sertifiseringseksamener som brukes i USA har medført omfattende
eksamensforskning. Bare de formene som har meget høy reliabilitet, slipper gjennom nåløyet til å brukes ved National
Board-eksamen. Problemet med eksamener som intiutivt virker valide, som våre kliniske eksamener og skriftlige eksamener
av essaytypen, er at deres reliabilitet viser seg å være meget lav. Dette skyldes i hovedsak at de tester for smalt,
fordi en kandidats prestasjon på en oppgave/pasient i forbausende liten grad forutsier hvordan han gjør det på en
annen (1, 2). For å oppnå tilfredsstillende reliabilitet må for eksempel en klinisk eksamen omfatte mer enn ti
pasienter for hver student, mens en såkalt OSCE (objective structured clinical examination) må ha 10-20 stasjoner. Våre
eksameners validitet er da bare tilsynelatende, siden reliabilitet er en forutsetning for validitet. Selv om det er
mange gode argumenter for bruk av bestått/ikke bestått (4), reduserer det heller enn det øker eksameners reliabilitet
(5).
Vi er heldigvis ikke like opptatt av sertifiseringsaspektet i Norge som i USA. Kanskje bør vi da akseptere at våre
eksamener diskriminerer dårligere mellom gode og svake kandidater, hvis vi vet at de stimulerer til ønsket
studieatferd. Vi kan også anta at 10-30 eksamener i løpet av en studietid samlet gir et tilstrekkelig reliabelt
resultat. Det gjenstår likevel den ubehagelige kjensgjerning at vi tar beslutninger om studenters studieprogresjon -
ev. studieplass - på bakgrunn av enkelteksamener som kan ha meget lav reliabilitet. Dette medfører både at noen stoppes
på feil grunnlag og at noen slipper videre som skulle vært stoppet.
Eksamen som pedagogisk virkemiddel
Faren med ensidig fokusering på reliabilitet er åpenbar: eksamens sammenheng med det vi virkelig ønsker å måle kan
neglisjeres. Hva verre er, eksamensformens innvirkning på studieatferd kan være direkte negativ: “Assessment always
leads to learning of some kind, but so often it is not what we desire” (6). Eksamen kan belønne egenskaper som ikke er
ønskelige hos en lege (7).
Første prioritet må derfor gis til å finne eksamensformer som i alle fall ikke har skadevirkninger på studentenes
læring og personlige utvikling. Ideelt sett bør eksamen kreve en tilnærming lik den vi ønsker hos studentene i
studieperioden. Hvis for eksempel et kurs har praktisk arbeid som et viktig element, vil en rent skriftlig kurstest
medføre nedprioritering av dette arbeidet - uansett om det dreier seg om studenter eller spesialistkandidater.
Problemet med eksamen ved avslutningen av en studieenhet er at den er uegnet til å forbedre læringsprosessen.
Uansett eksamensform må vi derfor også arbeide med å bedre tilbakemelding underveis i studieperiodene.
Hva nå?
Det finnes neppe ideelle løsninger på problemene som er skissert foran. Det bør ikke forhindre at vi ser
fordomsfritt på om de eksamensformene som brukes innen medisinsk utdanning i Norge, tilfredsstiller krav til
sertifisering og virkning på studieatferd. Et alternativ til dagens skriftlige eksamener kan være de såkalte
progresjonstestene som nå brukes både ved Limburguniversitetet i Nederland og ved McMaster i Canada. De synes nemlig å
ivareta både tilbakemeldings- og kontrollbehov, uten å virke negativt styrende på studieatferd (5, 8).
Per Brodal