Validitet og reliabilitet er vanskelige ord både for medisinstudent og lege. Det har eit eller anna med om at ei prøve skal måle det ei prøve skal måle og at prøva måler det prøva skal måle meir eller mindre det samme kvar gong.
Som student i Oslo har eg hatt gleda av å ha Gjersvik i hudterminen. Eg har hatt stor sansen for hans pedagogiske tankegang og ynskje om å utdanne legar som tenker kritisk og kan vurdere mellom ulike og til dels motstridande funn. Eg opplever at han også har dette ynskje for evaluering av studentar også. Så langt er eg heilt enig. Eg trur også vi er einige om at eit viktig premiss for karakterdebatten er dette:
I kva grad fortel karakterar frå prøver om faktisk kunnskap, haldningar og ferdigheiter hos studenten? Og er dette kunnskap, haldningar og ferdigheiter folk som anset ser på som relevante for den jobben ein lege skal utføre.
Gjersvik ønsker at vi skal ha det litt meir "slik det er i utlandet".
Eg har det siste semesteret studert som ERASMUS-student i utlandet. Utlandet avdeling Innsbruck. Der har eg også hatt gleda av å ha ein del kontakt der med andre medisinstudentar frå rundt omkring i Europa. Det er ein klassikar blant utvekslingsstudentar å snakke og tulle litt om forskjellar om landa og universiteta våre. Det eg har opplevd som underlig påfallende er at det virkar å være særs stor skilnad i bedømming av studentar. Dette går både på type eksamnar, nivå og karaktersetting..
Ta den ordinære medisin-eksamen nede i Innsbruk til dømes. Det er ein eksamen kvart studieår og den er multiple choice... Altså er det 5 år og 5 karakterar og ingen av dei dømmer studenten i klinisk dugleik eller i særleg grad klinisk tenkning. Den har stor kritikk blant studentar her nede. Dei er lei av å sitte å svette og krysse og gulpe opp ting dei har nipugga frå gamle-multiple-choice-prøver. Andre utanlandsstudentar fortel om gode standardiserte prøver som dei opplever skil godt mellom sentrum og periferi i faget. Nokre har enkle kirurgi-eksamnar. Nokre har merkelige kirurgi-eksamnar. Andre har gode kirurgieksamnar.
Mitt inntrykk er at det generelt sett er litt få og litt for effektive eksamnar. Det er jo forståelig. Eksamensavvikling er vanskelig. Det er vanskelig å eksaminere kunnskap, ferdigheter og til og med litt haldningar når det er kull på 3-400 studentar…og alle er omtrent like flinke til å lese gamle eksamensoppgåver eller pugge professoriske kjepphestar.
La meg ta meg sjølv som eksempel…ikkje som et eksempel på normalen, men eit eksempel på variasjonsbredda: Eg har hadde 2 muntlige spesial-eksamnar fordi eg var utanlands-student. På min auge-eksamen fekk eg to stikkordsspørsmål før "Der Professor" var lei og gav meg toppkarakter. Det heile varte i tre heile minutt. Heile seansen opplevde eg som ein sketsj meir enn universitetseksamen. Eg kjem sjølvsagt til å legge ved denne karakteren når eg søker turnus…sjølv om den ikkje er verdt skrivemaskinpapiret den var skrive ut på. Min kollega hadde opplevd det samme i Tyskland: "Det var en vits. Alle fikk toppkarakter"
Ein treng dessverre studere i utlandet for å oppleve variabel eksamensavvikling. Gjersvik har sjølv måtte gå gjennom rundar med Hud-OSCEen på 6.semester. Kvifor? Jo…eksamen er vanskelig!
Så kva er poenget mitt? Poenget mitt er at Gjersvik synest å bruke Osce og klinikk-eksamnar i Noreg så vel som i utlandet som "validitets- og Reliabilitetsvitne". Argumentasjonen virkar å skulle forsikre til dømes arbeidsgivarar om at karakterar er reliable og valide og gir eit godt screening-verktøy for ansettelse av nye legar. Eg er ikkje så fullt så sikker på det.
Sjølv har eg sett lite reliabilitet og mykje variabilitet.
Gledelig nok har eg også erfart at studiekvaliteten i Oslo er godt over gjennomsnittet. Eg er stolt over å studere ved Universitetet i Oslo og eg takker både Gjersvik og andre gode professorar og lektorar for god undervisning og god tilbakemelding. Spesielt slik Gjersvik skisserer i slutten av sitt innlegg. Dette er ikkje sjølvsagt verken i Noreg eller i Utlandet.
Eg er usikker og delt i spørsmålet om karakterar. Det hadde vore ein god ide…Sett at karakterane målte noko som folk som ansett sånne som meg anser som viktige for å kunne Trøste, lindre og nokon gongar helbrede. Og at prøvene var nokonlunde like slik at det var mulig å samanlikne dei som eg konkurrerar med.
Det er jo akkurat som OL-krav. Det er greit om stoppeklokkene fungerer omtrent likt og at alle veit kva grein utøveren konkurrerer i. Eg veit ikkje om vi er heilt der i moderne medisinutdanning enno. Det er eit tankekors at det Gjersvik bruker som argument for karakterar er akkurat det samme som eg bruker mot karaktear. Vi er ikkje der Gjersvik seier vi er. Sjølv om vi begge kanskje vil dit.
Så slik eg ser det, Gjersvik, så er det to alternativ til vi kjem dit. At vi tek karakterar med en klype salt og konkurrerer ut i frå andre kriterier om jobbane. Til dømes Referansar, intervju og arbeidserfaring … Eller at du og dine kolleger innfører fleire "kontinentale" 3-minuttseksamnar.