Old Drupal 7 Site

Statistikk i medisinsk forskning

Geir Aamodt, Petter Laake Om forfatterne
Artikkel

Arne Høiseths kommentarartikkel i dette nummer av Tidsskriftet (1) med kritikk av vår artikkel i Tidsskriftet nr. 16/2005 (2) innholder dessverre mange feil og uklarheter omkring statistikk som fag, statistiske begreper og statistiske metoder.

Høiseth starter innlegget med at «teoretisk matematikk og statistikk er ikke uten videre et anvendbart forskningsredskap i et praktisk fag som medisin» (1). Vi bestrider sterkt slike påstander og påpeker bare kort at statistikk er et helt sentralt redskap i medisinsk forskningsmetode. Uten en statistisk formulering og analyse av problemstillingene er det ikke mulig å komme til konsise, gyldige og reproduserbare konklusjoner.

Statistikere tar variasjon på alvor. Statistiske metoder er utviklet for å splitte opp variasjonen til en avhengig variabel i systematiske og tilfeldige komponenter. Disse kan være henholdsvis forskjellen i effekt av to ulike behandlinger og ulike variasjonskomponenter knyttet til individ, behandlingssenter eller behandler. Ved å bruke velkjente statistiske metoder ender man opp med tolkbare populasjonsparametere, som for eksempel forskjell mellom populasjonsgjennomsnitt eller en regresjonsparameter. Disse størrelsene vil man kjenne igjen fra protokollen til studien.

Høiseth anbefaler «kun å anvende p-verdier der det er legitimt» (1). Dette er vi uenig i. Konfidensintervallet gir mer informasjon enn p-verdien, og dersom vi blir «tvunget» til å velge mellom dem, ville vi ha valgt å presentere konfidensintervaller. Grensene til konfidensintervaller vil jo gi informasjon om en effekt er signifikant eller ikke. P-verdien vil derimot være et hjelpemiddel til å vurdere grad av statistisk signifikans, en grense som er gitt i protokollen.

Vi er enig i at presisjon i estimatet øker med økende utvalg. At standardavvik øker med utvalgsstørrelsen, er en misforståelse. Høiseths alternative presentasjon av regresjonsparametere forstår vi dessverre ikke. Høiseth sier også at «hvis man måler alle aktuelle objekter, er konfidensintervallet definisjonsmessig lik null» (1). Dette beror på en misforståelse av populasjonsbegrepet. Lengden på intervallet avtar med utvalgsstørrelsen, men det blir aldri lik null.

Det finnes flere kilder til variasjon enn de vi har diskutert i vår artikkel (2). Høiseth nevner selv målefeil, altså variasjon fra måling til måling. Vi kan for egen del legge til situasjoner der vi har målefeil både for de avhengige og de uavhengige variablene i studien (eksponeringsvariablene). Metoder for slike studier er riktignok såpass kompliserte at vi valgte å ikke diskutere disse.

Vi kan bare beklage at vår presentasjon misoppfattes som en kokebok. Er det noe vi ikke ønsker, er det å «legitimere overfladisk bruk av matematikk».

Anbefalte artikler