Det er to hovedmetoder for metaanalyse – faste eller tilfeldige effekter. Disse bygger på forskjellige antagelser om studiene som inngår i metaanalysen.
Forskjellige studier kan gi forskjellige resultater selv når de undersøker det samme. Noen finner at aktiv behandling er bedre enn kontrollbehandling, andre at de er like gode, og enkelte hevder at kontrollbehandlingen var best hele tiden. Resultater blir analysert og presentert med et stort mangfold fra studie til studie. Fra bunken med forskningsartikler som skulle oppklare det hele, blir det en rikholdig blanding av gjennomsnitt, p-verdier, medianer og krysstabeller, samt flere ekspertuttalelser enn det er eksperter. Da er metaanalyse en statistisk metode som kan rydde opp i virvaret og gi et mer entydig resultat. Kvaliteten på en metaanalyse avhenger av en rekke faktorer. Er de utvalgte studiene egentlig den samme studien gjentatt flere ganger eller er hver studie en unik, men tilstrekkelig sammenlignbar, undersøkelse av det samme fenomenet?
To forskjellige antagelser
La oss for eksempel tenke oss at flere forskningsgrupper undersøker det samme medikamentet mot kolesterol på et meget likt utvalg av pasienter. Målemetodene og analysene av resultatene er tilsvarende i alle artiklene. Da er det rimelig å anta at de på sett og vis gjentar den samme studien hver for seg, og den «sanne» effekten – statistisk kaller vi ofte dette for populasjonseffekten – av medikamentet antas å være den samme – «fast» – i alle studiene. De observerte forskjellene skyldes dermed bare naturlig statistisk variasjon. En metaanalyse med fast effekt er da et fornuftig valg. Vi oppnår et samlet estimat av de identiske «sanne» effektene i alle studiene, men med en høyere presisjon enn i hver og en av dem (1 ).
La oss ta et annet eksempel: Forskningsgruppene undersøker effekten av trening etter hoftebruddsoperasjon sammenliknet med vanlig oppfølging. Inklusjon av pasienter og intensitet og varighet av treningsøvelsene er vidt forskjellig mellom studiene. Noen måler balanse, mens andre måler ganghastighet eller utholdenhet. Studiene undersøker det samme fenomenet og er for så vidt sammenlignbare, men den «sanne» effekten av trening er høyst sannsynlig forskjellig fra studie til studie. Da er det riktig å bruke tilfeldige effekter som modell for metaanalysen. Det samlete resultatet av metaanalysen blir et gjennomsnitt av de ulike «sanne» effektene som varierer «tilfeldig» mellom studiene. Den observerte forskjellen mellom studiene skyldes både naturlig statistisk variasjon og varierende sanne effekter fra studie til studie. Valg av metode påvirker både tolkningen av resultatene og vektleggingen av studiene mot hverandre (2 ). Figur 1 illustrerer den prinsipielle forskjellen mellom faste og tilfeldige effekter som modell for metaanalyse.
Figur 1 En illustrasjon av den prinsipielle forskjellen mellom metaanalyser med ulike antagelser. I en fast effekt-metaanalyse antar vi at den sanne effekten er lik i hver studie, mens vi antar den varierer, men er tilstrekkelig sammenlignbar i en tilfeldige effekter-metaanalyse. De sanne (ukjente) effektene er illustrert med grønne sirkler, de observerte effektene med tilhørende konfidensintervaller er vist med firkanter og linjer, og det overordnete resultatet fra de to metodene er vist nederst i de to balansediagrammene.
Fast, tilfeldig eller begge deler
Kjennskapen om de inkluderte studiene bør i stor grad avgjøre om vi bruker en metaanalyse med faste eller tilfeldige effekter. Ved hjelp av en test for heterogenitet kan man vurdere hvor mye av den samlete variasjonen mellom studiene som skyldes forskjellene til de sanne effektene i forhold til den naturlige statistiske variasjonen. Omfanget av heterogenitet kan estimeres ved I2 og testes for eksempel med Cochrans Q-test (3 ). Resultatene fra slike analyser bør oppgis som del av metaanalysen uansett valg av metode. F.eks. hadde metaanalysen i figur 1 en I2 på 52,9 % og p-verdien til Cochrans Q-testen var 0,075. En høy grad av heterogenitet og en signifikant Cochrans Q-test taler for å velge en tilfeldige effekter-metaanalyse. Studiene kan også være så forskjellige at de i liten grad er sammenlignbare og dermed ikke egnet for en metaanalyse. Da løser ikke tilfeldige effekter problemet.
Enkelte statistikere argumenter for alltid å utføre en analyse med tilfeldige effekter, fordi fast effekt-metoden kan overestimere presisjonen (4 ). Etter å ha valgt og presentert resultatene med den ene metoden, kan man oppgi resultatet fra den andre metoden som en sensitivitets- og robusthetsanalyse.