Ordet «overlevelse» brukes ofte i medisinsk forskning, selv om den hendelsen man studerer, ikke nødvendigvis er død, men en hendelse som residiv eller kurasjon. Overlevelse fremstilles gjerne i form av en kurve som estimeres ved hjelp av betingede sannsynligheter.
Levetidsdata eller overlevelsesdata karakteriseres ved at man ofte ikke har tilstrekkelig lang oppfølgingstid til å registrere når den hendelsen man er interessert i, inntreffer for alle pasientene i studien. Ufullstendig observerte levetider sier vi er sensurerte (1 ). For å håndtere sensurerte data trenger vi spesielle statistiske metoder.
Kaplan-Meier-metoden
Den mest brukte metoden til å estimere overlevelse er den såkalte Kaplan-Meier-metoden (2 ). Observasjonstiden deles inn i intervaller på en slik måte at det skjer en hendelse i slutten av hvert intervall. For hvert tidsintervall estimerer vi den betingede sannsynligheten for å overleve til slutten av intervallet – gitt at man var i live ved starten av intervallet. Overlevelsessannsynligheten på ethvert tidspunkt er produktet av de betingede sannsynlighetene for å overleve hvert tidsintervall.
I det tenkte eksempelet i tabell 1 vises levetider i måneder etter start av behandling for åtte pasienter. Tider merket * er sensurerte. For disse observasjonene vet vi altså at individet var i live ved det registrerte tidspunktet, men har ikke tilgang til ytterligere oppfølgingsdata.
Tabell 1
Levetider i måneder for åtte tenkte pasienter. Tider merket * er sensurert
Levetid
Antall under risiko
Estimert overlevelsessannsynlighet
5,6 *
8
1
6,6
7
0,857
14,4 *
6
–
18,3
5
0,686
22,2
4
0,514
32,2 *
3
–
38,4
2
0,257
41,0 *
1
–
Det første dødsfallet skjer ved 6,6 måneder. Da er det syv pasienter under risiko for å dø, siden én er sensurert ved 5,6 måneder, og andelen av disse som vi vet er i live, er dermed 6/7 = 0,857. Neste dødsfall skjer ved 18,3 måneder. Da er det fem pasienter under risiko fordi nok en levetid er sensurert, og den betingede sannsynligheten for å overleve er 4/5 · 0,857 = 0,686. Sensurerte observasjoner inngår altså i beregningen ved at de påvirker antallet under risiko ved tidspunktet for neste hendelse. I praksis vil man selvfølgelig bruke statistisk programvare til å gjøre disse beregningene.
Overlevelsessannsynligheter presenteres vanligvis som en kurve, et Kaplan-Meier-plott (fig 1). Hvert trappetrinn på kurven representerer en hendelse, og tidspunktet for sensurerte observasjoner merkes ofte med en liten loddrett strek på kurven. Ved hjelp av kurven kan vi lese av median levetid: det tidspunktet hvor 50 % av pasientene fortsatt er i live, og 50 % er døde. I eksempelet er estimatet av median levetid 38,4 måneder. Estimert to års overlevelse er 51,4 %.
Figur 1 Kaplan-Meier-estimat av overlevelsessannsynlighetene beregnet i tabell 1. Hvert trappetrinn representerer en hendelse, og sensurerte observasjoner er merket med loddrette streker
Bruk av Kaplan-Meier-metoden forutsetter at man kjenner tidspunktet for hendelsen for hver enkelt pasient og at det kun inntreffer én eller få hendelser på hvert tidspunkt. Dersom man ikke kjenner eksakt tidspunkt for hendelsen man er interessert i, men kun vet om den har inntruffet eller ikke innenfor et gitt lengre tidsintervall, kan man i stedet benytte aktuarmetoden (3 ). Den er i praksis lite brukt i klinisk forskning.
Oppfølgingstiden
Man bør etterstrebe en oppfølgingstid som medfører en lav andel sensurerte observasjoner – da får man et såkalt modent datasett. Jo færre ufullstendig observerte levetider, desto mindre usikkerhet i Kaplan-Meier-estimatet.
Dersom mange sensureringer inntreffer tidlig, peker det mot at mange pasienter er inkludert sent i studien og at oppfølgingstiden kanskje er for kort. Alternativt kan det skyldes frafall, og det er også potensielt problematisk. Når vi merker av sensurerte observasjoner på kurven, blir det tydelig om mange levetider er sensurert tidlig. Ofte angir man også noen enkle deskriptive mål, slik som median oppfølgingstid for pasienter som fortsatt er i live, samt minimum og maksimum oppfølgingstid for disse pasientene. Da kan en leser selv vurdere om oppfølgingstiden synes å være tilstrekkelig. Et 95 % konfidensintervall for overlevelseskurven gir verdifull informasjon knyttet til usikkerhet, men vises dessverre sjelden.