Hvert år får over 2 000 kvinner i Norge diagnosen brystkreft, og rundt 800 dør av sykdommen. Det har vært en betydelig økning i aldersjustert insidens av brystkreft i Norge siden man startet å registrere kreft, mens insidens av brystkreft med spredning og aldersjusterte dødelighetsrater for sykdommen har vært uforandret de siste 20 år (1). Det fins tre hypoteser på hvorfor dødelighetsratene ikke har steget i takt med insidensraten:
– Behandlingen er bedre enn tidligere
– Man oppdager flere lavmaligne lesjoner som tidligere ble oversett
– Flere svulster oppdages på et tidlig stadium og dette medfører lavere dødelighet
Hvis tidlig diagnose ved hjelp av mammografi reduserer dødeligheten, støtter det sistnevnte hypotese.
Det er i alt foretatt åtte randomisert mammografistudier for å teste denne hypotesen (nullhypotese: mammografi reduserer ikke dødeligheten). Fire studier, hvorav tre er fra Sverige, viste signifikant reduksjon av dødelighet av brystkreft. I en metaanalyse av i alt fem svenske mammografistudier ble det funnet 30 % reduksjon i dødelighet i aldersgruppen 50 – 69 år (2). I tillegg er det gjort mammografistudier i New York (3) på 1960-tallet som viste signifikant effekt og i Edinburgh (4) i 1980-årene som ikke viste signifikant effekt. I den nyeste, største og best vitenskapelig dokumenterte studien fra Canada (5), er det ingen reduksjon i dødelighet ved screening med mammografi i forhold til screening med kliniske undersøkelser.
”Gullstandarden” for kliniske undersøkelser er randomiserte studier. En av fordelene er enkel design. Resultatene kan derfor analyseres med relativt enkle statistiske metoder. Men ikke alle randomiserte studier viser seg å være like holdbare (6, 7). Generelt kan kvaliteten vurderes ut fra følgende tre generelle kriterier:
1) Er resultatene reprodusert senere?
2) Har man fulgt den fastlagte protokoll for studiene?
3) Er publiserte resultater robuste for alternative statistiske analyser?
Kriterium 1 er ikke oppfylt for de svenske mammografistudiene. I Sverige har aldersspesifikke dødelighetsrater ikke falt etter 11 år med slike masseundersøkelser (8), og heller ikke etter 13 år (Epidemiologiskt Centrum i Sverige, upubliserte data). I flere andre land med nasjonal mammografiscreening har man heller ikke sett det forventede fallet i dødelighetsrater for brystkreft (9 – 11).
Kriterium 2 er heller ikke oppfylt. Gøtzsche & Olsen (12) har nylig påvist mangelfull randomisering og andre vitenskapelige svakheter i seks av mammografistudiene, spesielt i de to viktigste som sammen ofte omtales som WE-studien (13). Moderne mammografiscreening bygger i stor grad på WE-studien, og hvis resultatene i denne studien kan trekkes i tvil, faller det vitenskapelige grunnlaget for slike masseundersøkelser.
Vi skal nedenfor diskutere kriterium 3. Det har vært forventet at mammografiscreening i Norge (14) og i Sverige (2) ville redusere dødeligheten med minst 30 %. Med utgangspunkt i faktakunnskap om stadiespesifikk dødelighet av brystkreft i Norge har vi beregnet hvilke forskyvninger i stadiefordeling og stadiespesifikk dødelighet mammografi må føre til for å kunne gi en 30 % reduksjon i dødelighet i WE-studien. Våre beregninger viser at med mindre man innfører lite rimelige antakelser om endringer i stadiefordeling ved diagnose og dødelighet blant dem som diagnostiseres uten spredning, er en reduksjon i dødelighet på 30 % ikke mulig.
Metode
Randomiserte studier analyseres vanligvis med en to-utvalgstest hvor man estimerer effekten i hver av gruppene, og så studerer differansen. En alternativ statistisk metode er en ett-utvalgstest hvor man sammenlikner estimert effekt i screeninggruppen med forventet effekt. Man kan også studere effekten i kontrollgruppen med forventet effekt. Den første sammenlikningen skal vise signifikant forskjellig effekt, mens den andre sammenlikningen ikke skal vise signifikant forskjell. Enkle ettutvalgs- og toutvalgstester er beskrevet i lærebøker i medisinsk statistikk (15). De mest kjente er Students ett-utvalgstest og to-utvalgstest.
Data fra WE-studien er aldri blitt gjort tilgjengelig for uavhengige forskere. I Sverige finnes ikke historiske data om stadiefordeling ved diagnose og tilhørende dødelighetsdata. Man kan derfor ikke gjøre en ett-utvalgs Students test, men vår metode bygger på samme prinsipp.
Ved diagnose klassifiseres brystkreft som stadium 1 (ingen kjente metastaser), stadium 2 (spredning til lokale lymfeknuter), stadium 3 (lokalt infiltrerende vekst; innvekst i hud eller brystvegg) og stadium 4 (fjernmetastaser). Det er enighet om at full helbredelse av brystkreft bare er mulig i stadium 1. Omtrent 20 % av pasientene med brystkreft i stadium 1 får tilbakefall og dør av sykdommen i løpet av ti år (16, 17). Det må bety at svulsten likevel hadde spredd seg selv om det ikke var holdepunkter for dette da den ble fjernet.
Fordi absolutt og relativ dødelighet av brystkreft i Norge og Sverige alltid har vært meget like og konstante over tid (18, 19), og fordi den relative andelen av pasienter som har metastase ved diagnose var meget lik i Norge og Sverige tidlig i 1980-årene (1, 13) formulerer vi følgende to antagelser:
Relativ overlevelsesrate
Overlevelse av kreft presenteres ofte som relativ overlevelsesrate (20). Relativ overlevelsesrate kan tolkes som sannsynligheten for å overleve en sykdom i en bestemt tid delt med sannsynligheten for å overleve, gitt at man ikke hadde sykdommen. Vi bruker R(t) for relative overlevelsesrate, og relativ overlevelsesrate av kreft er definert som
Dette kan tolkes som sannsynlighet for å overleve en kreftsykdom til tid t i forhold til sannsynlighet for å overleve hvis man ikke har kreft. R(t) varierer mellom 0, som er 100 % dødelig og 1, som betyr full helbredelse.
En reduksjon i dødelighetsraten på x prosent gir en forandring i den relative overlevelsesrate på (formel 1)
Den relative andel i hvert stadium ved diagnose er beskrevet med henholdsvis p ₁, p ₂, p ₃ og p ₄. Relativ overlevelsesrate for alle brystkreftpasienter er gitt som et veid gjennomsnitt (formel 2)
hvor R₁(t), R₂(t), R₃(t) og R₄(t) er de stadiespesifikke relative overlevelsesrater.
I perioden 1978 – 82 var det bare 2,5 % av alle kvinner med brystkreft som hadde ukjent klinisk stadium ved diagnose i Norge. De resterende fordelte seg med 60 % i stadium 1 ( p ₁ = 0,60), mens p ₂ = 0,28, p ₃ = 0,05 og p ₄ = 0,07 (16). I kontrollgruppen i WE-studien (13, 20) var det også 60 % med stadium 1. Tiårs relativ overlevelsesrate for kvinner i aldersgruppen 50 – 69 år i perioden 1975 – 84 er henholdsvis 0,81, 0,47, 0,40 og 0,08 (data fra Kreftregisteret i Norge) (16, 17). Tiårs relativ overlevelsesrate for alle individer med vår stadiefordeling blir da 0,643.
Vi har ikke vært i stand til å finne konsistente data om stadiefordelingen i WE-studien, og heller ikke tall på hvor mange pasienter som hadde fjernmetastaser. Data om stadiefordeling varierer f.eks. i artiklene (13), (21) og (22). Vi har valgt å benytte data om antallet svulster med og uten spredning fra artikkel (21).
Resultater
Mammografiscreening medfører at diagnosetidspunktet blir fremskyndet. For enkelthets skyld formulerer vi følgende antakelser om effekt av mammografiscreening:
– Flere svulster fjernes når de er i stadium 1
– Dødelighet i stadium 1 faller (f.eks. fordi svulstene som oppdages er mindre og fordi risikoen for tilbakefall synker)
– Dødelighet i stadium 2, 3 og 4 endres ikke (1)
– Totalt antall svulster som oppdages er konstant (5)
Etter justering for at flere får diagnosen stilt i stadium 1, må effekten av mammografi skyldes en kombinasjon av første og andre antakelse. Vi antar at tidligere diagnostikk i stadiene 2 – 4 ikke forandrer dødelighet i disse stadiene, men bare reduserer andelen som diagnostiseres i disse stadiene.
Tabâr og medarbeidere (21) oppgir at:
– Reduksjon i dødelighet i stadium 1 er på 14,7 %.
– Reduksjon i proporsjon av svulster i stadium 2 – 4 er på 23,1 %.
Reduksjonen i dødelighet i stadium 1 beregner vi ut fra tabell 5 i Tabâr og medarbeidere (21) som 1 – 1,57/1,84 = 0,147, eller 14,7 % mellom kontrollgruppen og screeninggruppen. Dette er regnet ut ved at reduksjonen i spredning er 1 – 29,6/38,5 = 0,231.
Vi antar først at mammografi fører til like stor relativ reduksjon i antall svulster i alle stadiene 2, 3 og 4. Den relative andelen i stadium 1 øker dermed fra 60 % til 69 %. Ny stadiefordeling blir p ₁ = 0,69, p ₂ = 0,22, p ₃ = 0,04 og p ₄ = 0,05. Relativ overlevelsesrate i stadium 1 i screeninggruppen blir 0,810,853 = 0,835. Vi får da ny relativ overlevelsesrate på
Ved bruk av formel 1 kan dette omregnes til en reduksjon i dødelighet på 19 % (første linje i tabell 1).
Man må redusere den stadiespesifikke dødelighet i stadium 1 med hele 42 % for at totaldødeligheten skal synke 30 % (andre linje i tabell 1). Alternativt kan man ha en reduksjon i spredning på 43 % (tredje linje i tabell 1). En 35 % jevn reduksjon i spredning kombinert med 30 % reduksjon i dødelighet i stadium 1, vil gi 33 % reduksjon i dødelighet (fjerde linje i tabell 1). Merk at våre analyser ikke kan tolkes som at mammografi reduserer dødeligheten med 19 %, men bare at den rapporterte effekt av mammografi tyder på at det er noe galt med studien.
Tabell 1 Reduksjon i totaldødelighet ved ulike verdier for reduksjon av spredning av svulst og dødelighet i stadium 1. Observerte verdier fra WE-studien er angitt i kursiv
|
Prosentvis reduksjon i stadium 2 – 4 ved diagnose¹
|
Prosentvis reduksjon i dødelighet i stadium 1
|
Prosentvis reduksjon totaldødelighet
|
23,1
|
14,7
|
19
|
23,1
|
42
|
30
|
43
|
14,7
|
30
|
35
|
30
|
33
|
25
|
14,7
|
26
|
1 I de fire første linjene antar vi lik prosentvis spredning i alle stadier; I den siste linjen antar vi at ingen med fjernmetastaser blir diagnostisert, mens andelen med stadium 2 og 3 er uforandret
|
La oss så til slutt anta at forskyvningen til tidligere stadier inkluderer alle som ville ha vært i stadium 4 (med fjernmetastaser), og at det er 14,7 % reduksjon i dødelighet i stadium 1 (linje 5 i tabell 1). Man kan enten tenke seg at alle med fjernmetastaser blir diagnostisert i stadium 1, eller at de blir diagnostisert i stadium 2 eller 3, og at et tilsvarende antall i stadium 2 og 3 nå blir diagnostisert i stadium 1. Vi får da at p ₁ = 0,70, p ₂ = 0,26, p ₃ = 0,04, p ₄ = 0 og R₁(t) = 0,835 som over. Observert overlevelsesrate blir
Dette gir igjen en reduksjon i dødelighet på 26 %. Men at mammografiscreening selektivt eliminerer stadium 4 både blant dem som får utført mammografi og de 20 % (13, 21) som ikke møter til mammografi er lite sannsynlig. Det ble heller ikke rapportert om noen tendens til selektiv reduksjon av svulster med fjernmetastaser i WE-studien (13, 21, 22). Tvert imot ble det rapportert om totalt 5,9 % fjernmetastaser i kontrollgruppen og 3,6 % i screeninggruppen (22). I tillegg ble det rapportert om 45,5 % metastaser i kontrollgruppen, som er vesentlig høyere enn hva man fant i Norge på samme tid (1, 16).
Normalt skulle en firedel av de 297 med spredning i screeninggruppen bli diagnostisert med fjernmetastaser (21), og tre firedeler med lokal spredning og infiltrerende vekst. En khikvadrattest gir p-verdi mindre enn 0,0001 for en så skjev fordeling at ingen er i stadium 4.
Vi finner ikke direkte antall med spredning i aldersgruppen 50 – 69 år i Tabâr og medarbeideres arbeider (21, 22), men det er 911 krefttilfeller og 167 dødsfall i screeninggruppen og 731 krefttilfeller og 188 dødsfall i kontrollgruppen. Data om reduksjon i kreft med spredning fra tabell 4 i artikkel (21), gir absolutt reduksjon i kreft med spredning på 8,9 % og absolutt reduksjon i dødelighet på 7,4 %. Dette understøtter sterkt vårt argument om at 30 % reduksjon i dødelighet bare kan fremkomme under den forutsetning at mammografiscreening medfører at alle diagnostiseres før de er i stadium 4 i en masseundersøkelse.
Formel 2 kan også brukes til å beregne effekten av mammografi per se i WE-studien. Med utgangspunkt i beregningene i vår modell antar vi at mammografi øker R₁(t) fra 0,81 til 0,835 (og at de andre relative overlevelsesratene er som i den norske befolkning) og det er 23,1 % reduksjon i stadium 2 ( p ₁ = 0,66, p ₂ = 0,22, p ₃ = 0,05 og p ₄ = 0,07). Vi bruker formel 1 og får at relativ overlevelsesrate blir 0,680. Dette tilsvarer 13 % reduksjon i dødelighet. Hvis man antar at halvparten av alle svulster i stadium 1 også ville blitt diagnostisert ved vanlig klinisk undersøkelse (23), får man at forventet effekt av mammografi per se i WE-studien er 6,5 %. Dvs. at bare en brøkdel av den reduserte dødelighet i screeninggruppen kan tilskrives mammografi. Merk at denne analysen ikke kan tolkes som at screening reduserer dødeligheten.
Vår modell er meget robust for den usikkerhet som kan relateres til estimering av stadiespesifikke dødelighetsrater. Modellen er også relativt robust for forandringer i stadiefordeling. F.eks. vil reduksjonen i dødelighet bli på 22 % hvis p ₁ = 0,67, p ₂ = 0,255, p ₃ = 0,04 og p ₄ = 0,035.
Diskusjon
Mammografi gav en relativt beskjeden forskyvning av svulster fra stadium 2 – 4 til stadium 1 i WE-studien. Med antakelsen om at norske stadiespesifikke dødelighetstall fra tidlig i 1980-årene også er gyldige for Sverige, er 30 % reduksjon i brystkreftdødelighet både medisinsk urimelig og statistisk usannsynlig. Det er derimot statistisk meget sannsynlig at enten har individene i kontroll- og screeninggruppen i utgangspunktet hatt forskjellig insidens og dødelighet av brystkreft, eller så har eksklusjon og oppfølging av individer vært forskjellig i de to gruppene. En kombinasjon av begge typer feil kan også ha funnet sted.
Insidens og dødelighet av brystkreft er assosiert med sosioøkonomiske grupper (24). Kvinner i de høyere sosioøkonomiske lag har lavere dødelighet av brystkreft og en annen stadiefordeling (24) og vil opplagt ha et større incitament for å bli med i screeninggruppen enn i kontrollgruppen. Fra Edinburgh-studien vet vi at dette problemet kan ødelegge slike studier (4, 12). Det finnes ingen dokumentasjon for at en slik seleksjon ikke finner sted i WE-studien (13, 21). Dermed kan screeninggruppen og kontrollgruppen allerede i utgangspunktet ha forskjellig insidens og dødelighet.
Etter 13 års oppfølging var det ikke slik at mammografi hadde medført at flere kvinner fikk brystkreftdiagnose i den kanadiske studien (5). I våre beregninger har vi derfor antatt at antallet brystkrefttilfeller ikke påvirkes med mammografi.
Vi har brukt norske tall for stadiespesifikke dødelighetsrater og stadiefordeling. Selv om disse tallene er fra den aktuelle perioden i 1980-årene, vet vi ikke sikkert om de passer for de svenske data. Imidlertid har dødelighet og relativ overlevelse av brystkreft i Norge og Sverige alltid vært meget like (18, 19). Videre var den totale andel med metastaser ved diagnose lik i WE-studien og i den norske befolkning (1, 13).
Vår modell er meget robust for valg av stadiespesifikke dødelighetsrater, men i mindre grad for stadiefordeling. Det er dermed forskjell i stadiefordeling mellom gruppene som er viktigst, og det er for disse forskjellene det er kritisk for modellen at norske tall kan benyttes.
En mammografidiskusjon er viktig av to grunner:
– For det første handler dette om viktig helsepolitikk: Undersøkelse av friske kvinner til meget høye omkostninger er et spørsmål om både etikk og økonomi. For eksempel er screening for brystkreft i Sverige anslått til å koste rundt 500 millioner kroner i året av Statens beredning för medicinsk utvärdering i 1995 (25), hvilket var fem ganger høyere enn hva de som organiserte masseundersøkelsene med mammografi selv hevdet. En tilsvarende uavhengig faglig utredning av disse tall er ikke foretatt i Norge.
– For det andre handler dette om hvilke krav man skal stille ved innføring av slike medisinske prosedyrer. Det finnes f.eks. ingen vitenskapelig dokumentasjon for at mammografiscreening reduserer dødeligheten for kvinner under 50 år, men man har likevel startet med dette blant annet i Oslo. Det er heller ingen overbevisende dokumentasjon for at mammografiscreening reduserer dødeligheten for kvinner i aldersgruppen 50 – 69 år fordi studiene (WE-studien) som viste signifikant effekt ikke var adekvat randomisert. Dessuten har 13 år med slike masseundersøkelser ikke medført noen redusert dødelighet blant dem som har deltatt i programmet (8), og andre land som har hatt slike programmer har heller ikke kunnet reprodusere effekten (4, 5, 9, 10, 11). Vi hevder i tillegg at det ikke er noen plausibel sammenheng mellom stadiefordeling og reduksjon i dødelighet i materialet og at en alternativ statistisk analyse gir andre resultater.
På grunn av den store grad av usikkerhet rundt effekten av mammografi mener vi at det bør gjøres en uavhengig evaluering av mammografiscreening i Norge. Dette er også foreslått i Sverige (26).