Hva kan man lære om medisinsk metodevurdering av bildediagnostikk fra evalueringen av positronemisjonstomografi (PET) ved kreftsykdommer?
For meg vekker diskusjonen om innføring av positronemisjonstomografi (PET) minner fra en forelesning i studietiden. En stolt radiolog presenterte sykehusets nye vidunder, en CT-maskin, men møtte overraskende motstand i en skeptisk forsamling. Han klarte delvis å berolige: CT ville for all fremtid bli et «smalt» spesialtilbud og ville være utenkelig utenfor regionsykehus. Men CT, og senere MR, gikk fra å være en kostbar og omdiskutert teknologi til å bli et uvurderlig redskap i den daglige rutine ved svært mange norske sykehus på mindre enn ti år.
En tilsvarende utbygging av PET er ingen selvfølge. Prisen per diagnostisk enhet (skanner) med nødvendige støttefunksjoner er høy, anslagsvis 50 millioner kroner. Man stiller i dag også strengere krav enn tidligere til dokumentert nytte før man får investere i ny teknologi (1, 2). PET brukes så langt hovedsakelig ved kreft og innen nevrologi og kardiologi (1, 2), men kan i fremtiden få et videre bruksområde.
Hvordan skal man avklare nytten ved PET? Skal nye bildediagnostiske metoder vurderes etter samme mal som man bruker for nye behandlingsmetoder? Kan prinsipper for metodevurdering av diagnostiske tester med svaralternativene ja/nei overføres til avansert bildediagnostikk, der informasjonen er sammensatt og delvis fremkommer ved tolking? Ved gjennomtenking vil man oppdage en rekke etiske, praktiske og tolkingsmessige tilleggsproblemer knyttet til randomisert design ved studier av bildediagnostiske metoder (3). Randomiserte studier av ny bildediagnostikk ved kreftsykdommer med ideelle endepunkter som helbredelse eller langtidsskader vil måtte pågå i 5 – 20 år. Resultatene vil, når de kommer, avklare nytten av en diagnostisk teknologi og et erfaringsnivå som for lengst er blitt historie. Man kan analogt tenke seg at vi først i år, i 2004, fikk modne resultater av en studie som belyste nytten av å innføre operativsystemet Windows 95 for ca. ti år siden. Uansett om studien var stor, hadde langvarig oppfølging og var metodologisk perfekt, hvem ville ha vært interessert i resultatet?
Den diagnostiske teknologiutvikling går for raskt til at den kan evalueres fortløpende basert på kliniske studier med langtidsoppfølging, i motsetning til studier der man vurderer metodens innvirkning på kliniske beslutninger. Eksempelvis inneholder den siste rapporten om PET fra Senter for medisinsk metodevurdering (2) ingen vurdering av utstyr for simultant opptak av PET og CT, som i dag vil være den aktuelle metode.
Når bildediagnostikken er digitalisert, kan både anatomisk og metabolsk/funksjonell informasjon fra flere metoder (MR, CT, PET) fusjoneres i ett tredimensjonalt system og vurderes samlet. Man får bedre anatomisk avgrensning og karakterisering av patologiske prosesser og kan bruke dette til diagnostikk, planlegging av stråleterapi eller veiledning av invasive prosedyrer. En slik fusjonert bruk gjør det imidlertid enda vanskeligere å evaluere bidraget fra den enkelte diagnostiske metode.
Noe av bakgrunnen for at kostbar teknologi som PET er aktuelt, er et stort og overraskende lite påaktet problem: Selv om vi bruker diagnostiske metoder og prognostiske faktorer på en god måte, er klinikerens treffsikkerhet ved beslutninger i møtet med enkeltpasienter for dårlig. Dette fører til at det gis mye uvirksom behandling med meget store kostnader, både menneskelig og økonomisk. Slike kostnader bør man vurdere nøye før man tar stilling til hva som er en akseptabel pris for nye og bedre diagnostiske metoder. Konsekvensen av å avvise nye metoder er også at allerede eksisterende metoder bygges ut og brukes i større grad enn tidligere, inkludert der indikasjoner har vært innført uten noen form for metodevurdering.
Hvem skal evaluere nye bildediagnostiske metoder? Skal det være fagpersoner med høy kompetanse i å finne, sammenstille og vurdere metoder fra relevante publikasjoner, men uten spesiell innsikt og erfaring fra den aktuelle metode eller pasientgruppe? Eller skal det være fagpersoner fra miljøer der man har erfaring med metoden eller pasientgruppen metodevurderingen vil ha konsekvenser for? Ved evaluering av diagnostiske metoder bør alle typer kompetanse være involvert. Fagpersoner uten praktisk kontakt med metode eller pasientgruppe bør ikke gjennomføre metodevurdering eller fastsette vurderingskriterier alene. Både når det gjelder tolking av innholdet i publikasjoner, innsikt i hva som får klinisk konsekvens og vurdering av hvilke typer studier man kan forvente tilgang til, må personer som kjenner fagområdet delta i evalueringen. I tillegg til å sikre en tverrfaglig vurdering vil man på denne måten forebygge at vurderingssentre og medisinske fagmiljøer etterpå strides offentlig, og det vil øke sannsynligheten for at anbefalingene man kommer frem til, følges opp i praksis.
Den siste vurderingen av PET fra Senter for medisinsk metodevurdering (2) måtte utføres som en intern oppsummering pga. kort frist fra oppdragsgiver (departementet). Vurderingen har derfor redusert autoritet og kort holdbarhet. For å unngå denne type problemer i fremtiden, må vi få en mer prinsipiell gjennomgang av hvordan man bør gå frem ved metodevurdering av bildediagnostikk. Sentrale momenter vil her være:
Hvordan sikre en tverrfaglig vurdering?
Hvilke praktisk brukbare kriterier bør legges til grunn ved vurdering av nye bildediagnostiske metoder, sett i forhold til kriterier brukt ved evaluering av behandlingsmetoder?
Hvilke konsekvenser får det for metodevurderingen når den teknologien man vurderer, er i rask utvikling?
Det er intet problem å sette opp ideelle fordringer til studier. Men hvordan skal man forholde seg til gjennomførte studier med metodologiske svakheter når man i praksis ikke har eller kan forvente tilgang til studier med optimal størrelse og design?