En rekke hypoteser har vært fremmet som forklaring på at tiazidliknende diuretika kom bedre ut enn andre antihypertensive midler i ALLHAT-studien. Dersom vanlige kvalitetskriterier legges til grunn, var studien av beste merke. Noen grad av skjønn inngår i enhver kvalitetsvurdering, og enkelte sider ved studien kan det settes spørsmålstegn ved. Likevel gir ikke det meste av kritikken mot ALLHAT-studien grunnlag for å forkaste hovedkonklusjonen, nemlig at tiazider er like bra eller bedre enn andre blodtrykkssenkende preparater.
Hovedresultatene fra ALLHAT-studien ble publisert i desember 2002 (1). Målet med undersøkelsen var å avklare hvorvidt nyere legemidler til behandling av hypertensjon er bedre enn tiazidliknende diuretika. I denne studien ble 42 000 pasienter tilfeldig fordelt til å få et tiazidliknende diuretikum, en kalsiumblokker, en angiotensinkonvertasehemmer (ACE-hemmer) eller en alfablokker. Etter 4 – 5 år ble status gjort opp. Det var små forskjeller i hvordan det hadde gått med pasientene, men det var klart færre som utviklet hjertesvikt i tiazidgruppen. Forfatterne konkluderte derfor med at tiazidliknende diuretika bør være førstevalg i behandlingen av hypertensjon. Etter at resultatene ble publisert, har det pågått en heftig debatt om ALLHAT-studien, blant annet i Tidsskriftet (2).
Vurdering av forskning
Det er mye å passe på når man skal vurdere en artikkel som rapporterer resultatene av randomiserte, kontrollerte undersøkelser, som for eksempel ALLHAT-studien (3). Én sentral problemstilling er hvorvidt resultatene fra undersøkelsen er til å stole på: Var randomiseringsprosedyren som fordelte deltakerne til de forskjellige gruppene tilfredsstillende? Var gruppene like ved oppstart av studien? Ble gruppene behandlet likt bortsett fra tiltaket som evalueres? Ble deltakere, helsepersonell og forskere blindet? Ble det gjort rede for alle deltakerne ved slutten av studien? Det må også stilles spørsmål om hvorvidt resultatene er overførbare til andre forhold enn dem som gjaldt i studien: Kan resultatene overføres til andre befolkninger/pasientgrupper? Ble alle viktige utfalls-/resultatmål evaluert? Og ikke minst: Bør praksis endres som følge av resultatene i denne studien?
I vurderingen av disse momentene vil det nesten alltid være rom for skjønn. Nettopp rommet for tolking gjør at det lett kan bli debatt om forskningsresultater. I noen tilfeller vil åpenbare svakheter ved en studie føre til velbegrunnet skepsis. Ett eksempel er CAPPP-studien fra 1999 der man sammenliknet ACE-hemmer med tiazid eller betablokker (4). I denne studien gikk noe galt i forbindelse med randomiseringsprosedyren, og det oppstod skjevheter mellom gruppene. Dette skjedde antakelig fordi noen leger kikket i de forseglede konvoluttene for å sjekke hvilken gruppe pasientene ville havne i, for deretter å bestemme seg for å inkludere pasientene i studien eller ikke. Andre ganger fremmes det kritikk i form av hypoteser som er vanskeligere å bekrefte eller tilbakevise. Da blir spørsmålet om kritikken virker rimelig. Ett eksempel er diskusjonen om hvorvidt resultatene fra store amerikanske effektstudier av hormonsubstitusjon er overførbare til norske forhold i og med at vi bruker andre typer østrogener her til lands.
Det vil alltid være noe å sette fingeren på ved design og gjennomføring av en studie. Noen kompromisser må alltid inngås for å kunne utføre et stort randomisert, kontrollert forsøk. Det er for eksempel ikke gjennomført noen store sammenliknende studier av blodtrykksmedisiner blant friske middelaldrende mennesker, til tross for at nettopp denne gruppen er storkonsument av slike medikamenter. Grunnen er enkel: En slik undersøkelse måtte antakelig inkludere over 100 000 personer og gå over minst ti år for å avdekke eventuelle forskjeller i effekt mellom de forskjellige medikamentene. Verken legemiddelindustrien eller det offentlige er villig til å betale for en slik studie. Derfor velger man heller å inkludere personer som er noe eldre og noe sykere. Dermed blir det flere hjerteinfarkter og slag å måle over kortere tid, som igjen gjør det mulig å påvise effektforskjeller innenfor et mindre budsjett. Ulempen er åpenbar: Kan vi være sikre på at resultatene fra disse studiene er overførbare til yngre og friske med hypertensjon?
Vurdering av ALLHAT-studien
Både før og etter at ALLHAT-resultatene ble kjent, har undertegnede argumentert for at tiazider bør være førstevalg i blodtrykksbehandlingen (5). Kritikerne er stort sett personer som har gått inn for kalsiumblokkere, ACE-hemmere og alfablokkere som førstehåndsmedikamenter (6). Dette er en mulig interessekonflikt som kan påvirke synspunktene til debattantene, på samme måte som sterke bindinger til legemiddelindustrien kan det.
Dersom vanlige kvalitetskriterier for randomiserte kontrollerte undersøkelser legges til grunn, kommer ALLHAT-studien særdeles godt ut. Randomiseringsprosedyren var tilnærmet vanntett (med liten fare for manipulering), verken pasienter eller leger ble informert om hvilket legemiddel som ble gitt (dobbeltblinding), og det samme gjaldt legene som vurderte hvordan det hadde gått med pasientene (endepunktsevaluering). I den forstand er ALLHAT-studien et svært godt eksempel på hvordan en slik studie bør gjennomføres. Likevel kan det naturligvis settes spørsmålstegn ved enkelte sider av den. Kritikerne betviler at tiazidliknende diuretikum kom best ut som det beste medikamentet, og har fremmet en rekke alternative forklaringer på hvorfor resultatene ble som de ble. Lesernes oppgave blir å vurdere om hypotesene deres virker rimelige, eller ei.
Noen av deltakerne i ALLHAT-studien ble ikke fulgt gjennom hele undersøkelsesperioden. Det er derfor hevdet at dette bør svekke tilliten til resultatene. Forsvarerne av studien har påpekt at pasientene er fulgt gjennom 99 % av alle mulige personår, og at uansett hvordan det gikk med den resterende prosenten, ville resultatene blitt de samme (sensitivitetsanalyse) (7).
ALLHAT-studien er også blitt kritisert for at bare 10 % av endepunktene ble evaluert av en uavhengig komité. I mange andre studier har man oppnevnt en egen gruppe for å vurdere dokumentasjonen bak hver eneste diagnose av hjerteinfarkt, slag, hjertesvikt osv. I ALLHAT-studien valgte man i hovedsak å basere seg på diagnoser som ble stilt av behandlende lege, ikke minst fordi det ville vært svært ressurskrevende å dobbeltsjekke alle diagnoser i en studie av denne størrelsen. Legene som deltok i studien ble gitt klare kriterier for diagnosene som skulle rapporteres, og de visste ikke hvilke medikamenter pasientene deres fikk. Det er antakelig viktig at en ekstern komité gjennomgår alle diagnoser når pasienter og/eller leger ikke er blindet for medikamentene som blir gitt, men er det rimelig å hevde det samme når alle er blindet – slik som i ALLHAT-studien?
En del kritikere har påpekt at kalsiumkanalblokkere ofte gir et ufarlig ankelødem, og at dette kan ha blitt feilklassifisert som hjertesvikt av legene som var med i ALLHAT-studien. Følgende momenter taler imot at dette var et problem (8): For å stille diagnosen hjertesvikt skulle pasientene fremvise klare symptomer eller tegn på venstre eller høyre ventrikkelsvikt som ikke kunne tilskrives andre årsaker. Legene innrapporterte diagnosene ved å fylle ut et endepunktsskjema hvor det ble krysset av for oppfylte diagnosekriterier. For hjertesvikt innebar det at minst ett av fire symptomer (anfallsvis nattdyspné, hviledyspné, NYHA-funksjonsklasse III eller ortopné) og minst ett av sju tegn måtte være til stede (knatrelyder, ankelødem grad 2 eller høyere, takykardi i hvile osv.). Hjertesviktdiagnosen ble i 81 % av tilfellene stilt i forbindelse med sykehusinnleggelse eller dødsfall, og det var like store forskjeller mellom medikamentgruppene dersom man kun inkluderte disse hjertesvikttilfellene – som neppe var forårsaket av ufarlige ødemer utløst av kalsiumblokkerbehandling. Dødeligheten var dessuten høy blant pasienter med hjertesviktdiagnose (20 % over to år).
Mange av deltakerne var under behandling med blodtrykksmedisiner da de ble med i ALLHAT-studien. Det optimale ville vært å bare la personer med ubehandlet hypertensjon delta, men da ville det blitt praktisk talt umulig å rekruttere det nødvendige antall pasienter innen rimelig tid. Pasientene seponerte gammel medisin dagen før de startet med studiemedikasjonen. Kritikere mener at dette «kan ha maskert latent hjertesvikt» hos de av deltakerne som brukte et diuretikum for sin hypertensjon (2). Én måte å vurdere den hypotesen på, er å ta deltakerne som brukte blodtrykksmedisin ved studiestart, ut av analysen og se om det endrer resultatene. I ALLHAT-studien fant man en 38 % høyere forekomst av hjertesvikt i kalsiumblokkergruppen sammenliknet med dem som fikk tiazidliknende diuretikum. Etter eksklusjon av alle deltakerne som hadde brukt blodtrykksmedisiner tidligere, var forskjellen praktisk talt den samme: 35 % flere hjertesvikttilfeller blant pasientene som fikk kalsiumblokker (Curt D. Furberg, personlig meddelelse).
Det er også hevdet at «mange av dem som ble randomisert til regimene uten diuretika …. ville få problemer med væskeretensjon og hjertsvikt» (2). Det vises også til at det kun tok noen uker før man kunne se en økt forekomst av hjertesvikt blant pasienter som ikke var i tiazidgruppen. En rekke mothypoteser har vært foreslått som forklaringer til denne observasjonen – for eksempel at en del pasienter seponerte kalsiumblokker 6 – 12 måneder etter studiestart og dermed reduserte risikoen for å utvikle hjertesvikt. Eller at mange pasienter etter et halvt års tid begynte med tilleggsmedisin, ofte betablokker, som beskytter mot hjertesvikt.
I ALLHAT-studien var det lagt opp til at deltakerne ikke skulle kombinere preparater fra de konkurrerende legemiddelklassene for å unngå at eventuelle effektforskjeller ble vannet ut. Det ville blitt vanskelig å vise at tiazider er bedre eller dårligere enn andre medikamenter dersom praktisk talt alle pasientene brukte et tiazid. Kritikere mener at dette gjør at funnene fra ALLHAT er «lite egnet for norske forhold» (2). Det er åpenbart riktig at kombinasjonene som ble benyttet i ALLHAT-studien er noe annerledes enn det som er vanlig – av nevnte grunner. Men svekker det studiens relevans? Påstanden om at tiazider for all del må unngås som førstemedikament, men samtidig er «utmerket tilleggsmedikasjon», virker litt inkonsistent.
Det er også påpekt at «i ALLHAT-studien var systolisk blodtrykk 1 – 3 mm Hg lavere i diuretikagruppen enn i de andre behandlingsgruppene» (2), og at dette burde vært korrigert for ved hjelp av statistiske metoder. Med andre ord: Fordi tiazidliknende medisin var mest effektiv til å senke blodtrykket, og fordi det i seg selv kan være medvirkende til at det gikk bedre med pasientene, må vi justere for det. Dette er et høyst diskutabelt resonnement. Det kan like gjerne hevdes at tiazider bør foretrekkes nettopp fordi de senker blodtrykket mer effektivt enn andre legemidler (9). Det hører med å nevne at det diastoliske trykket i diuretikagruppen var likt eller høyere enn i de andre behandlingsgruppene, og at den observerte forskjellen i blodtrykksnivå ikke kan forklare forskjellene i forekomst av hjertesvikt, som er det viktigste funnet i ALLHAT-studien.
Enkelte har gjort et nummer av at hjertesvikt ikke var et såkalt primært endepunkt, og har hevdet at ALLHAT-forfatterne fravek sin egen studieprotokoll da de vektla et sekundært endepunkt i sine konklusjoner. Dette er feil. I tillegg til blodtrykksstudien bestod ALLHAT-studien også av en ublindet undersøkelse av kolesterolsenkende medisin, og det var sekundære endepunkter fra denne delen av studien som ikke skulle tillegges vekt (10).
Er resultatene overførbare til norsk virkelighet?
Det er i første rekke den store andelen av afroamerikanere blant deltakerne som har vært begrunnelsen for at ALLHAT-resultatene ikke kan overføres til norsk praksis. Det hevdes, med en viss rett, at svarte reagerer bedre på bruk av tiazid enn hvite, mens det omvendte er tilfellet for ACE-hemmere. Én måte å håndtere dette problemet på er å se på resultatene uten å inkludere de svarte deltakerne. Dette ble gjort allerede i hovedpublikasjonen fra ALLHAT-studien, og konklusjonen blir den samme: Det var en klar overvekt av hjertesvikttilfeller i ACE-hemmergruppen (15 %) og i kalsiumblokkergruppen (33 %) sammenliknet med dem som fikk tiazidliknende diuretikum.
Det er uttrykt skepsis til at ALLHAT-resultatene blir brukt på pasientgrupper som er forskjellige fra dem som deltok i studien (2). Dette er et viktig og vanskelig poeng. Når det gjelder blodtrykksbehandling, er vi i den ulykkelige situasjon at vi ikke har gode studier å basere oss på når det gjelder den store gruppen av middelaldrende og friske hypertonikere. Alle relevante studier er gjennomført med eldre pasienter – ofte med diabetes eller hjertesykdom. Hva gjør vi da? Dersom vi studerer resultatene fra studiene der man har sammenliknet blodtrykkssenkende behandling med placebo, finner vi at resultatene er ganske like. For eksempel er den relative risikoreduksjonen i antall slag blant dem som fikk aktiv behandling som regel i området 35 – 40 %. Det samme fenomenet gjelder for kolesterolsenkende medikamenter: Den relative effektforskjellen mellom placebo og statin er praktisk talt lik på tvers av studiene, enten det dreier seg om primærprofylakse, personer med hjertinfarkt, med diabetes osv. Det virker altså ikke bare rimelig, men det er også empirisk belegg for å anta at effekten av blodtrykkssenkende behandling er noenlunde den samme på tvers av forskjellige pasientgrupper. Riktignok er det her snakk om relativ nytte. Personer med svært lav risiko for slag vil ha liten glede av å bruke et blodtrykkssenkende legemiddel selv om det medfører at risikoen for slag reduseres med 40 %.
Bør resultatene føre til endret praksis?
ALLHAT-resultatene skiller seg ikke særlig fra funnene i andre sammenliknende studier av blodtrykkssenkende behandling. Det er gjennomgående liten eller ingen forskjell i effekt mellom preparatene. For å kunne påvise små effektforskjeller må man ha et meget stort antall pasienter som følges over lang nok tid. For å øke muligheten for å påvise små effektforskjeller som enkeltstudier ikke har fanget opp, kan man slå sammen resultatene fra flere undersøkelser i en metaanalyse. Senest i fjor ble to slike metaanalyser publisert, og resultatene er ganske entydige: De forskjellige preparatene er noenlunde likeverdige, men forskjellene som finnes går i tiazidenes favør (11, 12). Også tidligere metaanalyser har konkludert med at tiazidene bør være førstevalgsmedikamenter (9, 13). ALLHAT-resultatene er altså enda en grunn til å velge et tiazid når det skal startes behandling for høyt blodtrykk, men kunnskapsgrunnlaget for å benytte disse medikamentene som førstevalg har vært til stede lenge. På tross av dette er det få norske leger som tilbyr tiazider til sine pasienter.
Debatten om valg av blodtrykksmedisiner det siste tiåret har i stor grad dreid seg om metabolske virkninger. Det er blant annet hevdet at tiazidbruk fører til ugunstig lipidprofil, og omvendt for alfablokkere, noe som igjen kan henholdsvis øke eller senke risikoen for hjerteinfarkt. Det er risikabelt å feste lit til slike spekulasjoner, da det er langt fra sikkert at små forandringer på blodprøver forteller hele sannheten om medikamentets virkning på pasientene (14). Nettopp av den grunn var det stor spenning knyttet til resultatene fra ALLHAT-studien og andre store studier som målte effekter som virkelig betyr noe, for eksempel hjerteinfarkt, slag og død. De aller fleste – også herværende debattanter – var tidligere enig om at resultatene fra ALLHAT-studien og andre undersøkelser ville bli sentrale i utformingen av retningslinjer for hypertensjonsbehandlingen (15). Nå foreligger altså resultatene, og de viser at tiazider er like gode eller bedre enn andre blodtrykkssenkende preparater.