Old Drupal 7 Site

Demensdiagnostikk – automatisert kvantifisering av hjernestrukturer

Knut Engedal, Anne Brækhus, Ole A. Andreassen, Per Hj. Nakstad Om forfatterne
Artikkel

Det finnes ulike årsaker til demens. Hyppigst er demens av Alzheimer-type (1). Mange pasienter med tegn til demens blir ikke utredet (2), på den annen side henvises pasienter til utredning ved hukommelsesklinikk på et tidligere tidspunkt i sykdomsutviklingen i dag enn for ti år siden (3). De er yngre, og halvparten oppfyller ikke kriteriene til demenssyndromet og får diagnosene «subjektiv opplevelse av kognitiv svikt» eller «mild kognitiv svikt». Det finnes ingen definisjon av begrepet «subjektiv opplevelse av kognitiv svikt». Det brukes der pasienten har en opplevelse av at de kognitive evner er redusert, men der man ved nevropsykologisk testing ikke kan påvise kognitiv svikt.

Det finnes ingen enkeltstående diagnostisk test som kan avgjøre om en spesifikk demenssykdom foreligger. Diagnosen bør stilles i henhold til standardiserte kriterier etter en grundig utredning som omfatter anamnese, testing av kognisjon, somatisk undersøkelse, bildediagnostikk og i mange tilfeller undersøkelse av spinalvæsken med bestemmelse av tauprotein og betaamyloid (4).

Det er forventet stor økning i nye tilfeller av demens i årene som kommer, og det er derfor viktig å utvikle gyldige og enkle diagnostiske prosedyrer. Det er dessuten foreslått nye kriterier for å kunne diagnostisere Alzheimers sykdom i en tidlig fase (før demensutvikling). Biomarkører har en mer sentral plass i disse kriteriene enn i dagens ICD-10-kriterier (5).

Det har lenge vært kjent at nevrodegenerasjonen ved Alzheimers sykdom starter i entorhinale cortex og raskt omfatter de mediale temporallapper (6). I 1990-årene ble det påvist at medial temporallappsatrofi dokumentert med cerebral computertomografi var typisk for pasienter med demens av Alzheimers type (7 – 9). Denne kunnskapen var vanskelig å anvende i klinisk praksis fordi kvaliteten av datidens apparatur varierte (10).

Fra studier med bruk av magnetisk resonanstomografi (MR) (11 – 13) er det rapportert sensitivitet og spesifisitet mellom 80 % og 90 % for å skille mellom pasienter med demens av Alzheimers type og friske eldre og mellom pasienter med demens av Alzheimers type og pasienter med mild kognitiv svikt (14, 15). Både visuell inspeksjon, lineær og volumetrisk måling brukes (8, 14, 16).

Visuell inspeksjon er en rask metode, men studier viser ulike resultater for samsvar mellom dem som anvender denne metoden (17, 18). Ikke-automatisert (manuell) volumetrisk måling er tidkrevende og av den grunn tungvint å anvende i klinisk praksis. Neuroquant er en av flere automatiserte metoder som er utviklet for bruk i klinisk praksis (11 – 13). Normdata er hentet fra The Alzheimer’s Disease Neuroimaging Initiative (ADNI) (19). Med Neuroquant kan man beregne hjernens totalvolum og volumet av spesifikke områder. Alderskorrigerte mål for hippocampus, laterale og nedre laterale ventrikler angis.

Hensikten med denne studien var å kartlegge den kliniske nytteverdien av Neuroquant for å skille pasienter med diagnosen demens av Alzheimers type fra dem uten demens og om metoden kan anvendes til å skille demens av Alzheimers type fra andre demenstilstander.

Materiale og metode

Pasientene

Dette er en prospektiv undersøkelse av 122 samtykkekompetente pasienter henvist fra fastleger til Hukommelsesklinikken ved Oslo universitetssykehus, Ullevål, for utredning av demens. MR-undersøkelse hører til standard prosedyre. Materialet er hentet fra pasienter henvist mellom september 2010 og juni 2011. I alt var 264 pasienter henvist i dette tidsrommet.

Utvelgelsen av pasienter til dette prosjektet ble avhengig av tilgjengeligheten på undersøkelse med 3 tesla-MR-maskinen ved Oslo universitetssykehus. Dersom behandlende lege anså at ventetiden ville bli for lang, ble pasientene henvist til en annen MR-undersøkelse (n = 142). Det forelå ingen kriterier for lang ventetid. Alle de 122 som ble forespurt samtykket.

Undersøkelsene

Ifølge retningslinjer for validitetsstudier ble alle pasientene undersøkt på samme standardiserte måte. Resultatene fra Neuroquant-analysen var ikke tilgjengelig for legene som satte de kliniske diagnosene (20). Undersøkelsene besto av intervju med pasient og pårørende, testing av kognitiv funksjon, somatisk undersøkelse, blodprøveanalyser, MR-undersøkelse, enfotonstomografi ved mistanke om Parkinson pluss-sykdommer eller frontotemporaldemens og spinalvæskeundersøkelse hos pasienter med vage symptomer (3, 4).

For å anskueliggjøre grad av kognitiv svikt blant pasientene viser vi resultater fra noen av de kognitive testene som ble utført. Mini mental status-evaluering (MMSE) skåres mellom 0 og 30, lavere skåre indikerer større kognitiv svikt (21, 22). Klokketesten skåres fra 0 til 5, lavere skåre indikerer større kognitiv svikt (23). Tiordstesten undersøker innlæringsevne og utsatt hukommelsesevne. Innlæringsdelen skåres mellom 0 og 30, lavere skåre indikerer større kognitiv svikt. Utsatt hukommelse skåres mellom 0 og 10, hvor 0 er dårligste resultat (24).

Diagnostikk

En nevrolog (AB) og en psykiater (KE), begge med mer enn 20 års erfaring i demensdiagnostikk, var ikke til stede under konsultasjonen, men vurderte all tilgjengelig informasjon for hver pasient, inkludert de ordinære MR-beskrivelsene, men ikke analysene gjort med Neuroquant. Diagnosene demens av Alzheimers type, vaskulær demens og Parkinson-demens ble satt i henhold til ICD-10-kriteriene. For diagnosen frontotemporaldemens benyttet vi Manchester-Lund-kriteriene og for demens med lewylegemer de reviderte konsensuskriteriene (25, 26).

For pasienter med demens som ikke tilfredsstilte noen av kriteriene eller der det forelå blandingstilstander, ble ifølge ICD-10 diagnosen uspesifisert demens brukt. Winblads kriterier ble brukt for mild kognitiv svikt, og subjektiv opplevelse av kognitiv svikt ble brukt hos pasienter med opplevde hukommelsesproblemer som ikke tilfredsstilte kriteriene for mild kognitiv svikt (27). De to legene var uenige i diagnosen hos åtte pasienter (6,5 %). I disse tilfellene diskuterte de seg frem til en konsensusdiagnose.

Magnetisk resonanstomografi, opptak og analyse

Magnetisk resonanstomografi (MR) ble gjennomført på en 3 tesla-maskin (General Electric, Sigma HDx, Milwaukee, Wisconsin, USA). T1-vektet 3D-opptak ble gjort med IRSPGR-pulssekvens med følgende variabler: inversjonstid ble fremstilt ved hjelp av sagittale opptak med repetisjonstid (TR) = 7,7 ms, ekkotid (TE) = ms, bildedimensjon = 256 mm, flippvinkel = 12, snittykkelse = 1,2 mm, vokselstørrelse = 1,2 × 1,0 × 1,3 mm, antall snitt = 170, baseoppløsing = 256.

Volumet av hjernestrukturer ble analysert med Neuroquant (CorTechs Labs Inc., San Diego, CA, USA), som utfører en automatisert anatomisk oppdeling og måler volumet av hjernestrukturer (11). I denne studien rapporterer vi volummål for fremre cortex, kortikal grå substans, cerebellum, hippocampus, amygdala, pallidum, putamen, caudatus, thalamus, laterale ventrikler og nedre laterale ventrikler. For hver struktur har vi angitt forholdet mellom hjernestrukturen (høyre + venstre)/intrakranialt volum uttrykt i prosent, i artikkelen kalt «volummål». Neuroquant angir også alderskorrigerte prosentiler for hippocampus, laterale ventrikler og nedre laterale ventrikler.

Statistikk

Data ble lagret og analysert i SPSS, versjon 18. Kontinuerlige data var tilnærmet normalfordelt og ble behandlet med parametriske analyser. Enkle tabellanalyser ble utført og t-test anvendt for å teste forskjeller i gjennomsnittlig volummål. I henhold til målsettingen og fordi vi hadde få pasienter med enkelte demenssykdommer slo vi sammen pasientene til tre grupper: ingen demens (subjektiv opplevelse av kognitiv svikt + mild kognitiv svikt) – n = 35, demens av Alzheimers type – n = 63, andre demenssykdommer – n = 24.

For å vise volummålenes diagnostiske styrke utførte vi ROC-analyser (receiver operating characteristic) og anga areal under kurven (AUK) samt grenseverdier for det volummål som klassifiserte flest pasienter riktig. ROC-analyse er en metode som kan anvendes for å gi et mål for en diagnostisk tests diskriminerende evne, det vil si den viser sammenhengen mellom sant positive og falskt positive rater. Areal under kurven ble kalkulert for å sammenlikne den diagnostiske diskriminerende styrken for de ulike hjernestørrelsene. Verdien 1 betyr at alle syke blir diagnostisert som syke og ingen som falskt syke, verdien 0,5 betyr at halvparten blir riktig klassifisert, det vil si samme resultat som fremkommer tilfeldig.

Sensitivitet, spesifisitet, positiv og negativ sannsynlighetsratio (likelihood ratio) for beregnet beste grenseverdi er angitt. Positiv sannsynlighetsratio angir forholdet mellom sant testpositive og falskt testpositive personer, mens negativ sannsynlighetsratio angir forholdet mellom falskt testnegative og sant testnegative personer. De to målene er uavhengige av sykdommens prevalens: positiv sannsynlighetsratio = sensitivitet/1-spesifisitet, negativ sannsynlighetsratio = 1-sensitivitet/spesifisitet. En god diagnostisk test bør ha en positiv sannsynlighetsratio over 5 og en negativ sannsynlighetsratio under 0,2 (28).

Etikk

Alle pasienter som undersøkes ved Hukommelsesklinikken blir spurt om resultater fra utredningen kan lagres i et forskningsregister. Over 99 % av dem med samtykkekompetanse samtykker til dette. Alle som inkluderes har samtykkekompetanse og signerer samtykkeskjema. Registeret er godkjent av Datatilsynet, REK Helse Sør-Øst og Personvernombudet ved Oslo universitetssykehus. Kliniske data i studien er hentet fra registeret, og det er godkjent av REK Helse Sør-Øst.

Resultater

Pasientkarakteristika vises i tabell 1. De 122 pasientene hadde følgende diagnoser: subjektiv opplevelse av kognitiv svikt (n = 10), mild kognitiv svikt (n = 25), demens av Alzheimers type (n = 63), vaskulær demens (n = 1), demens med lewylegemer eller Parkinson-demens (n = 9), frontotemporal demens (n = 8) og uspesifisert demens (n = 6).

Tabell 1  Karakteristika for 122 pasienter utredet ved Hukommelsesklinikken ved Oslo universitetssykehus. Gjennomsnitt (standardavvik) når ikke annet er angitt. MMSE = Mini mental status-evaluering, CERAD = Consortium to establish a registry of Alzheimer’s disease

Alder (år)

67,2 (10,5)

Kvinner, antall (%)

49 (40,3)

MMSE-skår (maksimum er 30)

25,1 (4,3)

Klokketestskår (maksimum er 5)

4,0 (3,2)

CERAD tiordstest, læring, (maksimum er 30)

14,1 (6,1)

CERAD tiordstest, hukommelse (maksimum er 10)

3,3 (1,5)

Tabell 2 viser volummål for pasientene i de tre pasientgruppene ingen demens, demens av Alzheimers type, andre demenssykdommer. Vi hadde komplette data for alle pasientene for volummål av hippocampus, laterale ventrikler og nedre laterale ventrikler. For de øvrige hadde vi data fra 102 pasienter, 53 av disse hadde demens av Alzheimers type.

Tabell 2  Volum av hjernestrukturer bilateralt sett i forhold til intrakranialt volum uttrykt i prosent for pasienter uten demens, for pasienter med demens av Alzheimers type og for pasienter andre demenstilstander. Volummål er gitt i prosent (standardavvik). For 20 pasienter hadde vi ikke mål for amygdala, caudatus, putamen, pallidum. thalamus, kortikal grå substans, fremre cortex og cerebellum

Ingen demens (n = 35)

Demens av Alzheimers type (n = 63)

Annen demens (n = 24)

P verdi, t-test¹

P verdi, t-test²

Hippocampus

0,52 (0,06)

0,44 (0,06)

0,47 (0,06)

< 0,001

0,098

Amygdala

0,23 (0,03)

0,19 (0,03)

0,20 (0,05)

< 0,001

0,448

Caudatus

0,50 (0,09)

0,53 (0,08)

0,51 (0,08)

0,087

0,316

Putamen

0,61 (0,07)

0,57 (0,08)

0,52 (1,00)

0,013

0,075

Pallidum

0,12 (0,02)

0,10 (0,03)

0,11 (0,03)

0,051

0,153

Thalamus

1,1 (0,08)

1,1 (0,10)

1,0 (0,16)

0,715

0,573

Fremre cortex

61,5 (2,80)

58,9 (2,90)

58,9 (4,30)

< 0,001

0,971

Kortikal grå substans

30,2 (2,10)

28,6 (2,20)

28,4 (3,00)

0,002

0,826

Cerebellum

8,8 (0,74)

8,6 (0,68)

8,1 (0,70)

0,185

0,027

Laterale ventrikler

2,24 (1,15)

3,34 (1,44)

4,0 (2,10)

< 0,001

0,195

Nedre laterale ventrikler

0,16 (0,07)

0,26 (0,10)

0,24 (0,11)

< 0,001

0,482

[i]

[i] ¹  Ingen demens versus demens av Alzheimers type

²  Demens av Alzheimers type versus annen demens

I sammenlikningen mellom pasienter med demens av Alzheimers type versus pasienter med subjektiv opplevelse av kognitiv svikt eller mild kognitiv svikt var volummålene for fremre cortex, kortikal grå substans, hippocampus, amygdala, putamen, laterale ventrikler og nedre laterale ventrikler signifikant forskjellige fra AUK 0,5 (tab 3). I sammenlikningen mellom demens av Alzheimer type og andre demenssykdommer var cerebellum det eneste volummål som var statistisk signifikant forskjellig fra AUK 0,5, med AUK= 0,67 (95 % konfidensintervall (KI) 0,53 – 0,81), p = 0,020. Den beste grenseverdien for dette volummålet var 8,3 %, med sensitivitet 72 %, spesifisitet 60 %, positiv sannsynlighetsratio = 1,8 og negativ sannsynlighetsratio = 0,63.

Tabell 3  Neuroquants evne til å skille pasienter med demens av Alzheimers type fra pasienter uten demens. For volummål av hippocampus, laterale ventrikler og nedre laterale ventrikler er 98 pasienter inkludert i analysene, av dem 63 med demens av Alzheimers type. For de øvrige volummålene er 78 pasienter inkludert, av dem 53 med demens av Alzheimers type. Grenseverdi for volummål er ikke angitt der AUK ikke var signifikant forskjellig fra 0,5 i ROC-analyse

Demens av Alzheimers type versus ingen demens

Beste grenseverdi volum/intrakranialt volum

Hjernestruktur

Areal under kurven

95 % KI

P-verdi

Grenseverdi (%)

Sensitivitet (%)

Spesifisitet (%)

Positiv sannsynlighetsratio

Negativ sannsynlighetsratio

Hippocampus

0,80

0,71 – 0,90

< 0,001

0,48

74

71

2,6

0,37

Amygdala

0,79

0,69 – 0,90

< 0,001

0,21

77

70

2,6

0,33

Caudatus

0,38

0,25 – 0,51

0,084

Putamen

0,65

0,53 – 0,78

0,022

0,56

76

49

1,5

0,47

Pallidum

0,63

0,51 – 0,76

0,051

Thalamus

0,57

0,44 – 0,69

0,343

Fremre cortex

0,77

0,66 – 0,88

< 0,001

60,72

79

75

3,2

0,28

Kortikal grå substans

0,69

0,58 – 0,81

0,004

28,60

72

52

1,5

0,58

Cerebellum

0,60

0,47 – 0,73

0,136

Laterale ventrikler

0,76

0,66 – 0,87

< 0,001

2,56

73

71

2,3

0,38

Nedre laterale ventrikler

0,78

0,68 – 0,87

< 0,001

0,18

73

74

2,7

0,36

I ROC-analyser av pasienter med demens av Alzheimers type versus pasienter med subjektiv opplevelse av kognitiv svikt eller mild kognitiv svikt var de tre strukturene med alderskorrigerte prosentiler statistisk signifikant forskjellig fra 0,5: hippocampus – AUK 0,80 (95 % KI 0,71 – 0,89), sensitivitet 74 % og spesifisitet 70 % for 30-prosentilen (best), laterale ventrikler – AUK 0,73 (95 % KI 0,63 – 0,84), sensitivitet 73 % og spesifisitet 69 % for 80-prosentilen (best). De respektive resultater for nedre laterale ventrikler var AUK 0,76 (95 % KI 0,66 – 0,85), sensitivitet 71 % og spesifisitet 75 % for 75-prosentilen (best). I ROC-analyser av demens av Alzheimers type versus andre demenssykdommer var AUK ikke signifikant forskjellig fra 0,5 for noen av de alderskorrigerte prosentilmålene.

Diskusjon

Vi fant at Neuroquant-metoden skilte pasienter med demens av Alzheimers type fra dem uten demens som utredes i en hukommelsesklinikk. Metoden skilte ikke mellom pasienter med demens av Alzheimers type og pasienter med andre typer demens. Den diagnostiske styrken vurderes som middels sterk for å skille mellom pasienter med demens av Alzheimers type og pasienter uten demens fordi den positive sannsynlighetsratioen for de beste volummålene var mellom 2 og 5 og den negative sannsynlighetsratioen var mellom 0,2 og 0,5.

Selv om volummålene for putamen og kortikal grå substans var signifikant forskjellig fra AUK 0,5 i sammenlikningen mellom pasienter med demens av Alzheimers type versus dem uten demens (tab 3), bidrar denne forskjellen ikke i særlig grad i diagnostikken fordi positiv sannsynlighetsratio var < 2. Det samme gjelder for cerebellum, som var signifikant forskjellig fra AUK 0,5 i sammenlikningen mellom pasienter med andre former for demens versus pasienter med demens av Alzheimers type. Vi hadde forventet at resultatene i ROC-analysene av de aldersnormerte prosentilene ville vært bedre enn for strukturvolum (høyre + venstre)/intrakranialt volum av hippocampus, amygdala og de laterale ventrikler. Det var de ikke, og det kan tyde på at disse normene ikke er godt nok validert og at man i klinisk praksis må bruke dem med varsomhet.

Våre resultater er vanskelige å sammenlikne med tidligere studier av Neuroqant, ettersom det i disse ikke er angitt positiv og negativ sannsynlighetsratio (11 – 13, 15). Resultatene er i samsvar med resultatene fra studier der man har anvendt manuelle volumetriske metoder og indikerer at Neuroquant-analyser er like bra som langt mer tidkrevende volumetriske målinger (29, 30).

I noen studier der man har anvendt manuell volumetrisk måling, er det rapportert bedre resultater enn våre. Dette er studier hvor man har sammenliknet pasienter med demens av Alzheimers type og friske kontrollpersoner (31, 32). Vi vil hevde at resultatene fra slike studier er mindre relevante enn våre, fordi en sammenlikning av en syk pasientgruppe med en frisk kontrollgruppe ikke gjenspeiler situasjonen i den kliniske hverdagen. I vår studie var ingen av deltakerne friske kontrollpersoner, alle var henvist av fastlege på grunn av mistanke om demenssykdom.

Om lag 50 % av dem med mild kognitiv svikt og 10 – 20 % av dem med subjektiv opplevelse av kognitiv svikt vil utvikle demens i løpet av en femårsperiode (33, 34). Typiske hjerneforandringer ved Alzheimers sykdom starter 10 – 15 år før debut av kliniske symptomer. Dette kan bety at flere av våre pasienter med mild kognitiv svikt og subjektiv opplevelse av kognitiv svikt har Alzheimers sykdom i en tidlig fase, selv om de ikke tilfredsstiller demenskriteriene. Dette kan være en forklaring på den relative lave spesifisiteten vi fant for hjernestrukturene (tab 3).

Noen av pasientene i gruppen uten demens kan være i ferd med å utvikle demens av Alzheimers type og har av den grunn atrofi av hippocampus og amygdala og utvidede laterale ventrikler. Det er vanskeligere å forklare hvorfor flere pasienter med diagnosen demens av Alzheimers type ikke har typiske MR-funn for denne sykdommen. Én årsak kan være feildiagnostisering. Undersøkelser viser dog at samsvaret mellom en nevropatologisk diagnose av Alzheimers sykdom og klinikernes diagnose – demens av Alzheimers type – er god, med en sensitivitet opp mot 90 % og en noe lavere spesifisitet (35).

Legene som diagnostiserte pasientene i denne studien er erfarne, noe som skulle tilsi at feildiagnostisering ikke er den viktigste årsaken til lav sensitivitet. En mer sannsynlig forklaring er at Alzheimers sykdom ikke alltid starter i entorhinale cortex, men i bakre kortikale områder. Volummålene hos pasienter med slik atypisk utvikling vil ikke affiseres på samme måte som hos dem der sykdommen starter i entorhinale cortex.

Vårt andre hovedfunn var at Neuroquant-analysene ikke skilte pasienter med demens av Alzheimer type fra dem med andre demenssykdommer. Dette er ikke uventet. Ifølge nevropatologiske undersøkelser har mange med kliniske demenssymptomer en blanding av ulike demenssykdommer (36). Om lag 75 % av dem med diagnosen nevropatologisk demens med lewylegemer har samtidig nevropatologiske forandringer i hjernen som indikerer en samtidig Alzheimers sykdom (37). Kombinasjon av vaskulær demens, demens med lewylegemer og demens av Alzheimers type er heller ikke uvanlig (36). Det er mulig at en automatisert MR-analyse ville klart å skille demens av Alzheimers type fra frontotemporal demens, men gruppen med fronttotemporal demens er for liten for å teste denne hypotesen. Hvorfor cerebellum var signifikant mer atrofiert i gruppen som hadde andre demenssykdommer enn i gruppen med demens av Alzheimers type, har vi ikke noe svar på. Det kan være et tilfeldig funn.

Studien har svakheter. Vi har brukt kliniske diagnoser som gullstandard. Det kan medføre feil fordi klinisk diagnostikk aldri samsvarer 100 % med nevropatologiske diagnoser. På den annen side er ikke nevropatologiske diagnoser heller gullstandard (38). Det kan hevdes at den kliniske diagnostikken hadde vært bedre dersom man hadde målt demensmarkører i spinalvæsken hos alle pasientene. Men spinalvæskebiomarkører er heller ikke fasit for demens av Alzheimers type eller for andre demenstilstander. Mange pasienter med normale verdier av tauprotein og/eller betaamyloid har symptomer og en sykdomsutvikling forenlig med demens av Alzheimers type (4).

En annen svakhet er inklusjon av få pasienter med mild kognitiv svikt og andre demenssykdommer enn demens av Alzheimers type. For å få sikre svar på om Neuroquant kan brukes, bør langt flere pasienter med mild kognitiv svikt, subjektiv opplevelse av kognitiv svikt og ulike demenssykdommer inkluderes i en liknende studie.

Studiens styrke er forskningsdesignen. Samtykkekompetente pasienter henvist til demensutredning ble fortløpende inkludert, en standard undersøkelsesprosedyre ble benyttet hos alle, og resultatene fra MR-kvantifiseringen var ikke tilgjengelig for legene som satte diagnosene. Siden mer enn halvparten av pasientene henvist til hukommelsesklinikken i den tiden undersøkelsen foregikk ikke ble inkludert, kan man hevde at utvalget er selektert. Men dette var ingen systematisk seleksjon, kun avhengig av om behandlende lege syntes at ventetiden for Neuroquant-undersøkelse ble for lang.

Konklusjon

Vår konklusjon er at automatisert kvantifisering av hjernestrukturer ikke kan brukes som enkeltundersøkelse i demensutredning, men den kan være en støtte til resultater av andre kliniske undersøkelser. Det er viktig å ta i bruk metoder med høy kostnad-nytte-verdi i dette arbeidet, da det er forventet en stor økning i antallet som ønsker en utredning av en mulig demenstilstand i årene fremover.

Anbefalte artikler