Fra de første varsellampene ble tent om en mulig sammenheng mellom maternell rubellainfeksjon i svangerskapet og medfødt katarakt hos barnet og til en effektiv, pålitelig og trygg vaksine mot sykdommen forelå, gikk det rundt 30 år. I løpet av de årene måtte man for det første danne seg en hypotese om en slik mulig sammenheng, noe som var mulig takket være gode deskriptive data. Den mistenkte sammenhengen ble deretter sterkt sannsynliggjort gjennom retrospektive analyser (1). Den endelige bekreftelsen kom i form av prospektive studier som viste at ikke bare hadde mødre som ble rammet av røde hunder tidlig i svangerskapet en økt risiko for å få slike barn – barna var også sterkt utsatt for å dø intrauterint og for å bli født med en rekke andre alvorlige misdannelser (2). Fra virus ble identifisert og isolert i 1962 tok det sju år å utvikle og prøve ut en vaksine i klinisk kontrollerte forsøk før den ble anbefalt til vanlig bruk. Slik er historien om røde hunder i svangerskapet, skadene sykdommen kan påføre fosteret og forebyggingen av dem en god illustrasjon på epidemiologifaget.
Denne artikkelen er ment å beskrive analytiske metoder som benyttes i epidemiologiske studier i form av hvilke spørsmål de kan besvare, deres anvendelighet og deres fortrinn og begrensninger. Observasjonsmetoder eller observasjonelle metoder brukes også som betegnelse. Det betyr at forsøkslederen står «utenfor» eller «på siden av» studiepopulasjonen i håp om å finne en sammenheng mellom en mistenkt påvirkning (eksponering) og et uønsket utfall (manifest sykdom eller økt disposisjon for sykdom).
«Eksponering» kan i dette tilfellet både være kjennetegn ved personene (f.eks. alder, kjønn og bakgrunn), hva de foretar seg med seg selv (blant annet utdanning og livsstil), med andre (atferd) og hvor de oppholder seg (det omgivende miljø). Forsøkslederen vil verken påvirke eksponering eller utfall, men sammenhenger som studiene kan avsløre, kan legges til grunn for senere intervensjonsstudier.
Avhengig av bl.a. art, omfang og alvorlighetsgrad av visse sykdommer og de muligheter man har for best mulig innsamling, karakterisering og klassifisering av eksponerings- og sykdomsdata, står valget mellom et retrospektivt eller et prospektivt forsøksopplegg (design).
I det første tilfellet studeres hendelsesforløpet baklengs i tid i et forsøk på å besvare spørsmålet: Hva var grunnen til at denne sykdommen oppstod? Retrospektive studier kalles også pasient-kontroll-studier. Motsatt tar de prospektive studiene utgangspunkt i eksponeringen (f.eks. basert på om forsøkspersonene røyker) og spør: Hvilke sykdommer kan denne eksponeringen føre til på kort eller på lang sikt?
Med gode, omfattende og pålitelige eksponeringsdata kan man prøve ut mange hypoteser om kausale sammenhenger i en retrospektiv design. Tilsvarende kan man med utfallsdata av høy kvalitet trekke mange slutninger om effekten av en bestemt eksponering (f.eks. røyking) i en prospektiv undersøkelse.
Uansett design må man ha et sammenlikningsgrunnlag: De syke må holdes opp mot en sammenliknbar gruppe friske personer, og de eksponerte må tilsvarende sammenliknes med en gruppe ikke-eksponerte. Vanskene med begge designvarianter kan være å finne frem til passende kontrollpersoner.
De nasjonale epidemiologiske registrene er, i tillegg til sykehus- og praksisbaserte registre, ofte et godt utgangspunkt for begge typer studier. Data om eksponering og utfall må uansett innsamles på en fordomsfri måte, og det er et godt prinsipp at den som gjør det i direkte kontakt med forsøkspersonene, ikke kjenner alle detaljene omkring hypotesene for studien og forholder seg mest mulig nøytral til opplysninger som gis.
De store prospektive undersøkelsene som startet med den legendariske Framingham-studien (3) og Nurses Health Study i USA (4) og studien av røykevaner blant engelske leger for flere tiår siden (5), er blitt fulgt opp med tilsvarende studier i Norge. Felles for alle er det store omfanget, de detaljerte eksponeringsdataene og det langsiktige perspektivet. En fordel med dem og en sikkerhet mot skjevhet (bias) er at all informasjon om eksponering samles inn før sykdom har oppstått eller er blitt kjent. Med gode eksponeringsdata, oppbygging av et nett med biobanker og registerbaserte endepunktsdata kan man med utgangspunkt i store befolkningsundersøkelser gjennomføre kombinerte pasient-kontroll- og kohortstudier (nested case/control studies) (6).
Retrospektive studier (pasient-kontroll-studier)
I denne designen er spørsmålet: Hva var årsaken(e) til denne hendelsen? Metoden passer godt der grupper av pasienter og passende kontrollpersoner kan identifiseres. Samtidig må det de er blitt eksponert for, kunne bedømmes retrospektivt. Metoden benyttes i stor grad til å studere uvanlige og nye utfall.
Tabell 1 Pasient-kontroll-studie: Bruk av prevensjonsmåte blant kvinner som var innlagt med dyp venetrombose og kontrollpersoner (7)
|
Prevensjonsmåte
|
Pasienter: Kvinner med dyp venetrombose
|
Kontrollpersoner: Kvinner uten dyp venetrombose
|
P-piller
|
67
|
30
|
Kondom
|
41
|
42
|
Pessar
|
40
|
34
|
Rytmemetoden
|
21
|
14
|
Sæddrepende krem
|
19
|
9
|
Vaginal skylling
|
11
|
11
|
Avbrutt samleie
|
8
|
8
|
Andre metoder
|
18
|
15
|
Totalt antall som har brukt en eller flere metoder
|
114
|
101
|
Tabell 2 Pasient-kontroll-studie: Bruk av p-piller blant kvinner som var innlagt med dyp venetrombose og kontrollpersoner (7)
|
Brukt p-piller
|
Pasienter: Kvinner med dyp venetrombose
|
Kontrollpersoner: Kvinner uten dyp venetrombose
|
Totalt
|
Ja
|
67
|
30
|
97
|
Nei
|
47
|
71
|
118
|
Totalt
|
114
|
101
|
215
|
Hypotesetesting: khikvadrat
Eksemplet i tabell 1 og tabell 2 er hentet fra en studie som fastslo sammenhengen mellom bruk av p-piller med høydose østrogen og venøs trombose (6, 7). Slik resultatene er presentert i tabell 2, kan man analysere og fortolke dem ved hjelp av en khikvadrattest. Er nullhypotesen sann, forventes det ingen forskjell i andel syke (med dyp venetrombose) og friske (uten dyp venterombose) som hadde brukt p-piller. Data viser imidlertid at det blant de syke var 67/114 (59 %) som svarte positivt på spørsmålet, i motsetning til 30/101 (30 %) blant kontrollpersonene. Utregnet får vi en khikvadrat = 19,4 med en p-verdi < 0,001. Det vil si at det er mindre enn 0,1 % sannsynlighet for å finne en så stor eller større forskjell mellom gruppene med henblikk på bruk av p-piller dersom den sanne forskjellen i virkeligheten var null. Og konklusjonen var klar: En større andel av de syke enn kontrollpersonene hadde brukt p-piller.
Tabell 3 Matchet pasient-kontroll-studie: Fordeling av 175 par etter bruk av p-piller i løpet av siste måned før innleggelse i sykehus for dyp venetrombose (7)
|
P-piller brukt av pasient
|
P-piller brukt av kontrollperson Ja
|
P-piller brukt av kontrollperson Nei
|
Totalt antall par
|
Ja
|
10
|
57
|
67
|
Nei
|
13
|
95
|
108
|
Totalt antall par
|
23
|
152
|
175
|
Tabell 4 Kohortstudie: Kumulativ insidens av hjerteinfarkt etter kolesterolnivå (3)
|
Serum-kolesterol
|
Studiepopulasjon
|
Hjerteinfarkt, antall nye tilfeller
|
Høyt
|
1 127
|
135
|
Lavt
|
1 120
|
66
|
Oddsforholdet og konfidensintervall
Ønsker vi mer enn bare en p-verdi for å forkaste nullhypotesen, kan data analyseres og resultatene presenteres i form av et oddsforhold og et konfidensintervall.
Oddsforholdet er det ubenevnte forholdstallet mellom oddsen for at de syke hadde brukt p-piller og oddsen for at de friske hadde gjort det. Vi må derfor først finne oddsen for at de syke hadde brukt p-piller. I tabell 2 var det 67/114 kvinner med dyp venetrombose som hadde brukt p-piller og 47/114 som ikke hadde brukt slike piller. Det beste estimat for oddsen for at kvinner med dyp venetrombose hadde brukt p-piller, er forholdet mellom de av dem som hadde og de som ikke hadde brukt det.
Odds for bruk av p-piller gitt status som syk:
[67/114]/[47/114]
Forkorter vi, får vi følgende:
Odds for bruk av p-piller gitt status som syk:
67/47 (odds 1)
Tilsvarende kan vi beregne odds for kontrollpersonene:
Odds for bruk av p-piller gitt status som frisk:
30/71 (odds 2)
Oddsforholdet for at de syke har brukt p-piller i motsetning til de friske blir da:
(odds 1)/(odds 2) = [67/47]/[30/71] = [67 · 71]/[30 · 47]
I en 2 ¥ 2-tabell kan altså oddsforholdet enkelt regnes ut ved å ta kryssproduktet av de syke eksponerte og de friske ueksponerte og dele det på kryssproduktet av de friske eksponerte og syke ueksponerte. Utregnet får vi følgende: Oddsforhold = 3,38 ª 3,4, der utfallet uttrykkes på følgende måte: Det er 3,4 ganger så stor sannsynlighet for at de syke har brukt p-piller som at kontrollpersonene har gjort det.
Hadde nullhypotesen vært sann, ville de to oddsene foran vært like store og tallverdien for oddsforholdet 1. Et beregnet oddsforhold gir oss med andre ord både retningen av og størrelsen på avviket fra dette tallet. Er forholdet større enn 1, er det funnet en positiv assosiasjon mellom dyp venetrombose og bruk av p-piller før sykdommen. Hadde på den andre siden forholdet vært < 1, måtte vi ha endret konklusjonen til at sannsynligheten for bruk av p-piller var mindre for de syke.
Når vi angir oddsforholdet som estimat på sammenhengen mellom sykdom og eksponering, er det hensiktsmessig å beregne et konfidensintervall omkring estimatet som uttrykk for usikkerheten det er beheftet med. Det er vanlig å bruke et 95 % konfidensintervall, som tilsvarer det 5 % signifikansnivå vi konvensjonelt benytter for p-verdien. Konfidensintervallet har en nedre og en øvre grense og det innebærer at de observerte data med 95 % konfidens (trygghet) er forenlig med den sanne sammenhengen mellom sykdom og eksponering. Men tilsvarende som med en p-verdi på 0,05 aksepterer vi at det fortsatt er en viss sannsynlighet for at vi tar feil.
I studien av kvinner med dyp venetrombose (7) ble det funnet ut en nedre grense på 1,9 og en øvre på 5,9 omkring oddsforholdet på 3,4. Et relativt smalt konfidensintervall som i dette tilfellet (1,9 – 5,9) og en nedre grense som ikke inkluderer tallverdien 1 (som svarer til at nullhypotesen er sann), indikerer at den påviste sammenhengen er høysignifikant. Det kan uttrykkes slik: Jeg er 95 % trygg på at det sanne oddsforholdet er minst 1,9, men ikke mer enn 5,9. Retningen, størrelsen og den statistiske signifikansen er slik man måtte ønske det, og det gir også konseptuelt mer informasjon enn en p-verdi < 0,001.
Konfidensintervallet kan beregnes på flere måter, bl.a. ved hjelp av den utregnede khikvadratverdien (8). Det er med andre ord en sammenheng mellom ulike måter å analysere de samme data på!
Valg av kontrollpersoner
Generelt kan man si at kontrollpersonene i en pasient-kontroll-studie bør stamme fra den samme kilde (populasjon) som de syke. Problemstillingen (hypotesen som skal prøves) vil ofte være avgjørende for valg av kontrollpersoner, men det er ikke uvanlig eller av veien å velge mer enn ett sett. Valg av mer enn én kontrollperson per pasient kan virke positivt inn på presisjonen i estimatet og gi et smalere konfidensintervall. Det er et spørsmål om ressurser og effektivitet, og det er sjelden man får noe ekstra ut av mer enn 3 – 4 kontrollpersoner per pasient (9). Varierende oppslutning og større frafall fra kontrollpersonenes side kan komplisere analysen i pasient-kontroll-studier med flere kontrollpersoner per pasient, selv om det er utviklet løsninger for denne type problemstillinger (10).
Siden man kan anta at pasientene i dyp venetrombose-studien (tab 2) alle var innlagt i sykehus, kunne kontrollpersonene godt ha vært valgt blant andre sykehusinnlagte kvinner i samme tidsrom. Men man burde søke å unngå kvinner innlagt for årsaker som også var knyttet til en mulig økt risiko for dyp venetrombose. Friske naboer eller kolleger ville vært et alternativ forutsatt at de var noenlunde jevngamle, hadde tilsvarende utdanning, hadde lik yrkesaktivtet, lik seksuell aktivitet og lik paritet.
Matching av kontrollpersonene
Det vil alltid være spørsmål om tilpasning av kontrollpersoner og pasienter til hverandre (matching). En slik tilpasning kan skje på individuelt grunnlag eller for pasientgruppen som helhet. Matching må ikke overdrives, bl.a. fordi det kan bli praktisk vanskelig å skaffe passende kontrollpersoner jo flere egenskaper det matches for. Dessuten spoleres muligheten til å studere effekten av hver eneste variabel det matches for. Behovet for slik tilpasning er blitt klart mindre med de nye multivariate analysemetodene som nå står til rådighet. Men skal man ha utbytte av slike analyser, kreves det pålitelige data for de karakteristika som det ellers ville vært naturlig å matche for.
Matchede pasient-kontroll-studier
Foretas en parvis matching av pasienter og kontrollpersoner, må analysen gjennomføres tilsvarende. Fremgangsmåten for analysen går frem av tabell 3, med data fra dyp venetrombose-studien (7).
Det er bare de diskordante par som bidrar med informasjon (tab 3), og oddsforholdet beregnes ut fra par der pasienter, men ikke kontrollpersoner, har brukt p-piller (n = 57), i motsetning til par der kontrollpersoner har brukt p-piller, men ikke pasienter (n = 13). Her blir oddsforholdet = 57/13 = 4,4, altså enda høyere enn før. Videre beregninger foretatt på angitt måte (8, 11) gav både en høyere khikvadrat og et smalere konfidensintervall.
Tabell 5 Sigaretter og lungekreft: Relativ risiko i forhold til økende forbruk som uttrykk for en dose-respons-effekt (12)
|
Antall sigaretter per dag
|
Lungekreft, menn (n = 1 376)
|
Kontrollpersoner, menn (n = 1 376)
|
Relativ risiko
|
0
|
7
|
61
|
1,0
|
1 – 4
|
55
|
129
|
3,7
|
5 – 14
|
489
|
570
|
7,5
|
15 – 24
|
475
|
431
|
9,6
|
25 – 49
|
293
|
154
|
16,6
|
50+
|
38
|
12
|
27,6
|
Fordeler og ulemper ved pasient-kontroll-studier
Retrospektive studier går for å være raskere og billigere enn de prospektive. De er relativt velegnet for sjeldne sykdommer, det vil si sykdommer med lav insidens, uavhengig av om latenstiden er kort eller lang. Er først de syke og kontrollpersonene identifisert, er det mulig å unngå frafall, eventuelt holde det på et minimum. Det viktigste er at flere mulige eksponeringer kan studeres. Om én hypotese slår feil, kan den med andre ord følges opp med en ny, forutsatt at gode eksponeringsdata lar seg fremskaffe.
Hukommelsesfeil er den viktigste begrensningen og ulempen. Forsøkspersonene husker ikke, eller de forleder seg selv eller forledes av andre til å gi feil opplysninger. Slik misklassifisering kan også gjelde pårørende og etterlatte der de brukes som informanter og ev. har gjort seg opp en mening om sykdomsårsaken. Men informasjonsskjevhet kan også være resultatet av måten intervjuet eller datainnsamlingen foregår på, selv om det er utilsiktet fra forsøksmedarbeiderens side. På den annen side kan kontrollpersonene underslå betydningen av en eksponering og bevisst eller ubevisst gi feil svar, ganske enkelt fordi eksponeringen (ennå) ikke har resultert i sykdom.
Det er også mulig at opplysninger i pasientjournaler eller andre kilder er mangelfulle, fordi ingen hadde tenkt på en mulig sammenheng den gang opplysningene ble innsamlet. Tilgangen f.eks. på data om yrkeseksponering kan dessuten ha blitt borte med bedriften dersom den i mellomtiden er nedlagt.
Det er en fare for utvalgsskjevhet dersom de syke som deltar, ikke er representative for alle med sykdommen. I den grad de sykeste er mer eller mindre motivert eller i stand til å delta, kan det slå ut på de studerte sammenhenger. Kontrollpersonene kan også være mindre motivert til å svare ja til deltakelse første gang eller etter stadig nye henvendelser. Frafallet blant dem kan derfor både være større og forekomme selektivt i forhold til de syke og gi seg utslag på en hvilken som helst måte. Et annet problem med seleksjon knytter seg til særlig robuste kontrollpersoner som oppholder seg i belastende arbeidsmiljøer uten at de (tilsynelatende) tar skade av det (healthy worker effect). Det vil i så fall svekke konklusjonen om en årsakssammenheng mellom eksponering og sykdom.
Prospektive studier (kohortstudier)
Det viktige spørsmålet som den prospektive design kan besvare, er: Hva er effekten av denne eksponeringen? Metoden kan i prinsippet benyttes for enhver kjent, uvanlig og ny eksponering der et tilstrekkelig antall utsatte personer kan identifiseres, karakteriseres og følges over tid. Det er også en forutsetning at utfallet kan bedømmes.
Prospektive studier har fått navn etter grunnenheten i romerhæren, kohorten. Designen illustrerer måten soldatene sloss på. De stilte opp skulder ved skulder i firkantformasjon med ryggen til hverandre og forflyttet seg en bloc under kampen. Ingen falne ble erstattet underveis, men rekkene ble stadig sluttet og soldatene kjempet om nødvendig til siste mann.
Tilsvarende bestemmes omfanget av studiekohorten på forhånd. Det skjer ingen «etterfylling» om noen av de eksponerte takker for seg, blir syke eller dør eller forsvinner på andre måter i løpet av observasjonsperioden.
Kumulativ insidens
Tabell 3 viser data fra Framingham-studien (2). Vel 2 000 friske menn ble inndelt i to grupper etter kolesterolnivå, og «høyt» og «lavt» kolesterolnivå angir om de lå over eller under medianverdien (tab 4). Etter en viss tid ble det foretatt en opptelling over antall nye hjerteinfarkter og tallene 135/1 127 (119/1 000) og 66/1 120 (59/1 000) er andelen eller den kumulative insidens for gruppene. På grunnlag av dette kan man regne ut den relative risiko (RR) som høyt kolesterolnivå er forbundet med. I dette tilfelle var RR ª 2, det vil si en fordobling av risikoen. Ved utregning av relativ risiko plasseres alltid de eksponerte i telleren av brøken og de ueksponerte i nevneren.
For å kunne slutte noe som helst om den påviste risikoøkningen, måtte mennene på forhånd være tilnærmet like med henblikk på andre egenskaper, og i særlig grad de egenskaper man på forhånd kjente til eller mistenkte kunne øke risikoen for infarkt. I motsatt fall kan slutningen om sammenheng bli feil på grunn av utvalgsskjevhet.
Persontid under observasjon og insidensrate
Fra starten av en prospektiv studie kan det ta ulik tid før sykdom, død eller andre årsaker fører til frafall blant enkeltdeltakerne i kohorten. Av den grunn benyttes begrepet persontid under observasjon. Det angir antall måneder, ev. år, den enkelte (eksponerte og ueksponerte) bidrar med frem til hendelsen som fører til at de forlater kohorten. Det er dessuten viktig å holde rede på – hvis mulig – hva som var årsaken til at de gikk ut. Og det er viktig å vite om det skyldtes sykdom (hvilken?) eller død (årsak?). Slikt frafall kalles sensurering, det vil si at det skjer i henhold til protokoll. Forsøkspersoner som selv trekker seg aktivt ut eller gjennomfører det rene forsvinningsnummer, betraktes derimot som frafall.
Persontid under observasjon gir anledning til å angi «sykdomstrykket» per tidsenhet. En insidensrate er for det første et estimat som intuitivt gir mening. Det er dessuten mer presist enn den kumulative insidens, som bare angir andelen som ble syke på et eller annet tidspunkt i løpet av en – ofte årelang – observasjonsperiode.
Hypotesetesting og konfidensintervall
Hvis nullhypotesen er sann, vil man forvente at det ikke er noen forskjell i kumulativ insidens eller insidensrate mellom gruppene. Sannsynlighten for å bli syk er med andre ord den samme enten personen er eksponert eller ikke og svarer til RR = 1. Sammen med et 95 % konfidensintervall som er relativt smalt og ikke omfatter nullverdien, gir et avvik i relativ risiko fra 1 det beste estimat på retning og grad av økning (ev. reduksjon) i risiko. I tillegg er det statistisk signifikant.
Historisk prospektive studier (kohortstudier)
Mange kolleger som går gjennom og etterundersøker et klinisk materiale, skriver at de foretok en «retrospektiv undersøkelse». Det er både rett og galt – rett fordi den diagnostiske, terapeutiske eller forebyggende intervensjonen de vil evaluere effekten av, hører historien til, galt hvis man tenker epidemiologisk studiedesign. Studien som foretas, startet i virkeligheten da intervensjonen fant sted. Deretter følges pasientene prospektivt for å se hvordan det har gått med dem frem til etterundersøkelsen. For å unngå sammenblanding med retrospektiv i den vanlige betydningen, nemlig pasient-kontroll-studie, er det en fordel å bruke betegnelsen historisk prospektiv eller historisk kohortstudie. Betegnelsen «retrospektiv kohort» har vært foreslått (9), men bør unngås. Analysen av data må i alle fall gjennomføres som i en regulær kohortstudie.
Fordeler og ulemper ved prospektive studier
Den prospektive design tar utgangspunkt i eksponeringen, først og fremst dens kjennetegn og eventuelle omfang (mengde og varighet). Av den grunn kan mer enn ett enkelt utfall studeres. Det er også et avklart forhold mellom tiden for eksponering og utfallet, og det er mulig å beregne relativ risiko for alle nivåer av eksponering (12) (tab 5). Eksponeringen er uavhengig av pasientens hukommelse, og siden klassifiseringen finner sted forut for utfallet, vil informasjonsskjevhet kunne unngås. Ny kunnskap kan sammen med gode eksponeringsdata på et senere tidspunkt gi adgang til å prøve ut andre hypoteser enn de som forelå da studien ble igangsatt.
Den største ulempen er ofte den lange tiden det tar fra status som eksponert eller ikke i kohorten fastslås og til utfallet foreligger. Av den grunn er denne designen lite egnet og lite effektiv for studier av sykdommer med relativt lang latenstid. Det samme gjelder sykdommer med lav insidens. På grunn av behovet for lang oppfølgingstid oppfattes kohortstudier som kostbare. Effektiviteten kan ytterligere svekkes ved at frafallet av forsøkspersoner kan bli stort og oppfølgingen av pasienter mangelfull. Ressurser og motivasjon kan selvsagt også ta slutt hos forsøkslederne.
Informasjons- og utvalgsskjevhet i form av mer inngående utspørring og hyppigere og mer omfattende oppfølging av eksponerte i forhold til kontrollpersonene kan føre til en differensiell misklassifisering og derav følgende feil fortolkning. Denne feilen kan gå i en hvilken som helst retning.
Kombinert pasient-kontroll- og kohortstudie
Mange av ulempene ved kohortstudiene kan unngås med denne designen, som er en pasient-kontroll-studie innenfor en kohortstudie (6). Det er en fremgangsmåte som langt på vei kombinerer de beste egenskapene til den prospektive og den retrospektive design.
Studier av svangerskapet og dets utfall er et godt eksempel. I realiteten kan man betrakte svangerskapskontrollpersonene som en kontinuerlig prospektiv innsamling av populasjonsbaserte data. Potensiell informasjonsskjevhet motvirkes ved at data innsamles før utfallet er kjent, og «latenstiden» er forholdsvis kort. Gjennom samarbeid med bl.a. Medisinsk fødselsregister kan også relativt sjeldne sykdommer studeres.
Samles biologisk materiale inn for lagring og senere mulig bruk, kan serum- og fullblodsanalyser og andre analyser gjennomføres mer rasjonelt og målrettet. Da vil fremgangsmåten være som i en vanlig pasient-kontroll-studie med en gruppe definerte pasienter og relativt få, men strategisk utvalgte kontrollpersoner, og man trenger ikke trekke inn hele kohorten.
Biobanker etablert i forbindelse med store populasjonsstudier vil helt sikkert komme til omfattende anvendelse etter hvert som kunnskap om eksponering kan individualiseres og karakteriseres nøyaktig på grunnlag av biologisk materiale. Dette vil innebære en vesentlig forbedring i forhold til dagens situasjon, der man fortsatt i stor grad er henvist til skjemabaserte opplysninger innhentet fra forsøkspersonene.
Feilkilder og fortolkning
Konfundering
Det er tre kilder som kan gi opphav til feil fortolkning av analysen, nemlig statistisk variasjon og feilklassifisering, som er berørt ovenfor, og konfundering, som innebærer en sammenblanding av effekter. Konfunderen er en utenforstående tredjefaktor som hører med blant årsakene til sykdommen og ikke påvirkes årsaksmessig av den eksponeringsfaktoren som vi studerer, men som likevel står i et bestemt forhold til den. En klassisk konfunder er sigarettrøyking i studien av en mulig årsakssammenheng mellom bruk av alkohol og lungekreft. Konfundering gir mangel på likhet mellom gruppene vi studerer, ved at de atskiller seg på andre områder enn dem vi er interessert i. Og de kan forårsake skjevhet i fortolkningen i en hvilken som helst retning. Konfundere er ofte utsatt for hukommelsesskjevhet i retrospektive studier. I kohortstudier bør flest mulig kjente og potensielle konfundere identifiseres på forhånd. Samles tilstrekkelig med data om dem, kan konfundere håndteres gjennom stratifiserte og multivariate analyser.
Avslutning
Analytiske epidemiologiske metoder er egnet til å besvare spørsmål knyttet til sykdommers etiologi, men det er viktig å kjenne til at valg av ulike epidemiologiske designer gir ulike bidrag til svar på et forskningsspørsmål. Det er også grunn til å understreke at epidemiologisk metode omfatter alle deler av prosessen – fra planlegging via gjennomføring og statistisk analyse frem til ferdig publisering. Hensikten med studien og hypoteser man ønsker å teste, må av den grunn være gjennomtenkt og klart formulert på forhånd. Andre nødvendige ledd i planleggingen er å vurdere om man har tilgang på et egnet pasientmateriale og tilstrekkelig økonomi til å gjennomføre studien. Og ingen statistisk analysemetode kan bøte på mangelen på opplysninger om kjente eller potensielle konfundere, seleksjons- eller informasjonsskjevheter som skyldes utilstrekkelig forarbeid eller gjennomføring, eller for få pasienter til å kunne påvise en ønsket årsakssammenheng.