Etter publiseringen av den første versjonen av den humane genomsekvensen vinteren 2001 ble arvematerialet til ulike individer anslått å være 99,9 % likt, mens forskjellene i hovedsak ble tilskrevet enkeltbaseforskjeller i DNA-sekvensen, kalt enkeltnukleotidpolymorfismer (single nucleotide polymorphisms, SNPs) (1 ). Når genomet til ulike individer sammenliknes, har det i tillegg blitt påvist strukturelle variasjoner, som inkluderer kopitallsvariasjoner, inversjoner og translokasjoner (tab 1). De siste årene er det blitt vist at de strukturelle variasjonene er svært utbredt i det humane genomet: Tusenvis av områder med størrelser fra noen tusen basepar (kilobaser, kb) til flere millioner basepar (megabaser, Mb) er blitt vist å variere i kopitall eller være invertert i genomet hos friske individer (2 – 7 ). Til sammen er de strukturelle variasjonene anslått å bidra mer til variasjonen i genomet enn enkeltnukleotidpolymorfismer når man ser på det totale antall basepar (bp) som er involvert (7 ). De svært mange strukturelle variasjoner som finnes hos friske individer, bidrar til variasjoner i vanlige trekk blant oss mennesker. De strukturelle variasjonene kan også på ulike måter være involvert i utvikling av sykdommer. Som en innledning til diskusjonen rundt de strukturelle variasjonene beskrives først noen detaljer fra den humane genomanatomien.
Tabell 1 Strukturelle variasjoner
Strukturelle variasjoner
Definisjon
Kopitallsvariasjon
Et DNA-segment større enn 1 kb som varierer i kopitall mellom ulike individer. Definisjonen inkluderer delesjoner og duplikasjoner
Inversjon
Et DNA-segment som har motsatt orientering i genomet til ulike individer
Translokasjon
En forskjell i lokalisering av et DNA-segment i genomet i ulike individer. Fører ikke til nettoendring i det totale DNA-innholdet
Artikkelen er basert på gjennomgang av litteratur funnet etter ikke-systematiske søk i PubMed.
Kort om genomanatomi
Det har lenge vært kjent at det er eksonene i genene som koder for proteiner, og at disse utgjør mindre enn 5 % av det humane genomet. Det er svært mye DNA-sekvens både innenfor og mellom genene som man fortsatt ikke kjenner funksjonen til. Mer enn halvparten av det humane genomet består av forskjellige former for repeterte sekvenser.
Alle kromosomene hos mennesket har en sentromer og i tillegg en telomer i hver ende. Dette er strukturer som er avgjørende for å beskytte arvestoffet og sørge for korrekt fordeling av dette gjennom celledelingene. I de sentromeriske og subtelomeriske områdene av kromosomene befinner det seg store mengder repetert DNA-sekvens som man ikke fullt ut kjenner funksjonen til. Disse sekvensene er i hovedsak sammensatt av enkle grunnenheter på noen få basepar som ofte er repetert etter hverandre i flere millioner kopier. Det er blitt anslått at slike enkle repeterte sekvenser til sammen utgjør over en femdel av genomet hos pattedyr.
Det finnes også repeterte sekvenser bestående av enkle grunnenheter spredt i genomet: Mikrosatellittene består av enheter på 2 – 4 basepar (for eksempel CAG-repetisjoner) som er repetert noen titalls ganger etter hverandre. De såkalte minisatellittene består av sekvenser på 10 – 100 basepar ofte repetert noen tusen ganger på ett sted. Disse repeterte sekvensene utgjør en liten andel av genomet totalt sett, men mikrosatellitter i enkelte gener er grunnlaget for de såkalte dynamiske mutasjonene som er kjent blant annet i forbindelse med flere nevrologiske, arvelige sykdommer som Huntingtons sykdom og fragilt X-syndrom (8 ).
I tillegg finnes det mange kopier av forskjellige større repeterte sekvenselementer spredt i genomet, slik som Alu- og LINE-elementer. Disse varierer i størrelse fra noen hundre til noen tusen basepar, og til sammen utgjør disse elementene over 45 % av genomet hos mennesker (9 ). De har ekspandert til dette nivået i løpet av en periode på flere millioner år ved at de har hatt evnen til å amplifisere seg selv. De repeterte elementene er i hovedsak ikke mobile i vår tid, og det er ikke fullstendig klarlagt hvilke roller de har.
Segmentduplikasjoner
Segmentduplikasjoner defineres som DNA-segmenter på én til flere hundre kilobaser som finnes i opptil flere dusin kopier på forskjellige steder i det humane genomet, og hvor kopiene er mer enn 90 % like i sekvens (10 ). På grunn av det begrensede kopitallet regnes ikke segmentduplikasjonene innunder de repeterte elementene. Totalt har segmentduplikasjonene blitt estimert til å utgjøre ca. 5 % av det humane genomet (10 ). De ulike kopiene kan enten befinne seg på ett kromosom eller på forskjellige kromosomer, og de finnes hyppigst i sentromeriske og subtelomeriske regioner av kromosomene. Segmentduplikasjonene inneholder ofte gener.
Strukturelle variasjoner
Kopitallsvariasjoner
Kopitallsvariasjoner i genomet (copy number variation, CNV) defineres som DNA-segmenter i størrelsesorden 1 kilobase opptil noen få megabaser som finnes med et variabelt antall kopier i forskjellige individer (fig 1). De inkluderer både delesjoner og duplikasjoner. Tilstedeværelse av kopitallsvariasjoner er utbredt i friske individer, noe som viser at tap av kromosommateriale og økt kopitall ikke nødvendigvis resulterer i sykdom (2 , 3 ). I en undersøkelse der kopitallsvariasjoner ble kartlagt hos 270 individer, ble det identifisert mer enn 1 400 slike. Til sammen dekket disse en DNA-lengde som tilsvarer ca. 12 % av det humane genomet (5 ). I en annen studie av 95 individer ble det vist at ca. 70 % av områdene som varierte i kopiantall mellom individene inneholdt ett eller flere gener (6 ). Derfor kan det forventes at svært mange kopitallsvariasjoner bidrar til den fenotypiske variasjonen i normale trekk blant mennesker, slik som høyde, vekt og liknende.
Figur 1 Kopitallsvariasjoner av den genomiske regionen A på de to homologe kromosomene. Slike kopitallsvariasjoner kan i noen tilfeller påvirke fenotypiske trekk
Helt nye funn indikerer at det er kopitallsvariasjoner også mellom eneggede tvillinger (11 ). Det betyr at variasjonen i kopitall også kan oppstå som resultatet av mitotisk ustabilitet. Denne variasjonen, som rokker ved den allmenne forståelsen av at eneggede tvillinger har identisk genom, kan være med på å forklare noen tilfeller der eneggede tvillinger viser forskjellige fenotyper, f.eks. der den ene har en sykdom og den andre er frisk. En annen viktig følge av disse funnene er at en nyoppstått kromosomendring hos en pasient viser seg ikke alltid å være den underliggende forklaringen på pasientens symptomer.
Innenfor de hittil detekterte kopitallsvariasjonene er det en overhyppighet av gener som er involvert i sanser, slik som lukt, syn og hørsel, i tillegg til gener som har en rolle f.eks. innen immunrespons og i detoksifisering av kjemikalier (6 ). Dette er egenskaper det rent evolusjonært kan være viktig at populasjonen er fleksibel i, slik at den som helhet er bedre rustet til å tåle skiftninger i miljøet.
Inversjoner
En inversjon er definert som et DNA-segment som kan ha omvendt orientering i forskjellige individer (fig 2). En inversjon endrer ikke kopiantallet til de genene som DNA-segmentet inneholder, men kan i noen tilfeller føre til at genet blir dysfunksjonelt. Dette kan skje enten ved at en del av selve genet er invertert slik at genproduktet endres, eller ved at inversjonen forstyrrer regulatoriske elementer slik at nivået av genuttrykk påvirkes. Inntil nylig fantes det ingen robust metode for å lete etter inversjonsvarianter i hele genomet fra mange individer. Mange av de kjente inversjonene er derfor blitt funnet fordi de forårsaker sykdom. Imidlertid indikerer nyere studier at inversjoner, på samme måte som kopitallsvariasjoner, er svært utbredt i det humane genomet (4 , 12 ). I en studie ble 56 inversjonsbruddsteder oppdaget hos ett individ etter at dette genomet ble sammenliknet med det publiserte humane referansegenomet (4 ). Ett eksempel på en inversjonsvariant som bidrar til fenotypisk variasjon, er en inversjon på 900 kb på kromosom 17q21.31 som finnes hos ca. 20 % av den europeiske populasjonen, men som er sjelden hos afrikanere og nesten fraværende hos personer fra Øst-Asia (12 ). Det inverterte området inneholder flere gener, blant annet CRHR1 som koder for kortikotropinfrigjørende hormonreseptor 1. En omfattende studie har konkludert med at denne inversjonen er under positiv seleksjon i den islandske populasjonen, slik at kvinner som bærer den totalt sett får flere barn enn de som ikke gjør det (12 ). Det er imidlertid ennå uklart hvordan inversjonsvarianten gir denne fenotypiske effekten.
Figur 2 Inversjoner. Et større område av de homologe kromosomene, som inneholder de genomiske områdene B og C, kan ha motsatt orientering i forskjellige individer. Lenger ned på de samme kromosomene er et mindre område (D) invertert. Inversjoner kan forstyrre genstruktur og i noen tilfeller forårsake sykdom
Genomiske syndromer
I motsetning til genetiske sykdommer, som følger enkel mendelsk arvegang hvis de skyldes én enkelt mutasjon, er de genomiske syndromene forårsaket av strukturendringer i genomet. Og i motsetning til de genetiske sykdommene opptrer ofte de genomiske syndromene de novo. De genomiske syndromene forekommer med en relativt høy frekvens i populasjonen (13 ). De er forårsaket av endringer i genomet som involverer kromosomsegmenter fra 1 kilobase til flere megabaser, og som fører til flere eller færre genkopier eller en annen type forstyrrelse av genfunksjon. En endring av antall genkopier grunnet rearrangeringer i genomet vil i mange tilfeller påvirke genuttrykksnivået, som igjen kan gi utslag i sykdom. Genuttrykket kan også bli påvirket på andre måter, blant annet ved endring av posisjonen av genet i genomet eller f.eks. ved at en inversjon ødelegger funksjonaliteten til et regulatorisk element som er viktig for korrekt uttrykk av genet.
Mange genomiske syndromer har velkjente kliniske manifestasjoner, og de underliggende strukturelle variasjonene er godt karakterisert. Et relativt hyppig forekommende genomisk syndrom er DiGeorges syndrom, med en prevalens på ca. 1 av 4 000 (tab 2) (14 ). DiGeorges syndrom skyldes en delesjon innenfor kromosom 22q11.2, som blant annet fører til mental retardasjon, hjertefeil (bl.a. Fallots tetrade) og et karakteristisk utseende hos pasientene.
Tabell 2 Eksempler på genomiske syndromer
Genomisk syndrom
Locus
Rearrangering
Gen
Karakteristiske symptomer
Prevalens
DiGeorges syndrom
22q11
Delesjon (1,5 – 3,0 Mb)
Flere, inkl. TBX1
Mental retardasjon, medfødte hjertemisdannelser (Fallots tetrade), primær hypoparatyreoidisme (og påfølgende hypokalsemi), thymusaplasi/-hypoplasi og ansiktsdysmorfi
1 : 4 000
Charcot-Marie-Tooths sykdom 1A
17p12
Duplikasjon (1,4 Mb)
PMP22
Redusert nerveledningshastighet, demyelinisering og funn av løkformasjoner ved nervebiopsi
1 : 3 000
Hereditær nevropati med trykkpareser
17p12
Delesjon (1,4 Mb)
PMP22
Abnorm følsomhet for trykk mot perifere nerver. Smertefrie, forbigående pareser
1 : 6 250
Williams-Beurens syndrom
7q11.23
Delesjon (1,5 Mb)
Flere, inkl. ELN
Mental retardasjon, hjertefeil (supravalvulær aortastenose), alveansikt og infantil hyperkalsemi. Svake visuospatiale evner
1 : 20 000
Hemofili A
Xq28
Inversjon (0,3 – 0,5 Mb)
F8
Redusert blodkoagulasjonsaktivitet
1 : 10 000 menn
Hunters syndrom
Xq28
Inversjon (20 kb)
IDS
Mental retardasjon, makrokefali, grove ansiktstrekk, skjelettdefekter, forstørrede organer (lever, milt)
1 : 132 000 menn
Angelmans syndrom
15q13
Delesjon (3,5 Mb)
UBE3A
Mental retardasjon, språkvansker, ataksi, hypotoni. Unik «lykkelig» atferd
1 : 10 000 – 20 000
De mange sjeldne syndromer som skyldes submikroskopiske kromosomavvik, er betydelig mindre beskrevet. Selv om disse syndromene hver for seg opptrer med lav frekvens, har de til sammen en stor utbredelse i populasjonen. De senere årene har nye metoder for screening av hele genomet blitt tatt i bruk, f.eks. den mikromatrisebaserte metoden komparativ genomisk hybridisering (array-based comparative genomic hybridization, CGH) som tidligere er blitt omtalt av Ness & Houge i Tidsskriftet (15 ). Ved bruk av disse metodene kan man påvise mikroduplikasjoner og mikrodelesjoner i et stort antall pasienter hvor man tidligere ikke oppdaget kromosomavvik. Resultater fra flere studier der slike metoder er benyttet, antyder at submikroskopiske rearrangeringer i genomet kan være årsak til 10 % av tilfeller med idiopatisk mental retardasjon (16 , 17 ). Det er blitt anslått at en submikroskopisk delesjon innen kromosom 17q21.31 alene kan være årsak til 1 % av alle slike tilfeller (18 – 20 ). Denne delesjonsvarianten er avgrenset på hver side av segmentduplikasjoner og var det første eksemplet på at sjeldne submikroskopiske kromosomavvik kan være assosiert med dupliserte segmenter.
Mikrodelesjoner og -duplikasjoner
Segmentduplikasjoner er assosiert med ustabile genomiske regioner, og de er blitt funnet i 25 – 50 % av kopitallsvariasjonene og inversjonene som hittil er påvist (4 , 5 ). Sekvenslikheten mellom ulike kopier av segmentduplikasjoner legger til rette for rekombinasjonshendelser i genomet, noe som igjen kan føre til at det oppstår duplikasjoner, delesjoner eller inversjoner (14 ) (fig 3). Tilstedeværelse av dupliserte segmenter i genomet predisponerer på denne måten for strukturendringer og kan være årsaken til at de genomiske syndromene forekommer med relativt høy frekvens i populasjonen. Noen segmentduplikasjoner varierer i kopitall mellom individer og er da også definert som kopitallvariasjoner. Noen kromosomområder kan forårsake patologiske fenotyper både i tilfeller der området er deletert og der det er duplisert (21 ). For eksempel er nevropatien Charcot-Marie-Tooths sykdom type 1A forårsaket av en 1,4 Mb duplikasjon innen området 17p11.2 – 12, mens delesjon av det samme området forårsaker hereditær nevropati med trykkpareser (21 ). Det er rekombinasjon mellom to segmentduplikasjoner på kromsom 17, kalt Charcot-Marie-Tooths type 1A-repetisjonene, som fører til disse rearrangeringene. Området som rearrangeres inneholder et gen, PMP22 , som forårsaker nevropati dersom antall kopier i genomet avviker fra to. Pasienter med Charcot-Marie-Tooths sykdom type 1A har tre kopier av dette genet, mens pasienter med hereditær nevropati med trykkpareser kun har en kopi (21 ). Gener som forårsaker sykdom når kopitallet avviker fra to, kalles dosesensitive gener. Mange av genene som er involvert i ulike genomiske syndromer er dosesensitive.
Figur 3 To segmentduplikasjoner, vist med gul og oransje farge, flankerer her et område som inneholder et gen. Ved rekombinasjon mellom ikke-alleliske segmentduplikasjoner (ulik farge) blir resultatet ett kromosom med en duplikasjon og ett kromosom med en delesjon. I dette tilfellet får kromosomet til venstre to kopier av genet som er lokalisert mellom de to segmentduplikasjonene på dette kromosomet, mens kromosomet til høyre ender opp uten genet
For en del genomiske syndromer, såkalte kontinuerlige gensyndromer (contiguous gene syndromes), er det flere gener som er påvirket av rearrangeringen, og som sammen bidrar til den patologiske fenotypen. For eksempel er en hyppig årsak til Williams-Beurens syndrom en 1,5 Mb delesjon innen 7q11.23 som omfatter mer enn 20 gener (22 ). Også denne delesjonen oppstår ofte de novo ved rekombinasjon mellom segmentduplikasjoner. Karakteristiske manifestasjoner hos pasientene med Williams-Beurens syndrom inkluderer mild til moderat mental retardasjon, karakteristiske ansiktstrekk (alveansikt), kardiovaskulære problemer (særlig supravalvulær aortastenose) og infantil hyperkalsemi. Det er også karakteristisk at pasientene har en relativt god evne til å uttrykke seg verbalt, men at de har store problemer med visuospatiale oppgaver (skriving, tegning, legge puslespill og liknende) (22 ). De forskjellige genene i den deleterte regionen hos disse pasientene antas å bidra ulikt til de karakteristiske symptomene: Tap av en kopi av genet ELN , som koder for bindevevsbestanddelen elastin, er assosiert med de kardiovaskulære sykdommene som ofte er sett hos pasientene. Genet GTF2IRD1 antas å være viktig for normal kraniofacial utvikling, og genet GTF2I, som koder for en transkripsjonsfaktor antas å ha en rolle i utviklingen av visuospatiale problemer og mental retardasjon (22 ).
De omtalte eksemplene er mikroduplikasjon- og mikrodelesjonssykdommer, en gruppe sykdommer som forekommer relativt hyppig i befolkningen. Dette understreker at tilstedeværelse av segmentduplikasjoner legger til rette for strukturelle endringer i genomet, noe som utvilsomt også er viktig i et evolusjonært perspektiv.
Repeterte elementer og sykdom
De spredte repeterte elementene i genomet er blitt vist å bidra til sykdomsutvikling ved to ulike mekanismer. Sekvenslikhet mellom ulike kopier av repeterte elementer kan, på samme måte som for segmentduplikasjoner, fremme rekombinasjonshendelser i genomet som kan resultere i strukturelle endringer (23 ). Rekombinasjon mellom såkalte Alu-elementer, som finnes i et kopitall på over en million i genomet (9 ), har f.eks. vært foreslått som mekanisme hos flere hyperkolesterolemipasienter med defekt LDL-reseptor (23 ). I tillegg kan noen repeterte elementer, slik som Alu-elementene, sette seg inn på nye steder i genomet og kan da iblant føre til inaktivering av gener. Alu-elementer har en insersjonsrate på ca. 1 per 200 fødsler og har blant annet forårsaket tilfeller av hemofili A og nevrofibromatose (23 ).
Inversjoner og sykdom
Det er mange eksempler på inversjoner som forårsaker sykdom. Et kjent eksempel er hemofili A. Ca. 40 % av disse pasientene har en omtrent 400 kb inversjon som omfatter store deler av genet F8 , som koder for koagulasjonsfaktoren VIII (24 ). Dette genet har 26 eksoner, og hos disse pasientene er de første 22 eksonene invertert, noe som hindrer at det dannes intakt koagulasjonsfaktor VIII fra denne kopien av genet. Videre resulterer det i redusert blodkoagulasjonsaktivitet. Årsaken til inversjonen er at det i intron 22 i F8- genet finnes en sekvens som har stor likhet med sekvenser som finnes utenfor genet. En rekombinasjon mellom disse sekvenselementene på samme kromosom resulterer i inversjonen man ser i pasientene. En tilsvarende mekanisme forklarer en inversjon i IDS -genet, som fører til mangel av enzymet iduronat-2-sulfatase (IDS), og som finnes hos en del av pasientene med den metabolske sykdommen Hunters syndrom. Denne enzymmangelen fører til opphopning av glukosaminoglykaner og kan i sin alvorligste form føre til død før fylte 15 år (25 ).
Mens disse inversjonene direkte fører til en patologisk fenotype, er det andre inversjonsvarianter som er nøytrale for bæreren, men som øker risikoen for spesifikke sykdommer i neste generasjon. Bærere av slike varianter er friske, men inversjonen predisponerer for en genomisk rearrangering som kan føre til sykdom hos barna. Ca. 70 % av tilfellene med Angelmans syndrom er forårsaket av en 3,5 Mb delesjon av den maternelle kopien av kromosom 15 som omfatter genet UBE3A . En inversjon som inkluderer denne regionen, finnes oftere hos mødrene til disse pasientene enn i populasjonen generelt. Den finnes også oftere hos mødrene til pasienter med Angelmans syndrom der årsaken ikke er denne vanligste delesjonen (26 ). På samme måte er foreldrene til pasienter med Williams-Beurens syndrom oftere bærere av en inversjonsvariant på kromosom 7, sammenliknet med den generelle befolkningen (26 ).
Kopitallsvariasjoner og multifaktoriell arv
Ved multifaktoriell arv bidrar flere gener med ulike varianter (alleler) og miljøfaktorer sammen til fenotypen. Multifaktoriell arv finnes ofte ved kvantitative egenskaper, som for eksempel blodtrykk og høyde. Ved multifaktoriell arv viser fenotypen, for eksempel en sykdom, opphopning i familier uten at man ser én enkel (mendelsk) arvegang. Mange såkalte folkesykdommer slik som hjerte-kar-lidelser, diabetes, astma og allergi viser multifaktoriell arv. Letingen etter genvarianter som er involvert i utvikling av disse sykdommene, var tidligere rettet mot enkeltnukleotidpolymorfismene, men spesielt har oppdagelsen av kopitallsvariasjonene i genomet endret dette fokuset de siste årene.
Kopitallsvariasjoner er blant annet blitt assosiert med sårbarhet for bipolar sykdom (27 ), glomerulonefritt (28 ), hivinfeksjon (29 ), og nylig ble kopitallsvariasjoner vist å være sterkt assosiert med autisme (30 ).
Kromosomområder med varierende kopitall mellom individer overlapper også med gener som er involvert i kjente sykdommer, eller gener som er assosiert med sårbarhet overfor sykdommer. Eksempelvis varierer kopitallet i genet LPA , som er involvert i utvikling av koronar hjertesykdom (31 ), fra to og helt opptil 38 kopier (4 ).
Glutation-S-transferaser (GST) er enzymer som har nøkkelroller i det cellulære forsvaret mot skadelige forbindelser som blant annet dannes ved oksidativt stress. Gener som koder for enkelte typer av disse enzymene, varierer ofte i kopiantall i den humane populasjonen, og det er store variasjoner mellom etniske grupper (32 ). Som ytterpunkter nevnes genet GSTT1 , som er fraværende på begge kromosomer i ca. 50 % av den asiatiske befolkningen, og GSTM1 som er fraværende hos ca. 50 % av den hvite populasjonen (4 , 32 ). Enzymene som kodes fra disse genene, spiller en viktig rolle for detoksifisering av industrielle kjemikalier og f.eks. cellegifter og enkelte karsinogene forbindelser i sigarettrøyk. Blant annet er det flere studier som indikerer at mangel på GSTM1-enzym er assosiert med en noe forhøyet risiko for lunge- og blærekreft hos røykere (33 ). Det finnes imidlertid andre studier som ikke har påvist denne assosiasjonen, noe som understreker at mangel på dette enzymet alene ikke er nok, men at effekten sannsynligvis skyldes et samspill med flere gener og miljøfaktorer.
Det er åpenbart at kopitallsvariasjoner av enkelte gener i befolkningen vil kunne være med på å avgjøre et individs sårbarhet for sykdom. Blant kopitallsvariasjonene finnes flere eksempler på gener som koder for enzymer som er involvert i metabolismen av ulike legemidler (32 ). At kopitallet av disse genene varierer i befolkningen, vil derfor også kunne bidra til variasjon både i den terapeutiske effekten og i bivirkninger av legemidler. Dette vil vi utvilsomt lære mer om i årene som kommer, og vil potensielt kunne bidra i utviklingen av skreddersydd behandling for den enkelte pasient i fremtiden.