Alu-elementer tilhører en gruppe DNA-sekvenser som kalles innskutt repetitivt DNA. De har økt i antall over tid ved å kopiere seg selv. Disse elementene er også blitt kalt «egoistisk DNA», siden de tilsynelatende mangler en generell funksjon. Mer enn 45 % av vårt genom består av innskutt repetitivt DNA – det er et lappeteppe av relativt korte unike DNA-sekvenser, hyppig avbrutt av ulike typer innskutt repetitivt DNA (1 , 2 ). Tabell 1 viser de ulike hovedgruppene av innskutt repetitivt DNA i det humane genom. Alu-elementer klassifiseres sammen med andre korte repetitive elementer i en gruppe som kalles SINE (short interspersed elements) (2 ). I denne oversiktsartikkelen belyses spesielt den genteknologiske nytten av Alu-elementer samt hvordan deres aktivitet kan føre til genetisk sykdom. Oversikten som presenteres er basert på en litteraturstudie av orginalartikler fra Medline.
Tabell 1 Innskutt repetitivt DNA i det humane genom
Hovedgruppe
Antall¹
Andel² (%)
Undergrupper
Korte repetitive elementer (SINE)
1,6 · 10⁶
13
Alu, MIR, MIR3
Lange repetitive elementer (LINE)
0,9 · 10⁶
21
LINE 1, 2, 3
Retrovirusliknende
0,5 · 10⁶
8
ERV I-III, MaLR
DNA-transposoner
0,3 · 10⁶
3
MER1, MER2
Uklassifiserte
0,03 · 10⁶
0,15
Uklassifiserte
[i]
Alu-elementene (fig 1) ble identifisert for mer enn 20 år siden. De består av en 300 basepar lang sekvens som kuttes i to av restriksjonsenzymet Alu-I, derav navnet Alu-elementer (1 ). Elementene har økt i antall ved en prosess som kalles retroposisjon. Denne starter ved at en RNA-polymerase III transkriberer Alu-elementet slik at det dannes et Alu-RNA. Alu-elementets egne RNA-polymerase III-promotorer (fig 1, boks A og boks B) er med på å initiere transkripsjonen (prosess der en RNA-kopi dannes fra DNA), og promotorene blir selv en del av RNA-transkriptet. Ved hjelp av enzymene reverstranskriptase og endonuklease vil det dannes et nytt Alu-element (DNA) fra Alu-RNA-transkriptet. Det integreres i en ny posisjon i genomet uavhengig av posisjonen til det orginale Alu-elementet. Den siste delen av retroposisjon er lite karakterisert, men antas å være avhengig av poly-A-halen på Alu-elementet (fig 1), mens enzymene «lånes» fra LINE-gruppen. Alu-elementene er med andre ord avhengig av en annen gruppe innskutt repetitivt DNA (tab 1, LINE, long interspersed elements) for retroposisjon, de blir derfor også omtalt som parasittens parasitter (1 ).
En skjematisk illustrasjon av et Alu-element. Boksen merket A₅TACA6 er en sentralt plassert karakteristisk AT-rik sekvens. Boks A og boks B er to promotorsekvenser for RNA-polymerase III. Poly-A er en sekvens på 20 – 30 basepar med adenosinmononukleotider. Pilene på hver side av Alu-elementet markerer direkte repeterte sekvenser som flankerer elementet og som er derivert fra den opprinnelige sekvensen der det ble integrert
Millioner av år med retroposisjon har ført til en betydelig akkumulering av Alu-elementer. I det (haploide) humane genom er det i snitt ett slikt element for hver tredje kilobase DNA (ca. 1,1 millioner kopier). De er dermed den hyppigst forekommende type innskutt repetitivt DNA i mennesker (2 ). Et karakteristisk trekk ved dem er at de finnes i alle primater, men ikke i andre arter. Man antar at en fusjon mellom to RNA-gener for 65 – 80 millioner år siden var opprinnelsen til Alu-elementene (1 ).
Noen få Alu-elementer er fremdeles aktive. Basert på grove beregninger er det anslått at det er 1 – 10 nye Alu-insersjoner (et Alu-element som settes inn i en ny posisjon i genomet) per 200 fødsler (3 ). Enkelte Alu-elementer har adoptert viktige funksjoner. Noen deltar i reguleringen av gentranskripsjon, andre i spleising av pre-mRNA (en klippe-og-lime-modifisering av pre-mRNA). I enkelte tilfeller har Alu-elementer også gitt gener nye funksjoner (4 ).
Alu-elementer og sykdom
Sykdom forårsaket av insersjoner
Det er et faktum at Alu-elementene fremdeles øker i antall og integreres i nye posisjoner. Den mest nærliggende sykdomsmekanismen er derfor insersjon av et Alu-element i eller nær et gen. En insersjon i et ekson vil ødelegge det affiserte genets normale funksjon siden Alu-elementet både forandrer genets leseramme og legger til en sekvens som vil gi 100 ekstra aminosyrer i proteinet.
Et klassisk eksempel på en slik Alu-insersjon er et tilfelle av alvorlig hemofili A hos to brødre i en familie uten tidligere forekomst av hemofili (tab 2, nr. 1) (5 ). Hemofili A skyldes defekt eller mangel på faktor VIII. Sukarova og medarbeidere viste ved å sekvensere faktor VIII-genet at de to brødrene hadde en Alu-insersjon i ekson 14, og at deres mor og mormor var bærere av denne mutasjonen. Den innskutte Alu-sekvensen inneholdt et stoppkodon som resulterte i for tidlig terminering av translasjonen (en prosess der en polypeptidkjede dannes ved hjelp av informasjon fra mRNA) og dermed et trunkert funksjonsløst protein.
Tabell 2 Alu-insersjoner som har forårsaket eller bidratt til ulike genetiske sykdommer
Sykdom¹
Forekomst
Gen
PubMed-indeksnummer²
1.
Hemofili A
De novo?
Factor VIII
11713379
2.
Hemofili B
Familiær, de novo
Faktor IX
8069649, 11385709, 10679958
3.
Arvelig desmoid tumor
Familiær
APC
10077730
4.
Nevrofibromatose type 1
De novo
NF1
1719426
5.
Ornitinaminotransferasedefekt
Ukjent
OAT
1992472
6.
Alports syndrom
Familiær
COL4A3
7633417
7.
Aperts syndrom
De novo
FGFR2
9973282
8.
Akolinesterasemi
Familiær
Kolinesterase
1662391
9.
Komplementsvikt
De novo
C1-inhibitor
2154751
10.
Hyperparatyreoisme, hyperkalsemi
Familiær
CaR
7717399
11.
Brankio-oto-renalt syndrom
De novo
EYA1
9361030
12.
Brystkreft
De novo
BRCA2
8640237
13.
Akutt porfyri
Familiær
PBGD
10408772
14.
Glyserolkinasedefekt
Ukjent
GK
10737976
15.
Autoimmunt lymfoproliferativt syndrom
Familiær
Fas (apo-1)
12215906
[i]
Nærmere undersøkelser av årsaken til en rekke ulike genetiske sykdommer, f.eks. hemofili B og arvelig desmoid tumor (familiær adenomatøs polypose), har vist at sykdommene er forårsaket av liknende Alu-insersjoner i eksoner (tab 2, nr. 2, 3).
Insersjoner av Alu-elementer i introner nær eksoner kan også forårsake sykdom ved å forandre spleisingen av pre-mRNA slik at et ekson utelates fra det ferdig prosesserte mRNA (exon skipping) (tab 2, nr. 4).
Deler av Alu-elementet, såkalte kryptiske spleiseseter, har stor likhet med sekvenser som regulerer spleising. Et nøytralt Alu-element i et gitt intron kan dermed over tid forandres til en aktiv regulator av spleising ved at en enkelt baseparmutasjon forandrer det kryptiske spleisesetet til en aktiv spleiseregulator som forårsaker genetisk sykdom (tab 2, nr. 5, 6).
Tabell 2 viser genetiske sykdommer forårsaket av eller mest sannsynlig forårsaket av Alu-insersjoner. Grove estimater basert på rapportering av slike mutasjoner til databaser antyder at rundt 0,1 % av genetiske sykdommer skyldes Alu-insersjoner (3 ).
Sykdom forårsaket av rekombinasjon
Homolog rekombinasjon sørger for korrekt fordeling av kromosomer i meiosen og for resiprok (gjensidig) utveksling av arvemateriale mellom to homologe kromosomer. Homolog rekombinasjon starter med en baseparing av identiske sekvenser fra komplementære enkelttråder i de to homologe kromosomer. Uten en vellykket baseparing mellom de komplementære enkelttrådene avbrytes rekombinasjonen. Baseparingen sørger for at homolog rekombinasjon vanligvis initieres mellom alleliske sekvenser i de to homologe kromosomene. Rekombinasjon er derfor en meget nøyaktig prosess der det verken legges til eller trekkes fra et eneste basepar (6 ).
To tilfeldige Alu-elementer har en gjennomsnittlig sekvenslikhet på 85 – 90 % (7 ), og det er omtrent ett Alu-element for hvert 3 Kb DNA. Det er derfor tallrike muligheter for at generell rekombinasjon kan initieres mellom to ikke-alleliske Alu-elementer siden de har nærmest identiske sekvenser. En slik ikke-allelisk homolog rekombinasjon vil imidlertid ikke være resiprok. Isteden vil den resultere i ett kromosom med en duplisering av området mellom Alu-elementene og ett kromosom med en delesjon (tap) av det samme området (fig 2).
En skjematisk illustrasjon av en intragenisk Alu-rekombinasjon. Trinn 1 viser to homologer (A og B) der det initieres rekombinasjon mellom to ikke-alleliske Alu-elementer (Alu-1 og Alu-2) lokalisert oppstrøms og nedstrøms for et ekson. Trinn 2: Alu-elementene består av homologe sekvenser. Initieringen avbrytes derfor ikke, men fortsetter i en fullstendig rekombinasjon der to homologer brytes og sammenføyes. Trinn 3: De to rekombinante kromosomene. A har fått en delesjon av eksonet mellom Alu-elementene, mens B har fått en duplikasjon av eksonet mellom dem
Grove estimater basert på rapporteringer til mutasjonsdatabaser viser at rundt 0,3 % av genetiske sykdommer skyldes slike Alu-rekombinasjoner (3 ). Dermed synes det som om denne mekanismen er en hyppigere årsak til sykdom enn Alu-insersjoner. Tabell 3 viser eksempler på genetiske sykdommer der Alu-rekombinasjon enten er den direkte årsaken til eller har bidratt til sykdommen.
Tabell 3 Oversikt over Alu-rekombinasjoner som har forårsaket eller bidratt til ulike genetiske sykdommer
Sykdom¹
Mekanisme
Gen
PubMed-indeksnummer²
1.
Hyperkolesterolemi
Intragenisk Alu-rekombinasjon
LDLR
3155573, 3815525, 2544509
2.
Angionevrotisk ødem
Intragenisk Alu-rekombinasjon
C1-inhibitor
2572212, 2276734
3.
Tay-Sachs’ sykdom
Intragenisk Alu-rekombinasjon
b-HEXA
2824459
4.
Insulinuavhengig diabetes
Intragenisk Alu-rekombinasjon
Ins. Rec. B
1971035
5.
Arvelig C3-defekt
Intragenisk Alu-rekombinasjon
C3
1350678
6.
Sandhoffs sykdom
Intragenisk Alu-rekombinasjon
HEXB
2147027
7.
Hypobetalipoproteinemi
Intragenisk Alu-rekombinasjon
apoB
2567736
8.
Alvorlig kombinert immunsvikt (SCID)
Intragenisk Alu-rekombinasjon
ADA
3366897, 1696926
9.
Arvelig tykktarmskreft (HNPCC)
Intragenisk Alu-rekombinasjon
hMSH2
12494471
10.
Arvelig tykktarmskreft (HNPCC)
Intragenisk Alu-rekombinasjon
hMLH1
7584997, 8971183
11.
B-cellelymfom
Intragenisk Alu-rekombinasjon
p107 (Rb)
10863094
12.
Hunters syndrom
Intragenisk Alu-rekombinasjon
IDS
12579417
13.
Fabrys sykdom
Intragenisk Alu-rekombinasjon
α-gal A
2160973
14.
α-talassemi
Subtelomere Alu-rearrangement
α-globin
3032452, 8842736, 9462544
15.
Glanzmanns trombobasteni
Alu-inversjon/-delesjon
Integrin
8317479
16.
Ehlers-Danlos syndrom
Alu-rekombinasjon. Stor duplikasjon
Lysinhydroksylase
7977351
17.
Duchennes muskeldystrofi
Alu-rekombinasjon. Meget stor duplikasjon
DMD
1868831
18.
Lesch-Nyhans syndrom
Alu-rekombinasjon. Stor duplikasjon
HPRT
8381385
18.
Li-Fraumenis syndrom
Alu-rekombinasjon. Stor delesjon
TP53
12584563
19.
XX-mann
Alu-XY-rekombinasjon
XY
2822256
20.
Brystkreft
Intragenisk Alu-rekombinasjon samt somatisk
BRCA1
9041180, 9285788
21.
Akutt myeloid leukemi
Translokasjon t(8;16)
MOZ/CBP
12461753
22.
Pelizaeus-Merzbackers sykdom
Translokasjon t(19;X)
PLP1
12297985
23.
Akutt lymfoblastisk leukemi
Somatiske alu-re-arrangem.
ALL-1
8044771, 9482895, 8988051
24.
Ewings sarkom
Somatisk interkromosomal alu-rek
TRE
1461655
[i]
Mindre duplikasjoner eller delesjoner forårsaket av rekombinasjon mellom ikke-alleliske Alu-elementer innen et gitt gen (intrageniske mutasjoner) er den hyppigste typen Alu-rekombinasjon (tab 3, nr. 1 – 13), men dersom det er stor avstand mellom to Alu-elementer som rekombinerer, kan dette føre til større rearrangementer, som duplikasjon av et fragment på over 100 Kb (tab 3, nr. 17).
Alu-rekombinasjon mellom elementer på ulike kromosomer kan føre til translokasjoner som gir genetisk sykdom. Eksempler på dette er en translokasjon som har resultert i en fusjon mellom genene MOZ (histonacetyltransferase) og CBP (CREB-bindende protein) samt en translokasjon som har ført til tap av genet PLP1 (tab 3, nr. 21, 22).
I noen gener er det rapportert mange uavhengige Alu-rekombinasjoner (tab 3, nr. 1, 2). Hva som er årsaken til en høyere rate av Alu-rekombinasjon i enkelte gener er ukjent, og det er ikke funnet noen direkte sammenheng mellom høy tetthet av Alu-elementer i et gitt gen og høy rate av Alu-rekombinasjon (P. Deininger, personlig meddelelse). Et annet gen med multiple rearrangementer forårsaket av Alu-elementer er ALL-1 (akutt lymfoblastisk leukemi) (tab 3, nr. 23). Mutasjonene i ALL-1 skiller seg imidlertid fra de tidligere nevnte Alu-rekombinasjonene ved at rearrangeringen foregår i somatiske celler.
Alu-elementer og kreft
Både Alu-insersjoner og Alu-rekombinasjoner kan bidra til utvikling av kreft ved å inaktivere tumorsuppressorgener eller «mismatch»-reparasjonsgener (feilparingsreparasjonsgener). I tumorsuppressorgenet BRCA1 (tab 3, nr. 20) er det vist at en Alu-rekombinasjon som resulterte i en delesjon av ekson 17 førte til inaktivering av genet, mens en Alu-insersjon som førte til alternativ spleising og «exon skipping» har forårsaket inaktivering av tumorsupressorgenet BRCA2 (tab 2, nr. 12). Inaktivering av de nevnte gener (BRCA1 og BRCA2) bidrar til utvikling av brystkreft.
Inaktiverende delesjoner som følge av Alu-rekombinasjon er også funnet i «mismatch»-reparasjonsgenene hMLH1 og hMSH2 (tab 3, nr. 9, 10). Blant annet synes en inaktivering av hMLH1 å være spesielt utbredt blant finner. I en studie av Nystrom-Lahti og medarbeidere ble denne mutasjonen funnet i ca. 40 % av alle tilfeller med arvelig predisposisjon for tykktarmskreft i Finland (8 ).
Alu-rekombinasjon kan også være en bidragsyter til tap av heterozygositet (LOH), en generell økning av delesjoner som observeres i kreftceller. Mekanismen for dette er knyttet til P53. Ved inaktivering av P53 er det vist at Alu-rekombinasjonsraten øker 20 ganger (9 ). En slik øking av rekombinasjonsraten fører til en tilsvarende økning av antall delesjoner. Det er derfor sannsynlig at Alu-rekombinasjon bidrar sterkt til tap av heterozygositet i kreftceller.
De fleste eksemplene på sykdomsfremkallende Alu-elementer i tabell 2 og tabell 3 beskriver de novo-mutasjoner, andre er mutasjoner som representerer familiære genetiske sykdommer eller historiske mutasjoner som i dag er relativt hyppige i enkelte populasjoner (f.eks. mutasjonen i hMLH1 i finner). Man kan også tenke seg at det finnes prehistoriske gendefekter som er forårsaket av Alu-elementer for så lenge siden at de er fiksert i hele den humane populasjon. Et fascinerende eksempel på dette synes å være tap av evnen til å syntetisere vitamin C. Genet GLO (gulonolaktonoksidase) koder for et enzym som katalyserer det siste trinnet i syntesen av vitamin C. En studie av Challem & Taylor indikerer at Alu-elementaktivitet kan være årsaken til tapet av dette genet i høyere primater for rundt 45 millioner år siden (10 ).
Alu-elementer som molekylære verktøy
Tallrike og primatspesifikke elementer
Alu-sekvensen har en kompleksitet som er tilstrekkelig til at både prober og primere (polymerasekjedereaksjonsmetoder, PCR) binder spesifikt til Alu-elementer. Det enorme antallet Alu-elementer kombinert med at de bare er til stede i primatgenomer kan derfor utnyttes i en rekke applikasjoner der man ønsker å detektere eller ekstrahere den humane komponenten i en blandingsprøve. Alu-elementenes spesielle egenskaper kan bl.a. utnyttes ved PCR-amplifisering av den klonede humane komponenten i Yeast Artificial Clones (YAC) (11 ). Prinsippet for denne metoden er illustrert i figur 3. Ved å benytte PCR-primere som binder spesifikt til Alu-elementer som er til stede i det klonede humane DNA kan man amplifisere den humane komponenten fra en en blanding av humant DNA og gjær-DNA. Ved hjelp av liknende metoder ble de første humane onkogener isolert (12 ).
PCR-amplifisering av humant DNA fra Yeast Artificial Chromosomes (YAC). Rektangelet øverst illustrerer et YAC-kromosom som består av gjær-DNA (mørkegrå flankerende bokser), humant klonet DNA (lysegrå) og Alu-elementer som er en del av det klonede humane DNA (svarte bokser). To grå piler illustrerer PCR-primere derivert fra overgangen mellom gjærsekvensen i de flankerende armene og det humane DNA (flankeprimer). De svarte pilene illustrerer PCR-primere derivert fra sekvensen til Alu-elementer (Alu-primer). Nederst en illustrasjon av produktene fra PCR-amplifiseringer med flankeprimere og Alu-primere. To typer fragmenter genereres. a) Humant DNA mellom en flankeprimer og en Alu-primer. b) Humant DNA mellom to Alu-primere. I begge tilfeller er det en spesifikk amplifisering av den humane komponenten i blandingen av gjær og humant DNA
De primatspesifikke egenskapene til Alu-elementer kan også utnyttes i rettsgenetikk. Det biologiske prøvematerialet er ofte en blanding av humant DNA og DNA fra andre arter (bakterier, hund, katt). Ved å måle andelen Alu-elementer i prøven kan andelen humant DNA beregnes (13 ).
Alu-elementer er molekylære fossiler
Retroposisjon av Alu-elementer startet tidlig i primatenes utvikling. Et element som er blitt integrert i en bestemt posisjon, vil arves av alle etterkommere av dette individet, siden det ikke er noen mekanisme som presist fjerner et Alu-element. Det er lite sannsynlig at to Alu-elementer uavhengig av hverandre er blitt integrert i eksakt samme posisjon i to individer. En insersjon i en gitt posisjon regnes derfor som en unik hendelse som indikerer et felles opphav (identity by descent). Samtidig representerer fraværet av Alu-elementet den opprinnelige tilstanden (ancestral state) for posisjonen man undersøker (14 ).
Disse egenskapene er utnyttet i ulike fylogenetiske undersøkelser. En studie av Hamdi og medarbeidere (15 ) illustrerer hvordan Alu-elementer er benyttet for å kartlegge slektskap mellom ulike primater. Ved å undersøke for tilstedeværelse av Alu-elementer i ortologe posisjoner kunne to arter klassifiseres som nærere beslektet enn det slektskapet de hadde til en tredje art fordi de hadde et Alu-element i en posisjon der den tredje arten manglet det. Slektskap ble med andre ord basert på at to arter hadde fått en felles karakteristisk markør, aldri på at de manglet markøren. Den samlede informasjonen fra 15 Alu-elementer støttet kun ett fylogenetisk slektstre for de åtte arter som ble undersøkt, i samsvar med at Alu-insersjoner er unike hendelser.
Alu-elementer kan benyttes på liknende måter for å kartlegge rekkefølgen av genomiske rearrangementer. Ved slike undersøkelser kan man få ytterligere informasjon ved å sammenlikne sekvensdiversitet mellom de enkelte elementene. Veksthormongener (16 ) og HLA-gener (17 ) er gode eksempler på historiske rearrangementer i det humane genom som er kartlagt ved hjelp av informasjon fra Alu-elementinsersjoner.
Bialleliske Alu-polymorfismer
Enkelte Alu-elementer som er blitt integrert inn i nye posisjoner de siste 30 000 år, er ikke fiksert i det humane genom, men kan enten være til stede eller ikke være til stede. Slike bialleliske Alu-polymorfismer kan benyttes til å studere populasjonshistorie og genetisk diversitet (18 ).
Et Alu-element på den ikke-rekombinerende delen av Y-kromosomet (Y-Alu-polymorphic element, YAP) er en biallelisk polymorfisme som er spesielt mye benyttet i kartleggingen av historisk slektskap mellom menn. YAP er høyfrekvent i asiatiske populasjoner, og siden tilstedeværelsen av dette Alu-elementet indikerer historisk slektskap, er det blitt en viktig markør for å kartlegge historiske migrasjoner i ulike folkegrupper (19 , 20 ).
Diskusjon
Den tilsynelatende parasittiske amplifiseringen av Alu-elementer har frembrakt markører i det humane genom som kan benyttes for en rekke ulike formål. Hvorvidt den enorme mengden Alu-elementer i primatgenomer har en eller annen generell funksjon, for eksempel ved stressrespons, er fremdeles et åpent spørsmål (4 ).
Elementene kan bidra til genetisk sykdom på flere måter. De fleste eksemplene i denne artikkelen illustrerer mekanismer der det er en direkte sammenheng mellom Alu-element og sykdom. I tillegg kan sannsynligvis insersjon av slike elementer nær gener gi disposisjon for sykdom ved å påvirke ekspresjonen av disse genene.
Det er sannsynligvis en underrapportering av Alu-elementer som genererer sykdom. Dette skyldes at de mest benyttede metodene i mutasjonsundersøkelser (SSCP, DGGE, DNA-sekvensering) er designet for å oppdage baseparmutasjoner i eksoner. Tap av et helt ekson pga. en Alu-rekombinasjon vil derfor ofte ikke bli oppdaget (21 , 22 ). Dersom man ønsker å finne alle mutasjoner i et gen, bør derfor metoder som proteintrunkeringstest (testet på mRNA) og kvantitativ PCR-undersøkelse vurderes, slik at også mutasjoner som er forårsaket av Alu-elementer blir oppdaget.