PLoS ONE: Evolutionær historie Cancer Immunity Antigen MAGE Gene Familie

Abstrakte

Den evolutionære tilstand af en multi-gen familie kan ændre sig over tid, afhængigt af den funktionelle differentiering og lokal genomisk miljø af familiemedlemmer. I denne undersøgelse har vi påvise en sådan ændring i melanom-antigen (

MAGE

) genfamilien på pattedyrs X-kromosom.

MAGE

gen familie består af ti underfamilier, der kan kategoriseres i to typer. Type I-gener er af relativ ny oprindelse, og de koder for epitoper til human leukocyt antigen (HLA) i cancerceller. Type II-gener er relativt gamle og nogle af deres produkter er kendt for at være involveret i apoptose eller celleproliferation. Den evolutionære historie

MAGE

genfamilien kan inddeles i fire faser. I fase I, havde en enkelt kopi tilstand af en nedarvet gen og evolutionært bevaret tilstand varede indtil fremkomsten af ​​eutherian pattedyr. I fase II, otte underfamilie- forfædre, med undtagelse for

MAGE-C

MAGE-D

underfamilier, blev dannet via retrotransposition selvstændigt. Dette ville falde sammen med en gennemførelse byge af

LINE

elementer på eutherian stråling. Men

MAGE-C

blev genereret ved gen-duplikering af

MAGE-A

. Fase III er karakteriseret ved omfattende gen dobbeltarbejde inden for hver underfamilie og især dannelsen af ​​palindromer i

MAGE-A

underfamilie, som fandt sted i en forfader til Østaber. Fase IV er karakteriseret ved nedbrydning af et palindrom i de fleste Østaber, med undtagelse af mennesker. Selvom palindrom er afkortet ved hyppige deletioner i aber og østaber er det bevaret i mennesker. Her vil vi argumentere for, at dette menneske-specifikke tilbageholdelse skyldes negativ selektion virker på

MAGE-A

gener, der koder epitoper af kræftceller, som bevarer deres evne til at binde til højt divergerende HLA-molekyler. Disse resultater fortolkes med hensyntagen til de biologiske faktorer forme seneste menneskelige

MAGE-A

gener

Henvisning:. Katsura Y, Satta Y (2011) Evolutionær historie Cancer Immunity Antigen

MAGE

Gene Family. PLoS ONE 6 (6): e20365. doi: 10,1371 /journal.pone.0020365

Redaktør: Nikolas Nikolaidis, California State University Fullerton, USA

Modtaget: 14 februar 2011; Accepteret: April 18, 2011; Udgivet: 10 juni, 2011

Copyright: © 2011 Katsura, Satta. Dette er en åben adgang artiklen distribueres under betingelserne i Creative Commons Attribution License, som tillader ubegrænset brug, distribution og reproduktion i ethvert medie, forudsat den oprindelige forfatter og kilde krediteres

Finansiering:. Dette arbejde blev understøttet af en Grant-in Støtte til videnskabelig forskning på prioriterede områder (17.018.032). De finansieringskilder havde ingen rolle i studie design, indsamling og analyse af data, beslutning om at offentliggøre, eller forberedelse af manuskriptet

Konkurrerende interesser:.. Forfatterne har erklæret, at der ikke findes konkurrerende interesser

Introduktion

den evolutionære tilstand af et gen familie, nemlig processen med fødsel og død af gener og omfang af sekvens divergens, afhænger af den funktionelle divergens af duplikerede gener og på den lokale struktur af genomet, hvor familien er bosat [1], [2]. Her, lokal struktur af genomet refererer til tandem eller omvendte gentagelser (IRS). Udviklingen af ​​et gen familie på IRS kan være særlig komplekse som følge af homogenisering ved hyppig gen konvertering og strukturel ustabilitet som følge af hyppige indsættelser og /eller sletninger.

Warburton et al. (2004) fandt en overvægt af store, IR med en høj grad af lighed mellem gentagelser på X- og Y-kromosomer (-30% af IR i det humane genom er der X- og Y-kromosomer) [3]. Mange IR’er på X- og Y indeholder gener, overvejende udtrykt i testis [3]. Warburton og hans kolleger foreslog, at disse IR spiller en vigtig rolle i den menneskelige genom evolution. Imidlertid har den præcise rolle IRS i evolutionen forblev uklart. Derfor, i dette studie, vi forsøger at undersøge koncentrere tilstanden af ​​gen familie evolution i IRS, med særligt fokus på melanom antigen (

MAGE

) gen-familien, hvor medlemmerne er placeret på en stor ( ~ 100 kb) palindrom på den menneskelige X-kromosom.

MAGE

blev oprindeligt identificeret som “en melanom antigen” og senere

MAGE

og dens homologer blev opdaget at danne en multi-genfamilien i eutherian genomer [4] – [7].

MAGE

homologe sekvenser er blevet fundet i nogle hvirveldyr (zebrafisk og kylling) [8], [9] og hvirvelløse dyr (frugt flyve) [10]. I det humane genom, er denne familie består af 10 underfamilier og hver underfamilie består af en til 15 gener [7]. Ud over klassificeringen af ​​underfamilie,

MAGE

gener kan også klassificeres i type I eller type II, baseret på deres ekspressionsmønstre og funktion. Type I gener er sammensat af tre underfamilier (

MAGE-A

, til –

C

) og type II-gener af syv underfamilier (

MAGE-D

til –

F

, –

H

, –

L2

,

NDN

,

NDNL2

). Type I gener udtrykkes i stærkt prolifererende celler, såsom tumorer, placenta og kimlinieceller [4]. Type II-gener, derimod, er allestedsnærværende udtrykt i somatiske celler, og nogle type II gener er kendt for at være involveret i apoptose eller celle proliferation [11].

Alle type I

MAGE

gener er placeret på X-kromosomet og indkode tumorantigener, der spiller en central rolle i immunitet kræft. Peptider i humane MAGE homologi domæne (MHD), der er 160-170 aminosyrer langt, er epitoper til human leukocyt antigen (HLA) klasse I-molekyler [4]. Når antigenet (peptid i MHD) på en tumorcelle binder til en receptor på en killer T-celle, T-celle-angreb tumorcellen [4], [12].

HLA

er usædvanlig polymorf i det humane genom og anderledes

HLA

alleler kan binde forskellige epitoper [13], [14].

MAGE

gener kan kode mange epitoper således at binde til eller reagere med, hver HLA-molekyle. Således er det af interesse at spore oprindelsen af ​​sammenhængen mellem

HLA

MAGE

samt at bestemme, hvordan den genetiske mangfoldighed i epitop-kodende region har udviklet sig og er blevet vedligeholdt.

Mange

MAGE

gener menes at være pattedyr-specifikke [7]. Desuden fleste eutherian

MAGE

gener har en enkelt exon at kode for et protein, og derfor er de tilbøjelige til at have stammer fra retrotransposition af

MAGE-D

[7], fordi kun

MAGE-D

underfamilie- medlemmer har 14 exoner, hvor en ORF kodes mellem den anden til 12. exoner [15]. Men forholdet mellem type I og type II-gener er ikke blevet fuldt undersøgt og den tilstand af diversificering af disse gener er fortsat uklart.

I denne undersøgelse undersøger vi den evolutionære historie

MAGE

genfamilie. Først søgte vi efter de fordums afveg

MAGE

gener i hvirveldyr og hvirvelløse genomer. For det andet, vi undersøgte, hvordan og hvornår forfædrene til hver tre type I og syv type II underfamilier blev genereret med særlig henvisning til deres form for forstærkning. For det tredje har vi fokus på den

MAGE

A

underfamilie (en af ​​type I underfamilier) og demonstrere, hvordan genomet arrangement har fundet sted i primater. Endelig viser vi, at nogle menneske

MAGE

A

gener har gennemgået negativ selektion mod homogenisering af gen-konvertering for at bevare deres genetiske variationer blandt aminosyresekvenser. Vi foreslår, at dette valg er relateret til opretholdelse af en række HLA-epitoper i kræftceller.

Materialer og metoder

Sekvenser brugt

Menneskelige (

Homo sapiens

) nukleotidsekvensdata og tilsvarende gen information blev opnået fra NCBI-databasen (build 36,3; https://www.ncbi.nlm.nih.gov/). Syntenic eller homologe genomiske sekvenser fra andre primater og pattedyr, herunder opossums (

Monodelphis domestica

) og platypuses (

Ornithorhynchus anatinus

), blev hentet fra NCBI og Ensembl databaser (http: //uswest .ensembl.org /index.html). For at finde bevaret synteny mellem den menneskelige X-kromosom og kromosomer i andre dyr, analyser BLAST hjælp menneske

MAGE

gener som forespørgsler blev udført. For at identificere homologe sekvenser, bruger vi 70% som en cut-off værdi for BLAST søgninger.

Identifikation af genomiske strukturer

Identifikation af IR og tandemgentagelser blev udført på en dot-matrix tilgang [ ,,,0],16]. GenomeMatcher [17] blev derefter anvendt til at opnå detaljerede oplysninger om nukleotidsekvens lighed mellem dublerede enheder. Et diagram, der trækkes af dette program viser omfanget af lighed mellem sekvenser under anvendelse farvekoder, med røde repræsenterer ligheden større end 95%, orange svarende til ca. 90% -95%, grøn svarer til ca. 85% -90%, og blå repræsenterer under 85 %.

Phylogenetisk og molekylær evolutionær analyser

at studere fylogenetiske relationer mellem

MAGE

familiemedlemmer, 158 kodende sekvenser (CDS’er) i mennesket, chimpansen (

Pan troglodytes

), makak (

Macaca mulatta

), mus (

mus musculus

), ko (

Bos taurus

), hund (

Canis lupus

), opossum, næbdyr, kylling (

Gallus gallus

) og zebrafisk (

Danio rerio

) genom blev hentet fra NCBI-databasen (tabel S1).

MAGE

homologer blev også søgt i Ensembl database af den vestlige Xenopus laevis (

Xenopus tropicalis

), lampretter (

Petromyzon marinus

), lancelets (

Branchiostoma floridae

), sækdyr (

Ciona intestinalis

) og søpindsvin (

Strongylocentrotus purpuratus

). For hver af disse arter, vi har søgt på

MAGE

homologer over hele genomer. I søgninger i homologer,

MAGE-D

underfamilie- medlemmer blev anvendt som en forespørgsel, fordi

MAGE-D

menes at være den nedarvede

MAGE

underfamilien [7] . Når vi bruger andre menneskelige

MAGE

sekvenser som en forespørgsel, fandt vi, at sekvenser detekteret allerede var medtaget i den opnåede ved hjælp af

MAGE-D

resultat.

I det humane genom , var der 37 kommenteret

MAGE

gener på X-kromosomet: 15

MAGE-A

s, 11

MAGE-B

s, tre

MAGE-C

s, fem

MAGE-D

s, to

MAGE-E

s og en

MAGE-H

. Desuden er to

MAGE-F

s beliggende på kromosom 3 og

necdin-lignende 2 Hotel (

NDNL2

eller

MAGE-G

) ,

MAGE-lignende 2 Hotel (

MAGE-L2

) og

necdin

(

NDN

) er på kromosom 15. ud over de annoterede gener, en homolog sekvens (

psMAGEA-lignende: psMAGEAL

, NC_000023: 2.765.558 ‥ 2.770.471) svarende til den menneskelige

MAGE

pseudogen,

psMAGEA Hotel (NC_000023: komplementære 151.952.946 ‥ 151.957.859), blev identificeret. Gene forkortelser, der bruges i denne undersøgelse følger de standarder, der anvendes til menneskelige gener.

Sekvenserne opnåede blev justeret ved hjælp af Clustal W software [18] med manuelle korrektioner. Sekvenserne af menneskelig

MAGE-H

, –

A5

og mus –

A9

var korte. Disse blev kasseret, fordi inklusion af disse sekvenser optaget en meningsfuld sekvensalignment kort. Antallet af nukleotidforskelle per site (

s

-Distance) blev derefter beregnet under anvendelse MEGA4 [19], og fylogeni blev konstrueret under anvendelse af nabo-sammenføjning (NJ) [20] metode til rådighed i denne software. Phylogenies blev også konstrueret med randomiseret A (x) ccelerated Maximum Likelihood (RAxML) [21] og Bayesianske (Bayes) metoder. Et program for RAxML fremgangsmåden er leveret af https://phylobench.vital-it.ch/raxml-bb/og at for Bayes metoden er MrBayes 3 [22]. De justeringer, der anvendes her, er tilgængelige efter anmodning. DnaSP v5 [23] blev anvendt til vinduet analyse af nukleotid divergens. RepeatMasker [24] blev anvendt til at screene sekvenser for indflettede gentagelser i NCBI-databasen. Et program, GENECONV [25] blev anvendt til at detektere genomdannelse.

transkriptionsfaktorbindingssites

transkriptionsfaktorbindingssites (TFBS) blev undersøgt under anvendelse af TRANSFAC R4.3 databasen [26], tilgængelige på TFBIND hjemmeside (http: //tfbind.ims.u-tokyo.acjp/) [27]. For at finde en kandidat TFB blev sekvenser opstrøms af målgener justeret, og højt konserverede sekvenser blev valgt. Sekvenserne blev kontrolleret for tilstedeværelsen af ​​TFBS kommenteret i databasen.

Resultater

Oprindelse af hvirveldyr og pattedyr

MAGE

genfamilien

For at identificere

MAGE

homologer i lampretter, lancelets, sækdyr og søpindsvin, var en bragende søgning udføres for deres genom og EST-sekvenser, ved hjælp af

MAGE-D

gener som forespørgsler. Selv om der var ingen påviselige homologe gener i lampretter og søpindsvin, hypotetiske gener i begge sækdyr (XM_002119518) og lancelets (XM_002613563) viste 37% sekvens lighed med den menneskelige

MAGE-D1

. De BLAST søgeresultater viste, at fremkomsten af ​​

MAGE

gen kunne have fundet sted før divergens Protochordata fra Chrodata.

I kæbet hvirveldyr, zebrafisk genom har en enkelt

MAGE

gen,

Necdin-lignende 2 Hotel (

DareNDNL2

) [8].

NDNL2

gener findes også i mennesker, mus og køer, men eutherian

NDNL2s

behandles gener og har en enkelt exon, mens

DareNDNL2

besidder ~11 exons. Et fylogenetisk træ baseret på aminosyresekvenser viser, at eutherian

NDNL2

s er paraphyletic til

DareNDNL2

(fig 1 og S1.):

DareNDNL2

er en “primær” ortolog af eutherian

MAGE

gener [28]. Denne fylogenetiske forhold (topologi af træet) understøttes også af RAxML og Bayes træer (data ikke vist).

CDS’er på 158

MAGE

gener blev brugt (se tabel S1). CDS sammenlignet er 204 bp lang. Efter justering blev alle huller udelukket for træ konstruktion. Underfamilie klynger er vist. Antallet på hver node er bootstrap værdi understøtter node. Fisk

NDNL2 Hotel (

Dare NDNL2

) og pattedyr

NDNL2

er vist med blåt. Artsnavnet forkortelser er som følger: Bota (

Bos taraus

), Capo (

Cavia porcellus

), Dare (

Danio rerio

), Gaga (

Gallus gallus

), Hosa (

Homo sapiens

), Mamu (

Macaca mulatta

), Modo (

Monodelphis domestica

), Mumu (

Mus musculus

), Orna (

Ornithorhynchus anatinus

), og Patr (

Pan troglodytes

). Figur S1 er en forstørret udgave af dette tal og har læselig tekst.

Hver af frø og kylling genomer besidder kun en

MAGE

gen. I begge tilfælde, om syntenic forhold med

DareNDNL2

, position af genet på et kromosom kunne ikke bekræftes på grund af den ufuldstændige tildeling af gener på kromosomer i disse arter. Men da faser ved hver exon og intron grænse i CDS af fisk, frøer og høns var godt bevaret (tabel 1), den fælles

MAGE

gener i frøen og kylling vil sandsynligvis være en-til -on orthologer af

DareNDNL2

.

Selv om kun en enkelt

MAGE

blev fundet i fisk, frøer og høns, mennesker og mus har flere underfamilier af

MAGE

gener [7]. Det er således interessant at undersøge

MAGE

homologer i Monotremer (næbdyr) og pungdyr (opossum). En fuld-genom BLAST søgning ved hjælp af menneskelig

MAGE-D1

som en forespørgsel opdaget en

MAGE

-lignende (

Magel

) sekvens i Platypus og to

Magel

s i opossum. Disse blev tentativt navngivet

OrnaMAGEL

og

ModoMAGEL1

/

L2

hhv. BLAST søger hjælp andre

MAGE

gener såsom

DareNDNL2

som en forespørgsel resulterede i påvisning af de samme gener.

opossums

ModoMAGEL1

ModoMAGEL2

er placeret på kromosomer X og 8.

ModoMAGEL2

er kodet af en enkelt exon, mens

ModoMAGEL1

er kodet med 11 exons. Således

ModoMAGEL2

vil sandsynligvis være et forarbejdet gen afledt af

ModoMAGEL1

. Faktisk

ModoMAGEL1

ModoMAGEL2

danne en monofyletisk gruppe i træet (fig. 1, fig. S1) og i træer konstrueret ved tre forskellige metoder (NJ, RAxML og Bayes).

de platypuses

OrnaMAGEL

gen er placeret på contig’en Ultra 403 og består af 10 exons. Selvom antallet af exons afviger fra det i

ModoMAGEL1

faserne og størrelser af delte exons velbevarede (tabel 1). Desuden Ultra 403 indeholder også ubiquitin ligasegenet

HUWE1

(HECT, UBA og WWE domæne, der indeholder 1), som er placeret ~600 kb opstrøms fra

OrnaMAGEL

. En

in situ

hybridisering undersøgelse bekræftede, at i Platypus,

HUWE1

er placeret på kromosom 6 [29]; Således er det sandsynligt, at denne contig er en del af kromosom 6. Platypus kromosom 6 er homolog med autosomale forfader til eutherian og pungdyr X-kromosomer [29]. Faktisk området omkring

OrnaMAGEL

på contig’en viste et syntenic forhold til den humane Xp11 region. I det menneskelige genom, den position, der svarer til

OrnaMAGEL

er besat af

MAGE-D2

D3

(. Figur 2). Menneskelig

MAGE-D2

D3

besidder 13 exons og faser og størrelser af delte exoner er bevaret med

OrnaMAGEL

, samt med

ModoMAGEL1

og andre

MAGE

gener i kylling, frø og zebrafisk genomer (tabel 1).

Røde søjler angiver

MAGE-D

eller

Magel Salg gener i det humane eller næbdyr hhv. Sorte bjælker og gen navne indikerer syntenic gener mellem mennesker og platypuses. Blå barer og gen-navne indikerer gener, som ikke viser synteny. Andre

MAGE-D

underfamilie- medlemmer,

MAGE-D1

MAGE-D4

er placeret på 51,6 M og 51,9 M på den menneskelige X-kromosom, hhv.

Fylogeni af pattedyrs

MAGE

genfamilien

Et træ af menneskelig

MAGE

gener viser, at de tre type i

MAGE

underfamilier (

MAGE-a

, –

B

og –

C

) danner en monofyletisk klynge, der adskiller sig fra de syv type II underfamilier (

MAGE- D

, –

E

, –

F

, –

H

, –

L2

,

NDN

NDNL2

) (fig. 3). Beviserne er støttet af fem fylogenetisk informative substitutioner (D16Y, K23T, I62V, A113E og R156Q i en tilpasning af MHD, fig. S3). Desuden

MAGE-D Salg gener danner en monofyletisk klynge. Selvom antallet af nukleotider, der anvendes i denne analyse er lille, er det klart, at type I underfamilier afveg mere nylig end type II underfamilier (fig. 3 og fig. S2).

Træet er baseret på antallet af aminosyre forskelle pr webstedet (

s

-distances). Gener men for

DareNDNL2

i træet er alle

MAGE

gener fundet i det humane genom.

DareNDNL2

fra zebrafisk bruges til at bestemme roden af ​​træet. Antallet af lokaliteter sammenlignet er 92 aminosyrer uden huller. Bootstrap værdi er angivet ved knudepunktet. Sekvenser er anført i tabel S1.

MAGE-E

har duplikeret MHD og dobbeltarbejde er opstået tidligere end fremkomsten af ​​typen Ι gener.

MAGEE1_1 Hotel (

MAGEE2_1

) og

MAGEE1_2 Hotel (

MAGEE2_2

) repræsenterer MHD i N og C-terminal side af

MAGE-E1 Hotel (

MAGE-E2

), hhv. Den eutherian

MAGE-D3

genet koder trophinin (TRO), som udtrykkes i placenta og påvirker embryo implantation.

Med undtagelse af

MAGE-D

gener, pattedyr

MAGE

gener har en enkelt exon for CDS. Således disse er tilbøjelige til at blive behandlet gener stammer fra udskrifter af

MAGE-D

eller andre

MAGE-D

behandlet gener [7], [30]. Men vi kan ikke udelukke muligheden for, at en forfader til hver underfamilie skyldes duplikering af et forarbejdet gen.

For at undersøge, hvordan stamfader til hvert gen familie opstod, nukleotidsekvenserne af en enkelt repræsentanter fra hver underfamilie var sammenlignet med hinanden ved hjælp dot-matrix analyse [16]. Hvis en hel kodende region, herunder flankerende region er blevet duplikeret, den dotter analyse viser ligheden ud over CDS. På den anden side har en forfader til hver underfamilie blevet genereret af retrotransposition, viser analysen, ligheden kun i CDS.

For det meste

MAGE

gener, dot-matrix analyse viste der blev observeret inden for og mellem type i og II betydelige ligheder kun i CDS regioner, hvilket tyder på en retrotranspostion. En sammenligning mellem

MAGE-A

og

MAGE-C

, på den anden side, var en undtagelse. Sammenligningen afslører ligheden ud over CDS, hvilket tyder på DNA-baseret gen dobbeltarbejde. Imidlertid kan det være muligt, at andre underfamilier også blev dannet ved genduplikering. Rækkefølgen lighed i flankerende regioner af dubletter blev muligvis tabt under evolution på grund af den svagere funktionelle begrænsning. Faktisk omfanget af synonyme sekvens forskelle blandt type II gens og dem mellem type I og type II-gener i området fra 0,81 til 1,0, således at der ikke væsentlig lighed i en region uden CDS blev observeret. Selvom cladistisk markører såsom

linjer

kunne have været oplysende til at skelne retrotransposition fra gen dobbeltarbejde, blev der ikke fundet sådanne informative elementer. , I mangel af støttende beviser, vi konkluderede derfor, at

MAGE-C

blev kopieret fra

MAGE-A

og at andre underfamilier blev genereret af retrotransposition. I alt otte indrykninger af retrotransposed

MAGE

har fundet sted i genomet af fædrene Eutheria og hver forarbejdet gen blev en forfader til en underfamilie. Efter retrotransposition, ser ud til at have fundet sted inden for hver underfamilie en uafhængig gen dobbeltarbejde.

Gene dobbeltarbejde og palindrom dannelse

Det er bemærkelsesværdigt, at klyngedannelse mønster af

MAGE-A

adskiller sig fra

MAGE-B

(fig. 1, fig. S1). Hver af de 11 menneskelige

MAGE-B

gener danner et monofyletisk klynge med ortologer i andre eutherians, mens 15

MAGE-A

gener danner arts- eller højere systematiske enhed-specifikke klynger (fig. 1 , fig. S1 og S2). Desuden tre

MAGE-C

gener synes at være primat-specifik. Inden de to type II

MAGE

underfamilier, fem

MAGE-D

to

MAGE

E

gener viser også en klyngedannelse mønster (en- til-en ortologe forhold), der svarer til

MAGE-B Hotel (fig. 1 og 3).

i alt 16

MAGE-A

gener er placeret på Xq28, i størrelsesordenen 148 Mb til 153 Mb, og er grupperet i tre blokke A, B og C (fig. 4A). Blokke A og B indeholder fem (

MAGE

A11

, –

A9

, –

A9B

, –

A8

psMAGEA7

) og ti (

MAGE

A4

, –

A5

, –

A10

, –

A6

, –

A2B

, –

A2

, –

A12

, –

A3

,

psMAGEA

og

psMAGEAL

) generne, hvorimod blok C indeholder et enkelt gen (

MAGE-A1

) (fig. 4B og C). Hver af de tre blokke besidder et palindrom (fig. 4C). Men kun i blok B fleste gener (seks ud af ti) er placeret på begge arme af palindrom (fig. 4C). Tre næsten identiske par af

MAGE

A2-service /

A2B

, –

A3-service /

A6

,

psMAGEA /psMAGEAL

er placeret i symmetriske positioner på armene (fig. 4B og 4C), mens

MAGE-A12

ligger i loop regionen. Vi har udpeget et par dublerede gener eller sekvenser x og y på symmetriske positioner af palindrom som x /y. Den fylogenetiske forhold mellem 16

MAGE-A

gener, herunder

psMAGEAL

(fig. 4B, se Materialer og metoder), og med

MAGE-D

anvendes som udgruppe afslørede, at fem gener i blok B er i en monofyletisk gruppe, mens et par af

psMAGEA

/

psMAGEAL

gener er fjernt beslægtet med andre

MAGE-a

gener.

(

A

) En diagonal linje fra øverste venstre til nederste højre viser identitet inden for regionen. Regionen er opdelt i tre underregioner, A, B, og C, som indeholder fem, 10 og en

MAGE-A

gener hhv. (

B

) Træet blev bygget ved hjælp af antallet af nukleotid forskelle (

s

-distances) blandt CDS’er (1916 bp) af de 16

MAGE-A

gener. Antallet på hver node repræsenterer bootstrap sandsynlighed understøtter denne node. Bootstrap værdier større end 50%, er vist. Operationelle taksonomiske enheder (otu) i magenta, grøn og blå repræsenterer gener i delregioner A, B og C, hhv. (

C

) Tre forudsagt palindromer vist i delregioner A, B og C. I delregion B, de fleste af gener er placeret på formodede palindrom arme.

Menneskelig blok B består af syv duplikerede enheder. Hver enhed er 10-20 kb lang og indeholder et

MAGE-A

og en chondrosarcoma associeret gen (

CSAGE

) [31] (fig. 5

A

). BLAST analyse af pattedyr genomer viser også fravær af

CSAGE

homologer i ikke-primater pattedyr. Den palindrom i blok B blev ikke observeret i ikke-primater genomer, såsom mus, hund og hest genomer.

(

A

) De diagonale linjer fra venstre øverst til højre bund indikerer identitet i det menneskelige (venstre panel) eller makak (højre panel) sekvens. Huller i den diagonale linje i makak indikerer sekventering hullerne. De farvede kasser i bunden af ​​hvert panel angiver syv duplikerede enheder. De samme farvede kasser inden for en art viser, at de er mere tæt knyttet til hinanden end til andre, mens dem mellem art viser formodede ortologer. (

B

) Palindromes forudsagt i delområde B i humane (venstre) eller makak (højre) sekvens. Tal ved siden af ​​linjer angiver hver duplikerede enhed. (

C

) En NJ træ baseret på

s

-distances mellem duplikerede enheder (2880 bp) er vist. Farven-koden for OTU er den samme som i (

A

) og (

B

).

Blandt primater, blok B kan identificeres i makakaber (fig. 5

A

). Denne blok indeholder også syv duplikerede enheder, men i form af den forventede palindrom afviger mellem mennesket og makak. I modsætning til den lange stilk og korte loop observeret i det menneskelige, i makak, er en kort stilk og en stor løkke struktur forudsagt (fig. 5

B

). Endvidere er orthology af enheder mellem makakaber og mennesker nysgerrige givet deres positioner. For nemheds skyld har vi udpeget de syv duplikerede enheder i blok B som

h1

til

h7

i mennesker og

m1

til

m

7 i makakaber ( fig. 5

A

) og derefter undersøgt deres fylogenetiske relationer (fig. 5

C

). Enheder af

h1

/

h7

personen skjult

psMAGEAL

og

psMAGEA

gener er ortologe til

m1

/

m7

. Enheder af

h3

/

h5

med

MAGE-A2 /A2B

gener er ortologe til

m5

med

MAGE-A2

: men i makakaber,

m5

ligger i løkken, og der er ingen partner (en meget lignende sekvens) af

m5

i blokken. Enheden for

h4

med

MAGE-A12

er ortologe til

m3

, men i makakaber denne enhed ikke indeholder en

MAGE

gen (Fig . 5

A

). Desuden forholdet mellem

h2

/

h6

,

m

2,

m4

og

m

6 er noget forvirrende, trods det faktum, at

MAEG-A3 /A6

er i

h2

/

h6

og tre mulige homologer (

MAGE-A3

, –

3L

, og –

A3L

) er i

m

2,

m4

og

m

6.

s

-Distance mellem

h2

h6

var 0,7% (± 0,2), mens

s

-distances blandt

m

2,

m4

og

m

6 er meget større (12,1%) end den tidligere. De parvise afstande på enheder mellem mennesker og makakaber varierede fra 8,3% (± 0,5) til 17,7% (± 0,7), som er for stort til en ortologe forhold. Den fylogeni heller ikke støtte en ortologe forhold mellem hver af de tre enheder i makakaber (

m

2,

m4

, eller

m

6) og

h2

/

h6

(fig. 5

C

).

for yderligere at undersøge de ortologe relationer i disse duplikerede enheder, cladistisk markører såsom

SINE

s og

LINE

s blev søgt hjælp RepeatMasker software [24] (fig. 6). Generelt arrangementet af

SINE

s,

LINE

s,

LTR

s, og korte gentagelser i blok B viser en delvis lighed mellem det menneskelige og makak genom. Positionen og typen af ​​repetitive sekvenser findes på tværs af hele

m2

region er næsten identiske med dem, der findes i den distale halvdel af

h2

. observeres En lignende fordeling af repetitive sekvenser mellem en region af

m5

og

h5

, og ligheden er også observeret mellem en del af

m4

og af

h4

. Men artsspecifikke regioner synes at være til stede i hvert genom. Hos mennesker, regionen er ~ 40 kb lang og strækker sig fra midten af ​​

h2

til

h4

, mens det i makakaber, den artsspecifikke region er -30 kb og strækker sig fra midten af

m2

til

m4

. I modsætning til resultaterne af fylogeni og genetisk afstand analyser (fig. 5

C

og 6), viste cladistisk markører,

h2

med menneskelig

MAGE-A6

m2

med makak

MAGE3L

er faktisk ortologe til hinanden.

Farvede trekanter viser indflettede elementer (

linjer

eller

Sines

) ,

LTR

, DNA transposoner (

DNA-TP

) eller simple gentagelser (

SR

) findes i den menneskelige eller makak genom, hhv. Beslag under hver linje angiver duplikerede enheder. Lyserøde pile angiver palindrom struktur. Den lyseblå pil viser sekventering huller i makakaber. Breve a til l og et “til i ‘på trekanterne angiver orthologe indsættelse elementer i de menneskelige og makak-genomer. Den lysegrønne bar indikerer en human-eller makak-specifik region og stiplede linjer angiver grænsen mellem artsspecifik og ortologe regioner.

Menneske-specifikke palindrom og gen konvertering

dot-matrix analyse viste, at palindrom i blok B fremgår kun hos mennesker. Selvom sekventering huller i øjeblikket findes i chimpanse og orangutang genom, viste de tilgængelige sekvenser, at palindrom i blok B er mindre tydelig i disse to aber end i mennesker (fig. 7). Vi parsimoniously udledte den nedarvede tilstand af palindrom ved anvendelse af sekvensinformation af genomet af bevarede primater.

Vinduet størrelse er 500 bp med nogen overlapning mellem hosliggende vinduer. Farvede rektangler i bunden af ​​figuren angiver den duplikerede enhed, herunder

MAGE

gener (lys rosa pile). Ordinaten repræsenterer nukleotid divergens (

d

) og abscissen repræsenterer positionen (i bp) i forhold til midten af ​​sløjfen (position nul, blå pil). Området omkring en rød stiplet linie indikerer den høje afveget region i

MAGE-A3

MAGE-A6

.

Gener på palindromer kan opleve hyppige genkonversion . Faktisk et vindue analyse af 500 bp med et ikke-overlappende interval afslører, at sekvenser af palindrom i arme er næsten identiske (fig. 8).

Be the first to comment

Leave a Reply