PLoS ONE: Slip-Sliding Away: Serial Ændringer og Homoplasy i Gentag nummer i Drosophila Yakuba homolog af human Cancer modtagelighed Gene BRCA2

Abstrakt

Flere nyere undersøgelser har undersøgt funktionen og udviklingen af ​​en Drosophila homolog til den menneskelige brystkræft modtagelighed gen

BRCA2

, opkaldt

dmbrca2

. Vi har tidligere identificeret, hvad syntes at være en nylig ekspansion i RAD51-bindende BRC-repeat array i stamfader til

Drosophila Yakuba

. I denne undersøgelse, vi undersøger mønstre af variation og evolution af

dmbrca2

BRC-repeat vifte inden

D. Yakuba

og dens nære slægtninge. Vi udvikler en model for, hvordan ulige overkrydsning kan have produceret den udvidet form, men vi observerer også korte gentagne former, typisk for andre arter i

D. melanogaster

gruppe, adskillelse inden

D. Yakuba

og

D. santomea

. Disse korte former synes ikke at være identiske-by-afstamning, hvilket tyder på, at historien om

dmbrca2

i

D. melanogaster

undergruppe har involveret gentagelsesenhed sammentrækninger resulterer i homoplasious former. Vi konkluderer, at den evolutionære historie

dmbrca2

i

D. Yakuba

og måske i andre Drosophila arter kan være mere kompliceret end kan udledes gennemgang af de offentliggjorte enkelt genom sekvenser pr arter

Henvisning:. Bennett SM, Mercer JM, Noor MAF (2010) slip- glidende Away: Serial Ændringer og Homoplasy i Gentag nummer i

Drosophila Yakuba

homolog af human Cancer modtagelighed Gene

BRCA2

. PLoS ONE 5 (6): e11006. doi: 10,1371 /journal.pone.0011006

Redaktør: William J. Murphy, Texas A M University, USA

Modtaget: 20. april, 2010; Accepteret: 17. maj 2010; Udgivet: Juni 8, 2010

Copyright: © 2010 Bennett et al. Dette er en åben adgang artiklen distribueres under betingelserne i Creative Commons Attribution License, som tillader ubegrænset brug, distribution og reproduktion i ethvert medie, forudsat den oprindelige forfatter og kilde krediteres

Finansiering:. Funding var leveret af National Science Foundation uddeler 0509780 og 0.715.484, og National Institutes of Health awards GM076051 og GM086445. De finansieringskilder havde ingen rolle i studie design, indsamling og analyse af data, beslutning om at offentliggøre, eller forberedelse af manuskriptet

Konkurrerende interesser:.. Forfatterne har erklæret, at der ikke findes konkurrerende interesser

Introduktion

Den menneskelige brystkræft modtagelighed gen

BRCA2

koder for et protein bredt studeret på grund af dens betydning i DNA-reparation [1] – [3]. Mutationer i human kimlinje

BRCA2

føre til en levetid øget følsomhed over for bryst- og kræft i æggestokkene [4], [5], måske som følge af ineffektiv reparation af DNA dobbelt strengbrud (DSBs) under homolog rekombination [6] – [8]. I funktionelle undersøgelser,

BRCA2

har vist sig at regulere RAD51 rekombinase, en vigtig nukleoprotein filament, der tillægger beskadiget, enkeltstrenget DNA på stedet for DSBs og er afgørende for initiering af reparationsprocessen [9]. BRCA2 binder sig til RAD51 ved association med sekvens motiver, kaldet “BRC gentagelser” [10], [11], som hver består af omkring 30 aminosyrer og findes i et højt konserveret region af

BRCA2

gen. Disse konserverede gentagelser har været nyttige i at identificere

BRCA2

homologer tværs af mange eukaryote arter, herunder,

Arabidopsis thaliana

,

Caenorhabditis elegans

,

Drosophila melanogaster

, og

Trypanosoma brucei

[12], [13]. Forskere stadig kæmper for at bestemme, hvordan

BRCA2

koordinerer sin RAD51 og ssDNA-bindende aktiviteter for at lette overførslen af ​​RAD51 protein på DNA (men se [14]), men Pellegrini og Venkitaraman [9] foreslog, at “primitive organismer huser en enklere version af

BRCA2

protein vil give nyttige modelsystemer. “

en formodet enklere

BRCA2

homolog blev identificeret i modellen organisme

Drosophila melanogaster

hjælp sekvens fingeraftryk, der repræsenterer vigtige rester for

BRCA2-RAD51

interaktioner i locus

CG30169

, senere kaldet “

dmbrca2

” [15]. Funktionelle studier af denne Drosophila gen har vist, at det interagerer med

D. melanogaster RAD51 Hotel (

spnA

), og dens forstyrrelser påvirker satser mitotiske og meiotisk DNA-reparation og homolog rekombination [15] – [17], hvilket Kløvstad

et. al.

[16] for at konkludere, at Drosophila

BRCA2

betegner en funktionel homolog af genet, som kan anvendes til at karakterisere sin menneskelige modstykke. I modsætning til den pattedyr

BRCA, 2

der har otte BRC gentagelser,

D. melanogaster

homolog viste sig at indeholde tre gentagelser [13]. En senere undersøgelse af dette gen på tværs af de offentliggjorte Drosophila genomer viste stor variation i antallet af BRC gentagelser, med

D. melanogaster

og dens undergruppe med tre gentagelser (figur 1), mens andre, mere fjernt beslægtede arter såsom

D. pseudoobscura

og

D. persimilis

bærende op til elleve gentagelser [18]. Denne variation i antallet af BRC gentagelser blev også demonstreret inden for de enkelte arter samt; ti udvalgte stammer af

D. pseudoobscura

viste sig at have syv, ni eller elleve BRC gentagelser, måske indikerer seneste udvikling inden for dette gen [18].

Dette træ præsenteres antallet af “BRC” gentager fra den offentliggjorte genom sekvens for hver arter i slægten Drosophila. Den blå kasse fremhæver melanogaster gruppe, som har et mønster af tilsyneladende stabilitet i gentagelse nummer.

Selv om der er stor variation i gentagelse nummer på tværs af fylogeni af Drosophila, synes denne variation at være fraværende i melanogaster gruppe, hvor de arter, der har udgivet genom sekvenser alt indeholder 3 BRC gentagelser. Undtagelsen til dette mønster i melanogaster gruppe er

D. Yakuba

, hvis offentliggjorte genom sekvens af

dmbrca2

bærer fem BRC gentagelser. Observation af denne alternative gentagelse formular rejser flere spørgsmål: er denne højere gentagelse nummer reel eller et genom mis-samling artefakt [19]? Hvis det er ægte, er denne højere gentagelse nummer formular allestedsnærværende på tværs af alle

D. Yakuba

stammer, eller er en kortere form til stede i naturlige populationer? Kan vi udlede historiske ændring i antallet af gentagelser ved at analysere nukleotidsekvens? Og endelig, hvis der er alternative former, kan vi opdage beviser for tilhørende naturlig udvælgelse i spredningen af ​​det store antal gentagelse formular? I denne undersøgelse undersøger vi sekvensen og udviklingen i antallet af BRC gentager i Drosophila homolog af

BRCA2

i

D. Yakuba

og sin søster arter

D. santomea

og læg det i en evolutionær sammenhæng. Forståelse de mønstre observeret i disse arter kan give os mulighed for bedre kender de genetiske processer der påvirker dette gen, der er vigtigt for den grundlæggende proces for rekombination og menneskers sundhed mere bredt.

Materialer og metoder

Drosophila

Aktier

Drosophila Yakuba

D. santomea Salg beholdninger, som anvendes i den foreliggende undersøgelse blev opnået fra Dr. Jerry Coyne [20]. Fluerne blev bevaret i absolut ethanol, indtil DNA’et blev ekstraheret i vores laboratorium.

DNA Isolation, PCR-amplifikation og sekventering

Genomisk DNA blev isoleret fra voksne

D. Yakuba

og

D. santomea

med en enkelt flue klemme-protokol [21]. Primere til PCR-amplifikation blev designet fra den offentliggjorte

D. Yakuba

genomsekvens samling [22]. De primere designet fra

dmbrca2

region blev anvendt til PCR amplifikation segmenter af genet i 25 pi reaktionsvolumener. Størrelser af PCR-produkter blev bekræftet ved elektroforese på en 1% agarosegel. PCR-produkter blev oprenset ved anvendelse ExoSAP-It (USB Corp.) og sekventeret under anvendelse ABI BigDye ved Duke University IgSP sekventering facilitet. Sekvenser blev deponeret i GenBank /EMBL databaser under accessionsnumre HM146151-HM146174.

Data Analyser

DNA-sekvenser blev tilpasset beregningsmæssigt bruger BioEdit 7.0.9 [23], og derefter modificeret ved manuel justering . DNAsp [24] blev anvendt til at estimere nukleotid mangfoldighed (pi) og Tajima s D [25], for

dmbrca2

region. Vi opnåede værdier Tajima s D for lignende loci i

D. Yakuba

og

D. santomea

fra Llopart

et. al.

[26] til sammenligning.

Vi undersøgte de sekventerede regioner for hver stamme og sammenlignede dem med fuldt samlet sekvens af denne region fra den offentliggjorte

D. Yakuba

genom [22]. I den offentliggjorte genom-regionen, vi kategoriseret de fem særskilte BRC gentager bruger diagnostiske aminosyrer og størrelse forskelle, nummerering dem numerisk 1 til 5 fra 5′-enden [18]. Vi oversatte DNA-sekvensen af ​​exonerne vore stammernes sekvenser og manuelt sammenlignet enkelte gentagelse til de nummererede genom gentagelser under anvendelse af diagnostiske aminosyrer og størrelsesforskelle.

fylogenetisk analyse blev udført med PAUP * 4.0b10 [27 ]. BRCA2 gentagne motiver til

D. melanogaster

(DME),

D. sechellia

(DSE),

D. simulans

(DSI),

D. erecta

(Der), og

D. Yakuba

(dya) blev indhentet fra de FlyBase reference- genomer, og kombineret med

D. santomea

(DSA) og yderligere

D. Yakuba

sekvenser indsamlet til dette arbejde.

D. Yakuba

blev anvendt som en standard for nummerering gentagne motiver: 1-5 fra amino-enden til carboxyl-enden af ​​peptidet.

D. persimilis Salg gentagelse 2 (Dpe2) blev anvendt som en udgruppe. Sekvensopstillinger blev udført i Seaview version 4.0 [28] med yderligere justeringer ved øjet. De sekvensmotiver blev afgrænset af den 35 aminosyrer lange Pfam skjulte Markov model (HMM) for BRCA2 gentagelser [29]. På grund af den korte sekvens længde og beskedne niveauer af sekvensvariation, var nabo-sammenføjning med ukorrigerede p-afstande valgt til træ estimation.

Resultater og Diskussion

Forud fylogenetisk analyse af den offentliggjorte

D. melanogaster

undergruppe genom sekvenser for gentagelserne afslørede to store clader: alle lige nummererede gentagelser og alle ulige gentagelser [18].

D. Yakuba

gentage 3 (Dya3) tilhørte ulige clade men var usædvanligt i ikke clustering med enten første eller tredje gentagelser, men i stedet resterende basal til begge (se figur 2). Visuel undersøgelse af aminosyren og nukleotidsekvenser afslørede, at 3′-enden af ​​Dya3 boring stærk sekvenslighed med Dme1 og der1, medens 5′-enden besad et par diagnostiske aminosyrer, der lignede Dme3 og Der3 (figur 3). Denne observation tyder på, at der kan være forekommet en ulige-crossing løbet begivenhed (figur 4) mellem gentagelse 1 og gentag 3 giver anledning til en gentagelse udvidelse fra en nedarvet af tre BRC gentager til en afledt tilstand af 5 gentagelser historisk i

D . Yakuba

afstamning. Selvom Dya2 og Dya4 gentager klynge fylogenetisk, den 17% aminosyresekvens divergens og 18 aminosyrer hul i den offentliggjorte genom sekvens af Dya4 forhold til Dya2, viser, at en sådan begivenhed, hvis det skete overhovedet ikke forekommer i meget seneste tid.

Sekvenser inkluderet stammer fra

Drosophila melanogaster

(DME),

D. Yakuba

(dya),

D. sechellia

(DSE),

D. erecta

(Der), og

D. simulans

(DSI). Dya3c og Dya3n angive 5 ‘og 3’ regioner gentag 3.

Disse aminosyre oversættelser fra de offentliggjorte genom sekvenser af

Drosophila melanogaster

(DMEL),

D. Yakuba

(dya),

D. sechellia

(DSE),

D. erecta

, og

D. simulans

(DSI) er justeret og farvekodede for at fremhæve lighederne mellem dem. D. Yakuba gentag 3 (Dya3) er opdelt i to halvdele, der synes at gruppen som følger, den 3 ‘ender med 1st gentagelser og 5’-enden med 3. gentagelser.

D. Yakuba

homolog af

dmbrca2

i den offentliggjorte genom sekvens indeholder 5 BRC gentagelser [18]; men når vi visualiserede de amplificerede PCR-produkter af denne gentagne region i 43

D. Yakuba

og 18

D. santomea

stammer, fandt vi to klart forskellige størrelser bands. Det større produkt, observeret i 57 af de 61 stammer, svarede til den forventede størrelse i 5 BRC gentagelser. Derfor er den 5-repeat form, observeret i den offentliggjorte genomsekvens ikke fast inden naturlige populationer. Denne gentagelse nummer variation blev bekræftet ved sekventering 11 af de lange stammer og alle fire af de korte former, der viser, at de lange former besad de forventede 5 distinkte BRC gentagelser, mens de korte stammer besad kun 3.

Vi justeret den forudsagte aminosyresekvenser sammenlignet dem med individuelle offentliggjorte genom repeats (og specifikt aminosyrer, der optrådte “diagnostisk” med hensyn til Dya2 og Dya4), og opdagede hvad der synes at være flere korte former.

D. Yakuba

stammen Cascade 21 og

D. santomea

stammen LAGO 1482 har hver 3 af total gentagelser, som omfatter 1

st og 3

rd gentagelser, der ligner den fulde 1

st og 5

th gentagelser af den offentliggjorte

D . Yakuba

genomsekvens. Deres 2

nd repeat imidlertid begynder ved ligner 2

nd genom repeat-baseret på en diagnostisk aminosyre og tilstedeværelsen af ​​en 18 aminosyre region specifik for Dya2-men skifter midtvejs at ligne Dya4 baseret på 4 diagnostiske aminosyrer (se figur 5).

D. Yakuba

stammen Cascade 24 og

D. santomea

stamme STO 7 har også kun 3 gentagelser, men meget mere af deres anden gentagelse ligner Dya4, herunder 18 aminosyrer trunkering (figur 5). Denne forskel tyder på, at mindst en trunkering begivenhed førte til fremkomsten af ​​en ny form med tre BRC repeats- og disse korte former kan være uafhængige sletninger fra en lang, 5 gentag formular.

Disse aminosyre oversættelser er fra Dya2, Dya4,

D. Yakuba

stammer Cascade24 og Cascade 21,

D. santomea

stammer STO7 og LAGO1482, Der og DME. Stjernerne over alignment indikerer steder, der har forskelle mellem de offentliggjorte genomsekvenserne Dya2 og Dya4, men er ikke fastsat blandt de sekventerede 5-repeat stammer af

D. Yakuba

(tyder de ikke er “diagnostisk”).

Denne observation af homoplasious 3 repeat allel former rejser spørgsmålet om, hvorvidt den tilsyneladende stabilitet denne formular i

D. melanogaster

gruppe modsiger skjulte udvidelser og sammentrækninger i gentagelse nummer. For at teste denne hypotese, vi nøje undersøgt den offentliggjorte

dmbrca2

sekvens af

D. erecta

(som desværre ikke har andre stammer til rådighed til direkte sekventering).

D. erecta

2

nd BRC repeat aminosyresekvens lignede dele af

D. Yakuba

2

nd og 4

th BRC gentager i overensstemmelse med det er afledt af en sletning af en fem-repeat formular (se figur 5). Specifikt den bærer de 18 aminosyrer, der er til stede i Dya2 men ikke Dya4, men har tre aminosyrer diagnostiske af Dya4 på dens 3′-ende. Derfor, i modsætning til det fylogenetiske hypotese i figur 4,

D. erecta

3-repeat formen kan have opstået sekundært fra en nedarvet 5-repeat formular.

dmbrca2

sekvens af

D. melanogaster

viser også en potentielt lignende mønster (figur 5), men konklusionerne er mere vanskelig på grund af langt større sekvens divergens og eventuelle flere evolutionære ændringer i rækkefølge pr aminosyre.

For at teste for undertegnelsen af ​​naturlige udvælgelse på den rigelige 5-repeat form vi beregnet Tajima s D i

D. Yakuba Hotel (D = -,68518) og

D. santomea Hotel (D = -,27805). Vi var ikke i stand til at beregne Tajima s for den korte formular på grund af sin meget lav frekvens blandt vores prøver (og at nogle af de korte alleler er heller ikke identiske-by-afstamning). Men vi sammenlignede 5-repeat formularens Tajima s D værdier til offentliggjorte Tajima s D værdier fra

D. Yakuba

og

D. santomea

for andre loci ligger på samme måde i områder af reduceret passage over [26], på grund af placeringen af ​​

dmbrca2

nær telomer af kromosom 2 og de kendte virkninger af lave rekombinationshastighederne på stedet frekvens spektre [ ,,,0],30]. De observerede værdier for

dmbrca2

var godt inden for området af disse andre publicerede værdier (

D Yakuba

:.. Middelværdi = -0,34, rækkevidde -1.03-1.05;

D santomea

: gennemsnit = -0,29, rækkevidde -1.27-1.03), dermed giver os mulighed for at udelukke atypiske valg pres på dette locus

Vi konkluderer, at den evolutionære historie

dmbrca2

i

D. Yakuba

, og måske i andre

Drosophila melanogaster

undergruppe arter, er mere kompliceret end kan antages fra gennemgangen af ​​de enkelte publicerede genom sekvenser pr art, og vi advarer imod at karakterisere hele arter eller evolutionære processer fra en sådan begrænsede data (f.eks [13]). Vi præsenterer en model for en gammel ekspansion i

dmbrca2

BRC gentagelse nummer i

D. Yakuba

(se figur 4) og foreslå, at observerede kortere alleler inden

D. Yakuba

,

D. santomea

, og måske

D. erecta

og andre arter opstod fra sammentrækninger af en nedarvet lange form, der producerer homoplasious alleler. Sådanne udvidelser og sammentrækninger ville være i overensstemmelse med modeller af udviklingen i tandem repeat sekvenser, såsom mikrosatellitter (fx [31]). Vores konklusion er foreløbig, men da vi ikke er i stand til at vurdere, hvilken rolle mulige intragenisk gen konvertering blandt gentagelser (dvs. konvergent evolution) komplicerer vores slutninger – disse processer er vanskelige at fuldt Adskille (f.eks [32])

.

Selvom teste for den præcise mekanisme af de foreslåede historiske stigninger og fald i BRC gentagelse nummer er uden for rammerne af dette papir, vi argumentere for, at resultaterne fra befolkningen genetiske og fylogenetiske analyser af Drosophila arter [18], løse et interessant fænomen omgiver et vigtigt træk af et gen relevant for menneskers sundhed. Mindst en BRC gentagelse er til stede i enhver organisme, hvori det homolog er blevet opdaget, og de synes at være absolut nødvendigt for mæglingen af ​​samspillet med RAD51. Man kunne hypotesen, at naturlig udvælgelse kan begunstige stigninger i antallet af gentagelser, da flere gentagelser ville tillade strammere samspil mellem disse to proteiner er essentielle for DNA dobbelt streng pause reparation; dog kan selektion for længere alleler kun strække sig op til et vist punkt, da Gudmundsdottir og Ashworth [2] fandt, at overekspression en enkelt BRC gentagelse i pattedyrceller faktisk forstyrrer dannelse RAD51 filament og opløser formonterede filamenter derved skabe en BRCA2-deficient fænotype. Den vedvarende flere kortere former for

dmbrca2

i populationer af

D. Yakuba

og

D. santomea

argumentere imod konsekvent og stærk retningsbestemt udvælgelse til længere alleler. En spændende mulighed for at udforske, er, om variation i

dmbrca2

BRC gentagelse nummer er ledsaget af tilsvarende ændringer i

RAD51

sekvens. Den fortsatte undersøgelse af mønstre af BRC gentage stigning og fald vil gøre det muligt yderligere oplysning af en dårligt forstået mekanisme regulerer kræft modtagelighed, et vigtigt spørgsmål i medicin i dag.

Tak

Forfatterne takker L . Bukovnik (IgSP sekventering center) til teknisk bistand, J. Coyne for Drosophila-stammer, VL Roth og L. Stevison om hjælp med tal, og C. Smukowski, S. McDermott, R. Varney, og to anonyme anmeldere for nyttige kommentarer til manuskriptet.

Be the first to comment

Leave a Reply