PLoS ONE: Stærk underskrift Natural Selection inden en FHIT Intron Involveret i prostatakræft Risk

Abstrakt

Tidligere kandidat gen kobling tilgang på Brother par ramt med prostatakræft identificeret et sted for prostatakræft modtagelighed på D3S1234 inden den skrøbelige histidintriade gen (

FHIT

), en tumorsuppressor, der inducerer apoptose. Efterfølgende forening test på 16 SNPs spænder ca. 381 kb omkringliggende D3S1234 i amerikanere af europæisk afstamning viste betydelig dokumentation for forening for et enkelt SNP inden intron 5 i

FHIT

. I den aktuelle undersøgelse, re-sekventering og genotypebestemmelse i en 28,5 kb område, der omgiver denne SNP yderligere afgrænset associering med prostatacancer risiko for en 15 kb region. Flere SNPs i sekvenser under evolutionær begrænsning inden intron 5 af

FHIT

definerede flere relaterede haplotyper med en øget risiko for prostatakræft i europæiske amerikanere. Stærke foreninger blev påvist for en risiko haplotype defineret af SNPs 138.543, 142.413, og 152.494 i alle tilfælde (Pearsons χ

2 = 12.34, df 1,

P

= 0,00045) og for den homozygote risiko haplotype defineret af SNP’er 144.716, 142.413, og 148.444 i sager, der delte 2 alleler identisk med nedstigning med deres berørte brødre (Pearsons χ

2 = 11,50, df 1,

P

= 0,00070). Ud over højt konserverede sekvenser der omfatter SNPs 148.444 og 152.413, befolkningsundersøgelser afslørede stærke underskrifter fra naturlig udvælgelse for en 1 kb vindue dækker SNP 144.716 på to befolkningsgrupper, den europæiske amerikanske (π = 0,0072, Tajima s D = 3,31, 14 SNP’er) og japanske (π = 0,0049, Fay Wu H = 8,05, 14 SNP’er), såvel som i chimpanser (Fay Wu H = 8,62, 12 SNP’er). Disse resultater støtter stærkt inddragelse af

FHIT

intron region i en øget risiko for prostatakræft

Henvisning:. Ding Y, Larson G, Rivas G, Lundberg C, Geller L, Ouyang C et al. (2008) Stærk underskrift Natural Selection inden for en

FHIT

Intron Involveret i Prostata Cancer Risk. PLoS ONE 3 (10): e3533. doi: 10,1371 /journal.pone.0003533

Redaktør: Matthew W. Hahn, Indiana University, USA

Modtaget: September 11, 2008; Accepteret: 2 okt 2008; Udgivet: 27 Oktober 2008

Copyright: © 2008 Ding et al. Dette er en åben adgang artiklen distribueres under betingelserne i Creative Commons Attribution License, som tillader ubegrænset brug, distribution og reproduktion i ethvert medie, forudsat den oprindelige forfatter og kilde krediteres

Finansiering:. YD, GL, GR, CL, CO, TGK blev støttet af NIH AG15720, DOE PC020680, og Beckman Research Institute of the City of Hope. LG, JW, JA, JS, MBD, ABB, JMK, PJO, RS, JAS, DJ blev støttet af NIH AG15720. MN blev støttet af NIH HG-002.790

Konkurrerende interesser:. De finansieringskilder havde ingen rolle i dataanalyse, skrivning, eller beslutninger offentliggørelse

Introduktion

Den genetiske kompleksitet. prostatakræft er blevet godt demonstreret af uafhængige, store, genom-dækkende forening undersøgelser, der identificerede risiko loci multiple hele det menneskelige genom [1], [2], [3], [4], [5], [6 ]. Disse loci hver kun moderat øger en persons risiko for sygdommen med op til 60% og kan tilsammen tegner sig for over 50% af den genetiske risiko for prostatakræft observeres i den humane population. Yderligere risiko loci mangler at blive opdaget gennem meta-analyse af eksisterende data og yderligere undersøgelse.

Vi har for nylig brugt sammenkædning analyse af kandidatgener og efterfølgende foreningens tests for at indblande en 30 kb region inden intron 5 i

FHIT Salg In risiko prostatacancer [7].

FHIT

gen, der koder for et 16,8 kD triphosphatase, består af 10 korte exons spænder ca. 1,5 Mb. Det er bosat på den hyppigst observerede skrøbelige sted i det humane genom,

FRA3B

(3p14.2); og det er en af ​​de tidligste og mest deleterede regioner i flere typer cancer [8], [9]. Selv sletning af

FHIT

gen i prostatakræft væv er ikke almindeligt rapporteret, tab af heterozygositet (LOH) er blevet rapporteret i 2 af 15 tumorer gennem brug af mikrosatellitmarkører beliggende i introns af

FHIT

[10]. Tab af

FHIT

blev også påvist i en

in vitro

model af en prostatakræft tumor cellelinie, der blev oprettet ved hjælp af HPV-18 at udødeliggøre en normal voksen human prostata epitel celle linje, efterfulgt ved malign transformation ved udsættelse for et kemisk carcinogen [11], [12]. Immunohistokemisk analyse i primær cancer væv bekræftede fravær eller stærkt reduceret ekspression af FHIT proteinniveauer i tumorceller, i modsætning til høje niveauer af ekspression i den tilstødende normale prostata epitel [12], [13].

Selvom FHIT proteinekspression er tabt eller reduceret i mange typer af humane kræftformer [9], den mekanistiske grundlag for inddragelse af intron 5 i genetisk risiko for prostatakræft er ikke synlige. En kim-line ændring i

FHIT Hoteller, som er forbundet med risiko kræft er ikke blevet rapporteret, muligvis på grund af begrænsninger i tidligere undersøgelser, der fokuserede kun på exons, utranslaterede regioner af mRNA og initiativtagere. Karakteristiske vartegn af et skrøbeligt område, såsom aphidicolin-induceret hybrid pauser, HPV16 integration sites, pSV2neo integration sites, og sletning endepunkter i kræftceller, er blevet identificeret inden for introns fra

FHIT

[14]; imidlertid har disse vartegn ikke overlappe med regionen inden intron 5, som vi impliceret i risiko prostatakræft. FHIT spiller en vigtig rolle til at inducere apoptose af celler reagerer på DNA-skader forårsaget af eksponering for en række miljømæssige midler, såsom stråling, vira, og giftige kemikalier i tobaksrøg og tin miner [15], [16], [17 ]; endnu de genetiske elementer, der styrer sådanne processer er ikke blevet identificeret.

De evolutionære kræfter mutation, naturlig selektion, genetisk drift, og rekombination har formet mønster af variation i det humane genom. Naturlig udvælgelse, som virker på funktionelt vigtige genetiske variationer, som resulterer i ændring af fitness, såsom tilpasning til lokale miljø og sygdom modtagelighed, kan efterlade specifikke underskrifter på berørte loci [18], og analyse af genetisk variation i populationer bliver central for forståelsen funktionen af ​​gener [19], [20]. Screening for underskrifter fra naturlig selektion kan bidrage til at belyse nye funktionelle elementer. Derfor brugte vi denne metode til at afgøre, om der kan påvises tegn på selektion inden for de 30 kb

FHIT

intron region. Vi har udført en re-sekventering undersøgelse og analyseret koblingsuligevægt (LD) og haplotype struktur i sekvenser fra intron 5 i

FHIT

i europæiske amerikanske, Yoruban, og japanske befolkninger, og flere ikke-menneskelige primater. Baseret på disse data, vi forfinet regionen er forbundet med risiko prostatakræft til en 15 Kb LD blok og afslørede stærke underskrifter fra udvælgelse i flere befolkningsgrupper og eventuelt andre primater.

Resultater

Re-sekventering

Larson et al. [7] testet 16 SNPs spænder over en 381 kb region inden intron 5 af

FHIT

for association med risiko prostatacancer og påvist en signifikant sammenhæng med en af ​​SNP’er, rs760317. En mindre signifikant sammenhæng med risiko prostatakræft blev fundet ved en tæt forbundet SNP, rs722070, ligger 13 kb fra rs760317 på centromerregionen side; ingen sammenhæng blev påvist med SNPs på telomere side. At kortlægge sammenhængen med risiko prostatakræft ved høj opløsning og se efter tegn på udvælgelse, vi gennemført en re-sekventering undersøgelse ved hjælp 13 tilfældigt udvalgte sager og kontrol af europæiske-amerikanske afstamning. Den adspurgte sekvens længde alt var 28,5 kb, undtagen to un-amplificerbare sekvens huller på 487 bp og 263 bp. Et af hullerne indeholdt en AT gentagelse og en lang poly A tarmkanalen, og den anden indeholdt AT og AG gentager. To fragmenter af denne region med længder på 19 kb (fra 134 kb til 153 kb, GeneBank tiltrædelse # AF152364) og 7 kb (fra 142 kb til 149 kb internt i 19 kb, GeneBank tiltrædelse # AF152364) blev også sekventeret i 16 Yoruban og 16 japanske personer henholdsvis.

på tværs af hele regionen, vi identificeret 216 SNPs og 9 indels, der spænder fra 1 til 24 bp, i de 13 europæiske-amerikanske individer (tabel S1). Inden for 19 kb region, sekventeret i både EU-amerikanere og Yorubans, fandt vi 146 SNPs og 7 indels fælles for begge populationer, 99 SNPs og en Indel unik for Yorubans og 19 SNPs og 1 Indel unikke for de europæiske amerikanere. Inden for 7 kb region sekventeret i alle tre befolkningsgrupper, vi har registreret 64 SNPs og 4 indels fælles for de tre befolkninger; 28 SNP’er og en Indel unik for Yorubans; 2 SNPs unikke for de europæiske amerikanere; En SNP unik til japanerne; og 9 SNP’er og 1 Indel fælles for to populationer. Indels og SNP’er inden lange spor af simple gentagelser blev ikke inkluderet i disse statistikker og efterfølgende analyser på grund af den lave nøjagtige sekventering på disse områder.

Bindingsuligevægt (LD)

Vi beregnede parvis klog r

2 baseret på SNPs med en mindre allel frekvens større end 0,05 (196 SNPs for de 13 europæiske-amerikanere prøver og 178 SNPs for de 16 Yorubans prøver) ved hjælp Haploview (fig. 1A og C) og rekombinationshastighederne med hotspots under anvendelse rhomap (fig. 1B). I overensstemmelse med tidligere rapporter [21], [22], observerede vi meget mindre LD i den afrikanske prøve, selv om mønstret for LD var ellers ens mellem befolkningerne. Den mest markante forskel mellem de to populationer var en 15 kb LD blokeret den europæiske amerikanske befolkning, der blev sprængt ved meget højere baggrund rekombinationshastigheden og mindst et rekombination hotspot i Yoruban population (fig. 1B). Vi valgte 48 SNPs fra re-sekventering undersøgelse og tre SNPs offentliggjort i Larson et al. [7], som repræsenterede den grundlæggende LD struktur og genotype disse SNPs i alle tilfælde og kontrolprøver for at vurdere deres tilknytning til prostatakræft.

A. Grafisk fremstilling af parvis r

2 (fra 0 til 1 repræsenteret med gråskala fra hvid til sort) beregnes og visualiseres ved hjælp Haploview for 13 europæiske amerikanere. B. Rekombinations satser (Rho) beregnet ved hjælp rhomap for Yorubans (rød linje, med SNP holdninger repræsenteret ved cirkler) og De Europæiske amerikanere (sort linje, med SNP positioner betegnet med solide diamanter) baseret på sekventering data. Den grå linje med solide trekanter var baseret på genotypebestemmelse data på 51 SNPs fra 25 tilfælde og 25 kontroller (europæiske amerikanere). C. Grafisk fremstilling af r

2 bruger til 16 Yorubans. En solid sort bjælke repræsenterede en 15 kb LD blok i europæiske amerikanske.

Association Tests

Vi udførte foreningens test på de enkelte SNPs og haplotyper af SNP kombinationer. Da den oprindelige kobling data forudsagt en recessiv model [7], vi hypotese, at undergruppen af ​​sager, der delte 2 alleler identiske med afstamning (IBD) på dette sted med deres brødre (2 IBD cases) ville være de største bidragydere til den observerede genetiske signal. Derfor har vi sammenlignet SNP frekvenser i kontrol mod alle tilfælde og 2 IBD tilfælde (Tabel S2). Signifikant sammenhæng (cutoff

P

= 0,05, ikke korrigeret for multiple test) blev observeret for flere SNP’er og maksimeret til 137.302 (rs9814915, Pearsons χ

2 = 5,16, frihedsgrader (df) 1,

P

= 0,0231) for alle tilfælde (single åbne cirkler i fig. 2A) og 138.543 (rs760317, Pearsons χ

2 = 7,42, df 1,

P

= 0,0064) til 2 IBD undergruppe (enkelt sorte cirkler i fig. 2A).

A. Association test af enkelte SNPs og haplotyper. Individuelle SNPs blev forankret på et kort UCSC genom med Multiz tilpasning og bevarelse af hvirveldyr (V166, https://genome.ucsc.edu) til 30 kb region. Regionen var repræsenteret med en åben bar i en indsat i øverste venstre hjørne skildrer enkelt SNP tests omkring en bredere 381 kb region. En pil pegede på mikrosatellit markering, D3S1234, udviser den stærkeste binding signal i den oprindelige undersøgelse. En solid sort bjælke svarer til 15 kb LD blok i europæiske amerikanske. Forsøg med allel frekvens for de enkelte SNP’er er angivet med cirkler (åben for alle tilfælde og sorte til 2 IBD tilfælde). Test for risiko haplotyes er repræsenteret ved cirkler forbundet med linjer. SNPs markeret med rødt er i stærk LD (r

2 0,9) med hinanden. B. nukleotid mangfoldighed (π) beregnet for Yorubans (rød linje), europæiske amerikanere (sort linje) og japansk (blå linje). C. Tajima s D beregnet for Yorubans (rød linje), europæiske amerikanere (sort linje) og japansk (blå) ved hjælp af skyderen. D. Mangfoldighed mellem menneskelige og chimpanse-sekvenser (mørkegrøn linje herunder SNPs i mennesker og lys grøn linje eksklusive SNPs hos mennesker).

Screening for haplotype forening for alle tre-SNP kombinationer afslørede, at den stærkeste association af prostatakræft risiko var med en haplotype defineret af SNPs 135.181, 142.413, og 152.494 i 2 IBD tilfælde (haplotype GGT blev beriget med 2 IBD tilfælde, χ

2 = 9,73, df 1,

P

= 0,0018, tabel S3) og SNP’er 138.543, 142.413, og 152.494 i alle tilfælde (haplotype AGT blev beriget i alle tilfælde, χ

2 = 13,72, df 1,

P

= 0,00021, tabel S3). Ved ethvert andet enkelt SNP til kombinationen øgede ikke association med risiko prostatacancer, mens udelade enhver SNP i kombinationerne reducerede signifikant signal (data ikke vist). I overensstemmelse med en recessiv model, prøver, der var homozygote for risikoen haplotypen signifikant beriget i tilfælde sammenlignet med kontroller.

Det er interessant, både SNP kombinationer identificeret i alle tilfælde og 2 IBD tilfælde inkluderet SNPs 142.413 og 152.494, der individuelt udviste meget begrænset association med risiko prostatacancer. SNP 152.494 var placeret i en stærkt bevaret ikke-kodende sekvens, og SNP 142.413 var placeret inden for 100 bp af en anden stærkt bevaret ikke-kodende sekvens (fig. 2A). Hverken SNP var i stærk LD med andre SNP genotype i tilfælde og kontroller. Men SNP 135.181 var i stærk LD med SNP 138.543 (r

2 = 0,86) og flere andre genotypede SNPs, 135240, 137261, 139813, 144716, 147.904 (r

2 spænder fra 0,87 til 0,97, fremhævede SNPs i fig. 2A). Derfor disse andre SNPs udstillet også en overbevisende association til risiko prostatakræft i kombination med SNPs 142.413 og 152494 (SNP kombinationer repræsenteret ved åbne cirkler forbundet med en linie i fig. 2A og tabel S3). Yderligere 21 SNPs var kendt for at være stærkt knyttet til 135.181 baseret på sekventering data. Blandt alle de SNPs tilknytning til 135.181, kun 147.907 var placeret inden for et særdeles konserveret sekvens (fig. 2A). Derfor kan SNP 147.907 være en sandsynlig kandidat til kausalitet.

En SNP, 148.444, ligger inden for en meget konserveret sekvens, viste den højeste LD (r

2 = 0,37) med SNP 152.494 blandt alle genotypede SNPs . Udskiftning SNP 152.494 med 148.444 i de tre-SNP kombinationer definerede også en haplotype for hvilke homozygote var især beriget i tilfælde (tabel S3). I overensstemmelse med en recessiv model, fandt vi den stærkeste association med homozygoter af risikoen haplotypen i 2 IBD tilfælde (SNP kombinationer repræsenteret ved sorte cirkler forbundet af en linje i fig. 2A)-selv stærkere end de fleste kombinationer med SNP 152494.

SNPs understregelse en underskrift Natural Selection hos mennesker er forbundet med prostatakræft risiko

for at diskriminere SNPs, der kan bidrage funktionalitet blandt SNPs viser stærk sammenhæng med risiko prostatakræft, vi brugte re-sekventering af data fra EU -American, Yoruban, og japanske befolkningsgrupper for at søge efter underskrifter fra naturlig udvælgelse, i tillæg til bevarelse, inden for 28,5 kb region. Flere vigtige statistik blev beregnet ved hjælp af skyderen. Vi sammenlignede disse befolkningsgrupper parametre i

FHIT

interval til dem, der opnås i HapMap INDKODNING Sequencing Project, hvor 10 regioner i 500 kb fra forskellige kromosomer i fire befolkningsgrupper blev sekventeret i deres helhed. Disse koder data tilvejebragt en rimelig kontrol for genomet hele fordeling af befolknings–specifikke statistikker. For at bekræfte de statistikker, observeret i de 13 tilfældigt udvalgte sager og kontroller, vi sekventeret også en 2 kb region, der indeholder den maksimale Tajima s D-værdi på 14 CEPH individer. Fordi kode data ikke giver genotyper på indels, vi også udelukket indels fra vores

FHIT

region i befolkningen analyser og sammenligninger.

Vi observerede en slående stigning i nukleotid mangfoldighed, som strakte sig flere LD blokke for de tre humane populationer (fig. 2B). Den maksimale π var 0,0072 (0,0065 for de 14 CEPH individer), 0,0077, og 0,0049 for europæisk-amerikanske, Yoruban, og japanske befolkningsgrupper, sammenlignet med et gennemsnit på 0,00071 (,000071-,0055), 0,00074 (0,00013 til 0,0046), og 0,00076 (0,00013 til at ,0050) inden for de 5 Mb Encode regioner. Derfor er den maksimale π observeret inden for 28,5 kb-regionen i intron 5 i

FHIT

overskredet det maksimale π observeret fra de 10 Encode regioner for både europæiske-amerikanere og Yorubans (p 0,0060 for begge populationer).

Vi har detekteret også en betydelig forøgelse af Tajima s D i den europæiske-amerikanske befolkning (fig. 2C). Den 1 kb vindue på maksimalt Tajima s D (3,31,

P

= 0,003 antager standard neutral model I;

P

= 0,006 antager neutral model II

P

= 0,021 antager neutral model III) svarer til det vindue af maksimal π. I de 14 CEPH individer, det samme vindue udstillet en Tajima s D på 3,11. Kun en lille KODE region, mindre end 0,6% af alle Encode regioner, viste en højere maksimum Tajima s D. En væsentlig Fay Wu H-værdi (8,05 til 14 SNPs,

P

= 0,0067, under forudsætning af en standard neutral model I) blev opdaget for det samme vindue i den japanske befolkning. En 14-SNP glidende vindue analyse for alle indkode regioner i den japanske befolkning fundet 237 af 6265 vinduer med et Fay Wu H værdi større end 8,05 (

P

= 0,038).

For at bestemme om større nukleotid mangfoldighed skyldtes en stigning i den lokale mutation rate, evaluerede vi nukleotid- forskelle i 28,5 kb sekventeret region ved at sammenligne en human sekvens med en chimpanse sekvens hentet fra UCSC genom browser. For hver 1 kb vindue hele 28,5 kb region, divergensen mellem den menneskelige og chimpanse sekvenser varierede 0,004-0,026 og gennemsnit 0,0145 (fig. 2D). For en kb region med den maksimale π i Europa-amerikanske befolkning, observerede vi en divergerende 0,0150. Divergens værdier for de tilstødende 5 og 10 kb var 0,0137 og 0,0149, henholdsvis. Disse statistikker var kun lidt højere end gennemsnittet for chimpanse genom (0,0123 [23]). Når SNP’er, der observeres i humane populationer blev udelukket, blev divergens signifikant reduceret (fra 0,002 til 0,022 og midling 0,0112), især inden for regionen, der viste høj nukleotid diversitet hos mennesker (fig. 2D). Disse observationer udelukket en højere lokal mutation sats som en væsentlig årsag til større mangfoldighed i humane populationer.

To SNPs, 144.716 og 144.552, inden for 1 kb vindue, der viste den maksimale signal om naturlig udvælgelse, var i stærk LD med 135.181 og demonstrerede et sammenligneligt niveau for sammenslutning med prostatakræft risiko i kombination med SNPs 142.413 og enten 152.494 eller 148.444 (tabel S3). Regionen fra 142 kb til 149 kb vises signifikant højere nukleotid mangfoldighed blandt de europæiske amerikanere end Yorubans, i modsætning til de omkringliggende regioner og langt størstedelen af ​​det menneskelige genom, hvor Yoruban mangfoldighed generelt er lig med eller højere end europæiske-amerikanske mangfoldighed ( fig. 2B). Denne region omfattede også tre SNP kombinationer: 142.413, 144716 eller 147904, og 148444, hver bosiddende i en sekvens under naturlig selektion og i fællesskab afgrænse den formodede risiko haplotypen. Denne overlapning af udvælgelse og signifikant sammenhæng signaler impliceret co-evolution og interaktive funktioner blandt sekvens moduler i deres involvering i risiko prostatakræft.

Signaturer af Selection i ikke-menneskelige primater

Sekventeringsdata i det samme en kb vindue i fælles vestlige chimpanser og bonoboer afslørede også potentielle naturlig udvælgelse. Selvom chimpanse-sekvensen havde en helt anden samling af SNP’er i forhold til den humane sekvens, haplotype distributioner udviste et mønster svarende til den i den japanske befolkning: overvejende én haplotype med ekstremt høje frekvenser af afledte allel for flere SNP’er (Tajima s D = – 1.81, Fu og Li D = -3,02, π = 0,0015). En betydelig høj Fay Wu H (8.62 til 12 SNPs,

P

= 0,0001 antager standard neutral model) foreslog en blaffe virkning under en nylig positiv selektion. For bonobo sekvens, to sjældne SNP’er, hver kun observeret én gang i de 6 personer, og ingen fast nukleotid ændring var til stede i en kb vindue (Tajima s D = -1,45, Fuli D = -1,72, π = 0,00034) sammenlignet med chimpanse sekvens

Tre underarter er anerkendt blandt almindelige chimpanser baseret på deres geografiske fordeling:.

Pan troglodytes Verus (PTV)

i det vestlige Afrika,

Pan troglodytes troglodytes (PTT)

i centrale Afrika, og

Pan troglodytes schweinfurthii (PTS)

i det østlige Afrika. Tidligere undersøgelser antydet distinkte demografiske historier for de tre underarter, hvilket resulterer i en lidt positiv gennemsnitlige værdi af Tajima s D for vestlige chimpanser (

PTV

) og en signifikant negativ gennemsnitlig værdi af Tajima s D for centrale chimpanser (

TOT

). At etablere en genom-bred fordeling af befolkningsstatistikken for de fælles chimpanser, vi hentet og analyseres igen sekvensdata fra to tidligere undersøgelser: 50 intergeniske regioner (Genebank acc # AY276396 til AY277244.) Sekventeret i 17 almindelige chimpanser (6

PTV

, 5

TOT

, 2

Pts

, og fire ukendt) [24] og 10 ikke-kodende regioner sekventeret i 14 centrale chimpanser [25] fra NCBI-databasen (tabel 1) . De observerede i en kb målregionen statistik (Tajima s D = -1,81, Fu Li D = -3,02) placeret den blandt de laveste af genom-dækkende distributioner. Sekventering data for et større antal primat individer, der analyseres separat for hver underarter vil være forpligtet til at vurdere effekten af ​​naturlig udvælgelse med højere tillid. Ikke desto mindre er disse foreløbige data er i overensstemmelse med underskrifter fra udvælgelsen i en anden end mennesker primater.

Diskussion

Tidligere kobling og association studier identificerede en ca. 30 kb regionen er forbundet med prostatakræft risiko. I denne rapport, detaljeret analyse af lokal LD ​​struktur og yderligere forening tests raffineret den maksimale signal til inden for en 15 kb region, der muligvis involverer en haplotype defineret ved tre eller flere SNPs inden sekvenser under stærkt evolutionære tvang.

Bevis for både forening og udvælgelse støttede vigtige og interaktive funktioner til sekvenser inden for 15 kb intron region

FHIT

. Risikofaktorerne haplotyper defineret af store alleler af flere SNPs i kombinationer var ikke i fuldstændig LD med en enkelt SNP opdaget i 28,5 kb regionen og udstillet meget stærkere foreninger med prostatakræft end nogen testet enkelt SNP. Blandt de 9 SNPs der afgrænset risiko haplotyper, fire (142413, 147904, 148444, og 152494) blev placeret inden eller i nærheden af ​​sekvenser, der er højt konserveret blandt pattedyr; og en (144.716) var placeret i en sekvens, som udviste signifikante og tydelige signaler om naturlig udvælgelse inden forskelligartede menneskelige og primater befolkninger. De alleler af 5 SNP’er (142413, 135181, 137.261, 138543, og 144716) i risiko haplotyper var fædrene. Allelerne af både SNP’er 148.444 og 152.494 i risikoområder haplotyper blev afledt og nåede meget høj frekvens ( 0,8) i alle tre befolkningsgrupper testet; derfor, syntes de at være under positiv selektion, især i Yoruban population. For eksempel, SNP 148.444 overlappede med 1-kb vinduer i minimum Tajima s D (-1,804 til 10 SNP’er) og forhøjede Fay og Wu H (9,31 til 17 SNP’er) i Yoruban befolkning.

Levin et al. [26] for nylig rapporteret en omvendt sammenhæng risiko prostatacancer til SNP, rs760317 (138.543), der er beskrevet i vores oprindelige undersøgelse [7]. Forfatterne tilskrives associeringen af ​​”spejlvendt” allel (G i stedet for A) til (i) en høj mindre allel frekvens af rs760317, (ii) en uidentificeret yderligere kausal SNP med relativt lav bindingsuligevægt med rs760317, og (iii) ingen overvejelse af samspillet mellem de to i deres analyse model. I den aktuelle undersøgelse, vi identificeret yderligere to SNPs, 142.413 og 152.494 eller 148.444, der interagerer med enten SNP 138.543 eller en SNP i meget høj LD med 138.543, såsom 144.716, der bestemmes risikoen for prostatakræft. Parvis LD målinger blandt de tre interagerende SNPs var faktisk meget lav (r

2 0,3 for alle mulige par), i overensstemmelse med den hypotese oprindeligt foreslået af Lin et al. [27] for at forklare en spejlvendt forening.

Påvisning af underskrifter fra naturlig selektion er blevet foreslået at kortlægge gener og regulatoriske elementer, der indgår i humane sygdomme [18], [28]. I dette papir, brugte vi beviser for naturlig udvælgelse til at udlede funktionaliteten af ​​en intronisk region impliceret i prostatakræft [7]. Da vi opdaget stærke signaler fra både positive og afbalancering udvælgelse inden for samme region for forskellige menneskelige og ikke-menneskelige primater befolkningsgrupper, chance og demografiske historie alene kan ikke helt forklare vores observationer. For at kontrollere for effekten af ​​den demografiske historie, bekræftede vi høj Tajima s D og π i de samme personer, som er blevet sekventeret i KODE Sequencing Project og forudsat en genom-bred baggrund. Derfor naturlig udvælgelse præsenterer en plausibel forklaring på den ikke-tilfældig fordeling af SNP-genotyper eksisterende i data.

Populationsgenetik i denne region foreslog, at forskellige selektive kræfter kan have været der handler på forskellige populationer af mennesker og primater. Det er derfor og fængslende, at

FHIT

gen er kendt for sin lydhørhed over for miljømæssige faktorer, såsom rygning [15] og stråling [17], og medierer celle overlevelse eller apoptose [9]. Vi sammenlignede synonyme og ikke-synonyme ændringer i

FHIT

kodende region mellem mennesket og chimpansen og fundet 4 synonyme og 2 ikke-synonyme ændringer inden sin 441 bp kodende region. Begge ikke-synonyme ændringer ændret de kemiske egenskaber af aminosyrer, der er involveret, hvilket indebærer, at

FHIT

kan være en af ​​de hurtigt udviklende gener udsat for positiv selektion.

Konventionelle foreningens undersøgelser har i høj grad fokuseret på kendte kodning sekvenser, som tegner sig for kun ca. 1,5% af det humane genom. Men de seneste undersøgelser viste store bestande af hidtil ukendte RNA-transkripter, hvoraf de fleste er ikke-kodning, inden introns og intergeniske regioner [29], [30]. Mange af disse transkripter er involveret i tumorigenese [31], herunder prostata tumor differentiering [32]. Flere uafhængige undersøgelser har også bekræftet den rolle, ikke-kodende regioner på 8q24 i modtagelighed for prostatacancer [2], [33]. Inden for regionen vi implcated i risiko prostatacancer, til et genom-dækkende indsats forudsige bevarelse af RNA sekundær struktur ved hjælp af computerprogrammet, EvoFold [34], detekteres en 61-bp konserverede struktur omkring SNP 148444. Hvorvidt sådanne elementer inden intron 5 locus overbringe prostatakræft risiko ved ændring af

FHIT

udtryk /funktion eller gennem ikke intron funktionelle elementer mangler at blive undersøgt.

Materialer og metoder

Undersøgelse Emner

case prøver og kontrolprøver er tidligere blevet beskrevet [7]. Undersøgelsen og brugen af ​​vævene er godkendt af institutionel gennemgang bord hver deltagende site. Informeret skriftligt samtykke blev opnået fra alle deltagere. Kort fortalt blev DNA’er fra 200 ubeslægtede patienter af europæisk afstamning påvirket med prostatakræft og 143 kontroller af matchede etnicitet anvendes i den aktuelle undersøgelse. Informeret samtykke blev opnået fra alle deltagere. Desuden blev DNA fra 14 CEPH (europæiske amerikansk), 16 Yoruban (afrikansk), og 16 japanske individer opnået fra Coriell Cell Repositories. Prøver fra de 14 CEPH enkeltpersoner, 8 af de Yorubans, og 8 i den japanske var blevet re-sekventeret i HapMap INDKODNING Gen- sekventering Project.

Vi opnåede primat DNA panel (PRP00003) fra Coriell Cell Repositories. Prøven indeholdt et individ fra hver af følgende arter: chimpanse, bonobo, gorilla, Sumatra orangutang, pigtailed makak, rhesus abe, sort-hånds edderkop abe, fælles uldne abe, rød overkrop mustached tamarin, og kattalemur. Vi fik også DNA af yderligere 12 ubeslægtede fælles vestlige chimpanser (NS03622, NS03623, NS03639, NS03641, NS03650M NS03656, NS03660, NA03450, NG06939, NS03489, NS03610, og NS03659, personlig kommunikation, W. Winckler De overordnede Institute, Cambridge, MA ) fra Coriell Cell Repository, samt DNA fra fem ekstra ubeslægtede bonobo individer (identifikatorer efter anmodning).

SNP genotypning

Genomisk DNA blev ekstraheret som beskrevet tidligere [7]. SNP genotyper blev opnået og kritiske SNPs blev bekræftet ved hjælp af en kombination af ABI SNAPSHOT ™ genotypebestemmelse på en ABI377 DNA sequencer, Sequenom IPLEX SNP skrive på en MassARRAY-system, og sekventering på ABI3130xl og ABI 3730 platforme.

Re-sekventering

Genomisk DNA blev amplificeret under anvendelse af overlappende PCR-primere og re-sekventeret under anvendelse af PCR og interne primere. SNP’er blev påvist ved anvendelse PolyPhred 4.0 [35] og Consed [36]. For at minimere falsk negative kurs, brugte vi en lav -Score indstilling af 50 til at mærke alle mulige SNPs og inspiceret hver SNP manuelt for at kontrollere rigtigheden af ​​sekvens opgaver. Indels blev registreret via manuel inspektion.

Statistiske Analyser

Vi brugte Haploview [37] for at udføre χ

2 tests af Hardy-Weinberg ligevægt (HWE) for hver markør genotypede i tilfælde og kontroller og fundet nogen ekstrem afvigelse. Vi har også brugt Haploview til at beregne og visualisere r

2 mellem hvert par af markører (mindre allel frekvens, MAF, ≥5%), og at sammenligne allel frekvenser af sager og kontroller. Rekombinations satser blev beregnet ved hjælp af rhomap [38] med 10000000 kører og 1000000 burn-ins. Screening for individuel haplotype sammenslutning af 3 SNP kombinationer blev opnået ved hjælp unphased [39].

Be the first to comment

Leave a Reply