PLoS ONE: Exome-Wide Association Study for endometriecancer i en multietnisk befolkning

Abstrakt

Endometriecancer (EF) bidrager væsentligt til den samlede byrde for kræft sygelighed og dødelighed i USA. Slægtshistorie er en kendt risikofaktor for EF, således genetiske faktorer kan spille en rolle i EF-patogenese. Tre tidligere genom-dækkende forening undersøgelser (GWAS) har fundet kun ét locus associeret med EF, tyder på, at almindelige varianter med store effekter ikke kan bidrage væsentligt til EF-risiko. Alternativt, vi hypotesen, at sjældne varianter kan bidrage til EF-risiko. Vi har udført en exome-sammenslutning undersøgelse (EXWAS) i EF ved hjælp af Infinium HumanExome BeadChip for at identificere sjældne varianter i forbindelse med EF-risiko. Vi lykkedes genotype 177,139 varianter i en multietnisk befolkning på 1.055 sager og 1.778 kontroller fra fire studier, som var en del af epidemiologi for endometriecancer Consortium (E2C2). Ingen varianter nået global betydning i undersøgelsen, tyder på, at der er behov for mere magt til at opdage beskedne sammenhænge mellem sjældne genetiske varianter og risiko for EF

Henvisning:. Chen MM, Crous-Bou M, Setiawan VW, Prescott J, Olson SH, Wentzensen N, et al. (2014) Exome-Wide Association Study for endometriecancer i en multietnisk befolkning. PLoS ONE 9 (5): e97045. doi: 10,1371 /journal.pone.0097045

Redaktør: Paolo Peterlongo, IFOM, Fondazione Istituto FIRC di Oncologia Molecolare, Italien

Modtaget: 24. februar, 2014 Accepteret: April 15, 2014; Udgivet: 8. maj 2014

Copyright: © 2014 Chen et al. Dette er en åben adgang artiklen distribueres under betingelserne i Creative Commons Attribution License, som tillader ubegrænset brug, distribution og reproduktion i ethvert medie, forudsat den oprindelige forfatter og kilde krediteres

Finansiering:. De Nurses ‘Health Study (NHS) efterforskere understøttes af NCI, NIH Grants Antal 1R01 CA134958, 2R01 CA082838, P01 CA087969, og R01 CA49449. MMC understøttes af uddannelse tilskud 5T32CA009001-38 fra NCI. MCB understøttes også af en Sara Borrell postdoc stipendium fra det spanske sundhedsministerium, Carlos III Health Institute. Multietniske Kohorte (MEC) er støttet af NCI, NHI Grants nummer CA54281, CA128008, og 2R01 CA082838. Den Fred Hutchinson Cancer Research Center (FHCRC) er støttet af NCI, NIH Grant Number 2R01 CA082838, NIH RO1 CA105212, RO1 CA 87538, RO1 CA75977, RO3 CA80636, NO1 HD23166, R35 CA39779, KO5 CA92002 og midler fra Fred Hutchinson Cancer Research Centrum. EDGE Study (Østrogen, kost, genetik, og endometriecancer) er støttet af NCI, NIH Grants Antal 2R01 CA082838, R01CA83918 (Olson PI) og P30-CA008748 (Cancer Center Support Grant). Den Alberta Health Services Study (AHS) blev støttet af driftstilskud opnået fra National Cancer Institute of Canada med midler fra den canadiske Cancer Society og den canadiske Institute for Health Research. Den AHS er også støttet af NCI, NIH Grant nummer 2R01 CA082838. Dr. Christine Friedenreich understøttes af karriere priser fra Alberta innoverer-Health Solutions og Alberta Cancer Foundation gennem Weekend til End Kvinders Kræft Brystkræft Chair. Dr. Linda Kog blev støttet gennem Canada Research Stole program. De finansieringskilder havde ingen rolle i studie design, indsamling og analyse af data, beslutning om at offentliggøre, eller forberedelse af manuskriptet

Konkurrerende interesser:.. Forfatterne har erklæret, at der ikke findes konkurrerende interesser

Introduktion

Endometriecancer (EF), kræft i livmoderen epitel, der typisk opstår i nærheden eller efter overgangsalderen, er den mest almindelige kræft i de kvindelige kønsorganer og den 10. hyppigste årsag til kræft død hos kvinder i den udviklede verden [1] – [3]. EF er stærkt forbundet med østrogen alene postmenopausal hormonbehandling [4], [5] og overskydende kropsvægt [6] på grund af øget aromatisering af C-19 steroider af overskydende fedtvæv [7]. Disse risikofaktorer støtte “opponeret østrogen” hypotese, hvor EF kan udvikle på grund af de ukontrollerede mitogene virkninger af østrogen i mangel af tilstrækkeligt progesteron [8]. Nogle undersøgelser har vist, at slægtshistoriske stiger risikerer 02:58 gange hos yngre kvinder, der har en første grads kvindelige slægtning med EF [9], [10], mens blandt ældre kvinder foreningen er mindre stærk. Derudover er der en øget risiko for EF hos kvinder med Lynch syndrom [11], en arvelig autosomal dominant tilstand, der medfører en høj risiko for kolorektal cancer samt. Disse observationer tyder på, at germline genetik kan bidrage til EF-modtagelighed.

Genom-dækkende forening undersøgelser (GWAS) har med succes identificeret mere end hundrede modtagelighed loci for en række forskellige cancertyper [12]. Tre GWAS studier af EF er blevet gennemført til dato med kun én identificerer en ny genom-dækkende væsentlige locus, rs4430796, (p = 7,1 × 10

-10) i forbindelse med EF [13] i

HNF1B

genregion på kromosom 17q12. To uafhængige undersøgelser efterfølgende gentaget foreningen med rs4450796 [14], [15]. Men to andre GWAS studier af EF [14], [16] var ikke i stand til at identificere yderligere genom-dækkende væsentlige loci, tyder på, at almindelige varianter med store effekter ikke meget kan bidrage til familiær risiko for EF.

De fleste risikofaktorer alleler opdaget gennem GWAS har beskeden effekt størrelser, der ikke tegner sig for meget arvelighed af almindelige sygdomme [17]. Desuden har GWAS undersøgelser fokuseret på almindelige varianter ( 5%) i den almindelige befolkning. Lavfrekvente varianter udgør en stor del af den genetiske variation i mennesker og kan forklare en væsentlig del af arveligheden i cancer ætiologi. Nylige exome-sekventering undersøgelser har fundet sjældne varianter i kandidat modtagelighed gener for familiær kolorektal cancer [18], brystkræft [19], og prostatakræft [20], tyder på, at analysen af ​​sjældne varianter kan også give indsigt i ætiologien af ​​EF. Men exome-sekventering studier kræver prøvestørrelserne, der ikke er modtagelige for store epidemiologiske undersøgelser på grund af de høje omkostninger i øjeblikket nødvendig for at opnå tilstrækkelig statistisk styrke.

Der har været et skub til at udvikle statistisk kraftfuld, men alligevel relativt billig, metoder til påvisning af foreninger for sjældne varianter med større effekt størrelser. Illumina har for nylig udviklet Infinium HumanExome BeadChip (exome array) fra ikke-synonyme varianter findes mindst 3 gange på mere end 2 datasæt fra det hele-exome sekventering af mere end 12.000 personer. Dette array giver en platform, hvorfra vi kan begynde at overskue landskabet af sjældne variation i et stort antal prøver.

Vi genotype sjældne varianter i en multietnisk befolkning på 3.067 kvinder (1.169 EF sager og 1.898 kontroller) fra den Epidemiologi for endometriecancer Consortium (E2C2) [21], for at teste hypotesen om, at sjældne varianter i kodende regioner kan være forbundet med EF-risiko.

Metoder

Etik udvalg fra hver deltagende undersøgelse (Alberta Health Services, østrogen, Kost, Genetik og endometriecancer Study, Multietnisk Kohorte) opnået skriftligt informeret samtykke fra alle undersøgelsens deltagere. Alle skriftlige samtykke blev godkendt fra Institutional Review Board (IRB) fra hver institution (Alberta Health Services, Canada, Memorial Sloan Kettering, USA; University of Hawaii Cancer Center, USA; Keck School of Medicine-University of Southern California, USA).

Alberta Health Services, Memorial Sloan Kettering, University of Hawaii Cancer center og University of Southern California institutionelle anmeldelse bestyrelser godkendt specifikt den foreliggende undersøgelse (Exome-Wide Association Study for endometriecancer), samt skriftlig tilladelse fås fra deltagerne.

deltagende studier også opnåede IRB certificering, tillader udveksling af data i henhold til NIH politik for deling af data fra NIH Understøttet eller Gennemført genom- Wide Association studier (GWAS).

undersøgelse Befolkning

Exome vifte genotypebestemmelse blev udført på 3.067 prøver fra 3 retrospektive case-kontrol-studier: Alberta Health Services Study (AHS) [22], den østrogen, Kost, Genetik og endometriecancer undersøgelse (EDGE) [ ,,,0],23], og undersøgelsen og en case-kontrol undersøgelse Fred Hutchinson Cancer Research center (FHCRC) indlejret i den kommende Multietnisk Kohorte (MEC) [24]. Undersøgelser, der deltager i denne analyse er beskrevet i tabel 1 og i vores tidligere GWAS [14]. Af kvinderne indgår i undersøgelsen, 1169 var EF tilfælde og 1898 var kontroller. Tilfælde var begrænset til dem diagnosticeret med den mest almindelige undertype af EF (type I), mens kontroller var cancer fri og havde en intakt uterus. Kontroller blev matchet til sager efter alder og studie site.

Genotypning og Kvalitetskontrol

DNA blev ekstraheret ved hver undersøgelse websted fra buffy coat eller kind-celleprøver efter fabrikantens protokol og genotypebestemmes på University of Southern California bruge Infinium menneskelige Exome BeadChip (Illumina Inc., San Diego, CA) som en del af fase II replikation af E2C2 GWAS. Den BeadChip omfattede 9,232 brugerdefinerede markører, 2211 af dem er særligt relevante for EF, ud over de 247,870 markører koder primært til protein-ændrende varianter allerede inkluderet i BeadChip standard design.

Genotype kald blev udført med Illumina GenCall på alle prøver (n = 3.067) ved hjælp af MEC klynge-fil (16.000 multietniske prøver) for de ikke-tilpassede markører og autoclustering for brugerdefinerede markører. Varianter blev udelukket fra analyserne, hvis takster var 90% (n = 115), varianten var monomorft (n = 77.521), de loci havde nogen observerede grundlæggere og mangler alle genotyper (n = 1.962), varianten var en insertion eller deletion allel (n = 117), eller variant afveg fra Hardy-Weinberg ligevægt ved p-værdi 0,0001 i nogen etnisk gruppe (n = 248). Den endelige sygdom træk dataanalyse sæt indeholdt 177,139 held genotypede varianter.

I alt 3031 ud af 3067 prøver lykkedes genotype med takster ≥ 90%. Af disse fjernede vi 40 dobbeltprøver (genotype konkordans rate 99,9%), der anvendes til assay kvalitetskontrol og 15 prøver for andre kvalitetskontrol grunde. Vi har udført principal komponenter analyse (PCA) for at identificere selvrapporterede etnicitet outliers og udlede herkomst med EIGENSOFT v 4.2 [25] med 47,097 brugerdefinerede og ikke-custom SNPs med genotypebestemmelse priser 90% og MAF 1%. Den HapMap fase II (bygge 37) CEU, Yri, og JPT-CHB prøver blev anvendt som referencepopulationer. Brug de første 5 hovedkomponenter, bestemte vi 7 personer, der var etnicitet outliers og udelukkede dem fra analyser. Efter yderligere fjernelse af 136 outliers (mere end 3,5 standardafvigelser fra middelværdien) af prøven heterozygositet med etnicitet, 2.833 kvinder (1.055 EF sager og 1.778 kontroller) forblev for sygdom træk analyse.

Statistisk analyse

Single variant forening analyse.

variant blev udført samlet og stratificeret efter selvrapporteret etnisk gruppe. For hver SNP, vi skønnede odds ratio (OR) og 95% konfidensintervaller (CI) ved hjælp ubetinget logistisk regression, under forudsætning af et tilsætningsstof genetisk model (0, 1, 2 eksemplarer af den mindre allel), og justering for body mass index (BMI i kg /m

2), alder, studie site, plade, og de første 4 hovedkomponenter til regnskab for befolkningen lagdeling. Alle enkelt variant analyser blev udført ved hjælp af Plink v 1,07 [26].

Gene-baseret analyse.

Som en ekstra metode til at opdage sjældne varianter i forbindelse med EF, gen-baserede test blev udført ved hjælp af SKAT-O [27] i alle etniske grupper. SKAT-O kombinerer gen-byrde tests og SKAT, et SNPset niveau test for association hjælp kernel maskine metoder, i særlige tilfælde for en optimeret tilgang, der maksimerer magt. Disse analyser blev også korrigeret for BMI, alder, studie site, plade og de første 4 hovedkomponenter. I alt blev 16,245 gener med mindst én variant testet

Statistisk signifikans

Vi bestemt variant forening at nå global betydning, hvis den ujusterede p-værdien var. . 2,82 × 10

-7, svarende til en Bonferroni korrektion for 177,139 tests. Gen-baserede foreninger blev betragtet som signifikante for ujusterede p-værdier. 3,08 × 10

-6, svarende til en Bonferroni korrektion for 16,245 tests

I overensstemmelse til NIH /NCI politik alle data vil blive forelagt til databasen af ​​genotyper og fænotyper (dbGaP, https://www.ncbi.nlm.nih.gov/gap).

Resultater

Association analyser indgår 177,139 held genotypede varianter med MAF 0 fra i alt 257,102 varianter inkluderet i array’et. Befolkningskarakteristika af de fire deltagende studier (AHS, EDGE, FHCRC, og MEC) er beskrevet i tabel 1. Mean alder ved diagnose for tilfælde varierede fra 58,5 år i AHS til 65,5 år i MEC og middel BMI på diagnosetidspunktet for tilfælde varierede fra 28,8 kg /m

2 i MEC til 32,3 kg /m

2 i AHS og EDGE. Af de 3.067 prøver genotypede blev 2833 medtaget i analysen. Der var ingen forskelle i alder, BMI, og etnicitet mellem udstødte sager og dem, der indgår i analysen (resultater ikke vist). Af disse 2.833 personer, var der 254 selvrapporteret afrikansk-amerikanere, 347 selvrapporteret asiater, 1686 selvrapporteret kaukasiere, 79 selvrapporteret stenplatforme, 360 selvrapporterede Latinas, og 107, der ikke rapporterer en specifik etnicitet (tabel 2).

Variant Fordeling blandt rapporteret etniske

I dette studie population, blev 77,521 varianter (30,4%) fundet at være monomorf på tværs af alle indberettede etniciteter og 177,139 varianter (69,6%) var polymorfe i mindst én etniske befolkning med 74,0% af polymorfe alleler med MAF ≤ 1% (figur 1). Af de varianter, der var polymorfe i mindst én etnisk befolkning, 42,0% i afroamerikanere, 71,7% i asiater, 34,9% hos kaukasiere, 69,7% i hawaiianerne, 49,5% i Latinas, og 60,0% hos dem af ukendt etnicitet var monomorft ( figur 2). MAF distributioner var temmelig ens blandt asiater, stenplatforme, og dem, der ikke rapporterer en bestemt etnicitet mens afroamerikanere, kaukasere og Latinas delte flere ligheder i MAF med hinanden end med asiater, stenplatforme, og dem af ukendt etnicitet. Omkring 20,2% (n = 35.912) af varianter blev delt af alle 5 indberettede etniciteter mens kaukasiere og Latinas havde flest varianter i fælles på 41,1% (n = 72.878) (Figur 3). Kaukasiere havde de mest unikke polymorfe varianter (18,7%), efterfulgt af afrikansk-amerikanere (14,0%), Latinske Piger (3,2%), asiater (2,7%), dem, der ikke rapporterer etnicitet (1,0%), og stenplatforme (0,4% ).

antallet af varianter er plottet af den mindre allel frekvens over alle etniske grupper. Disse varianter omfatter dem, der er monomorf i alle etniske grupper.

Antallet af varianter er plottet af den mindre allel frekvens for hver etnicitet. Alle disse varianter er polymorfe i mindst én rapporterede etnicitet.

Antallet af delte varianter er vist i vejkryds. De samlede antal polymorfe varianter af etnicitet er anført i øverste venstre hjørne.

Single Variant Association for endometriecancer

Ingen varianter nået global betydning i enkelt variant sammenslutning af EF for alle etniske grupper tilsammen (figur 4A, tabel 3), når der korrigeres for flere sammenligninger ved hjælp af Bonferroni justering (p 2,82 × 10

-7). De stærkeste foreninger var for varianter med 0,05 MAF (tabel 3) ligger inden for 50 kb af den lange ikke-protein-kodende intergeniske RNA,

LINC00520

(rs1953358, OR = 1,36, p = 4,76 × 10

-7) og i intronen region

PROS1

(rs8178648, OR = 1,71, p = 1,53 × 10

-6), som koder for protein S, en cofaktor til protein C i anti -coagulation pathway. I kaukasiere, som udgør størstedelen af ​​den samlede analyse, forblev kun rs8178648 suggestively forbundet med OR = 1,98 og p = 3,35 × 10

-6 (figur 4b, tabel 3). Der var ingen globalt signifikante eller suggestive varianter i afrikanske amerikanere, asiater, hawaiianerne, Latinske Piger, og dem, der ikke rapporterer etnicitet (tabel S1).

Resultater af enkelt variant analyser (-log

10p) er plottet mod kromosom position (NCBI bygge 37) til foreningen i alle etniske grupper (A) og for foreninger inden kaukasiere (B). Suggestive varianter er mærket ovenfor. Resultaterne blev korrigeret for alder ved diagnose, BMI, undersøgelse site, plade, og de første fire hovedkomponenter.

Gene-baserede analyse af endometriecancer

Ingen af ​​de genbaserede test af foreningen var globalt signifikant (p 3,08 × 10

-6) efter justering for multiple sammenligninger (tabel S2). Af de 16,245 gener testet, den mest betydningsfulde EF association var med

KRT81

(p = 2,21 × 10

-5), et medlem af keratin gen familien beliggende på 12q13.

PROS1

, hvor rs8178648 ligger, var ikke signifikant associeret med EF (p = 0,6789) ved test i alle etniske grupper hverken når kun at teste i Causasians (resultater ikke vist).

Diskussion

Vi præsenterer en indledende udforskning af, om sjældne varianter er forbundet med EF-risiko i en multietnisk befolkning fra E2C2. Ingen varianter nået global betydning (p 2,82 × 10

-7) i det indre variant association analyser af EF i alle etniske grupper kombinerede eller når forskellige niveauer af rapporteret etnicitet. Derudover ingen gen-baserede test foreningsfrihed nåede global betydning (p 3,08 × 10

-6)

Blandt alle etniske grupper, rs8178648 på kromosom 3 opretholdt en suggestiv forening med EF (OR = 1,707. , 95% CI: 1,363-2,123, p = 1,53 × 10

-6). Varianten ligger i intronen region

PROS1

, et gen, der koder for protein S, en cofaktor i antikoagulationspathwayen, der forårsager autosomal dominant arvelig trombofili når muteret [28].

PROS1

ekspression er blevet rapporteret at være forhøjede i aggressiv prostatakræft væv [29] og thyreoideacancer væv [30], hvilket tyder det kan have en rolle i cancer ætiologi eller progression.

PROS1

har vist sig at være opreguleret direkte af progestiner [31] og nedreguleres af 17β-estradiol, et østrogen som regulerer genekspression via østrogenreceptoren [32], hvilket gør det modtageligt for ubalancer i kønshormon metaboliske pathway, som er impliceret i EF ætiologi. Men

PROS1

var ikke signifikant associeret med EF (p = 0,6789), når du bruger SKAT-O og ingen anden GWAS har fundet væsentlige eller suggestive varianter i dette gen.

En svaghed ved denne undersøgelse er vores begrænsede stikprøve, som ikke var tilstrækkeligt strøm til at detektere sjældne varianter med beskedne virkninger forbundet med EF. Derudover er exome vifte indhold overvejende baseret på europæisk afstamning mens vores undersøgelse omfattede et betydeligt antal prøver med andre ophav. Ufuldstændig exome vifte dækning af alle funktionelle varianter og indels der kan påvirke EF risiko kan også have begrænset omfanget af vores undersøgelse. Men vores analyse er en af ​​kun to undersøgelser [33] ved hjælp af exome array til at undersøge sammenhængen mellem sjældne varianter og komplekse sygdomme i store multietniske befolkningsgrupper. Vores undersøgelse er også den første til at udnytte exome array med EF og tjener som en udvidelse til vores tidligere undersøgelse af almindelige varianter på EF-risiko.

En tidligere GWAS [13] identificeret en roman locus nær

HNF1B

, rs4430796, omvendt forbundet med EF-risiko. Vi gentaget resultaterne i vores GWAS [14], men ingen andre almindelige varianter er forbundet med EF er blevet fastlagt. Exome arrays, der fokuserer på sjældne varianter, som er hypoteserne at have større effekt størrelser end almindelige varianter, er blevet brugt til at identificere nye loci påvirker insulin behandling og sekretion i type 2 diabetikere [34]. Til dato, analyser af kræft websteder ved hjælp exome arrays har undladt at finde stærke beviser for, at sjældne varianter er stærkt forbundet med kræft, afslører kun en variant signifikant associeret med brystkræft og ingen med prostatacancer [33]. Ligeledes har vi ikke identificeret loci signifikant associeret med EF. På grund af vores begrænsede stikprøvestørrelse, blev vores undersøgelse skønnes at være tilstrækkeligt strøm til at detektere yderste periferi 2,53 for lav frekvens varianter (MAF = 0,02). En OR på 2,00 (MAF = 0,01) vil også være nødvendigt omkring 4250 tilfælde og 7.250 kontroller for at være tilstrækkelig strøm. Selv for varianter med højere MAFs ligner det, der blev observeret for rs8178648 en undersøgelse afsløre en per-allel OR på 1,70 ville kræve mindst 1.107 sager og 1.871 kontroller, der skal overvejes tilstrækkeligt strøm (β = 0,80). Derfor brug for større undersøgelser, der gennemføres med henblik på at opdage nye foreninger med sjældne varianter.

Som konklusion, vores undersøgelse fandt ingen beviser, at sjældne varianter med stor effekt størrelser er forbundet med EF-risiko. Selvom vi var i stand til at identificere et par suggestive foreninger, som med rs8178648, ville meget større undersøgelser være nødvendige for at identificere en mere beskeden indflydelse af sjældne varianter på risikoen for EF.

Støtte oplysninger

tabel S1.

1-5. Enkelt variant association resultater. Top 100 mest betydningsfulde enkelt variant foreninger med endometriecancer ved etniske grupper

doi:. 10,1371 /journal.pone.0097045.s001

(XLSX)

tabel S2.

SKAT-O-gen baserede forening resultater. SKAT-O-gen baserede foreninger med endometriecancer for alle etniske grupper tilsammen

doi:. 10,1371 /journal.pone.0097045.s002

(XLSX)

Be the first to comment

Leave a Reply