PLoS ONE: Identifikation af en Potentielle Regulatory Variant for tarmkræft Risk Mapping til kromosom 5q31.1: En Post-GWAS Study

Abstrakt

Storstilet genom-dækkende forening undersøgelser (GWAS) har etableret kromosom 5q31 0,1 som en modtagelighed locus for tarmkræft (CRC), som stadig var mangel på kausale genetiske varianter. Vi søgte potentielt regulatoriske enkelt nukleotid polymorfier (SNP) i overlapningsområdet mellem koblingsuligevægt (LD) blok af 5q31.1 og regulatoriske elementer forudsagt af histon modifikationer, derefter testet deres forbindelse med CRC via en case-kontrol undersøgelse. Blandt tre kandidatlande almindelige varianter, fandt vi rs17716310 tillagt betydeligt (heterozygot model: OR = 1,273, 95% konfidensinterval (95% CI) = 1,016-1,595,

P

= 0,036) og marginalt (dominerende model: OR = 1,238, 95% CI = 1,000-1,532,

P

= 0,050) øget risiko for CRC i en kinesisk befolkning, herunder 695 tilfælde og 709 kontroller. Denne variation blev foreslået at være regulerende ændre aktiviteten af ​​forstærker, der styrer

PITX1

udtryk. Brug epigenetisk information såsom kromatin immunofældning-sekventering (chip-seq) data kan hjælpe forskerne til at fortolke resultaterne af GWAS og find kausale varianter for sygdomme i post-GWAS æra

Henvisning:. Ke J, Lou J, Chen X, Li J, Liu C, Gong Y, et al. (2015) Identifikation af en Potentielle Regulatory Variant for tarmkræft Risk Mapping til kromosom 5q31.1: En Post-GWAS Study. PLoS ONE 10 (9): e0138478. doi: 10,1371 /journal.pone.0138478

Redaktør: Yifeng Zhou, Medical College of Soochow University, KINA

Modtaget: Juni 24, 2015; Accepteret: August 29, 2015; Udgivet: 18 September, 2015

Copyright: © 2015 Ke et al. Dette er en åben adgang artiklen distribueres under betingelserne i Creative Commons Attribution License, som tillader ubegrænset brug, distribution og reproduktion i ethvert medie, forudsat den oprindelige forfatter og kilde krediteres

Data Tilgængelighed: Alle relevante data er inden for papir og dens Støtte Information filer

Finansiering:. National Natural Science Foundation of China (NSFC-81.402.744) til JG. De finansieringskilder havde ingen rolle i studie design, indsamling og analyse af data, beslutning om at offentliggøre, eller forberedelse af manuskriptet

Konkurrerende interesser:.. Forfatterne har erklæret, at der ikke findes konkurrerende interesser

Introduktion

i Kina, kolorektal cancer (CRC) er den femte mest almindeligt diagnosticeret kræft hos mænd og den tredje i hunner, med en anslået 310,244 nye tilfælde og 149,722 dødsfald i 2011 [1]. Risikofaktorer for CRC omfatter kost, fysisk inaktivitet, fedme, rygning og drikke [2, 3], og det er velkendt, at genetiske faktorer også spille en vigtig rolle i ætiologien af ​​CRC [4, 5]. Ved nu, har genom-dækkende forening undersøgelser (GWAS) og fine kortlægning research identificeret risikofaktorer varianter kortlægning til over 30 uafhængige modtagelighed loci af CRC i europæere og asiater [6-20]. Men langt de fleste af disse varianter bor i intergeniske og intron regioner, og det mest sandsynlige biologiske mekanisme, der forbinder dem med sygdom er lovgivningsmæssige [21].

Akkumulerende beviser viste, at ikke-kodende genetiske varianter af risiko-associerede loci kunne udøve en virkning på genekspression ved modulering af aktiviteten af ​​regulatoriske elementer [22], herunder promotorer, enhancere, isolatorer og lyddæmpere. Og forskellige histoner i de flankerende nukleosomer på sådanne genomiske regioner er blevet opdaget at bære karakteristiske posttranslationelle modifikationer [23, 24]. For eksempel er initiativtagere markeres sædvanligvis af H3K4me3 (histon H3 trimethyleret på lysin 4) og forstærkere af H3K4me1 (histon H3 monomethylerede på lysin 4), og enten er desuden præget af H3K27ac (histon H3 acetyleret ved lysin 27) ved aktivering [25- 28]. I dag er genom-dækkende kortlægning af histon modifikationer udført af kromatin immunofældning-sekventering (chip-seq) almindeligt anvendt til at forudsige initiativtagere og forstærkere [29-32].

5q31.1 blev først kortlagt som en CRC modtagelighed locus af Jia et al [17] i både østasiatiske og europæiske befolkninger, yderligere understøttet af en anden større målestok genetiske undersøgelse af Zhang et al [20] i østasiater. Den mest sandsynlige involveret gen

PITX1

(parret-lignende homeodomæne 1) er blevet anset for at være et tumorsuppressorgen vedrørende carcinogenese af CRC [33, 34] og andre kræftformer [33, 35-38]. Men den rapporterede stærkeste risiko polymorfi rs647161 er uklar funktion og ikke i nogen kendt transskriberede eller regulatoriske sekvenser. Så vi ræsonnerede, at rs647161 ikke er den kausale enkelt-nukleotid polymorfisme (SNP), og de reelle funktionelle SNPs mangler at blive udvundet i denne region. Samtidig, identificere funktionelle SNPs, der overlapper vævsspecifikke regulatoriske elementer forudsagt af kromatin status som histon modifikationer, har repræsenteret en kraftig tilgang til fremskridt fra statistisk association til funktionalitet og kausalitet i post-GWAS genetiske undersøgelser [39-42].

i denne undersøgelse analyserede vi chip-seq data for histon modifikationer fra Encode projektet [29], udforsket potentielt regulatoriske varianter inden for modtagelighed locus 5q31.1, og undersøgte kandidat fælles SNPs associering CRC risiko via en case-kontrol undersøgelse i kinesiske befolkning.

Materiale og metoder

undersøgelse Deltagerne

i alt 695 CRC tilfælde og 709 kræft-fri kontroller blev rekrutteret fra Tongji Hospital i Huazhong Universitet for Videnskab og Teknologi (HUST) mellem 2008 og 2011. Alle emner var ubeslægtede etniske han-kinesere, der bor i Wuhan City og de omkringliggende områder. Inklusionskriterierne for sager blev histopatologisk bekræftet CRC uden forudgående kemoterapi eller strålebehandling, og ingen begrænsning til køn og alder. Kontroller blev udvalgt tilfældigt fra en fysisk undersøgelse programmer på samme hospital i samme periode som patienterne blev inkluderet, var en del af, som også er involveret i vores gennemtrængelige undersøgelser [43, 44], og var tilstrækkeligt tilpasset til tilfælde med hensyn til køn og alder (± 5 år). Heri blev rygere defineret som dem, der havde røget mindst én cigaret om dagen i 12 måneder eller længere på ethvert tidspunkt af deres liv, mens ikke-rygere blev defineret som dem, der ikke havde. Ved rekruttering blev 5-ml perifert venøst ​​blod opsamlet fra hvert emne efter en skriftligt informeret samtykke blev opnået. Denne undersøgelse blev godkendt af ethnics udvalg Tongji Hospital Huazhong Universitet for Videnskab og Teknologi

Udvælgelse af kandidatlandene SNPs

Kandidat SNPs i denne undersøgelse er identificeret som almindelige (mindre allel frekvens, MAF 0,05) genetiske varianter lokalisering i overlapningsområdet mellem de 5q31.1 locus og CRC-specifikke regulatoriske elementer præget af ordentlige epigenetiske mærker. For det første, vi hentede genotypen information af han-kinesere i Beijing, Kina (CHB), der var 500 kb opstrøms og nedstrøms for tagSNP rs647161 fra HapMap database, og input, som data i softwaren HaploView at få bindingsuligevægt (LD) blok af rs647161 med kriterierne i

r

2

0,8, der blev defineret som grænsen for GWAS locus 5q31.1. For det andet købte vi chip-seq data fra forskellige histon modifikationer produceret i to CRC cellelinjer HCT116 og Caco2 fra UCSC database integration med Encode data (S1 tabel), derefter ekstraheret omfanget af deres signal toppe stående i regulatoriske elementer, hvor vi gennemskåret to replikation versioner af samme datasæt (vejkryds) og forenet alle de forskellige datasæt (union). For det tredje, basere på dbSNP database, vi plukket ud SNPs med MAF 0,05 i CHB, der ligger i det overlappende område mellem førnævnte LD blok og toppe. Endelig tre SNP’er, rs2193941, rs17716310 og rs7703385 blev valgt som kandidat SNPs for næste trin genotypebestemmelse.

Genotypebestemmelse

Genomisk DNA blev ekstraheret fra perifere blodleukocytter vha RelaxGene Blood System DP319-02 (Tiangen, Beijing, Kina) med henvisning til producentens anvisninger. Alle SNP’er blev genotypebestemt med TaqMan SNP genotypebestemmelsesassay (Applied Biosystems, Foster City, CA, USA) på en 7900HT Hurtig Real-Time PCR System (Applied Biosystems, Foster City, CA, USA). 5% duplikerede prøver blev udvalgt tilfældigt til at vurdere reproducerbarheden for kvalitetskontrol, med en konkordans på 100%.

Statistisk analyse

t test og χ

2 test blev anvendt på estimere forskelle i variable og fordelinger af genotyper mellem cases og kontroller. Hardy-Weinberg ligevægt (HWE) blev evalueret ved at anvende goodness-of-fit χ

2 test i kontrol. Styrken af ​​sammenhængen mellem hver SNP og CRC risiko blev målt ved odds ratio (OR) og dens tilsvarende 95% konfidensintervaller (95% CI). For at undgå den antagelse af genetiske modeller, heterozygot, homozygote, dominante, recessive og additive modeller blev analyseret. Den statistiske test magt hver SNP blev beregnet ved POWER v3.0 (https://www.mds.qmw.ac.uk/stat-gen/dcurtis/software.html). Og yderste periferi og tilsvarende 95% initiativerne, justeret efter køn, alder og rygning status blev beregnet ved ubetinget multivariat logistisk regression. Statistiske analyser blev udført ved hjælp af SPSS Software v20.0 (SPSS, Chicago, Illinois, USA). Den potentielle gen-miljø og SNP-SNP interaktioner blev evalueret af en parvis analyse under multiplikative [45] og additive interaktion modeller [46].

P

værdier for multiplikativ interaktion blev beregnet ved hjælp af en multiplikativ interaktionen under multivariat logistisk regressionsmodel i SPSS-software. Og de

P

værdier for additiv interaktion blev vurderet af en bootstrapping test af goodness-of-fit hjælp Stata v11.0 (Stata Corporation, College Station, TX). Alle

P

værdier var tosidet med den statistiske signifikans kriterier

P

0.05

Resultater

Udvælgelse af kandidatlandene SNPs

Det område af GWAS modtagelighed loci 5q31.1 vi defineret af LD var kromosom 5:. 134.467.220-134.518.445. Efter en tre-trins bioinformatik analyse, tre almindelige polymorfismer, rs2193941, rs17716310 og rs7703385 at beliggende inden toppene af histon modifikation chip-Seq data genereret fra HCT116 eller Caco2, blev fundet i den ovennævnte loci (tabel 1).

befolkningskarakteristika

695 indfaldende tilfælde og 709 frekvens-matchede kontroller blev inkluderet i denne undersøgelse. Som det fremgår af tabel 2, at andelen af ​​mænd var 58,42% i alle tilfælde mod 56,42% i kontroller (

P

= 0,449, Pearson χ

2 = 0,570). Mean alder og tilsvarende standardafvigelse var 60.16 ± 12,26 år for sager og 59,80 ± 13,18 år for kontroller (

P

= 0,598 af t-test), og der var ingen statistisk signifikante forskelle mellem tilfælde og kontrol i form af alder distribution (

P

= 0,305, Pearson χ

2 = 3,625) mellem fire kategorier (≤50, 51-60, 61-70 og ≥71). Som forventet blev flere rygere præsenteret i de tilfælde, end i kontrollerne (35,25% mod 29,62%;

P

= 0,022, Pearson χ

2 = 5,257), i betragtning af at cigaretrygning var en veletableret risikofaktor for CRC (2).

Association Analyse

Alle tre SNPs, rs2193941, rs17716310 og rs7703385, var i HWE (

P

HWE = 0,55, 0,17 og 0,55), og den statistiske test magt var 95,9%, 95,3% og 95,5% hhv. Genotypen fordelinger af undersøgte polymorfier blev vist i tabel 3. I association analyse, viste kun rs17716310 signifikant sammenhæng med CRC under heterozygot model, mens de andre to SNPs rs2193941 og rs7703385 fremlagt noget statistisk bevis for relation til CRC risiko.

Under multivariat logistisk regressionsmodel justeret for køn og alder, personer med AC genotype rs17716310 havde en signifikant øget risiko for CRC (OR = 1,273, 95% CI = 1,016-1,595,

P

= 0,036 ) sammenlignet med dem med AA homozygot. En dominerende model blev udført for at forbedre statistisk styrke ved at kombinere AC med CC i en C-carrier-gruppe (AC plus CC), og det viste, at allel C bærere fik en marginal effekt på CRC modtagelighed (OR = 1,238, 95% CI = 1,000-1,532,

P

= 0,050). Der blev imidlertid ingen signifikant risiko for varianten C allel set i homozygot, recessivt eller additiv model. Som for rs2193941 og rs7703385, var der ingen positive resultater under alle genetiske modeller vi studerede.

Analyse af koblingsuligevægt

Vist i figur 1, tre undersøgte SNP’er var i høj LD med hinanden ( rs2193941 og rs17716310,

r

2

= 0,89; rs17716310 og rs7703385,

r

2

= 0,97; rs2193941 og rs7703385,

r

2

= 0,90) i vores undersøgelse. På den anden side, blev rs2193941, rs17716310 og rs7703385 opdaget at være i høj LD med tagSNP rs647161 (

r

2

= 0,83,

r

2

= 0,88,

r

2

= 0,88, henholdsvis) i CHB befolkning på 1000 genomer Projekt fase 3.

Interaction Analysis

tabel 4 detaljeret resultaterne af interaktionsanalyse mellem den lovende SNP rs17716310 og rygning, hvor vi observerede en signifikant interaktion (

P

mult = 0,013) i multiplikativ betingelser. Når vi undersøgte parvise interaktioner mellem tre kandidatlande variationer, fandt vi ingen positive resultater under både multiplikative og additive model (S2 tabel).

Diskussion

I post-GWAS æra , identificere specifikke funktionelle genetiske varianter, der faktisk tegner sig for fænotype er den største formål og udfordring, og regulatoriske elementer af genomet kan hjælpe. Brug epigenetiske mærker opnået fra relevante celletyper, vi søgte potentielt funktionelle SNPs, der var beliggende i putativt regulerende elementer, og valideret deres tilknytning til CRC i en selvstændig population.

I denne undersøgelse ved at kombinere GWAS locus 5q31.1 og lovende regulatoriske regioner forudsagt af histon modifikationer i CRC-cellelinjer, vi screenet tre almindelige varianter, rs2193941, rs17716310 og rs7703385, i deres overlap. Efter vi gennemførte en forening studie i en kinesiske befolkning, som indeholder 695 CRC tilfælde og 709 sundhedskontrol, fandt vi signifikant og marginal effekt af rs17716310, som var i LD med tagSNP rs647161 og måske interageret med rygning.

Resultaterne førte os til at antage rs17716310 påvirket CRC risiko ved at ændre aktiviteten af ​​regulatoriske elementer, der styrer

PITX1

udtryk. Liggende i en region af genomet udstiller kromatin ændringer H3k4me1 og H3k27ac, er rs17716310 meget foreslog at være en regulerende varianter, der tilhører en aktiv forstærker [47, 48]. Det er cirka 107 kb opstrøms for den nærmeste genet

PITX1

, som er blevet rapporteret som en tumor suppressor nedregulering RAS vej [33], at aktivere

TP53

[49] og tuning telomerase-aktivitet [ ,,,0],50]. Desuden lavere

PITX1

ekspression er blevet fundet i humane cancer vævsprøver og cellelinier [35-37], og forbundet med dårlig overlevelse i CRC patienter [51]. På den anden side, i en online database HaploReg [52], blev rs17716310 indikeret at ændre bindende motiv af p300, der fungerer som en transkriptions-coaktivator og histonacetyltransferase regulering af genekspression ved remodeling chromatin [53]. Varianten kan ændre bindingsstedet af nogle transkriptionsfaktor (r), og indvirkning på interaktionen mellem dette aktive enhancer og den nedstrøms promotor for

PITX1

derfor forringe transkription og ekspression af den undertrykkende gen og dermed lette CRC tumorigenicitet og modtagelighed. Som for interaktion med rygning fundet i multiplikativ model, kan det være på grund af forholdet mellem røg status og RAS vej,

TP53

og telomerase-aktivitet [54-57], hvori

PITX1

var involveret. Men den antagelse behov for yderligere funktionelle eksperimenter der skal kontrolleres.

Anvendelsen af ​​epigenetisk biofeature oplysninger såsom histon modifikation chip-seq data for at identificere kandidat forstærkere har repræsenteret et nyttigt redskab til at identificere kandidat funktionelle SNPs i regulatoriske regioner [ ,,,0],58, 59], og databaser såsom UCSC og Encode har givet let adgang til enorme mængder af relevante data. Integration nyligt opståede epigentics og traditionel molekylær epidemiologi kunne være en effektiv metode til at hjælpe tolkning GWAS resluts og opdage kausale varianter for sygdomme i post-GWAS undersøgelser. Anvendelse tilsvarende strategi til andre CRC GWAS regioner skal hjælpe med dybere forståelse af CRC risiko.

Alligevel bør flere begrænsninger anerkendes her. For det første strategi hente kandidat polymorfier afhang af forudsigelsen fra CHIP-seq data fra to CRC cellelinier, hvilket ikke var streng nok til at definere præcise regulatoriske elementer, og ikke omfattende nok til at opdage alle funktionelle SNPs inde. For det andet, prøve størrelsen af ​​vores case-kontrol undersøgelse var relativt lille. For det tredje, utilstrækkelig miljø- og kliniske oplysninger begrænset os til yderligere at undersøge samspillet mellem gen og andre faktorer. Forth, mangler af funktionelle eksperimenter, biologisk virkelighed under statistisk signifikant sammenhæng vi rapporteret er usikker.

Sammenfattende opdagede vi en sandsynligvis regulerende SNP i høj LD med GWAS tagSNP der er forbundet med CRC risiko i kinesiske befolkning . Systematiske undersøgelser på mere følsomhed loci med større stikprøvestørrelser og opfølgende funktionelle analyser berettiget til at identificere kausale varianter og uddybe den biologiske mekanisme af genetisk ætiologi.

Støtte Information

S1 Table. Chip-seq datasæt downloades fra UCSC integrere Encode data

doi:. 10,1371 /journal.pone.0138478.s001

(DOC)

S2 Table. Interaktion analyse mellem rs17716310 og rs2193941, rs17716310 og rs7703385, rs2193941 og rs7703385

doi:. 10,1371 /journal.pone.0138478.s002

(DOCX)

Be the first to comment

Leave a Reply