PLoS ONE: Flere Funktionelle Risk Varianter i en SMAD7 Enhancer indfoldede en Colorectal Cancer Risk Haplotype

Abstrakt

Genom-dækkende associationsstudier (GWAS) af kolorektal cancer (CRC) har ført til identifikation af en række fælles varianter forbundet med beskedne risiko. Adskillige risiko varianter kort i omegnen af ​​TGF /BMP signalvejen gener, herunder rs4939827 inden en intron af

SMAD7 dele på 18q21.1. En tidligere undersøgelse impliceret en roman SNP (roman en eller rs58920878) som en funktionel variant inden for en forstærker element i

SMAD7

intron 4. I denne undersøgelse viser vi, at fire SNP’er herunder nye 1 (rs6507874, rs6507875, rs8085824 og rs58920878) i koblingsuligevægt (LD) med indekset SNP rs4939827 demonstrerer allel-specifikke forstærker effekter i en stor, multi-komponent forstærker af

SMAD7

. Alle fire SNP’er demonstrerer allel-specifikt protein binding til nukleare ekstrakter af CRC cellelinier. Desuden er nogle af de risikovægtede forbundet alleler korrelerer med øget ekspression af

SMAD7

i normale colon væv. Endelig viser vi, at forstærkeren reagerer på BMP4 stimulation. Tilsammen foreslår vi, at den tilhørende CRC risiko på 18q21.1 skyldes fire funktionelle varianter, der regulerer

SMAD7

udtryk og potentielt forstyrrer en BMP negativ feedback loop i TGF /BMP signalveje.

Henvisning: Fortini BK, Tring S, Plummer SJ, Edlund CK, Moreno V, Bresalier RS, et al. (2014) Multiple Funktionel Risk Varianter i en SMAD7 Enhancer indfoldede en Colorectal Cancer Risk Haplotype. PLoS ONE 9 (11): e111914. doi: 10,1371 /journal.pone.0111914

Redaktør: Ludmila Prokunina-Olsson, National Cancer Institute, National Institutes of Health, USA

Modtaget: Maj 16, 2014; Accepteret: 1 oktober 2014; Udgivet: November 6, 2014

Copyright: © 2014 Fortini et al. Dette er en åben adgang artiklen distribueres under betingelserne i Creative Commons Attribution License, som tillader ubegrænset brug, distribution og reproduktion i ethvert medie, forudsat den oprindelige forfatter og kilde krediteres

Data Tilgængelighed:. Det forfattere bekræfter, at alle data, der ligger til grund resultaterne er fuldt tilgængelige uden restriktioner. Alle relevante data er inden for papir og dens Støtte Information filer

Finansiering:. Dette arbejde blev støttet af National Institutes of Health (R01 CA143237, U19 CA148107 til GC). Den videnskabelige udvikling og finansiering af dette projekt blev delvist støttet af Genetic Foreninger og mekanismer i Oncology (GAME-ON), en NCI Cancer Post-GWAS Initiative. Indholdet er alene forfatternes ansvar og repræsenterer ikke nødvendigvis de officielle synspunkter fra National Cancer Institute eller National Institutes of Health, som ikke havde nogen rolle i studie design, indsamling og analyse af data, beslutning om at offentliggøre, eller forberedelse af manuskript

konkurrerende interesser:.. forfatterne erklærer, at der ikke findes konkurrerende interesser

Introduktion

TGF signalering har længe været forbundet med kolorektal cancer (CRC). Ud over kanoniske roller i reguleringen af ​​apoptose, celledifferentiering og cellevækst af intestinal epitel, TGF-signalering er en vigtig aktør i immunresponset og inflammatorisk tarmsygdom, en risikofaktor for CRC (anmeldelser [1] – [3] ). TGFp og BMP signalering definerer de to store grene af TGF-vejen. Aktivering af enten gren fører til rekruttering af R-SMADs, SMAD2 /3 i tilfælde af TGFp eller SMAD1 /5/8 i tilfælde af BMP’er, som danner et kompleks med Smad4. Dette kompleks dirigerer derefter transskription af mange målgener, herunder

SMAD7

. SMAD7, en inhibitorisk SMAD ligesom SMAD6 på sin side tjener som en negativ feedback regulator af TGFp og BMP-signalering, ud over at fungere som en krydstale node med andre veje, herunder TNF [4], [5].

SMAD7 også spiller andre vigtige roller i ætiologien af ​​CRC, såsom interaktion med β-catenin at regulere

MYC

ekspression og WNT signalering [6].

SMAD7

overekspression er set i nogle CRC celler, og reduktion af

SMAD7

udtryk ved hjælp anti-sense RNA fører til nedsat proliferation i HCT-116 CRC cellelinje og menneskelige CRC neoplastiske eksplantater, og reduceret tumorigenese i APC

min /- mus [7]

CRC GWAS har ført til identifikationen af ​​adskillige genomiske regioner forbundet med risiko, der omfatter gener i TGFp-signalvejen, herunder

SMAD7.

,

BMP-2

,

BMP4

, og

GREM1

[8] – [14]. Dette omfatter enkelt (SNP) rs4939827, der ligger i

SMAD7

intron 4, som er blevet rapporteret i flere studier. Pittman et al. rapporterede, at en roman SNP (betegnet roman 1, senere omdøbt rs58920878) tildeles en forstærker element, der kørte GFP udtryk i

Xenopus

Tadpole muskler og colorectum i en allel specifik måde, implicerer rs58920878 som en funktionel variant inden for denne region [15].

Foranlediget af vores opdagelse af flere funktionelle varianter inden 11q23 CRC GWAS region [16], vi grundigt undersøgt den genomiske region omgiver CRC tagSNP rs4939827 på 18q21.1 for andre potentielle funktionelle SNPs. Vi identificerede 4 SNP’er, rs6507874, rs6507875, rs8085824 og rs58920878 (roman 1), i et område på ca. 2 kb, hver demonstrerer allelspecifik enhanceraktivitet. Vi yderligere bestemt, at alleler svarende til risikoen haplotype korreleret med forøget ekspression af

SMAD7

i normale colon epitelvæv. Sekvenser der omfatter alle fire SNPs også bundet til nukleare proteiner fra CRC cellelinjer i en allel-specifik måde i elektroforetiske mobilitet shift assays (EMSAs). Endelig viste vi, at enhanceren var responsiv til BMP4-induceret signalering i luciferaseassays mens hverken haplotypen var responsiv til TGFp1. Tilsammen foreslår vi, at CRC risiko på kromosom 18q21.1 skyldes bidrag fra 4 funktionelle varianter i en forstærker, der påvirker ekspressionen af ​​

SMAD7

, kan føre til urolig regulering af BMP negativ feedback loop i BMP /TGF signalveje.

Resultater

Region Analyse

indekset SNP rs4939827 forbundet med CRC på kromosom 18q21.1 ligger inden intron 4 i

SMAD7

gen. Der er 20 SNPs i LD med rs4939827 med en r

2≥0.2 i CEU befolkning (1000 genomer Project juni 2011 Meddelelse), vores valgte tærskel LD for potentielle funktionelle kandidater (figur 1A og 1C). Alle 21 SNPs ligge inden for en 16 kb region af

SMAD7

intron 4. For at identificere potentielle genomiske sekvenser fra denne region, det SNPs i LD med rs4939827 blev afstemt med kromatin immunopræcipitation og sekventering (chip-seq ) spor for histon methylering og acetyleringsniveauer mærker forbundet med forstærkere, H3K4me1 og H3K27ac (figur 1B). For denne undersøgelse, vi refereres sigmoid Colon H3K27 acetylering fra køreplanen Epigenomics Consortium [17], og CRC-cellelinjer SW480 og HCT-116 H3K4 monomethylation genereret i vores laboratorium og fra KODE projektet, henholdsvis [16], [18], [ ,,,0],19]. Flere potentielle enhancer toppe indeholdende SNP’er i LD med rs4939827 blev identificeret i sigmoid colon, SW480, eller HCT-116 celler, herunder et 2 kb region indeholdende rs58920878 (grøn stribe, figur 1 B). For at karakterisere regionen omfattende, blev mindre toppe under tærsklen for peak kalde software også klonet og testet for aktivitet, hvis de indeholdt en SNP møde vores LD cut-off. DNase I hypersenstitivity numre fra KODE projektet blev også justeret, men ingen toppe overlappede med nogen af ​​kandidatlandene SNPs i LD med rs4939827 [20], [21].

(A)

SMAD7

gen afbildet med genomiske koordinater (hg19) og placeringen af ​​SNPs i LD (r

2≥0.2, CEU befolkning) med tagSNP rs4939827. (B) UCSC Genome Browser visning af SMAD7 med SNPs i LD med rs4939827 angivet. Chip-seq spor til forstærker histon mærker er sigmoid kolon (SC) H3K27ac fra REMC /UCSD for køreplanen Epigenomics Consortium, SW480 (SW) H3K4me1, og HCT-116 (HCT) H3K4me1 fra KODE konsortiet. DNase I hypersensitivitet spor HCT-116 (HCT) og Caco-2 nedenfor er fra UW KODE datasæt. Den grønne stribe repræsenterer enhancer fragment A. røde striber angiver klonede fragmenter B til G (venstre til højre), der viste sig at mangle enhanceraktivitet. Koordinater for hvert fragment er tilvejebragt i File S1. (C) Bindingsuligevægt plot for rs4939827 herunder alle SNPs i 1KG projekt med r

2≥0.2, skabt med Haploview. r

2 = 1- sort, 1 r

2 0,2 – gråskala. (D) forstørrede visning af fragment en fremvisning sub-fragmenter A1-A4. Den INDKODNING Layered H3K4me1 styr på 7 cellelinier er vist at identificere celletype-specifikke toppe. (E) haplotyper og procenter (CEU population) for de 4 SNPs i fragment A og rs4939827. Haplotyper tilknyttet til rs4939827 risiko allel T er i lyslilla.

enhanceraktivitet Assays Salg

Syv formodede enhancerregioner blev klonet ind i en luciferase-assay-vektor til bestemmelse enhanceraktivitet i CRC-cellelinier HCT-116 og SW480. Kun 2 kb fragmentet (grøn stribe i figur 1 B) ved 3′-enden af ​​

SMAD7

intron 4 udviste aktivitet i vores assays, men kun i den modsatte orientering (figur 2A). Regioner testet men mangler aktivitet i dette assay er angivet i røde striber på figur 1 B (figur 2B). De 2 kb forstærker region, vi sigt fragment A, indeholder 4 SNPs i LD med rs4939827: rs6507874, rs6507875, rs8085824, og rs58920878 (novel 1). Et ekspanderet billede af fragment A er vist i figur 1D. Som vist i figur 1C, disse fire SNP’er er i LD (r

2 = 1 til 0,494) med hinanden og definere 5 haplotyper i CEU population. Disse haplotyper er vist i forhold til rs4939827 variant (risiko allel T) i figur 1E [22], [23].

(A) Relativ luciferaseaktivitet for positiv kontrol, fragment A i den forreste, og fragmentet A i omvendt orientering. Lette kolonner indikerer aktivitet i HCT-116, mørke søjler indikerer aktivitet i SW480. (B) fragmenter B til G, der er vist i figur 1B som røde striber ikke viser enhancer aktivitet i begge orienteringer i HCT-116. Positive kontroller er vist for hver gruppe af konstruktioner analyseret på den samme plade. Fragment E indeholder tagSNP rs4939827. (C) Aktivitet af fragment A i omvendt orientering med alle SNP’er i fragmentet med deres C-allel, med hver allel ændret uafhængigt til den alternative allel, vist som gange ændring i forhold til konstruktion indeholdende fire C alleler. Alle fire alleler resultere i en statistisk signifikant reduktion i aktivitet: rs6507874 T

s

= 8.25 × 10

-3 (HTC-116),

s

= 3,30 × 10

-2 (SW480); rs6507875 G

s

= 3,40 × 10

-2 (HCT-116),

s =

6.79 × 10

-3 (SW480); rs8085824 T

s =

1,20 × 10

-2 (HCT-116),

s =

3,12 × 10

-3 (SW480); rs58920878 G

s =

2,09 × 10

-3 (HCT-116),

s =

3,05 × 10

-3 (SW480).

Vi først afprøvet, om der var nogen allelspecifikke forskelle i enhancer aktiviteten for hver af SNP’eme individuelt begyndende med en 2 kb fragment med alle 4 SNPs indeholdende C alleler. Mens denne haplotype ikke ses i CEU population viste denne allel kombination højeste enhancer aktiviteten af ​​alle testede fragmenter. Vi observerede allel-specifikke ændringer i enhancer aktivitet for hver af de fire varianter, når alleler blev ændret ved steddirigeret mutagenese (Figur 2C). Alle 4 SNP’er viste et fald i forstærker aktivitet, når alleler blev ændret til alternative form. Det største fald i aktivitet blev set, når rs58920878 blev ændret fra C til G. Mens de mindre alleler for SNPs rs6507874 (T, mindre allel frekvens (MAF) = 0,44) og rs58920878 (G, MAF = 0,34) viste en lavere enhanceraktivitet, de mindre alleler for SNP rs8085824 (C, MAF = 0,34) og rs6507875 (C, MAF = 0,49) viste en højere forstærker aktivitet i disse analyser.

Fragment a omfatter flere mindre distinkt HCT-116 H3K4me1 toppe, med længst til venstre top specifik for HCT-116 sammenlignet med det lagdelte H3K4me1 super styr på 7 KODE Tier 1 cellelinier [19] (figur 1D). For at teste de relative bidrag i disse regioner og SNPs individuelt på den samlede forstærker aktivitet, 4 mindre konstruktioner, A1-A4, var designet (Figur 1D). A1-fragmentet omfatter SNPs rs6507874 og rs6507875 og omfatter HCT-116 specifik højdepunkt. Disse to SNP’er er kun adskilt af 13 bp og er i LD med hinanden med r

2 = 0,794, D ‘= 1. Som vist i figur 3A, A1-fragment påvist enhanceraktivitet. Den største haplotype af rs6507874 og rs6507875 alleler i CEU befolkning, CG, demonstrerede det laveste niveau af enhancer aktivitet sammenlignet med de andre tre mulige allel kombinationer (figur 3B). TC og CC mindre haplotyper viste ca. 1,3-1,5 gange og 2-2,5 gange højere aktivitet i begge cellelinier, HCT-116 og SW480, henholdsvis (figur 3B). TG allel kombination, mens ikke en kendt CEU haplotype viste lavere aktivitet end TC haplotypen. Samlet set konkluderer vi, at mens begge SNP’er, rs6507874 og rs6507875, bidrage til den samlede enhancer aktivitetsniveau på A1-fragmentet, rs6507875 alleler viser et større allelspecifik virkning end rs6507874, i retningen i overensstemmelse med 2 kb fragmentet (figur 2C ). I modsætning hertil virkningen af ​​rs6507874 allel på enhanceraktivitet var afhængig af hvilken rs6507875 allel var til stede, hvilket antyder en kontekstuel virkning inden enhancer komponenter. Disse data indebærer eksisterer en kompleks funktionel forbindelse mellem tilstødende SNP’er.

(A) Fragment A blev opdelt i 4 mindre DNA-fragmenter, A1-A4, der er afbildet i figur 1D. Hver mindre fragment påvist enhancer aktivitet i både HCT-116 (lyse søjler) og SW480 (mørke søjler). For det viste forsøg alle SNP’er indeholdt deres C alleler. (B) Aktivitet af Fragment A1 indeholder rs6507874 og rs6507875, vist som fold ændring i forhold til den store haplotype CG for HCT-116 (lyse søjler) og SW480 (mørke søjler). Den mindre haplotype TC (

s

= 2,25 × 10

-2 (HCT-116),

s

= 8,59 × 10

-2 (SW480)), og kombinationen CC (

s

= 5,06 × 10

-5 (HCT-116),

s

= 1,75 × 10

-5 (SW480)) ikke set i CEU befolkning viser højere aktivitet end de store haplotype. Kombination TG (

s

= 0,450 (HCT-116),

s

= 0,287 (SW480)) viser aktivitet svarende til CG. (C) Fragment A2 indeholdende rs8085824 viser 2 gange højere enhanceraktivitet med den mindre C-allel af end den større allel T (

s =

4,75 × 10

-3 (HCT-116),

s =

3,61 × 10

-4 (SW480)). (D) Aktivitet af fragment A3 indeholder rs8085824 og rs58920878 forhold til større haplotype TC. Den mindre haplotype CG demonstrerer højere aktivitet end TC (

s =

2,49 × 10

-2 (HCT-116),

s =

6,32 × 10

-3 (SW480 )). T (større) allel af rs8085824 viser lavere aktivitet end C (mindre) allel uanset rs58920878 allel. Den højeste aktivitet ses i haplotype CC, der ikke er rapporteret i CEU population (

s =

6,35 × 10

-7 (HCT-116),

s =

1,47 × 10

-6 (SW480)). (E) Aktivitet af fragment A4 omfatter toppen indeholdende rs58920878. Den mindre allel G i rs58920878 viser dramatisk mindre aktivitet end de store C-allelen (

s =

1,92 × 10

-4 (HCT-116),

s =

1,52 × 10

-5 (SW480)). (F) Fragment A blev testet for aktivitet med de to mest almindelige haplotyper (figur 1E) i CEU befolkning. Den CGTC haplotypen viser højere aktivitet i HCT-116 (lys barer,

s

= 1.04 × 10

-11) og SW480 (mellemstore barer,

s

= 8,60 × 10

-11), men ingen signifikant forskel i aktivitet i RKO (mørke søjler).

A2 fragmentet indeholder SNP rs8085824 og skræver over området mellem de to mest fremtrædende HCT-116 H3K4me1 toppe i forstærker A (figur 1D). Mens fragment A2 havde aktivitet på egen hånd, det viste den laveste aktivitet af de 4 testede delregioner (figur 3A). Når rs8085824 allelen blev ændret fra T (større allel) til C (mindre allel), aktivitet steget til det dobbelte (figur 3C) stemte overens med resultaterne for den større fragment (figur 2C). A3 fragmentet omfatter A2 regionen (herunder rs8085824) og en yderligere 160 bp til at omfatte rs58920878. Dette fragment viste 2 gange mere aktivitet end A2-fragmentet. Den største haplotype af rs8085824 og rs58920878 (r

2 = 1, D ‘= 1, CEU) er TC. Den mindre haplotype CG demonstrerede 1.3 til 1,6-x højere aktivitet end den største haplotype i HTC-116 og SW480 celler. Den kunstigt konstrueret CC allelkombination havde det højeste niveau af aktivitet testet for A3-fragment. Sammenligning af CC-fragment til TC og CG haplotype fragmenter, observerede vi, at et større fald i aktivitet resulterede i at ændre rs8085824 allel end rs58920878. Omvendt oplyste skiftende rs58920878 i TC haplotypen for TG ikke resultere i en signifikant forskel i enhanceraktivitet. Som med A2-fragmentet, for SNP rs8085824 disse resultater stemte overens med allel-specifikke virkninger, der ses ved anvendelse af større fragment (figur 2C). For SNP rs58920878, effekten forudsagt af 2 kb fragmentet var afhængig af hvilken rs8085824 allel var til stede, igen, hvilket antyder, at der eksisterer en kompleks funktionel forbindelse mellem tilstødende SNP’er.

Endelig fragment A4, der omfatter det andet mindre HCT-116 H3K4me1 peak, indeholdt kun SNP rs58920878 og demonstrerede lignende aktivitet til fragmenter A1 og A3 (figur 3A). Dette fragment viste enhancer-aktivitet blev reduceret 3 gange, når den større allel C blev ændret til den mindre allel G (figur 3E). A4 fragment indeholdende rs58920878 var den eneste af de mindre fragmenter, hvor den mindre allel eller haplotype påvist lavere aktivitet end de store allel /haplotype.

De to mest almindelige haplotyper i CEU for denne gruppe af 4 SNPs er CGTC (49,9%) og TCCG (33,4%) (figur 1E). Disse kombinationer blev testet i forbindelse med 2 kb enhancer En konstruktion. Som vist i figur 3F, samlet større CGTC haplotypen demonstrerede højere enhancer aktivitet end den mindreårige TCCG haplotypen i HCT-116 og SW480. Interessant, når vi testede de to haplotyper i CRC cellelinien RKO, CGTC var ikke signifikant mere aktiv end TCCG haplotypen, angiver, at der var nogle specificitet til fragment A aktivitet, selv blandt CRC cellelinier. Hverken haplotype af fragment A var aktiv i ikke-CRC cellelinie HEK293, der tjente som en negativ kontrol (Figur S1A). Fragmenter indeholder haplotyper TCTC (9,5% af CEU befolkning) og CCTC (5,9% af CEU befolkning) demonstrerede aktivitetsniveau mellem denne af haplotyper CGTC og TCCG (figur S1B).

elektroforetiske mobilitet Shift Analyser

for bedre at forstå disse allel-specifikke enhancer virkninger, vi næste undersøgt nukleare proteinbinding til sekvenserne indeholdende hver af de 4 SNP’er, rs6507874, rs6507875, rs8085824, og rs58920878. Vi antager, at transkriptionsfaktorer selektivt ville binde til C-alleler med højere affinitet, som 2 kb fragmentet og fragmenterne A1-A4 med C alleler viste det højeste niveau af enhanceraktivitet. Omvendt kan inhibitoriske proteiner binder til T eller G alleler fortrinsvis til negativt at regulere enhanceraktivitet. Til dette formål 33 bp dobbeltstrengede oligonukleotider centreret på hver SNP, syntetiseret. I hvert tilfælde blev C-allel mærket med rød (700) IR-farve. De alternative alleler, enten T eller G blev mærket med grøn (800) IR-farve (individuelle kanaler præsenteres som sorte og hvide billeder i figur S2-S5 for let reproduktion og analyse). Nukleare ekstrakter blev fremstillet fra SW480, HCT-116 og RKO CRC cellelinier og inkuberet med ikke-specifik og specifik umærket konkurrerende DNA som vist i figur 4. De to alleler af hver SNP er mærket med forskellige farver, hvilket tillader en direkte sammenligning af binding af hver allel til kerneproteiner i den samme reaktion. Som vist i figur 4, for hver probe sæt testes, er der bands specifikke for én allel versus den anden allel.

(A) Nuclear ekstrakter fra SW480, HCT-116, og RKO cellelinier blev inkuberet med IR -dye mærkede 33mers centreret om rs6507874 C (red label) og T (grønne etiketter) forud for indfødte EMSA. Bane 1 og 2 viser sonden uden kerneekstrakt. Bane 3, 4, 9, 10, 15 og 16 viser hver mærket probe-binding til kerneproteiner individuelt med cellelinje som nævnt ovenfor. Bane 5-8, 11-14, og 17-20 er en 01:01 konkurrence med mærkede C og T allel prober. Bane 6, 12 og 18 indeholder 200 gange overskud af umærket C-allel konkurrent. Bane 7, 13 og 19 indeholder 200 gange overskud af umærket T allel konkurrent. Bane 8, 14 og 20 indeholder 200 gange overskud konkurrent til en unmatching sekvens med lignende indhold nukleotid. Bands specifikke for én allel og tabte for konkurrencen er markeret med pile. Se figur S2 for rød (700) kanal billede af C-proben og den grønne (800) kanal af T probe i sort og hvid. (B) Som i panel A, med rs6507875 C allel (rød sonde) og G-allelen (grøn). Se figur S3 for rød (700) kanal billede af C-proben og den grønne (800) kanal af G-probe i sort og hvid. (C) Som i panel A, med rs8085824 C allel (rød) og T-allelen (grøn). Se figur S4 for rød (700) kanal billede af C-proben og den grønne (800) kanal af T probe i sort og hvid. (D) Som i panel A, med rs58920878 C allel (rød) og G-allelen (grøn). Se figur S5 for rød (700) kanal billede af C-proben og den grønne (800) kanal af G-probe i sort og hvid.

I hver allel sæt, bane 3, 4, 9 , 10, 15 og 16 viser en enkelt allel probe inkuberes med kerneekstrakt. Banerne 5-8, 11-14, og 17-20 indeholder reaktioner med 1:1 mængder af hver mærket allel. For at bestemme specificiteten af ​​de ændrede komplekser, blev umærkede konkurrerende oligonukleotider til hver allel tilsat i 200 gange overskud. Banerne 6, 12 og 18 indeholder de umærkede C alleler og stræder 7, 13 og 19 indeholder umærkede T eller G alleler. I bane 8, 14 og 20, en umærket konkurrent til lignende basesammensætning men som ikke matcher nogen af ​​sekvenserne blev tilsat i samme mængde. Bands, der forsvandt, da konkurrerede med enten SNP allel, men til stede med den uafhængige (ikke-specifik) konkurrent blev anset specifik for SNP sekvens. Den mest fremtrædende af de specifikke bånd er markeret i tilknytning med pile.

For rs6507874 og rs58920878 (figur 4A, 4D), der var komplekser findes i HCT-116 og SW480, som ikke blev set i RKO. Dette kan forklare, hvorfor haplotype specifik aktivitet ikke blev set i RKO luciferaseaktiviteten eksperiment. I figur 4A og S2, bandet markeret med pilen var specifik for rs6507874 C allel probe. Bemærk, at i HCT-116 og RKO ekstrakter, selv 200 gange overskud af umærket T allelen oligonukleotid kunne ikke udkonkurrere C allel for binding. For rs6507875 prober (figur 4B og S3), mens der var specifikke bånd til begge alleler (pile), G-allelen bundet med mere affinitet end C-allelen. Interessant, bundet rs6507875 prober stærkt til komponenter af RKO ekstrakt, selv i nærvær af overskud af umærket DNA (figur 4B).

For rs8085824 prober, vi igen fundet flere specifikke komplekser for hver allel. En fremtrædende komplekst og er kendetegnet ved den nederste pil viste, at C-allel-proben ikke blev fuldstændig udkonkurreret med 200 gange overskud af T-allelen. Det fremgår, at de bundne proteiner af dette kompleks findes i højere mængder i SW480 og HCT-116 end RKO kerneekstrakter. I tilfælde af rs58920878 prober, fandt vi flere bands specifikke for C-allel, mens G-allelen blev fundet overvejende større komplekser (højere bånd) end C-allel.

bestemmelse af identiteten af ​​disse allel- specifikke bindende proteiner vil være forpligtet til fuldt ud at forstå virkningen af ​​SMAD7 forstærker. Protein binding forudsigelse software Biobase Match, baseret på TRANSFAC motiv databasen, blev brugt til at identificere kandidater til hver SNP region [24]. Resultaterne af denne analyse er præsenteret som tabel S1, S2 og S3 i File S1. Den DNA-bindende protein med den øverste forskel i forventede bindende score mellem alleler for rs6507874 /rs6507875 (analyseres sammen grundet nærhed) var NF-1A, for rs8085824 var Churchill, og for rs58920878 var ZF5. Men for hvert locus, ingen af ​​proteiner med de største forventede allel forskelle var proteinerne med den højeste kerne eller matrix scorer for hver sekvens.

eQTL Analysis in Normal Colon Tissue

Vi næste spurgte hvis genotypen ved disse SNPs korreleret med genekspressionsniveauer i normale colon væv. Da forstærkeren er placeret i intron 4 i

SMAD7

gen,

SMAD7

var en oplagt kandidat målgen. Udover rs6507874, rs6507875 og rs8085824, vi genotype også tagSNP rs4939827 i patologisk normale humane vævsprøver opnået fra overvågning koloskopi gennem Aspirin /Folat Polyp Prevention Study [25] – [27]. Vi kunne ikke designe et TaqMan assay for rs58920878 dog SNPs rs8085824 og rs58920878 er i perfekt LD (r

2 = 1, D ‘= 1); derfor rs8085824 repræsenterer også en proxy for rs58920878. Ingen statistisk signifikant korrelation mellem ekspressionen af ​​de to andre gener inden for 0,5 Mb rs4939827,

CTIF

eller

DYM

, og nogen af ​​de genotype SNP’er blev set (data ikke vist).

Vi fandt, at tagSNP rs4939827 ikke viste en statistisk signifikant sammenhæng med

SMAD7

ekspressionsniveauerne, selv om højere udtryk trended med T GWAS risiko allelen (p = 0,1130) (figur 5). Men SNP rs8085824 C (mindre) allel viste en statistisk signifikant korrelation (

s

= 0,01197) med øget

SMAD7

udtryk. Eftersom SNPs rs8085824 og rs58920878 er i perfekt LD, kan dette resultat ekstrapoleres til at antyde en sammenhæng mellem rs58920878 G (mindre) allel og højere niveauer af

SMAD7

udtryk. Den rs6507874 T (mindre) allel (p = 0,07531) og rs6507875 C (mindre) allel (

s

= 0,1337) viste ikke en statistisk signifikant sammenhæng med øget

SMAD7

udtryk. Bemærk at den samlede TCCG haplotype (mindre haplotype) korreleret med højere

SMAD7

ekspression i væv og i luciferaseassays inden for rammerne af fragmenterne A1, A2 og A3, men blev modsat retning set for enhancer aktiviteten af den 2 kb fragmentet i luciferase- eksperimenter, hvor fragmentet indeholdende TCCG haplotype (mindre haplotype) korreleret med reduceret enhancer aktivitet sammenlignet med fragment indeholdende CGTC haplotypen.

Fold ændring (FC) af SMAD7 ekspression blev målt i normalt prøver kolon væv fra overvågning colonoscopies. Rank, ikke-parametrisk analyse blev anvendt til at estimere effekten af ​​hver ekstra mindre allel for rs6507874, rs6507875, rs8085824, og rs4939827 (additive model) på genekspression justering for køn, alder og race. Tosidet

s

-værdier blev opnået fra et likelihood ratio test. Log

2 (ΔΔCt) blev afbildet som funktion af genotyper ved hjælp af en kasse plot – dot plot overlay. Antal prøver bemærkes under hver genotype. En statistisk signifikant sammenhæng blev fundet for rs8085824.

vil være behov for yderligere undersøgelser for at bestemme, hvordan denne multi-komponent forstærker kontroller

SMAD7

genekspression under kolon udvikling og cellevækst, og til afgøre, om de enkelte komponenter i forstærker handler uafhængigt af hinanden.

Regulering af SMAD7 Enhancer

Vi næste ønskede at bestemme forholdet mellem forstærker aktivitet og BMP /TGF-signalering. Som nævnt i indledningen, SMAD7 fungerer som en nøglemediator af den negative feedback loop for både TGFp og BMP signalveje. Vi var interesserede derfor at bestemme, om enhancer A var en del af en tilbagekoblingssløjfe, bliver mere aktive som reaktion på enten TGFp1 eller BMP4 signalering. HCT-116 og SW480-celler blev serumudsultet natten over forud til 6 timers behandling med 100 pmol TGFp1 eller BMP4, og 2 kb fragment A blev anvendt til at teste for luciferaseaktivitet. Efter behandling med TGFp1, fragmenter indeholdende enten CGTC (den største) haplotype eller TCCG (mindre) haplotype viste ingen statistisk signifikant ændring i aktivitet i enten cellelinje (figur 6A). I modsætning hertil efter behandling med BMP4, enhancer aktivitet af fragmentet indeholdende CGTC større haplotype blev forøget 1,2 gange i HCT-116 celler og 1,5 fold i SW480-celler (figur 6B). En stigning i enhancer-aktivitet blev også set med fragmentet indeholdende TCCG minor haplotype i SW480 celler, hvor BMP behandling førte til en 1,4 gange stigning i enhanceraktivitet, men ikke i HCT-116 celler, hvor ingen signifikant stigning blev observeret (

s

= 0,38) (figur 6B). Fordi DNA-fragmenter indeholdende begge haplotyper blev stimuleret af BMP4 i SW480 i et tilsvarende omfang (fold ændring), postulerer vi, at de 4 SNP’er i risikoen haplotype ikke forstyrrer den faktiske BMP reagerende bestanddele af enhanceren. Men på grund af underskud i aktiviteten med mindre haplotype efter BMP4 stimulering, den TCCG haplotypen konstruktion stadig viser, lavere forstærker aktivitet end CGTC haplotypen uden BMP4 stimulering (figur 6C). I alt data implicerer enhancer i en negativ feedback loop som reaktion på BMP signalering, men ikke i TGFp arm af signaleringskaskade.

(A) Enhancer aktivitet blev målt ved luciferase assay for fragmentet A indeholdende den største (CGTC) og mindre (TCCG) haplotyper i serum sultet HCT-116 og SW480 celler inkuberet med TGFp1 i 6 timer. Prøver afbildet som en fold ændring i aktivitet i forhold til ikke-behandlede celler på den samme plade. (B) Enhancer aktivitet blev stimuleret af 6 timers BMP4 behandling for CGTC haplotypen i HCT-116 (

s

= 4.14 × 10

-3) og SW480 celler (

s

= 1,22 × 10

-10). Den TCCG haplotypen i fragment A viser lavere niveauer af stimulation, og kun i SW480 (

s

= 1,61 × 10

-6). (HCT-116

s

= 0,38). Virkning af BMP plottes som gange ændring i forhold til ubehandlede prøver for hver haplotype på den samme plade. (C) Enhancer aktivitet sammenligning mellem de CGTC og TCCG haplotyper efter BMP4 behandling. Relativ luciferaseaktivitet blev plottet for hver haplotype i HCT-116 og SW480 bruger den samme eksperimentelle datasæt som (B).

Diskussion

For nylig har vores laboratorium, og andre er begyndt at overveje virkningerne af flere funktionelle varianter i koblingsuligevægt (LD), der bidrager til sygdom konstateret risiko gennem GWAS stedet for en enkelt funktionel variant [28]. For eksempel ved kromosom 11q23.1, vores laboratorium identificeret to SNP’er i LD (r

2 = 1) i forbindelse med CRC risiko, en i en enhancer og en i et tovejs-promotoren, som viste allel-specifik aktivitet og korreleret med ekspressionsniveauer af tre tidligere karakteriserede genmål [16].

Be the first to comment

Leave a Reply