PLoS ONE: Intra-Gene DNA Methylering Variabilitet er et klinisk Uafhængig Prognostisk Marker i kvinders Cancers

Abstrakt

Vi introducerer et nyt pr-gen mål for intra-gen DNA methylering variabilitet (IGV) baseret på Illumina Infinium HumanMethylation450 platform, som er prognostiske uafhængigt af kendte prædiktorer for kliniske resultat. Brug IGV, udlede vi en robust gen-panel prognostisk signatur for kræft i æggestokkene (OC,

n

= 221), der validerer i to uafhængige datasæt fra Mayo Clinic (

n

= 198) og TCGA (

n

= 358), med betydningen af ​​

s

= 0,004 i begge sæt. The OC prognostiske signatur gen-panel består af fire gen grupper, som repræsenterer forskellige biologiske processer. Vi viser IGV målinger af disse gen-grupper er mest sandsynligt en refleksion af en blanding af intra-tumor heterogenitet og transkriptionsfaktor (TF) binding /aktivitet. IGV kan bruges til at forudsige det kliniske resultat hos patienter individuelt, hvilket giver en surrogat udlæsning af hårdt efter mål sygdomsprocesser

Henvisning:. Bartlett TE, Jones A, Goode EL, Fridley BL, Cunningham JM, Berns EMJJ, et al. (2015) Intra-Gene DNA Methylering Variabilitet er et klinisk Uafhængig Prognostisk Marker i Kvinders Kræft. PLoS ONE 10 (12): e0143178. doi: 10,1371 /journal.pone.0143178

Redaktør: Dajun Deng, Peking University Cancer Hospital og Institut, KINA

Modtaget: Oktober 5, 2015; Accepteret: 30 oktober 2015; Udgivet: December 2, 2015

Copyright: © 2015 Bartlett et al. Dette er en åben adgang artiklen distribueres under betingelserne i Creative Commons Attribution License, som tillader ubegrænset brug, distribution og reproduktion i ethvert medie, forudsat den oprindelige forfatter og kilde krediteres

Tilgængelighed Data: data DNA methylering for de vigtigste OC data-sæt analyseret her er deponeret i Gene Expression Omnibus (GEO) under tiltrædelsen nummer GSE72021

Finansiering:. Dette arbejde blev finansieret (MW, AJ) af den Europæiske Unions syvende rammeprogram ( FP7 /2007-2013) under tilskudsaftale nummer 305.428 (Project EpiFemCare), af National Institute for Health Research University College London Hospitals Biomedical Research Centre, og af Eva Appeal og det europæiske netværk Translationel forskning i Gynækologisk Onkologi (ENTRIGO) i european Society of Gynækologisk Onkologi (ESGO). TEB modtaget støtte fra Engineering og fysik Forskningsråd UK (ESPRC) og Medical Research Council UK (MRC) via UCL Complex. ELG modtaget støtte fra Fred C. og Katherine B. Andersen Fonden, NIH tilskud R01-CA122443, P50-CA136393 (Mayo Clinic kræft i æggestokkene SPORE) og P30-CA15083. De finansieringskilder havde ingen rolle i studie design, indsamling og analyse af data, beslutning om at offentliggøre, eller forberedelse af manuskriptet

Konkurrerende interesser:.. Forfatterne har erklæret, at der ikke findes konkurrerende interesser

Forkortelser : BRCA, Brystkræft invasiv karcinom; DNAM, DNA-methylering; EF, Endometriecancer; KODE, Encyclopedia of DNA-elementer; FDR, False opdagelse sats; ITH, Intra-tumor heterogenitet; OC, Ovariecancer; IGV, Intra gen variation af DNA methylering; TCGA, The Cancer Genome Atlas; TF, transkriptionsfaktor; UCEC, uterin corpus endometrialcarcinom

Introduktion

Forskelle i DNA-methylering (dNAM) niveauer er blandt de tidligste ændringer i menneskets carcinogenese [1] og er et adelsmærke for kræft [2], der tilbyder den potentiale for nye strategier til at forudsige kræft biologi og resultat. De epigenetiske forskelle, som disse ændringer giver anledning til, er mere stabile end forskelle i genekspression niveau. Genekspression niveauer, målt ved RNA, er genstand for periodiske og forbigående variabilitet (såsom døgnvariation og mRNA ustabilitet), som ikke gælder for dNAM. Identificering pålidelige indikatorer for forskelle i dNAM mønstre kan give et værdifuldt bly til udvikling af DNA-baserede kræft biomarkører i væv og kropsvæsker.

Kræft i æggestokkene (OC) og endometriecancer (EF) er de mest almindelige gynækologiske cancere [3]. Kun en ud af tre patienter med fremskreden OC overleve fem år efter deres første diagnose [4]. Meget lidt er kendt om OC biologi og hvordan man kan manipulere denne sygdom terapeutisk. DNAM ændringer er vigtige i cancer [5]; den epigenome er en grænseflade mellem genomet og miljø [6, 7], og dermed dNAM ændringer kan måle eksponeringen for risikofaktorer for kræft miljømæssige. DNAM biomarkører, som repræsenterer et surrogat for mønstre af gen interaktion har tidligere været forbundet med kliniske resultater i en lang række forskellige kræftformer [8], samt specifikt i kvinders kræftformer [9].

prøve til prøve variabilitet dNAM ved specifikke genomiske placeringer er kendt for at være vigtig i udviklingen af ​​cancer [10, 11], og det er for nylig blevet vist, at en forøgelse af intra-genet variabilitet af dNAM (IGV), et mål for inden-prøve methylering variabilitet ( fig 1a), er stærkt associeret med cancervæv sammenlignet med raske [12]. Forskellen methylering er den almindeligt anvendte fremgangsmåde, hvorved methylering niveauer sammenlignes mellem væv, fænotyper og eksperimentelle betingelser (ækvivalent til differential ekspression af gener). Her udvikler vi en prognostisk signatur baseret på IGV som er uafhængig af velkendte kliniske prognostiske karakteristika, og viser, at denne IGV prognostiske signatur er sandsynligvis et surrogat udlæsning afspejler en blanding af intra-tumor heterogenitet og transkriptionsfaktor (TF) binding /aktivitet .

(a) methylering Jo middelværdi over en specifik genomisk region er beregnet særskilt for TSS200 (promotor) og gen krop genomiske regioner. Den blå kurve angiver den nye position af den røde kurve efter et tilsætningsstof global skift i methylering niveau, hvilket kan skyldes teknologiske eller andre eksperimentelle faktorer, og forskellen mellem de vandrette røde og blå linjer (gennemsnitlige niveauer) illustrerer effekten af ​​dette skift på den gennemsnitlige methylering niveau. (B) inden for genet methylering variabilitet (IGV) beregnes ud fra variationen omkring methylering niveau gennemsnit, dvs. fra de stiplede lodrette linier, og er ligeledes beregnet særskilt for TSS200 og gen krop genomiske regioner. De lodrette grønne linier ændres meget lidt i forhold til de lodrette røde linjer, der illustrerer, at en sådan global additiv skift i gennemsnitlig methylering niveau har meget mindre effekt på IGV, som derfor betegnes som et “selvkalibrerende foranstaltning«.

Resultater

sammenligning af prædiktiv robusthed pr-gen methylering foranstaltninger i data

for at vurdere effektiviteten og robusthed IGV forhold til at betyde methylering niveauer, vi sammenlignet fire per- gen methylering foranstaltninger, baseret på gennemsnitlige methylering niveau og IGV (figur 1). For hvert gen, vi beregnede middelværdi methylering niveau og IGV, separat for promoteren (TSS200) og gen-krop regioner, ved hjælp af Illumina Infinium HumanMethylation450 platform specifikationer af de CpG’er i disse regioner for hvert gen. Vi overvejede forskellige genomiske regioner hver for sig, fordi methylering mønstre varierer meget fra genomisk region til en anden, og effekten af ​​methylering niveau på genregulering varierer alt efter genomisk region. De fire foranstaltninger, vi sammenlignede, er som følger:

TSS200 gennemsnitlig methylering

TSS200 IGV

Gene krop betyde methylering

Gene krop IGV

Vi opnåede genom-dækkende dNAM profiler via Illumina Infinium HumanMethylation450 platform, fra 218 primære OC prøver. For hver af de fire beskrevne foranstaltninger, vi brugt “Elastic Net” [13, 14] for at finde en prognostisk udvalg af gener. Elastisk net har vist sig at være et optimalt lineær modellering metode til identificering grupper af gener, der fungerer sammen som en del af en fælles biologisk proces [15]. Det er en regression metode, som “vælger” det sæt af gener, som model data bedst, forsøger at omfatte så få gener i modellen som muligt og samtidig sikre, at modellen forudsiger resultatet af interesse så præcist som muligt. Dermed er det kasserer gener, som ikke giver nyttig information, eller som giver gentagne oplysninger. Som vores mål er at finde et minimalt sæt af gener til at bruge som en prognostisk signatur, er det vigtigt at bemærke, at blandt disse gener, vil der være grupper af gener, for hvilke deres IGV indeholder overflødige eller overlappende information, og der vil være grupper af gener for hvilke IGV indeholder supplerende oplysninger for hvert gen. Derfor valgte vi at bruge Elastic Net teknik til præcist at skelne en sådan ikke-redundant gruppering af gener som en minimal prædiktiv sæt fra mange muligheder, genom bred. Vi bemærker, at mens denne metode kan synes kompleks i denne sammenhæng, ville enklere metode ikke være i stand til at skelne disse påholdende grupperinger af gener, hvor overlappende og overflødig information holdes på et minimum.

Vi vurderede effektiviteten af methylering foranstaltninger pr-gen som prognostiske foranstaltninger tilfældigt opdele data i to dele: en “træningssæt”, og en “test sæt ‘. Elastisk net blev anvendt til at vælge gener og montere en model til træningssættet, og evnen hos dette gen udvælgelse og model blindt forudsige patientoverlevelse udfald (korrigeret for kliniske kovarianter) blev vurderet ved anvendelse af testen-sættet. Dette blev gentaget 2001 gange, og betydeligt forudsigende udvalgte grupper af gener blev defineret i henhold til falsk opdagelse sats (FDR) justeret [16]

s

-værdi (dvs. FDR

q

-værdi) 0,1 (figur 2a). Som vist i figur 2b, kun gen organ IGV forudsiger godt.

(a) Metode overblik for sammenligning af de fire per-genet methylering foranstaltninger. (b) Resultaterne af denne sammenligning. (C) Metode overblik for beregning af kræft i æggestokkene IGV prognostisk score.

Udledning af en kræft i æggestokkene prognostisk signatur, og IGV prognostisk score

Vi brugte IGV at udlede en OC dNAM prognostisk signatur (figur 2c), baseret på gen-krop IGV (herfra på blot benævnt »IGV«). Vi gjorde dette ved at bestemme en konsensus om et sæt af gener prædiktive for at overleve, ved at følge den samme procedure for at opdele data i test og uddannelse sæt, og derefter vurdere gen udvælgelse og monteret model for deres evne til blindt at forudsige patientens overlevelse udfald (justeret til kliniske kovariater) i testsættet. For at sikre konvergens til et stabilt resultat, vi gjorde 10

5 sådanne partitioner af dataene, hver resulterer i en prædiktiv udvalg af gener. Af disse blev 8281 fundet som signifikant (FDR

q

0,1), og betydning for hvert gen blev derefter beregnet på grundlag af antallet af væsentlige modeller, hvor dette gen dukkede. 679 gener blev udvalgt som dette for optagelse i OC prognostiske signatur på et signifikansniveau på FDR

q

0,05, med den mindst betydende genet til stede i 1057 ud af 8281 model passer. Den øverste 100 mest betydningsfulde af disse gener er vist i supplerende tabeller (S1 File).

Gener ofte optræde sammen som en del af biologiske veje, og processer. Derfor kan vi forvente, at disse 679 OC prognostiske signatur gener kan være repræsenteret af et mindre antal underliggende biologiske processer, som er vigtige for sygdomsprogression. Gruppering gener med lignende eksperimentelle målinger ved hjælp grupperingsmetoder er veletableret som en effektiv metode til bestemmelse af klinisk relevante prognostiske markører [17, 18]. Derfor, for at afdække sådanne grupperinger i 679 gener af vores OC prognostisk signatur, vi udført konsensus klyngedannelse [19], for at identificere grupper af gener med lignende mønstre af IGV tværs patienter. Hver klynge på denne måde identificeret afslører en anden IGV tendens, og derfor kan svare til en anden underliggende biologiske proces, som giver anledning til mønster af IGV observeret i denne klynge. Den klyngedannelse blev udført separat for gener, der hver for sig var forbundet med dårligere patient overlevelse resultat for øget IGV ( ‘hyper’ gener) og for nedsat IGV ( »hypo« gener). Resultatet blev fire klynger: to fra de hyper gener, kaldet klynger ‘hyper 1’ og ‘hyper 2’, og to fra hypo gener, kaldet klynger ‘hypo 1 «og» hypo 2’; de er vist i supplerende tabeller (S1-fil). Middelværdien IGV af generne af hver af de fire klynger giver en IGV ‘klynge score “, for hver klynge og for hver patient, der er taget for at være repræsentative for de forskellige IGV tendenser, og den tilsvarende underliggende biologiske processer, i OC prognostisk signatur.

Vi derefter beregnet et IGV prognostisk score, ved at montere en multivariat Cox proportional farer model (tegner også til kliniske kovariater) til de fire IGV klynge scoringer. Det var ikke muligt at montere en sådan model til det fulde sæt af 10014 gener, fordi der er mange flere prediktorvariabler (gener) end prøver [20]. Imidlertid reducerer prognostiske signatur til 4 klynge scores, dvs. 4 prædiktorer, tillader, Cox proportional hazards model til montering. Dette resulterer i en model koefficient for hver klynge score /prædiktor; disse anvendes til at beregne IGV prognostisk score. Den IGV prognostisk score er en one-tal prognostisk indikator for en enkelt prøve /patient, og vi bemærke, at det skal beregnes på grundlag af alle fire klynge scoringer, at være væsentligt prognostisk.

Medianen af ​​denne IGV prognostisk score blev anvendt til at opdele patienterne om de vigtigste OC datasættet til bedre og dårligere prognostiske grupper, vist i figur 3a og 3b. Den IGV prognostiske point er valideret i to uafhængige sæt af kræft stammer fra Müllerske tarmkanalen. En ny OC sæt fra Mayo Clinic (

n

= 198) bekræftede prognostiske kapacitet IGV prognostisk score i både univariate (fig 3c) og multivariat (Fig 3d) analyser. For at teste, om IGV prognostiske score kun er begrænset til OC, eller om det er også prædiktiv i andre cancere, som stammer fra den samme embryologiske struktur (dvs. den mullerian kanal), anvendt vi vores prognostisk score til en offentligt tilgængelig uterin corpus endometrioide carcinom (UCEC) indstilles fra

The Cancer Genome Atlas Hotel (TCGA) [21] (

n

= 358). Igen i både univariate (Fig 3e) og multivariat (fig 3f) analyser, kunne vi validere den IGV prognostiske score

(a), (c) og (e):. Sammenligning af overlevelseskurver af grupper defineret af IGV prognostisk score, i: (a) den vigtigste OC datasæt, (c) Mayo Clinic OC validering sæt, (e) livmoderkræft TCGA validering sæt. Grupperne er delt af medianen IGV prognostisk score afledt i de vigtigste OC dNAM data-sæt. Den hazard ratio (

HR

) vises med 95% C.I. i parentes, med tilsvarende

s

-værdi beregnes ved univariate Cox regression. (D), (e) og (f):. Multivariate Cox regression sammenligne de samme grupper defineret af IGV prognostiske score

Vi bemærker, at anvendelse af den mediane prognostiske score fra de vigtigste OC data-sæt (træningssættet) til dichotomise patienterne i Mayo OC og TCGA UCEC validering sæt gør dette til en sand vurdering af den prognostiske evne af denne metode. Dette skyldes, ved denne metode, er patienterne i validerings- sæt klassificeret én efter én ind i en bedre eller værre prognostisk gruppe, i form af deres dNAM målinger kun. Denne klassificering sker efter en tærskel eller grænsen dividere disse prognostiske grupper (dvs. medianen af ​​den prognostiske score i uddannelsen data-sæt), og denne grænse er sat helt uafhængigt af disse validering data-sæt.

IGV og intra-tumor heterogenitet

Vi foreslår, at de IGV klynge score er hver repræsentant i forskellige biologiske processer, vigtig for udfaldet sygdom. Men hvad er disse processer? At forsøge at finde nogle svar på dette spørgsmål, vi først antaget, at intra-tumor heterogenitet kan være en afspejling af IGV. Emnet for intra-tumor heterogenitet modtager i øjeblikket en stor opmærksomhed, afdække meget rumlig og tidsmæssig mangfoldighed i genomiske processer inden for de enkelte tumorer [22]. Ideelt set bør DNA methylome af individuelle celler fra den samme tumor prøve analyseres for at løse dette spørgsmål. Som en alternativ fremgangsmåde anvender vi her cross-prøve methylering varians (dvs. betyde methylering varians af individuelle CpG’er af et specifikt gen-body region), som et mål for intra-tumor methylering heterogenitet, for at vurdere, hvordan dette varierer som en funktion af IGV (fig 4a). Cross-prøve methylering variabilitet er også et mål for hvor ens methylering profiler er for genet, tværs prøver. Hvis cross-prøve methylering variabilitet var en afspejling af IGV, som IGV stiger, ville vi forvente at se en konstant stigende cross-prøve methylering varians (figur 4b, forventes proportional pasform). Men i stedet ser vi et mønster, hvor for lav IGV, cross-prøve methylering varians stiger, mens der for høj IGV, cross-sample methylering varians aftager igen og er meget lav for de højeste IGV værdier. For at validere dette yderligere, analyserede vi yderligere to datasæt, som der er taget flere prøver fra forskellige regioner i samme kræft. Den første yderligere data-sæt er afledt af livmoderkræft, hvor der er taget uafhængige prøver fra 2 eller 3 primære cancer og metastatiske steder, i hver af 10 patienter (Fig 4c, en kurve af bedste tilpasning er vist per patient). Den anden er afledt af prostatakræft, hvor der er taget 8 uafhængige prøver fra den samme tumor, fra hvert af fem cancerpatienter [23] (figur 4d, en kurve per patient). Mønsteret af disse kurver er næsten identiske med de intra-tumor heterogenitet undersøgelser, i de vigtigste OC undersøgelse, som vi brugte til at identificere OC prognostiske signatur (figur 4b), og i basale prøver fra TCGA brystkræft invasiv carcinom (BRCA) data-sæt (figur 4e). Overlappet af gener i alle regioner i disse plots er også stor betydning på tværs af datasæt (fig 4f-4h).

(a) Cross-prøve variation af methylering (Intra-tumor heterogenitet) og IGV beregnes som forskellige og komplementære retninger. Den Heatmap viser methylering profilen af ​​et enkelt gen (vandret akse), på tværs af flere prøver (lodret akse). (B) – (e) En karakteristisk mønster af høj cross-prøve variabilitet (intra-tumor heterogenitet), når IGV er lav, og vice-versa, er konsekvent observeret på tværs af forskellige undersøgelser: (b) Main OC-data-sæt, (c ) Endometriecancer intra-tumor heterogenitet data-sæt, (d) prostatacancer intra-tumor heterogenitet data-sæt, (e) BRCA basal data-sæt. (F) – (h) Overlapningen af ​​gener i hver region af (b) med gener i ækvivalente regioner af (c) – (e) er af stor betydning. I (c) og (d), hver linje angår prøver fra en enkelt patient, og er en bedste fit kurve svarende til den under (b) og (e). I (b), odds-forhold og

s

-værdier på toppen af ​​plottet viser berigelse af generne af hver klynge, hver side af medianen IGV af den prognostiske signatur. Forkortelser:. ITH (intra-tumor heterogenitet), OC (ovariecancer), BRCA (brystkræft invasiv karcinom)

De gener fra klynge hyper 1 er lidt overrepræsenteret i venstre halvdel af fig 4b, hvor IGV er lavere, og cross-prøve methylering heterogenitet typisk er højere. Dette antyder, at den forøgede IGV af disse gener er forbundet med intra-tumor heterogenitet. Men generne af klynger hyper 2 og hypo 2 falder det meste i området af høj IGV og lav cross-prøve methylering variabilitet (mod højre i fig 4b). Dette betyder, at for generne af disse klynger, deres methylering profiler tendens til at være ens i forskellige prøver fra samme tumor, eller fra forskellige tumorer. I tilfælde af cluster hyper 2, svarer dette til høj methylering variabilitet inden for en enkelt gen i fattige prognostiske tilfælde, og at denne variabilitet er konsekvent ens i hele tumoren og mellem tumorer. Derfor generne af klynge hyper 2 viser høj IGV i fattige prognostiske tilfælde alligevel synes at være uafhængig af intra-tumor heterogenitet. Derfor spekulerer vi, at den øgede IGV af disse gener er en tumor-celle iboende fænomen, uafhængig af intra-tumor heterogenitet. Dette betyder, at IGV prognostiske signatur kombinerer foranstaltninger af intra-tumor heterogenitet, med de uafhængige, tumor-celle iboende fænomener. Vi bemærker, at begreberne »hyper« og »hypo«, her vedrører ændre, snarere end absolutte niveau. For eksempel S1 Fig viser, at klynge hypo 2 har den højeste IGV enhver klynge; imidlertid IGV af denne klynge er faktisk lavere i fattige sammenlignet med gode prognostiske tilfælde.

Generne definerer klynge hypo 1 har den højeste gennemsnitlige cross-prøve methylering variabilitet (figur 4), såvel som den højeste gennemsnitlige methylering niveau (S2 fig), og den lave IGV af hypo 1-gener er associeret med dårlig prognose. I første omgang er det vanskeligt at forklare, at fattige prognostiske kræftformer har lavere IGV i hypo1 gener, men disse hypo1 gener repræsenterer også høj prøve-prøve methylering heterogenitet. For at forklare dette, brugte vi et mål for CpG-CpG methylering variabilitet, som vi kalder den gennemsnitlige derivat [12], der beregnes som den gennemsnitlige absolutte forskel i methylering niveauer mellem tilstødende CpG’er af genet-body af et gen, i en enkelt prøve. Den Illumina HumanMethylation 450K vifte måler methylering niveauer af specifikke CpG loci, gennemsnit på tværs af en blandet-up prøve af mange celler. Figur 5a og 5b viser to eksempler på, hvordan høj methylering variabilitet på single-celle niveau kan manifestere i målinger erhvervet ved hjælp af denne teknologi.

450K vifte giver methylering målinger fra en blandet-up prøve af flere celler. (A) Et eksempel på en methyleringsmønster som er meget variabel, på lignende måde tværs celler. Dette fører til lave cross-sample heterogenitet, og høj IGV, som i klynge hyper 2. (b) Et eksempel på en methyleringsmønster som er meget varierende, men i en heterogen måde på tværs celler. Dette fører til høj cross-prøve heterogenitet imidlertid nettovirkningen på midling af methylering profiler på tværs af blandet op prøve af mange celler er et mål med lav IGV, som i klynge hypo 1. (c) Et mål for CpG-CpG-methylering variabilitet , beregnet som middelværdien derivat eller den gennemsnitlige absolutte forskel i methylering niveau mellem hosliggende CpG’er. (D) variation af den gennemsnitlige-derivat foranstaltning tværs prøver kvantificerer heterogenitet af CpG-CpG methylering variabilitet. Cluster hyper 2 er lav ifølge (d), og derfor svarer til et mønster, såsom (a). Klynge hypo 1 er høj ifølge (d), og derfor svarer til et mønster, såsom (b).

I eksemplet i fig 5a, ser vi, at der er ringe celle-celle heterogenitet, selv om der er store udsving inden for et gen. Derfor resulterer dette i målinger af høj IGV, og lav cross-sample methylering variabilitet, som vi ser i klynge hyper 2. Derefter Fig 5b viser et eksempel, hvor der er meget celle-celle-variabilitet, samt meget variabilitet inden for en gen . Resultatet er, at cross-prøven methylering variation af array-målinger er høj, men fordi de meget variable methylering profiler gennemsnitlige out ‘på tværs af de blandede-up celler i prøven, nettoresultatet er en måling med lav IGV. For at undersøge, om denne hypotese er plausibel, bruger vi den gennemsnitlige derivat mål for CpG-CpG methylering variabilitet (figur 5c). Ved at overveje, hvordan heterogen denne CpG-CpG variabilitet er på tværs prøver (figur 5d), er vi i stand til at bekræfte, at i generne af klynge hypo 1, den CpG-CpG methylering variabilitet tendens til at være mere forskellige på tværs af forskellige celler end i nogen anden klynge , som afspejles i den høje varians af de gennemsnitlige-derivat målinger. Vi er også i stand til at bekræfte fra figur 5d, at i de gener af klynge hyper 2, CpG-CpG-methylering variabilitet tendens til at være mindre forskellige i forskellige celler end i nogen anden klynge, som angivet ved den lave varians af middelværdien derivat. Derfor er disse data understøtter modellen i figur 5a og 5b for gener i cluster hyper 2 og hypo 1 hhv.

Funktionel rolle af transskription-faktor aktivitet i IGV

Som generne omfattende cluster hyper 2 synes at vise det samme IGV i de fleste celler i tumoren, men den høje IGV af klyngen hyper 2 gener er forbundet med dårlig prognose, vi anser klyngen hyper 2 IGV at være en “konsekvent tumor-celle iboende fænomen ‘ , som sandsynligvis vil blive reguleret af differentiel binding af transkriptionsfaktorer (TF). Derfor undersøgte vi TF binding til genet kropsområder af OC prognostisk signatur gener, og afprøvet korrelationen af ​​TF-ekspression med IGV af generne, de binder til (i et TCGA sæt basale brystkræft). Vi fandt, at hver prognostiske signatur klynge viser sin egen karakteristiske mønster af TF binding (figur 6a), som vi kan hypotese er forbundet med de biologiske processer, der er ansvarlige for det karakteristiske mønster af IGV observeret i denne klynge.

(en ) Falsk opdagelse sats justeret

s

-værdier og odds-ratio (OR) show berigelse af binding af specifikke transkriptionsfaktorer (TFS), til genet kropsområder af generne af hver klynge. TF’er for hvilke binding er betydeligt over eller under beriget (Fishers eksakte test, FDR

q

0,05) er farvet grøn og rød, hhv. (B) TF’er som viser signifikant mere positiv korrelation med IGV af generne, de binder til, i forhold til generne, de ikke binder til. (C) TF’er som viser signifikant mere negativ korrelation med IGV af generne, de binder til, i forhold til generne, de ikke binder til. (D) TF’er som er væsentlige ifølge (a) og enten (b) eller (c); TF’er med kendt relevans er angivet med en henvisning til den relevante undersøgelse. Manglen på berigelse af TF-binding til generne af klynge hypo2, er en afspejling af det lille antal (19) af gener i denne klynge.

transskriptionsfaktorbindende site information, opnået fra KODE ( Encyclopedia af DNA Elements) projektet [24], var til rådighed for de gen kroppens regioner alle generne repræsenteret i Illumina HumanMethylation 450K array, for 55 transkriptionsfaktorer. Vi testede hver af disse 55 TF’er, for signifikant øget eller nedsat binding til generne af hvert prognostisk signatur klynge. Cluster hypo 2 består kun af 19 gener, og derfor ville vi ikke forvente at se mange signifikante sammenhænge, ​​på grund af lille stikprøve. Men interessant nok for cluster hyper 2 (bestående af gener, hvis methylering varierer lidt tværs tumorer men viser højere IGV), ser vi, at 20% (11/55) af TFS testede show signifikant mere binding til disse gener end forventet, mens 16 % show betydeligt mindre bindende end forventet. For gen klynger for hvilke dNAM varierer på tværs /i tumorer og har generelt lave IGV (klynger hyper 1 og hypo 1), ikke en eneste TF viste højere end forventet binding, mens 27% og 38% af TF’er vise lavere end forventet binding til generne omfatter klynge hyper 1 og hypo 1 hhv. Dette er i overensstemmelse med den ide, at tf bindende er involveret i særskilte og forskellige processer i forbindelse med IGV og methylering heterogenitet i en prøve.

Vi ønskede også at teste den faktiske korrelation mellem ekspressionen af ​​TFS med IGV af generne de binder til, og gener, de ikke binder til, genom-dækkende. For at gøre dette, brugte vi en TCGA sæt basale brystkræft, for hvilke der findes 450 k methylering data samt udtryk data. Vi har allerede etableret en høj grad af lighed i opførsel af vores prognostiske signatur gener i OC, og disse TCGA BRCA basale prøver (Fig 4). Endvidere er det blevet udførligt påvist af TCGA konsortium, high-grade serøse ovarie- og uterus og BRCA basal kræftformer er ekstremt molekylært lignende [25]. Figur 6b og 6c viser TF’er med væsentlig mere positiv, og mere negativ, korrelation med IGV af de gener, de binder til, i forhold til de gener, de ikke. Det er interessant, at de to mest højt rangeret transkriptionsfaktorer efter øget positiv korrelation af deres udtryk med IGV i bundne gener,

Rad21

Brg1 Hotel (

SMARCA4

), er begge dele af kromatin modificerende komplekser med relevans for stamceller identitet [26, 27]. Især

Brg1 Hotel (

SMARCA4

) har vist for nylig at have særlig relevans for småcellet æggestokkræft [28-30]. Overlappet mellem TFS som viser signifikant forskellige bindingssteder mønstre i forhold til OC prognostisk signatur gener, og TF’er som display væsentligt ændret korrelation af deres ekspression med IGV af gener, de binder til, er vist i fig 6d. Meget relevant detalje er allerede blevet rapporteret om de fleste af disse TF’er (referencer noteret i figuren): enten deres binding påvirkes af methylering (eller

omvendt

), eller de er involveret med kromatin remodeling i stamceller . De viste i figur 6d TF’er er vigtige for de processer, der ligger til grund sygdomsprogression, som er forbundet med vores OC prognostiske signatur (TFS med kendt relevans er angivet med en henvisning til den relevante undersøgelse [26, 31-40]). hypotese Derfor har vi at IGV, i vores OC prognostisk signatur gen panel, repræsenterer et surrogat mål for deres aktivitet og rolle i omdannelsen sygdom.

Foreningen af ​​prognostiske signatur CpG’er med CpG øer og enhancerregioner

placeringen af ​​CpG’er forhold til CpG-øer (CGI’er) vides at være en vigtig determinant for den funktionelle rolle af disse CpG’er [41]. Vi testede for berigelse af sonder kommenteret til CGI regionernes ø ‘,’ shore “og” hylde “blandt alle gen krop kommenterede sonder, samt sonder kommenteret til gen-organer af generne i vores prognostisk underskrift, og de fire klynger . Mens vi fundet, at genet krop sonder blev samlet betydeligt udtømt for sonder i disse CGI regioner, det modsatte var tilfældet for gen-organer vores prognostisk signatur (se supplerende Tabeller i S1-fil). Denne effekt synes at være i høj grad drevet af den anden klynge. Dette indikerer en fremtrædende rolle for CpG øer i de relevante områder af generne i vores prognostisk signatur.

Placering af CpG’er forhold til Enhancer regioner er også kendt for at være relevante for den funktionelle rolle af CpG’er. Vi testede om der var berigelse af methylering sites kommenteret til forstærkere i gen organer generelt, at finde, at der er, som ville forventes. Derefter testede vi forstærker berigelse på samme måde i de prognostiske signatur gen organer og de gen instanser i de enkelte klynger. De finansieringskilder havde ingen rolle i studie design, indsamling og analyse af data, beslutning om at offentliggøre, eller forberedelse af manuskriptet.

Be the first to comment

Leave a Reply