PLoS ONE: Identifikation af Tumor Suppressors og Onkogener fra genomisk og Epigenetisk funktioner i æggestokkene Cancer

Abstrakt

Identifikation af genetiske og epigenetiske ændringer fra primære tumorceller er blevet en fælles metode til at identificere gener kritiske for udviklingen og progression af cancer. Vi søger at identificere de genetiske og epigenetiske aberration, der har den største indflydelse på gen-funktion i tumor. Først, vi udfører en bioinformatisk analyse af kopi nummer variation (CNV) og DNA methylering dækker genetiske landskab af æggestokkene kræft tumorceller. Vi separat undersøgte CNV og DNA methylering i 42 primære serøs ovariecancer prøver ved hjælp af MOMA-ROMA assays og 379 tumorprøver analyseret af Cancer Genome Atlas. Vi har identificeret 346 gener med betydelige deletioner eller opformeringer blandt tumor prøver. Anvende tilknyttede genekspression data, vi forudsige 156 gener med ændret kopital og korreleret ændringer i ekspression. Blandt disse gener CCNE1, POP4, UQCRB, PHF20L1 og C19orf2 blev identificeret inden for begge datasæt. Vi var specielt interesseret i kopi nummer variation som vores base genomisk ejendom i forudsigelsen af ​​tumor undertrykkere og onkogener i den ændrede æggestokkene tumor. Vi identificerer derfor ændringer i DNA-methylering og udtryk for alle forstærkede og slettede gener. Vi statistisk definere tumor suppressor og onkogene funktioner til disse modaliteter og udføre en korrelationsanalyse med udtryk. Vi forudsagde 611 potentielle onkogener og tumorundertrykkere kandidater ved at integrere disse datatyper. Gener med en stærk korrelation til methylering afhængige udtryk ændringer udstillet på varierende kopi nummer afvigelser omfatter CDCA8, ATAD2, CDKN2A, RAB25, AURKA, BOP1 og EIF2C3. Vi giver kopital variation og DNA-methylering analyse i over 11.500 individuelle gener, der dækker den genetiske landskab af kræft i æggestokkene tumorer. Vi viser omfanget af genomiske og epigenetiske ændringer for kendte tumorsuppressorer og onkogener og også bruge disse definerede funktioner til at identificere potentielle æggestokkene kræft gen kandidater

Henvisning:. Wrzeszczynski KO, Varadan V, Byrnes J, Lum E, Kamalakaran S, Levine DA, et al. (2011) Identifikation af Tumor Suppressors og Onkogener fra Genomic og Epigenetisk funktioner i kræft i æggestokkene. PLoS ONE 6 (12): e28503. doi: 10,1371 /journal.pone.0028503

Redaktør: Xin-Yuan Guan, The University of Hong Kong, Kina

Modtaget: Juli 25, 2011; Accepteret: November 9, 2011; Udgivet: 8. december 2011

Copyright: © 2011 Wrzeszczynski et al. Dette er en åben adgang artiklen distribueres under betingelserne i Creative Commons Attribution License, som tillader ubegrænset brug, distribution og reproduktion i ethvert medie, forudsat den oprindelige forfatter og kilde krediteres

Finansiering:. Dette arbejde blev støttet af Department of Defense W81XWH-05-1-0068, The Starr Foundation (https://www.starrcancer.org) og Philips Research Nordamerika. De finansieringskilder havde ingen rolle i studie design, indsamling og analyse af data, beslutning om at offentliggøre, eller forberedelse af manuskriptet

Konkurrerende interesser:. En del af denne forskning er finansieret af Philips Research Nordamerika. Vinay Varadan, Sitharthan Kamalakaran og Nevenka Dimitrova er medarbejdere i Philips Research Nordamerika. Der er ingen patenter, produkter i udvikling eller markedsførte produkter til at erklære. Dette ændrer ikke forfatternes tilslutning til alle de PLoS ONE politikker om datadeling og materialer, som beskrevet online i vejledningen for forfattere.

Introduktion

I USA, vil der være over 22.000 nye tilfælde af kræft i æggestokkene i 2011. af dem, vil cirka 14.000 bukke under for sygdommen. For bedre at kunne behandle disse kvinder og forbedre overlevelsen, vores mål er at bestemme de molekylære ændringer der har fundet sted i patienternes tumorer, og at være i stand til at fortolke betydningen af ​​disse ændringer har på vækst og udvikling af tumoren. Denne afvigende vækst er et resultat af kromosomale abnormaliteter og epigenetiske variationer [1], [2]. Desuden generelt lave somatisk nukleotid mutation i ovariecancer i forhold til andre faste tumorer tyder på en øget betydning af kopiantal og epigenetiske aberrationer. Denne type regulering har vist sig at påvirke mange tumorsuppressorer og onkogener vedrørende kræft i æggestokkene [3].

Kopier nummer variationer (CNV) er en fælles begivenhed i alle former for kræft [4], [5] [6], [7], [8], [9]. En typisk cancer Prøven udviser et gennemsnit på 17% amplifikationer og 16% deletioner i en hel-genom. Somatisk kopi nummer rettelser er vist signifikant at påvirke veje involverer kinase funktion, celle cyklus regulering, de Myc og NF-KB-netværk og apoptose [4]. Påvisning af disse ændringer og identifikation af de specifikke gener, der er ansvarlige for kræft spredning kan bidrage til molekylært undertype kræftformer og føre i retning af mere individualiseret kræft-typespecifikke behandlinger [7], [10], [11], [12], [13], [14], [15], [16], [17], [18], [19], [20].

Epigenetisk egenskaber af kræft genomet korrelerer med udvikling og funktion af kræftcellen [1], [21], [22], [23], [24]. Specifikt kan DNA-methylering ved gen-promotorregioner regulere genekspression af forskellige onkogener og tumor suppressorer [25], [26], [27]. Det er blevet foreslået, at total DNA cytosin 5C-methylering mellem normale celler og cancerceller synes at blive fordelt til specifik CpG loci i cancercellen [28], [29]. Tab af funktion eller transkriptionel inaktivering via hypermethylering er blevet identificeret for tumorsuppressorgener, mens hypometylering er blevet tilskrevet onkogenese og tab af prægning egenskaber ved bestemte kræftrelaterede alleler [1], [30].

Tumor suppressor og onkogen genomiske og epigenetiske funktioner er stærkt variable inden for ovariecancer [3]. Kendte tumorsuppressorer og onkogener ikke lige bidrage til udviklingen af ​​kræft. Vi håber at identificere de genetiske og epigenetiske aberration, der har den største indflydelse på gen-funktion i tumor. Mange af de nuværende bioinformatik protokoller anvender kun single modal analyse for at bestemme genfunktion af en bestemt tumortype. En genom bred tilgang, der kombinerer flere kilder genetiske aberration data er nødvendige til forudsigelse af evt konsistente og epigenetisk integrerede veje, der fungerer i tumorigenese. Vi udførte en bred bioinformatik analyse af kopi nummer variation, udtryk og epigenetisk information til at identificere potentielle tumorsuppressorer og onkogener forbundet til serøs kræft i æggestokkene. Analyse 42 uafhængige serøse ovariecancer prøver og drage fordel af The Cancer Genome Atlas (TCGA; https://tcga.cancer.gov) [31] data at sammenligne og forbedre vores protokol, vi identificerer unormal DNA-kopi nummer med korrelerede ændringer i methylering og udtryk for serøs kræft i æggestokkene gener. Kombinationen af ​​epigenetisk og udtryk dataanalyse kan muligvis give specifikke oplysninger den molekylære basis for kræft og kræft undertyper og belyse de gener, kørsel forskellige tumorer [28], [32], [33], [34], [35]. Derved sidst giver klinikere til at indarbejde disse typer af omfattende multimodale data-analyser i tumor biospecifik baseret diagnostik og pathway rettet terapi [36].

Metoder

Patient Prøver (MSKCC data)

Tumor DNA fra 42 patienter med nyligt diagnosticeret, ubehandlet, fremskredent stadium, serøse ovariecarcinomer set på Memorial Sloan Kettering Cancer center mellem perioden maj 1992 februar 2003, blev inkluderet i denne undersøgelse. Prøverne blev indsamlet under forskningsprotokoller godkendt af Memorial Sloan-Kettering Cancer Center IRB. Undersøgelsen af ​​patientprøver og analyse af alle eksempeldata overholdt retningslinjerne i Memorial Sloan-Kettering Cancer Center IRB og blev godkendt af Memorial Sloan-Kettering Cancer Center IRB. Patienter individuelt forudsat skriftlig informeret samtykke til at bruge deres prøver til forskningsformål. Derudover har vi brugt 7 ovarievæv normale prøver fra Andelsselskabet humant væv Network, et lager af væv og tumor materiale drives af National Institutes of Health. Vi henviser til denne prøve patient og normal indstillet som indstillede MSKCC data.

Kopier nummer Detection via Representational Oligonucleotid microarray analyse (ROMA)

ROMA-protokollen som tidligere skitseret [11], [15 ], [37] blev udført på en høj densitet oligonucleotid array med ~85,000 funktioner fremstillet af NimbleGen Systems Inc. Kort fortalt kompleksitet-reducerede repræsentationer [38] består af mindre (200-1200 bp) fragmenter, der genereres ved spaltning af DNA-prøver med restriktionsendonukleasen Bglll, blev amplificeret ved adapter-medieret PCR af genomisk DNA [11]. DNA-prøver (2 ug) blev mærket med enten Cy5-dCTP eller Cy3-dCTP under anvendelse af Amersham-Pharmacia Megaprime mærkning kit og kompetitivt hybridiseret til hinanden på samme glas [11]. Hybridiseringer bestod af 35 pi hybridiseringsopløsning (37% formamid, 4 x SSC, 0,1% SDS, og mærket DNA). Microarry anvendelse og hybridisering blev udført som tidligere beskrevet [11]. Scannet på en Axon GenePix 4000B scanner ved hjælp af en pixelstørrelse på 5 um, og alle data blev importeret til S-Plus 2000 analyse software (Indsigtsfuld, Seattle, WA). De normaliserede log-forhold fra hvert eksperiment blev beregnet pr segmentering. Vi anvendte derefter CBS (Circular Binary segmentering) algoritme til disse data. CBS segmentering metode er den cirkulære binære segmentering algoritme som beskrevet i Olshen, AB. et. al. [39]. Som i tidligere analyser, er CNV segmenter defineres som regioner i statistisk kombineret sonde (markør) intensiteter beregnet af CBS-algoritmen [39], [40]. Alle generel analyse og statistik blev beregnet ved hjælp af S-plus, R pakker og individuelle Perl /Python scripts. Alle ROMA data MIAME kompatibel og kan findes i GEO-databasen (https://www.ncbi.nlm.nih.gov/geo/) for subseries tiltrædelse nummer GSE28013.

Methylering Detection via Representational Oligonucleotid microarray Analysis (MOMA)

MOMA protokol blev udført som tidligere beskrevet [41], [42]. MOMA afsløring methylering vifte er udført og godkendt på cellelinjer og brystkræft tumor prøver. Annoterede genomiske CpG island steder blev opnået fra UCSC genom browser. På tidspunktet for eksperimentet indeholdt genomet 26,219 CpG-øer i området fra 200-2000 bp. Disse CpG ø steder var omfattet af MspI restriktion fragmentering. Arrays blev fremstillet af NimbleGen Systems Inc. ved hjælp af 390.000 sonder format. CpG island annotation fra det humane genom bygge 33 (hG17) blev anvendt til at designe en 50-mer flisebelægning array. Den primære restriktionsendonuklease anvendes, er Mspl. Efter fordøjelsen linkere blev ligeret, og materialet renses ved phenol chloroform, præcipiteret, centrifugeret og resuspenderet. Materialet er opdelt i to, halvdelen blive fordøjet af endonukleasen McrBc ifølge specifikation af New England Biolabs, og den anden halvdel er mock fordøjet. Procedurer for hybridisering og vask blev rapporteret tidligere [41]. Proceduren blev udført i dobbeltbestemmelse med et farvestof-swap for det andet eksperiment. Etiketterne blev byttet mellem McrBc behandlede og mock prøver. For hver probe, den geometriske gennemsnit af forhold (GeoMeanRatio) af McrBc behandlede prøver og kontrolprøver blev derefter beregnet pr eksperiment og dens tilhørende farvestof swap. Microarray billeder blev scannet på GenePix 4000B scanner og data uddrages ved hjælp Nimblescan software (NimbleGen Systems Inc). De GeoMeanRatios for alle prøver i et datasæt blev derefter normaliseret ved hjælp af en fraktil normalisering metode [43]. Alle generel analyse og statistik blev beregnet ved hjælp af S-plus, R pakker og individuelle Perl /Python scripts. Alle MOMA data MIAME kompatibel og findes i GEO-databasen (https://www.ncbi.nlm.nih.gov/geo/) for det subseries tiltrædelse nummer GSE27940.

Gene Expression Analyse for human æggestokkene tumorprøver

Gene Expression data blev udført ved hjælp af Affymetrix human Genome U133A vifte: GEO platform identifier GPL96. RNA blev isoleret under anvendelse af Trizol-protokollen. RNA omdannes til cDNA og det dobbeltstrengede cDNA anvendt som template i en in-vitro transcription reaktion indeholdende biotinyleret CTP og UTP foruden de fire umodificerede ribonukleosidtriphosphater. Standard Affymetrix protokollen anvendes. Afsluttende signalintensiteter behandles ved hjælp af RMA normaliseringsmetode i affy pakke af R BioConductor 2.5. Alle matrix data MIAME kompatibel og tilsvarende CEL filer kan findes i GEO-databasen (https://www.ncbi.nlm.nih.gov/geo/) for det subseries tiltrædelse nummer GSE27943.

Cross- modal Analyse af The Cancer Genome Atlas data (TCGA data)

Kopier nummer variation data for primære tumorer i æggestokkene blev hentet fra TCGA (https://tcga.cancer.gov/) og CBS [39] datafiler fra Agilent SurePrint G3 Menneskelig 1 M CGH (komparativ genomisk hybridisering) Microarray med etiketten mskcc.org_OV.CGH-1 × 1M_G4447A blev analyseret. CBS behandlede data fra TCGA blev derefter kommenteret med UCSC Genome Browser hg18 samling oplysninger for at tildele kopi nummer variation seg.mean værdier pr gen per prøve. Med henblik på at studere CNV pr gen begrænset vi vores data til en komplet CBS segment pr gen per prøve. Derfor, hvis et gen locus delvist er omfattet af to eller flere CBS segmenter pr prøve vi ikke inddrage det i vores analyse. Kun hvis et komplet gen locus var i en prøve CBS segment var det inkluderet i vores analyse. Endvidere har vi udelukker enhver CBS segment med en informativ (num.info) værdi på mindre end 4. Desuden for at fange signifikant CNV vi kun analyserede prøver i 90% af dataene ekskl 5% af dataene nærmest en seg. betyder af 0 fra den positive og negative værdi distribution. TCGA methylering data blev opnået fra JHU-usc.edu_OV.HumanMethylation27.2.lvl-3 datafiler for hver tilsvarende tumor og normal prøve. Dette er fra Illumina Infinium Human27-methylering assay. En endelig middelværdi betaværdi for gener med 2 eller flere sonder blev beregnet pr gen per prøve. Endelig TCGA udtryk, der anvendes til denne analyse var fra broad.mit.edu HT_HG-U133A genekspression fil for hver tilsvarende tumor og normal prøve køre på Affymetrix GeneChip HT Human Genome U133A array. Vi undersøgte 379 prøver fra TCGA der var til stede på tidspunktet for vores analyse. Forud for den endelige fremlæggelse af vores manuskript The Cancer Genome Atlas har offentliggjort deres foreløbige rapport om ovariecancer [31]. Vores brug af TCGA datasæt er at styrke og sammenligne vores tumor suppressor og onkogen opdagelse protokol, som vi anvendes på MOMA-ROMA (MSKCC) datasæt. Vi anerkender noget lignende fund, vi har gjort brug af vores protokol om TCGA datasæt med det, der findes i den seneste TCGA publikation.

Bioinformatik Analyse af MSKCC Copy Number (ROMA), DNA-methylering (MOMA) og Expression data

Alle analyse blev udført ved hjælp af Perl, Python, Matlab, og R-pakker. Vores strategi var at undersøge de epigenetiske og genomiske funktioner til mulige tumorsuppressorer og onkogener i primære tumorer i æggestokkene. Med base funktionen bliver kopiantals variation undersøger vi methylering og udtryk data for hvert gen under forstærkede eller slettede kopi nummer betingelser. Derfor er et onkogen klassificeret som et amplificeret gen, der har lav methylering og forhøjet ekspression (figur 1). Denne samme amplificeret onkogen kan epigenetisk reguleret gennem hypermethylering i ovariecancer resulterer i en reduceret ekspression selvom kopital forstærkes. Omvendt kan en tumor suppressor har sænket kopital variation og blive hypermethyleret resulterer i nedsat ekspression eller reguleres gennem hypometylering muliggør dets ekspression under sænkede CNV betingelser (figur 1). ROMA fragmenter blev tilskrevet gener ved hjælp af UCSC Genome Browser hG17 forsamling. Vi identificerede gennem prøve sammenligning mellem den TCGA platformen og ROMA platform (for hvilke 7 prøver var i fælles) en ROMA platform-specifik tærskel for 0,0 seg.mean, der fanger en maksimal procentdel af slettede gener og samtidig opretholde en minimal falsk positiv procentdel af amplificeret eller neutrale kopi-gener. Final gen methylering opgave blev udført under anvendelse af det maksimale probe for hver MOMA-fragment og den maksimale MOMA fragmentet værdi blev tilskrevet den nærmeste gen. Den Wilcoxon-test blev anvendt til beregning berigelse p-værdier for CNV og udtryk data og (BH) metode Benjamini-Hochberg blev anvendt til justering multitest og False Discovery Rate (FDR) kontrol. Euklidiske afstande blev beregnet mellem normale og tumorprøver til methylering og udtrykket datapunkter for alle gener i både MSKCC og TCGA datasæt. I tilfælde af MSKCC datasættet når tilstrækkelig normale prøve ekspression data ikke var tilgængelige, en 50 × bootstrap prøveudtagning blev udført under anvendelse af TCGA normale prøver ekspression data pr gen. Single variate og Hotelling flerdimensionale t-tests blev udført på disse afstande til beregning af alle p-værdier ved udførelse af analysen methylering og ekspression ved varierende kopital værdier, med statistiske multiple test FDR justeringer som ovenfor. For at identificere sandsynlige funktionelle og pathway ændringer fanget af vores funktion baseret genanalyse testede vi, om medlemskab af forudsagte MSKCC gener i enkelte funktioner klasse i alt 173 Kegg biologiske veje var proportional med deres størrelse. Dette svarer til identificere veje, hvis gen medlemskab i hver enkelt funktion klasse afviger væsentligt fra nul, som defineret ved en hypergeometriske fordeling. Den endelige liste over væsentlige veje blev valgt efter at kontrollere den falske opdagelse sats ved Benjamini-Hochberg multiple test korrektion. Dataanalyse scripts og yderligere information analyser kan findes i Analyse S1.

Kopiér nummer variation er grundlaget genomisk funktion for vores identifikation af tumor suppressor og onkogene gen egenskaber i kræft i æggestokkene. Et onkogen kan overudtrykkes under amplificeret kopital og lav methylering, mens hypermethylering kan anvendes til regulering ekspression i et gen amplificeret tilstand. Ligeledes faldt tumor suppressor ekspression kan være resultatet af delvis kopi nummer tab med hypermethylering. Tumorsuppressorer kan eventuelt også reguleres via hypometylering i et kopital slettet angivet. Vores analyse er modelleret for sådanne egenskaber og først undersøger CNV pr gen og derefter attributter epigenetiske ændringer for hver kopi nummer aberration med genekspression.

Resultater

æggestokkene tumor Kopier nummer Afvigelser og DNA-methylering

Vi analyserede først individuelt både kopitallet variation og DNA methylering for hvert gen af ​​kromosomal position i 42 serøse primære ovarietumorer leveret af Gynækologi Research Laboratory på Memorial Sloan-Kettering Cancer center (MSKCC datasæt) hjælp Representational Oligonukleotid Microarray Analysis (Roma) [37], [44] og methylering detektion Oligonukleotid Microarray Analysis (MOMA) [41], [42]. De forstærkede og slettede breakpoint loci dækker i alt 561 regioner blandt alle prøver (figur 2). ROMA identificerer 205 sletning og 356 forstærkning breakpoints. Breakpoints blev defineret som områder mellem hver segment (statistisk kombineret probe intensiteter) beregnet ved hjælp af CBS (cirkulære binær segmentering [39], [40]) metode. Blandt de 42 tumorprøver, finder vi et gennemsnit på 76 CBS beregnede segmenter pr kromosom. Segmentering count per kromosom svarede med kromosom størrelse undtagen for kromosomer 8, 11, 12, 17, 19, og 20, hvor segmentering massefylde var større end normaliseret for kromosom størrelse og mindre for kromosomer 6, 9, 10, 14, 15, 16, og 18. Den største variabilitet kopiantal variation (som målt ved CBS segmentering middelværdier) blandt alle prøver forekommer i kromosomer 19, 2, 10 og 4, henholdsvis (fig S1). De hyppigste sletninger ( 10% tumor prøver) blev observeret i loci; CHR4: Q25-q35.2, chr7: p22.3-p15.3, CHR8: p23.3-p21.1, chr13q12.11-Q34, chr14q32.2-q32.33, chr15q13.3-q21.1, chr16q11.2-q24.3, chr17p13.3-q25.3, CHR19: q13.2-q13.43 og CHR22: q11.21-q13.33 (tabel 1 giver den procentdel af alle prøver slettet inden en loci). De hyppigst forstærkede ( 10% tumorprøver) loci inden for alle kromosomer blandt alle 42 tumorprøver er; CHR1: p34.4-p34.1, CHR1: q21.1-q21.2, CHR3: q13.2-Q23, CHR8: q11.22-q24.3, CHR19: Q12-q13.12 og chr20: Q13. 12-q13.2 (tabel 1). blev fundet tre breakpoint symmetri loci (amplificeringer og sletninger på lignende genomiske positioner i flere prøver); CHR17: q11.2-q21.32, CHR19: q13.12-q13.2 og chr21: q21.3-22.13. Sammenligning af ROMA resultater (tabel 1) med kopi nummer data for normale individer findes i HapMap [45] viser intet overlap med de få forstærkede områder findes i HapMap normal datasæt. Overlappende områder af sletning mellem vores CNV resultater og HapMap er 8p23 og 22q11.23 hvor begge regioner viser hyppige heterozygot tab. Vi analyserede derefter methylering af DNA på CpG-øer anvendelse af de samme 42 primære ovarietumorer og 7 normale vævsprøver (figur 3). Vi kompileret methylering værdier for 11.978 gen promoter regioner, der dækker 22 kromosomer. Når direkte sammenlignet med normalt væv blev fundet i alt 68 gener, der skal rangeret som hypermethyleret og 19 rangeret som hypomethylated inden for 10% af hele normalt at tumor-forhold distribution (tabel S1). Generne udviser methylering værdier over normale prøver omfatter onkogen PHOX2B, den neuroblastom associeret gen ALX3, den almindeligt methylerede PCDHα gen klynge, POU4F2, REXO1L1, BAPX1, og kalium-kanal KCNJ8. Specifikt REXO1L1, (RNA exonuclease) viser høje niveauer af methylering i både tumor og normale prøver, men der er en stigning 56% af methylering i tumorprøver. Gener med det laveste tumor til normale methylering nøgletal omfatter kromosom 4 variant af onkogene fremme gen ubiquitin hydrolase DUB3 (19% fald) og CAPS (onkogen impliceret i endometriecancer, 25% fald). Andre hypomethylated gener sammenlignet med normale prøver inkluderet; RNPC3, USP37, LDHD, GJB4 (gap junction protein), LCN8 (impliceret i metastase) og CGB1 (choriongonadotropin, beta polypeptid 1) (tabel S1).

Breakpoint positioner kopi nummer variabilitet (sletninger afbildet i blå, amplifikationer afbildet i rødt) i 22 kromosomer er vist som bestemt ud fra ROMA genereret segmentering data. Den indledende ændre sletning eller forstærkning genomisk position er afbildet fra alle 42 æggestokkene tumor kræft prøver

tumor:. Normal forhold procentsats for MOMA methylering per gen fra 42 æggestokkene kræft tumor prøver og 7 væv normale prøver er skitseret per kromosom. For hver prøve middelværdien methylering værdi beregnes ud fra den maksimale MOMA værdi pr probe, der inkorporerer genpromotorregion. MOMA methylering data omfattet 11,978 gen promotorregioner. Fremtrædende hypermethylering (rød) og hypometylering (grøn) gener er mærket og forsynet i tabel S2.

Korrelationer af genekspression med Copy Number Variation eller DNA-methylering

Vi separat undersøgte afhængighed af genekspression (via Affymetrix human Genome U133A array, se metoder) på eksemplar nummer forstærkning, kopiere nummer sletning og promotor methylering i æggestokkene kræftsvulster. Vi først sammenlignet fordelingen af ​​genekspression for diskontinuert høje og lave CNV gener der findes i vores MSKCC datasæt og TCGA datasæt. De to datasæt viste lignende tendenser i ekspression fordeling for gener med høj og lav kopiantal variation (Figur 4, Figur S2). Som kopi nummer variation den stiger fra sletning amplifikation den gennemsnitlige genekspression øger også (figur 4). Vi viser derfor en korrelation mellem en forøgelse af den samlede genekspression med amplifikationen af ​​genkopiantallet i primære ovarietumorer. Desuden har vi målt den kumulative fordeling af genekspression for slettede og opformerede gener. Den kumulative fordeling er den samlede procentdel af gener fundet under en dynamisk udtryk tærskel. Hvis gener med en lav CNV (udgår) er mere under udtrykkes end gener med en højere CNV (amplificeret og overudtrykt) de kumulative fordelingskurve resulterer i en stejlere stigning ved lavere ekspression værdier for slettede gener (hvilket indikerer en større procentdel af gener fundet med lavere ekspressionsniveau værdier). En maksimal kumulativ ekspression forskel mellem 7-17% observeres for gener med lavt kopiantal i forhold til gener med højt kopiantal (Figur S3). Dernæst udførte vi ekspression til CNV korrelation pr genet for alle tumorprøver i både MSKCC datasæt og TCGA datasæt. Vi opdagede 124 gener med positiv CNV til udtryk Pearson korrelation koefficient grænser ≥0.8 i TCGA datasæt (p-værdier 1,0 × 10

-10, tabel S2B). Den seg.mean amplifikation og deletion interval for sættet MSKCC data er ikke så stor som observeret i TCGA datasæt (fig S1 og S2) og dermed færre gener er fanget med betydelig CNV ekspressionssystemer korrelationer. Men vi er i stand til at identificere 32 gener med Pearson korrelation values≥0.6 (p-værdier 4,0 × 10

-5, tabel S2A) med 18 af de 32 gener også identificeret i TCGA datasæt (tabel S2A).

Som genkopitallet variation stiger fra sletning amplifikation den gennemsnitlige genekspression øger også i både den MSKCC (blå linje) og TCGA (grøn linje) datasæt.

Større gen udtryk forskelle mellem normale og tumor prøver ikke overholdes, indtil vi kun stole på de prøver, der indeholder gener med ekstreme amplifikationer og sletninger (figur 4). Derfor vores tilgang til at identificere gener med ændret kopital variation korreleret til ekspression var at undersøge ekspressionsniveauerne værdier af gener i høje og lave kopiantal seg.mean værdier og sammenligne ekspressionen af ​​de gener, som de normale vævsprøver. I et arrangement, hvor der er kopital aberration i normale prøver denne samme type korrelation ville blive observeret. Vi undersøgte kun tumorprøver da størrelsen og omfanget af kopi nummer ændringer er mere markant opdaget gennem vores protokol. Oprindeligt vi beregnet den gennemsnitlige ekspression værdi for hvert gen, hvor 20% af tumorprøverne viste en CNV værdi på over 0,50 seg.mean eller under -0,50 seg.mean og filtreres også ud generne for hvilke den normale ekspression ikke var inden for normeret afvigelse (TCGA CNV tærsklerne standard blev anvendt som svarer til mindst et amplificeret eller slettet kopi og med evnen til at fange så mange ændrede CNV prøver pr gen som muligt). Denne strenge kriterier for 20% af TCGA tumorprøver erobrede 21 gener (Tabel S3). Disse 21 gener, såsom CCNE1 og GSTT1 repræsenterer de mest ændrede CNV gener i tumoren prøver med forskellig ekspression i sammenligning med væv normale prøver i TCGA datasæt. Men denne tilgang er i høj grad afhængig af det normale gen gennemsnitlige ekspressionsniveauerne. For TCGA, på tidspunktet for vores analyse udtryk oplysninger var kun tilgængelige for 8 prøver, der er udpeget som normalt. Derfor et gen, såsom MYC (oftest overudtrykt i tumorceller), som har en gennemsnitlig prøve udtryk værdi på 8,93 i de otte TCGA normale prøver (Figur S4) og en gennemsnitlig tumorprøve ekspression værdi på 7,75 (fra 339 tumorprøver) observeres ikke ved denne fremgangsmåde. Ved at udføre tumor prøve specifik analyse kan vi ikke helt eliminere disse variationer, men håber at begrænse deres omfang.

For ikke at stole på den lille normale væv prøvetagning til udtryk værdier, vi udførte en Wilcoxon rank test kun på udtryk værdier fra mindst 20% af tumorprøver inden genkopital seg.mean tærskler meget lave og høje. I TCGA tumor datasæt produceret denne et sæt af 54 gener inden for en falsk opdagelse på 5% ved seg.mean værdier på 1,25 og -0,50 for høj og lav kopiantal variation (tabel 2, tabel S4). Antallet af gener tilfangetagne afhænger højkopiantals segmentering middelværdi anvendes som en filtrerende tærskel (under opretholdelse af et sæt tærskel lavt kopiantal på -0,50, hvorved minimum indfange et tab af heterozygositet pr gen [8] Figur S5). I alt 1114 gener er fanget (FDR 0,05) til en lavere CNV tærskel på 0,8 seg.mean (fig S5). Med Wilcoxon rank test finder vi gener såsom MYC, CCNE1, KRAS, NDRG1, MLL4 og MTSS1 for hvilke data, der er specifikke normale væv udtryk kan ikke være væsentligt forskellig fra alle tumorprøver men er variabel mellem lav og høj kopi nummer tumorprøver. Konservative tærskel begrænsninger af 20% tumorprøve inklusion resulterede i identifikationen af ​​gener fra ekstrem CNV loci såsom i kromosom 1, 8 og 19. Af interesse blev transkriptionsfaktor CEPBG sig at have god CNV til ekspression korrelation og også ekspression og methylering korrelation i sættet MSKCC data. Ligeledes udfører Wilcoxon rank test på MSKCC tumorprøver på et højt kopiantal tærskel ≥0.5 og en lav kopi nummer ROMA platform-specifik tærskel 0,0 (se metoder) vi fangede 62 gener på en falsk opdagelse sats ≤0.05 (tabel 2 tabel S4). Generne identificeret i sættet MSKCC data var fra tilsvarende genomiske loci som dem, der findes i TCGA datasæt. Fem gener blev forudsagt fra begge datasæt: CCNE1, POP4, UQCRB, PHF20L1 og C19orf2 (tabel 2). Vi har integreret udtrykket data med CNV at bestemme de gener, der er mere tilbøjelige til at være kandidater som fungerende cancer gener med potentiel tumor suppressor og onkogene CNV-udtryk funktioner. Dette gør antallet af gener i yderligere undersøgelser mere ubureaukratiske til funktionel validering af gener, der berøres af genetiske afvigelser.

Vi analyserede også den klassiske afhængighed af DNA methylering i gen-promotorregioner med den af ​​genekspression. Methylering data udviser dårligere korrelation til ekspression end kopiantal variation (fig S6). Vi bestemt Pearson korrelationer mellem DNA methylering og genekspression i både MSKCC og TCGA æggestokkene primær tumor datasæt. Pearson korrelationsværdier 0,5 (p-værdier 2,0 × 10

-4, lav methylering og høj ekspression til høj methylering og lav udtryk) er observeret i 86 gener mellem de to datasæt. Prominent, det gen, der koder ubiquitin B (UBB) viser en høj korrelation mellem methylering og udtryk i begge datasæt og RAB25 en kendt kræft i æggestokkene mistænkte findes også i de TCGA datasæt [31], [46] (tabel S2A og S2B)

Be the first to comment

Leave a Reply