PLoS ONE: Forudsigelse af potentielle Cancer-Risk Regioner Baseret på Transkriptomet data: Mod en global View

Abstrakt

En roman integrativ rørledning præsenteres for opdagelsen af ​​potentielle kræft-modtagelighed regioner (PCSRs) ved at beregne antallet af ændrede gener ved hver kromosomal region, ved hjælp af udtryk microarray datasæt fra forskellige menneskelige kræftformer (HC) . Vores nye tilgang omfatter primært forudsige PCSRs efterfulgt af identifikation af centrale gener i disse regioner for at opnå potentielle områder huser nye cancer-associerede varianter. Ud over at finde nye cancer kausale varianter, en anden fordel i forudsigelse af sådanne regioner risikofaktorer er samtidig undersøgelse af forskellige typer af genomiske varianter i overensstemmelse med fokus på specifikke kromosomale regioner. Ved hjælp af denne rørledning vi udvundet antal regioner med meget ændret ekspressionsniveauer i kræft tilstand. Regulatoriske netværk blev også konstrueret til forskellige typer af kræft efter identifikationen af ​​ændrede mRNA og microRNA. Interessant, viste resultaterne, at GAPDH, LIFR, ZEB2, mir-21, mir-30a, mir-141 og mir-200c, alle placeret på PCSRs, er almindelige ændrede faktorer i konstruerede netværk. Vi fandt en række klynger af ændrede mRNA og miRNA på forudsagte PCSRs (

f.eks

.12p13.31) og deres fælles regulatorer herunder KLF4 og SOX10. Stor skala forudsigelse af risiko regioner baseret på transkriptom data kan åbne et vindue i omfattende undersøgelse af kræft risikofaktorer og de andre humane sygdomme

Henvisning:. Alisoltani A, Fallahi H, Ebrahimi M, Ebrahimi M, Ebrahimie E ( 2014) Forudsigelse af potentielle Cancer-Risk Regioner Baseret på Transkriptomet data: Mod et helhedssyn. PLoS ONE 9 (5): e96320. doi: 10,1371 /journal.pone.0096320

Redaktør: William B. Coleman, University of North Carolina School of Medicine, USA

Modtaget: Januar 23, 2014 Accepteret: April 7, 2014; Udgivet: 5 maj 2014

Copyright: © 2014 Alisoltani et al. Dette er en åben adgang artiklen distribueres under betingelserne i Creative Commons Attribution License, som tillader ubegrænset brug, distribution og reproduktion i ethvert medie, forudsat den oprindelige forfatter og kilde krediteres

Finansiering:. Forfatterne har ingen støtte eller finansiering til at rapportere

konkurrerende interesser:.. forfatterne har erklæret, at der ikke findes konkurrerende interesser

Introduktion

Ændring i mRNA og miRNA udtryk og den vigtige rolle, af et stort antal af disse molekyler er blevet undersøgt i initieringen, udviklingen og metastase af mange typer cancere [1], [2], [3] _ENREF_1. Ændringer i DNA-methylering og transkriptionsfaktor (TF) regulering, genomisk kopiantal variation (CNV) [4], enkelt-nukleotid polymorfisme (SNP) [5] og mikrosatellit vekslen [6] samt andre kromosomafvigelser er karakteriseret som store mekanismer udtryk vekslen i forskellige menneskelige kræftformer (HCS).

forskellige metoder, herunder genom brede associationsstudier (GWAS) har identificeret en lang række tilhørende varianter til forskellige kræftformer [7], [8], [9]. For eksempel blev fundet fælles varianter på region 19p13 at være forbundet med ovariecancer [10], CNVs på 6q13 og fem risiko loci på 21q21.3, 5p13.1, 21q22.3, 22q13.32 og 10q26.11 var direkte forbundet til kræft i bugspytkirtlen [4], [11]. Derudover blev nye risici loci på 10q25.2, 6q22.2 og 6p21.32 forbundet med lungekræft [12], og flere risici loci på 9q31.2 blev 19q13.4 og 8q24 vist at være forbundet med prostatakræft [ ,,,0],13], [14], [15].

dog er udfordringer i GWAS finde kausale varianter og funktionelle virkninger, såvel som indbyrdes forhold mellem disse varianter i kræft. Mens tidligere genetiske undersøgelser af kræft har forudsagt en lang række cancer-associerede varianter [8], [9], [10], [15], [16], identificere kausale varianter er væsentlig hindring, fordi de kendte kausale genetiske varianter er hovedsagelig placeret i ikke-kodende regioner eller placeret på forskellige fysiske afstande fra genet de påvirker [17]. Derudover anvendes lineære modellering ramme i GWAS mener ofte kun en SNP ad gangen og ignorerer virkningerne af de andre genotypede SNP’er [5]. Derfor kan progressionen være besværlig fra statistisk association opnået gennem GWAS til udledte kausalitet og funktionelle konsekvenser for kræft. En anden udfordring i store genomics undersøgelser er, at nogle af disse varianter, herunder mikrosatellitter er mindre undersøgte forhold til de andre typer (SNP og CNV). Desuden er mange af disse undersøgelser er fokuseret på en type af genomiske variationer i cancer; derfor er virkningerne af andre involverede faktorer forsømt.

Den fælles procedure anvendt i tidligere undersøgelser er påvisning af kausale varianter og søge efter funktionelle effekter af disse varianter såsom sammenslutning af varianter med udtryk kvantitativ trait loci (eQTLs) [17]. Men der er også en omvendt strategi omfatter forudsigelse af potentielle områder kræft-risiko deles på tværs af forskellige typer af kræft baseret på transkriptom udtryk data og derefter søge efter kausale varianter. Identifikation af disse regioner hjælper til opdagelse af nye varianter samt samtidige undersøgelse af forskellige faktorer, der påvirker genekspression ved at begrænse vurderinger til specifikke kromosomale område. Her har vi udviklet en rørledning, som bestod af PCSRs forudsigelse ved hjælp beregning af udskrift-udtryk ændringer under kræft for hver kromosomal region. Vi udvindes også fælles ændrede mRNA og microRNA hjælp microarray og udtrykte sekvens (EST’er) data efter med netværksanalyse for at opnå mere indsigt om de forudsagte PCSRs. Ved hjælp af denne rørledning, vi forudsagde potentielle risikofaktorer regioner interagere med klynge af mål (mRNA, miRNA og /eller TF’er) optrevling potentielle-kandidater til yderligere genom associationsstudier.

Resultater

Gene udtryk data fra flere kræftformer blev analyseres igen, og resultaterne blev kombineret til at forudsige fælles cancer risiko regioner. Et andet formål med denne undersøgelse var at få indsigt i sammenhæng mellem PCSRs og ændrede mRNA, miRNA og deres fælles regulatorer. En oversigt over arbejdsgangen er vist i figur 1.

Den omfatter ekspression dataanalyse af forskellige humane cancere, herunder bryst-, tyktarms-, endometrial, mave, lever, lunge, ovarie, pancreas, prostata, testikel, blære, tarm neuroendokrine, livmoderhalskræft og renal kræftformer samt glioblastom. Denne primære analyse efterfulgt af ekstraktion af ændrede gener, tælle kromosomale regioner ændrede gener og forudsigelse af risiko regioner baseret på region frekvens.

Resultater af udskrift udtryk analyser for hver kræft datasæt herunder bryst-, tyktarms-, endometrial, gastrisk, lever, lunge, ovarie, pancreas, prostata, testikel, blære, tarm neuroendokrine, cervikale og renale kræftformer samt glioblastom er vist i tabel S1. Disse udvundet gener og miRNA blev derefter anvendt til yderligere analyse som beskrevet nedenfor.

Forudsigelse af potentielle Kræft-Følsomhed Regioner Brug Microarray Datasæt forskellige kræftformer

Den procentdel af region deltagelse blev beregnet for hvert kromosom (chr) fra mikroarraydata (med 2-fold-changes tærskel) af 11 HC’er. Nærmere oplysninger om fremgangsmåden er beskrevet i materialer og metoder. For hvert kromosom blev fem regioner, der dækker den højeste frekvens af ændrede gener registreres som potentielle PCSRs (tabel 1). Resultaterne viste, at blandt disse PCSRs, to regioner indeholder det største antal over-udtrykte gener; chr1p31.2 (27,27%) og chr13q13.2 (20,45%) (tabel 1, kolonne 3 til 7). Mens der i tilfælde af down-udtrykte gener, blev den højeste procentdel registreret for regioner, der ligger ved chr13q13 (15,53%) og 4q34.2 (15,15%).

For at teste pålideligheden af ​​de forudsagte PCSRs procentdelen af ​​regionen deltagelse i kræft blev beregnet med forskellige tærskel, hvor frekvenserne af de første 200 probesets med højeste fold ændringer blev identificeret for hver region (tabel S2). Mens en stor del af disse regioner, herunder 1q31.3, 2p25.2,3q25.2, 12p13.31 og 22q12.1 deles i begge tærskler (tabel 1 og tabel S2), nogle regioner blev registreret som et PCSR for kun én af disse tærskler. For eksempel 1p32.2 og 2q22.3 blev identificeret for 2-fold ændringer tærskel, mens 1p22.3 og 2p12 blev registreret for de højeste fold ændringer (tabel 1 og tabel S2).

Procentdel af kromosom deltagelse blev også beregnet for 11 HC’er, at identificere, hvilke kromosom (s) er mere involveret i udskrift udtryk ændringer (tabel S3). Resultaterne viste, at CHR4 er huser det højeste antal gener ændret i cancer (ekskl prostata og gastriske cancere) (tabel S3). I modsætning hertil chrY har det laveste antal gener udtrykt i cancer. Et resumé af kromosomal deltagelse af 11 HC viser betydelige forskelle som angivet af General Chi-squared test. Øverste fire kromosomer, der huser de mest ned-udtrykte gener var Chrs 4, 5, 13 og X, hvorimod de højeste antal ændringer i tilfælde af over-udtrykte gener, blev registreret for Chrs 1, 7, 8 og 12 (fig S1). Salg

Altered mRNA deles på tværs af forskellige kræfttyper

differentielt udtrykte mRNA’er med de højeste fold ændringer i mindst 6 HC blev udvalgt som de fælles ændrede mRNA (tabel 2 og tabel 3). Disse fælles ændrede mRNA blev klassificeret i tre forskellige udtryk grupper. Klasse I viste overekspression i størstedelen af ​​cancertyper såsom tubulin alpha 1b (TUBA1B) og glyceraldehyd-3-phosphatdehydrogenase (GAPDH) (tabel 2), klasse II repræsenteret ned-ekspression i de fleste af HC’er såsom aspartoacylase (ASPA) og kemokin (CXC-motivet) ligand 12 (CXCL12) (tabel 2), mens pauserne (klasse III) viste en blandet ekspressionsmønstre i forskellige kræfttyper såsom proteinkinase (cAMP-afhængig, katalytisk) inhibitor beta (PKIB) ( tabel 3).

Interessant, en række fælles ændrede mRNA er placeret på de forudsagte PCSRs (kolonne 3 i tabel 2 og tabel 3). For eksempel GAPDH ved 12p13.31 (som en forudsagt PCSR) viste overekspression i alle HCS (Table2). CKS2 (chr9q22.2), CEP55 (chr10q23.33), UHRF1 (chr19p13.3), RRM2 (chr2p25.1), AURKA (chr20q13.2), FLJ39632 (chr14q11.2), FAM83D (chr20q11.23), NEK2 (chr1q32.3) og MAD2L (chr4q27) blev alle placeret på PCSRs og viste overekspression i 9, 8, 10, 9, 8, 9, 9, 8 og 9 typer af kræft, (tabel 2 og tabel 3 ). I modsætning hertil DCN (chr12q21.33), LIFR (chr5p13.1), ABCA8 (chr17q24.2), C7 (chr5p13.1) og ZEB2 (chr2q22.3) på forventede PCSRs blev ned-udtrykt i 9, 7, 8 , 8 og 8 cancere (tabel 2 og tabel 3). Resten af ​​ændrede gener på PCSRs udstillet både ned og over-udtryk mønstre (tabel 3).

Altered miRNA deles på tværs af forskellige kræftformer

Flere typer af miRNA (såsom miR-93, mir -182, mir-196b og mir-1274b) udviste overekspression i størstedelen af ​​cancere (tabel 3). En række miRNA (såsom miR-30a og mir-30c-2) blev ned-udtrykt i forskellige HC, mens mange andre miRNA udstillet en blandet mønster af udtryk (tabel 4).

de kromosomale steder blev bestemt for fælles ændrede miRNA. Interessant miRNA på samme region viste co-ekspression i nogle kræftformer, såsom en klynge på 19q13.41 (herunder mir-99b og -125a). Denne klynge (19q13.41) blev fastsat-udtrykt i hals-, prostata og renale cancere. I modsætning hertil blev den samme klynge overudtrykt i blærekræft. En anden co-udtrykkes klynge blev observeret ved 12p13.31 (mir-141and mir-200C), som viste overekspression i æggestokkene, prostata og blære kræft, og omvendt, blev det ned-udtrykt i renal cancer (tabel 4). Resten af ​​co-udtrykte klynger blev angivet til regioner på 6q13 (herunder mir-30a og mir-30c-2), Xp11.23 (herunder mir-362, mir-500, mir-501, mir-502 og mir-532 ), 14q32.2 (herunder mir-134, mir-379 og mir-382), 14q32.31 (herunder mir-127, mir-432 og mir-770), 9q22.32 (herunder lad-7d, mir-23b og mir-27b) og 7q22.1 (herunder mir-93 og mir-106b) (tabel 3). Fem ud af ni miRNA co-udtrykte klynger anført ovenfor er placeret på forudsagte PCSRs herunder 6q13, 12p13.31, 14q32.2, 19q13.41 og Xq26.2 (tabel 4).

Interaktion inden for og mellem fælles ændrede mRNA og miRNA Revealed af Network Analysis

Fire separate netværk blev konstrueret herunder et netværk for fælles ændrede mRNA (med 409 enheder og 1288 relationer) (Figur S2), et netværk for fælles ændrede mRNA placeret på forskellige forudsagt PCSRs (med 383 enheder og 1121 relationer) (Figur S3), et netværk af fælles ændrede miRNA (med 322 enheder og 1041 relationer) (Figur S4) og et netværk for fælles ændrede miRNA placeret på forskellige PCSRs (with123 enheder og 409 relationer ) (figur S5). Desuden blev en kombineret netværk opbygget ved integration af ændrede mRNA og miRNA data, som har 667 enheder og 2482 relationer (Figur S6). Forskellige typer af transkriptionsfaktorer, protein kinaser, små molekyler, mRNA og miRNA tjene som enten validerede eller formodede regulerende myndigheder i disse netværk. Yderligere oplysninger om de enkelte netværk, herunder antallet af importerede gener og biologiske processer i tabel S4.

Vi identificerede netværk med lignende biologiske processer, såsom cellulær proces, biologisk regulering, metaboliske proces, flercellede organismal proces, udviklingsmæssige proces og respons på stimulus (tabel S4 kolonne 5). Disse fælles processer indebærer eksistensen af ​​fælles gener og miRNA tværs af forskellige konstruerede netværk som anført i tabel S5. For eksempel zink finger E-box bindende homeobox 2 (ZEB2), DEAD (Asp-Glu-Ala-Asp) box helicase 5 (DDX5) og leukæmi hæmmende faktor receptor alpha (LIFR) blev delt mellem begge konstruerede netværk af fælles ændrede mRNA og miRNA (tabel S5). Blandt almindelige ændrede miRNA, mir-21, mir-30a, mir-141 og mir-200c blev delt på tværs af alle de fire konstruerede netværk (tabel S5).

Den hyppigste undernet observeret i disse netværk var centreret på DDX5 (figur 2). Denne undernetværk består af 5 enheder, herunder DDX5, mir-20b, mir-21, mir-141 og mir-182. DDX5 er negativt reguleret af mir-20b og mir-141, mens DDX5 selv regulerer mir-21 og mir-182. Down-ekspression af DDX5 blev observeret i 7 typer af HC, mens, mir-20b, mir-21, mir-141 og mir-182 overudtrykkes i 3, 5, 3 og 4 HC’er (tabel 3 og tabel 4 ). Det foreslår den negative sammenhæng mellem DDX5 og disse fire miRNA.

Netværk er inklusive mir-21, mir-182, -mir20b og mir-141. Network blev bygget ved hjælp pathway studie 9-software. Netværk blev samlet baseret på bioinformatik og litteratur, kombineret med biologisk fortolkning af microarray data og beriget Gene ontologi funktionelle grupper. Rød: over-regulerede enheder i de fleste kræftformer. Blå: nedreguleret enheder i de fleste kræftformer. repræsenterer negativ-reguleret.

En anden subnetværket blev konstrueret baseret på mir-141, mir-200C, og GAPDH, som alle ligger på forudsagte PCSRs på 12p13.31 (figur 3). Dette netværk består af 17 enheder og 29 relationer (Figur 3). blev observeret Tretten downstream mål for mir-141, mir-200C, og GAPDH. For eksempel, mir-141 og, mir-200C, som var overudtrykt i 3 HCS (vist som lilla i figur 3), har miRNA virkninger på ZEB2 (med down-ekspression i 7 HC’er). Interessant, disse ændrede RNA herunder mir-141, mir-200C og GAPDH (ved 12p13.31) og også ZEB2 (ved 2q22.3) er alle placeret på forudsagte PCSRs. I tilfælde af opstrøms knudepunkter, blev TP53 og MYC observeret som opstrøms regulatorer af mir-200C og GAPDH (figur 3). TP53 er fælles positiv regulator for både mir-200c og ​​GAPDH, men MYC kun regulerer GPADH (figur 3).

Network blev bygget ved hjælp af sti studie 9-software. Korteste vej algoritme blev anvendt til at konstruere netværk. Netværk blev samlet baseret på bioinformatik og litteratur, kombineret med biologisk fortolkning af microarray data og beriget Gene ontologi funktionelle grupper. Lilla: over-regulerede enheder i de fleste kræftformer Blå: down-regulerede enheder i de fleste kræftformer. O-vertex repræsenterer TFS repræsenterer positiv-reguleret, og repræsenterer negativ-reguleret.

Promoter Analyse af Altered mRNA og miRNA tværs af forskellige kræftformer

Initiativtagere af overudtrykt og down- udtrykte mRNA’er og miRNA blev individuelt analyseret på tværs af forskellige kræftformer. En liste over almindelige transkriptionsfaktorer for hvert sæt af down-udtrykt og over-udtrykte mRNA findes i tabellerne S6 og S7, hhv. Blandt 18 almindelige forudsagte TF’er for over-udtrykte mRNA’er blev Kruppel-Like Factor 4 (KLF4) beliggende ved PCSRs fundet at være ned-udtrykkes i 7 typer af kræft (tabel S6). Mens, fra alt 13 fælles regulatorer forudsiges for down-udtrykte mRNA’er, er 6 regulatorer ligger på PCSRs. Blandt disse 6 regulatorer RAR-relaterede orphan receptor A (AURORA) var nede-udtrykt i 8 typer af kræft (Bortset fra, at glioblastoma med overekspression og ingen signifikant udtryk i prostata og gastrisk kræft) (tabel S7).

fælles regulatorer blev også forudsagt for klynge af ændrede miRNA på samme region (tabel S8). For eksempel GATA2, GATA3, ETS1, MZF1_1-4, SOX10, YY1, ZNF354C og SPI1 blev forudsagt for miRNA placeret på cluster på Xp11.23 (tabel S8). I alt blev 22 almindelige regulatorer forudsagt for forskellige klynger af miRNA, som otte af dem er placeret på PCSRs herunder YY1, SPIB, SOX10, NFIC, NR4A2, FOXD1, NFATC2 og HOXA5 (tabel S9). Interessant GATA2 blev forudsagt for begge ned-udtrykte mRNA og ændrede miRNA.

Diskussion

En effektiv rørledning blev udviklet til at forudsige PCSRs hjælp microarray datasæt fra forskellige undersøgelser kræft. To forskellige tærskler blev anvendt til at forudsige PCSRs herunder probsets med mindst 2-fold ændringer og første 200 probsets med de højeste fold ændringer. De fleste af de forudsagte PCSRs på hvert kromosom var ens i begge anvendte tærskler, som bekræfter pålideligheden af ​​disse PCSRs.

Ud over denne bekræftelse, baseret på en gennemgang fandt vi tilstedeværelsen af ​​flere vigtige cancer-associeret varianter på vores forudsagte PCSRs. Disse varianter er blevet rapporteret tidligere for pancreas [4], [11] (6q13, 21q21.3, 5p13.1, 21q22.3 og 22q13.32), lunge [12] (6p21.32), prostata [13], [14], [15] (9q31.2, 19q13.4, 8q24 og 17q21-q22), æggestokkene [10] (19p13), bryst [18] (8q24, 12p13 og 20q13) og kolorektal cancer [19] (11q23 , 8q24 og 18q21). Vores fund i aftale med disse undersøgelser identificerede region 8q24 som en risiko region i forskellige HC [8], [14], [19], [20], [21], som viser inddragelse af nogle af risikofaktorer regioner i flere typer af kræft snarere end en bestemt cancer. Desuden blev nogle af de forudsagte PCSRs i denne undersøgelse rapporteret i andre typer af humane sygdomme, herunder herpes simplex virus type 1 [22] (21q), polycystisk ovariesyndrom [23] (9q33.3), type 1-diabetes og leddegigt [ ,,,0],24] (begge beliggende på 18p11). Denne lighed kunne tyde effektiviteten af ​​vores tilgang i forudsigelse risiko- områder forbundet med forskellige humane sygdomme udover kræft.

Vi fandt også, at otte kromosomer harbor de ændrede gener i forskellige typer af kræft, herunder kromosomer 1, 4, 5, 7, 8, 12, 13 og X. Interessant kromosomer 1, 4 og 13, blev også registreret som kromosomerne med den højeste procentdel af forudsagte PCSRs, hvilket tyder den vigtige rolle af disse kromosomer i cancer biologi. Baseret på disse resultater og dem tidligere rapporteret på kromosomer abnormitet [7], [25], [26], [27], kan det konkluderes, at vores pipeline er i stand til at forudsige risiko regioner samt risiko kromosomer i en række sygdomme herunder cancer. Denne rørledning kan også anvendes på de hurtigt voksende (men stadig begrænset antal) RNA-seq datasæt i fremtidige studier.

Netværk analyse viser, at DDX5, LIFR, ZEB2, mir-21, mir-27b, mir -30a, mir-141, mir-182 og mir-200c blev delt på tværs af forskellige konstruerede netværk, anklage deres afgørende rolle i cancer biologi og progression, som tidligere [28] er blevet rapporteret, [29], [30]. For eksempel er den potentielle kliniske anvendelighed af DDX5 og dens tilknyttede miRNA (MIR-21 og mir-182) foreslået som terapeutisk mål i brystcancer [29], [31]. Den kliniske anvendelse af forskellige miRNA i kræft såsom lad-7, mir-21 Og mir-122 er diskuteret i seneste undersøgelse af Nana-Sinkam og Croce [28].

Fordi miRNA fungerer ikke i isolation [28], vi analyserede klynge af miRNA på samme områder for at forstå det relative bidrag af flere miRNA snarere end individuel miRNA. Co-ekspressionen af ​​forskellige miRNA indebærer tilstedeværelsen af ​​fælles transskription regulatorer og /eller fælles kausale varianter for disse regioner. Det er også tidligere rapporteret, at fælles moduler på promotorer kan forårsage co-ekspression af generne [32].

Vi fandt, at forskellige fælles regulatorer til ændrede mRNA’er og miRNA herunder, KLF4 (ved 9q31.2) og AURORA (15q22.2) var på de forudsagte PCSRs. Disse to TF’er mægle et sæt celle-cyklus gener og udstiller både onkogene og tumor undertrykkende funktioner [33], [34]. Interessant, ned-ekspressionen af ​​mir-30c-2 (ved 6q13) samt overekspression af GATA3 blev observeret på tværs af forskellige typer af HC’er i denne undersøgelse, som bekræfter regulering af mir-30C-2 gennem GATA3. Bockhorn og collogues nylig vist, at mir-30c transkriptionelt reguleres med GATA3 [35].

Tilstedeværelse af et andet niveau af sammenhæng mellem kræft-risiko områder blev foreslået, hvor mRNA og deres fælles regulatorer på forskellige PCSRs interagerer med hver andre såvel som deres mål. Den subnetværket centreret om DDX5 med alt 5 knuder og 4 relationer (Figur 2) og undernetværk af GAPDH, miR-141 og mir-200C bekræfte sådanne interaktioner (figur 3). I disse undernet, er forskellige RNA placeret på PCSRs herunder GAPDH, ZEB2, mir-20b, mir-21, mir-141 og mir-200C understøtter de vigtige virkninger af disse RNA og deres regioner i kræft.

Subnetmaske centreret om DDX5 deles på tværs af netværk konstrueret til ændrede mRNA og miRNA i forskellige kræftformer. RNA helicase DDX5 (også kendt som p68) er involveret i RNA-metabolisme og fungerer som en transskriptionel co-regulator og er blevet rapporteret som regulator af mir-182 i brystcancer [29]. Signifikant sammenhæng er også blevet rapporteret mellem DDX5 rs1991401 (OP = 7,90 × 10-5) og ondartet perifer nerve kappe tumor [36]. Vores resultater viste, at opregulering af mir-20b og mir-141 nedregulerer DDX5.

Second undernet (figur 3) indeholdt GAPDH, mir-141 og mir-200C, som er placeret på 12p13.31 som forudsagt PCSRs . Amplifikation af 12p13 region blev observeret ved brystcancer [37], T-celle-lymfomer og lymfatisk leukæmi [38], [39], der forårsager overekspression af GAPDH, mir-141 og -200c. Upstream regulatorer kan inddrage i opregulering af disse RNA’er og en positiv virkning er blevet rapporteret for TP53 beliggende på den opstrøms region af GAPDH [40]. Desuden Yoshihara et al [41] rapporterede nogle sporadiske ovariecancer-unikke CNVs på 12p13.31. Generelt disse rapporter i kombination med vores

in silico

resultater viser den afgørende rolle, 12p13.31 i HC’er.

Interessant, nogle andre almindelige RNA mellem kræftformer i denne rapport, er observeret i forudgående undersøgelser af tumorer og andre sygdomme [16], [42]. For eksempel har tilstedeværelsen af ​​synonym SNP (rs12948217) påvirker exon splejsning enhancere websted nærheden ASPA blevet rapporteret for neurodegenerativ sygdom [43]. Tab af regioner, herunder 14q32.2 (placering af mir-127, mir-432 og mir-770) og 14q32.31 (mir-134, mir-379, og mir-382) blev rapporteret i tidligere studier af nyrekræft og osteosarkom [16], [44]. I vores undersøgelse, mirRNAs placeret på 14q32.2 og 14q32.31 viste ned-udtryk i flere kræftformer, hvilket indebærer ned-ekspressionen af ​​miRNA følgende kromosom tab i disse regioner.

Som konklusion, forudsagde PCSRs i den aktuelle undersøgelse åbner ny vej i yderligere genom associationsstudier til at finde forskellige typer af kræft-kausale varianter. Da flere variationer akkumuleret i et gen eller en klynge af gener kan alle bidrage til fænotype, studere forskellige typer af variationer eller reguleringsmekanismer over en gen, kan klynge af gener eller bestemt region være et nyttigt redskab til at forbedre forening afsløring. De identificerede fælles ændrede RNA ved PCSRs i vores konstruerede netværk har et stort potentiale til at blive brugt til at finde associerede SNP’er, CNVs og /eller SSR’er nærheden af ​​disse gener. Derudover tyder disse resultater potentialet af hidtil ukendte regulator-baserede (snarere end gen-baseret) cancerterapi for at genskabe det sprængte klynge af mRNA’er og /eller miRNA. Generelt kan vores pipeline effektivt anvendes til at forudsige kræft-risiko områder og kræft-risiko kromosomer.

Metoder

Expression Dataanalyse

Raw CEL udtryk data til forskellige HC blev opnået fra Gene Expression Omnibus (GEO) database (tabel S10). RMA (Robust Multichip Gennemsnit) algoritme blev først anvendt på microarray rå data for at opnå normaliserede data ved hjælp af Expression Console-softwaren (Affymetrix, CA, USA). Data blev derefter analyseret under anvendelse FlexArray software (https://genomequebec.mcgill.ca/FlexArray/). Differentiel genekspression mønster for hvert forsøg (cancer vs. normal) blev evalueret under anvendelse empirisk Bayes test (a modereret t-test) (p 0,05). Gener, der udviser mindst 2-fold ændringer i genekspression og 1,5 fold ændringer i miRNA-ekspression blev selekteret til yderligere analyse. Desuden blev 1,2 gange ændring anses for at spore fælles ændrede mRNA og miRNA i forskellige kræftformer.

Det digitale differential display (DDD) værktøj (https://www.ncbi.nlm.nih.gov/UniGene/ddd.cgi) blev anvendt til at screene de cancerrelaterede gener i forskellige HC’er. EST biblioteker udvalgt til DDD sammenligninger af forskellige væv (cancer vs. normal) er anført i tabel S11. Pools A og B blev tildelt for normale og cancerøse biblioteker i hvert cancer hhv. Outputtet forudsat en talværdi i hver pulje, der angiver den del af sekvenser i den pulje, der mappet til UniGene cluster. Statistisk signifikante hits (Fishers eksakte test) viser 10-fold forskelle blev udarbejdet, og en foreløbig database blev oprettet. Fold forskelle blev beregnet ved hjælp af forholdet mellem pool B /pool A, ifølge tidligere beskrevet metode [45].

Blandt probsets med højeste fold ændringer, fælles ændrede mRNA og miRNA (i hvert fald i 6 ud af 11 HC) blev ekstraheret under anvendelse DDD værktøjer sammen med microarray datasæt. Disse fælles ændrede RNA bagefter bruges til netværk konstruktioner.

Afsløring af Shared-cancer af følsomhed Regioner

Antallet af differentielt udtrykte gener blev talt for hver region (som hyppigheden af ​​regionen) ved hjælp af en i -House udviklet python script (The python script er tilgængelig i script S1). Hyppigheden af ​​region involveret i ekspression blev beregnet for probsets med mindst 2-symmetriske fold ændringer (tabel S12) og 200 først probsets med de højeste fold ændringer (tabel S13). Næste for hver region, blev procentdel af region deltagelse i differentielt udtrykte probsets i alle 11 typer af HC beregnet ved hjælp af følgende ligninger: Hvor FOR er hyppigheden af ​​regionen for over-udtrykte probsets (summation af 11 HC), n er antallet af kræfttilfælde (her er 11) og FTP er hyppigheden af ​​region for samlede probsets (tabel S14 og S15) er sædet FDR er frekvensen af ​​region for down-udtrykte probsets (summation af 11 HC), n er antallet af kræfttilfælde (her er 11 ) og FTP er frekvensen af ​​regionen for den samlede probsets (tabel S14 og S15). . Endelig blev fem regioner med det højeste forhold, der vælges som potentielle områder kræft risiko for hvert kromosom

Desuden blev procentdel af kromosom deltagelse i differentielt udtrykte probsets i alt 11 HC beregnes ved hjælp følgende ligninger: Hvor FOC er hyppigheden af ​​kromosom i over-udtrykt probsets (summation af 11 HC’er), n er antallet af cancere (her er 11) og FCTP er frekvensen af ​​kromosom for totale probsets (tabel S16) er sædet FDC er frekvensen af ​​kromosom for ned-udtrykt (summation af 11 HC’er), n er antallet af cancere (her er 11) og FCTP er frekvensen af ​​kromosom for totale probsets (tabel S16). Desuden blev de procentdele af kromosom deltagelse for hver kræft (tabel S17) beregnes ved hjælp brøkdel af kromosom frekvens for ændrede probsets til kromosom frekvens for den samlede probsets (tabel S17). Forskellene kromosomer blev undersøgt på grundlag af generel chi square test.

Konstruktion af Networks om fælles Altered mRNA og miRNA

Pathway Studio 9 software (Ariadne Genomics, Rockville, MD) blev anvendt til at konstruere forskellige netværk. Pathway Studio bruger RESNET Mammal databasen, som er en omfattende tilgang og molekylær interaktion database [46]. Denne database indeholder nye aliaser for menneskelige gener, miRNA og firmaer andre pattedyr. Den korteste vej algoritme blev anvendt til at konstruere fire forskellige netværk baseret på ændrede mRNA og miRNA [47]. Fem netværk blev konstrueret baseret på fælles ændrede RNA’er, herunder netværk af almindeligt ændrede mRNA, netværk af almindeligt ændrede mRNA på PCSRs, netværk af almindeligt ændrede miRNA, netværk af almindeligt ændrede miRNA på PCSRs og integrativ netværk af fælles ændrede mRNA og miRNA. Den biologiske proces med hvert netværk blev identificeret ved hjælp af DAVID (https://david.abcc.ncifcrf.gov/tools.jsp) suite af bioinformatiske værktøjer. DAVID bioinformatiske ressourcer består af en integreret biologiske knowledgebase og analytiske redskaber til systematisk at udvinde biologisk betydning fra store gen /protein-lister [48].

Promoter Analyse af Altered RNA

Promotor analyse blev udført for co-udtrykte mRNA på tværs af forskellige kræftformer hjælp PSCAN [49]. Transkriptionsfaktorer (TFS) blev forudsagt i promotorregionerne (-1 kb til 0) af mRNA ved hjælp Jaspar database (TFS med P-værdi 0,1 blev udvalgt). I tilfælde af miRNA, blev fælles regulatorer forudsagt for ændrede miRNA på samme region hjælp Jaspar web værktøj (https://jaspar.genereg.net/). TF’er blev forudsagt i de formodede promotorområder (-3 kb til en kb) af microRNA med mindst 99% score tærskel relativ profil. Ekspression af forudsagte TF’er blev bestemt under anvendelse transkript-microarray udtryk data fra 11 forskellige cancere, herunder bryst-, tyktarms-, endometrial, mave, lever, lunge, ovarie, pancreas, prostata, testikel, blære, tarm neuroendokrine, cervikal og renale kræftformer samt glioblastom .

Støtte Information

figur S1.

Andel af kromosom deltagelse i genekspression

doi:. 10,1371 /journal.pone.0096320.s001

(PDF)

Figur S2.

Be the first to comment

Leave a Reply