PLoS ONE: Rekonstruktion og analyse af Transcription Factor-miRNA Co-regulering Feed-Forward Loops i Human kræftformer Brug Filter-Wrapper Feature Selection

Abstrakt

Baggrund

Som en af ​​de mest almindelige typer af samregulering motiver, foder frem løkker (FFLs) styrer mange cellefunktioner og spiller en vigtig rolle i humane kræftformer. Derfor er det afgørende at rekonstruere og analysere kræftrelaterede FFLs der er kontrolleret af transskription faktor (TF) og microRNA (miRNA) samtidig, for at finde ud af, hvordan miRNA og TF’er samarbejde med hinanden i kræftceller, og hvordan de bidrager til carcinogenese. Aktuelle FFL undersøgelser afhængige forudsagt regulering information og derfor lider den falske positive problem i forudsigelse resultater. Mere kritisk, kan FFLs genereret af eksisterende tilgange ikke repræsenterer den dynamiske og betinget regulering forhold under forskellige eksperimentelle betingelser.

Metodologi /vigtigste resultater

I denne undersøgelse foreslog vi et nyt filter-wrapper funktion udvælgelse metode til præcist at identificere fælles reguleringsmekanisme ved at inkorporere forudgående oplysninger fra forudsagte regulatoriske interaktioner med parallelle miRNA /mRNA ekspression datasæt. Ved at anvende denne metode, vi rekonstrueret 208 og 110 TF-miRNA samregulerede FFLs fra humane pan-cancer og prostata datasæt hhv. Yderligere analyse af disse kræftrelaterede FFLs viste, at top-ranking TF STAT3 og miRNA HSA-lad-7e er centrale regulatorer impliceret i humane kræftformer, der har reguleret mål betydeligt beriget med cellulær proces regler og signalveje, der er involveret i carcinogenese.

konklusioner /betydning

I denne undersøgelse har vi indført en effektiv beregningsmæssige tilgang at rekonstruere samreguleringsforanstaltninger FFLs ved præcist at identificere gen samreguleringsforanstaltninger interaktioner. Styrken af ​​den foreslåede funktion udvælgelsesmetode ligger i det faktum kan det præcist bortfiltrere falske positiver i forudsagte regulatoriske interaktioner ved kvantitativt modellere komplekse samregulering af målgener medieret af TF’er og miRNA samtidigt. Desuden kan den foreslåede funktionen valgmetode generelt anvendes på andre undersøgelser genregulering hjælp parallelle udtryk data med hensyn til forskellige biologiske sammenhænge

Henvisning:. Peng C, Wang M, Shen Y, Feng H, Li A ( 2013) Genopbygning og analyse af transskription Factor-miRNA Co-Regulatory feed-forward loops i Human kræftformer Brug Filter-wrapper Feature Selection. PLoS ONE 8 (10): e78197. doi: 10,1371 /journal.pone.0078197

Redaktør: Raya Khanin, Memorial Sloan Kettering Cancer Center, USA

Modtaget: Juni 11, 2013; Accepteret: 9. september 2013; Udgivet: 29 Oktober 2013

Copyright: © 2013 Peng et al. Dette er en åben adgang artiklen distribueres under betingelserne i Creative Commons Attribution License, som tillader ubegrænset brug, distribution og reproduktion i ethvert medie, forudsat den oprindelige forfatter og kilde krediteres

Finansiering:. Dette arbejde blev støttet af tilskud fra National Natural Science Foundation of China (61101061 til MW, 31100955 til AL). De finansieringskilder havde ingen rolle i studie design, indsamling og analyse af data, beslutning om at offentliggøre, eller forberedelse af manuskriptet

Konkurrerende interesser:.. Forfatterne har erklæret, at der ikke findes konkurrerende interesser

Introduktion

Central for alle biologiske organismer, tydningen af ​​komplicerede gen regler mellem en gruppe af lovgivere og målgener er afgørende for at lære de intracellulære fysiologiske aktiviteter og funktioner i det molekylære niveau. Det hjælper også til at forstå de indre mekanismer i komplekse sygdomme

in vivo

. Regulatorerne i genprodukter forordninger omfatter transkriptionsfaktorer (TFS), som er proteiner, der binder til specifikke steder i promotorregionerne af målgener og dermed aktivere eller inhibere ekspressionen af ​​dem. Andre regulatorer omfatter endogene små (19-24 nukleotider) ikke-kodende RNA (miRNA), der involverer i reguleringen af ​​genekspression på [1] den post-transkriptionel niveau ved at hæmme oversættelsen procedure eller nedværdigende target mRNA. Det har vist sig, at både TF’er og miRNA spiller en vigtig rolle i humane cancere [1] – [5]., Ved at kontrollere mange biologiske processer i udviklingen af ​​kræft og progression

Mange undersøgelser har fundet, at TF’er og miRNA er primære gen regulatorer i dyr og funktion i en lignende regulerende logik [6]. Derfor TF’er og miRNA kan regulere samme målgen samvirkende på det transskriptionelle og post-transkriptionel niveau hhv. På den anden side er miRNA reguleret af TF’er under deres transkription fra genomet i kernen, og ekspressionen af ​​TF’er kunne også moduleres ved miRNA. Derfor er gen-regler ved TF’er og miRNA ofte tæt koblet, hvilket gør en bestemt “Feed-forward sløjfer« (FFLs) [7] struktur med lukkede regulatoriske kredsløb. FFLs er blevet påvist som en afde mest almindelige typer af co-transkriptionelle motiver [8], og det er blevet rapporteret, at hundredvis af miRNA-kontrollerede FFLs findes på genomet niveau [9], [10]. Ved at danne funktionelle moduler i gen regulatoriske netværk (GRNs), FFLs styre mange cellefunktioner og også spille en vigtig rolle i menneskelige kræftformer, for eksempler, ved at støtte onkogene egenskaber af onkogener [11] og påvirke en masser af målgener i tumorceller ved forskellige biologiske pathways [12]. Således bliver det afgørende at rekonstruere og analysere TF-miRNA samregulering FFLs i humane kræftformer, for at finde ud af, hvordan miRNA og TF’er samarbejde med hinanden i kræftceller, og hvordan de bidrager til carcinogenese.

Én af udfordringerne i at studere FFLs er den ufuldstændige oplysninger af lovgivningsmæssige mål. Da der kun er et lille antal eksperimentelt verificerede mål, de fleste FFL undersøgelser vedtage lovgivningsmæssige oplysninger fra beregningsmæssige forudsigelse. For eksempel, for at finde kræftrelaterede miRNA og TF’er, Yan

et al

. udtrukne og klassificeret FFLs fra forudsagt TF og miRNA mål ved hjælp TRANSFAC og Targetscan [13]. Ye

et al

. også brugte FFLs opnået fra andre ressourcer forudsigelse til at konstruere og analysere miRNA og TF samregulering netværk i T-celle akut lymfoblastær leukæmi [14]. Disse forudsagte resultater indeholder en stor del af falske positiver, og mere kritisk FFLs genereret af ovennævnte fremgangsmåder er statiske og kan ikke repræsentere de dynamiske og betingede regulering relationer under forskellige eksperimentelle betingelser.

I øjeblikket parallelle microarray eksperimenter har været udført for at undersøge gen og miRNA udtryk i kræft samtidigt [15], [16], som giver en stor mulighed for at løse ovennævnte problemer ved hjælp udtryk data i rekonstruktion af TF-miRNA samregulering FFLs. For nylig, Lu

et al

. foreslået en Lasso regressionsmodel, der bruger beregningsmæssigt forudsagt regulatoriske interaktioner og kræft parallelle udtryk data til at udlede miRNA målgruppen regulatoriske netværk [17], Yu

et al

. brugte trinvis lineær regressionsmodel (STEP), der også integrerer forudsagte forordninger med udtryk data for at opnå et kombinatorisk netværk af TF og miRNA i cancer [18]. Disse to papirer belyse metode til opbygning af miRNA-involverede GRNs og revolutionerede vores forståelse af virkningen af ​​TF’er og miRNA i humane kræftformer. Men studiet af FFLs kræver præcis co-lovgivningsmæssige oplysninger, som FFLs repræsentere sig selv som en subtil form for samregulering motiv. mere avancerede beregningsmetoder er derfor foretrukket til præcist rekonstruere FFLs fra udtryk data ved hjælp af forventede regulatoriske interaktioner.

I denne undersøgelse foreslog vi en ny beregningsmetode baseret på funktionen valg at rekonstruere TF-miRNA samregulering FFLs i humane kræftformer. Som en kraftfuld maskine learning teknologi, har funktionen udvælgelse været udbredt i mange områder af bioinformatik, såsom gen markering fra microarray data [19], inferens af gen-netværk [20], indhold og signal analyse af sekvens [21] og massespektre analyse [21]. Vi ansat to populære funktion selektionsstrategier: filter og indpakning, til effektivt at opdage co-forskrifter TF’er og miRNA fra parallelle microarray data for menneskelige kræftformer. Vores resultater viste, at den foreslåede metode væsentligt reduceret den falske opdagelse sats i de udledte regulatoriske forhold, der fører til mere præcise FFL genopbygning. Yderligere analyse af de FFLs identificeret af den foreslåede metode viste, at de omfattede mange kendte kræftrelaterede gener og miRNA, med angivelse af deres funktionelle betydning i humane kræftformer.

Materialer og metoder

Forventet regulatoriske interaktioner

Tre typer af regulatoriske interaktioner blev undersøgt i denne undersøgelse: TF til miRNA (TF-miRNA), TF til gen (TF-gen), og miRNA til gen (miRNA-gen). Vi downloadede forudsagt TF-miRNA interaktioner fra cGRNB hjemmeside [18] med 11,599 regulatoriske par. At hente kandidat TF-gen interaktioner blev TF-bindingssteder først ekstraheret fra TFbsConsSites fil fra UCSC [22] ved at følge fremgangsmåden beskrevet i [18] og derefter bruges til at scanne 1 kb opstrøms til 0,5 kb nedstrøms for transcription start sites af alle referencematerialer gener i UCSC. Resultaterne blev yderligere kombineres til 7.059 TF-gen interaktioner fra TRED database [23], hvilket fører til helt 130,338 TF-gen interaktioner herunder 16,534 målgener og 214 menneskelige TF’er. For miRNA-gen interaktioner, resultaterne af tre udbredte miRNA target forudsigelsesværktøjer: PicTar [24], Targetscan [25] og Miranda [26] blev opnået fra miRGen database [27], som indeholder 75.968, 75.613 og 41.804 forudsagde miRNA- gen interaktioner henholdsvis. Foreningen af ​​forudsigelse resultater, herunder 118,408 miRNA-gen interaktioner med 276 menneskelige miRNA og 10,255 målgener blev anvendt til yderligere undersøgelse.

Parallel mRNA og miRNA udtryk datasæt

Vi brugte to parallelle mRNA og miRNA udtryk datasæt for humane kræftformer, som repræsenterer miRNA og mRNA udtryk data fra de samme prøver og under samme eksperiment forhold. Den første datasæt omfatter NCI-60 mRNA udtryk data baseret på Affymetrix HG-U133 chips [16], og de parallelle miRNA udtryk data [15] fra CellMiner hjemmeside. Denne pan-cancer datasæt omfatter totalt 60 forskellige humane cancercellelinier, der stammer fra melanomer, leukæmi og andre faste tumorer såsom bryst-, tyktarms-, ovarie-, lunge- og prostatakræft. Denne parallelle udtryk datasæt består af i alt 8388 gener og 195 miRNA [18]. Den anden parallel mRNA og miRNA udtryk datasæt vedtaget i denne undersøgelse består af 111 prostatakræft og 28 normale prostata prøver, herunder 373 miRNA og 19,253 mRNA [28]. Denne datasæt er tilgængelig på databasen GEO med tiltrædelsen nummer: GSE21032

Feature valg for at identificere regulatoriske interaktioner

For hvert mål (mRNA eller miRNA), det sæt af oprindelige funktioner (dvs. alle forudsagt. TF’er eller miRNA at regulere dette mål) indeholder normalt mere end et element på grund af et stort antal falske positiver i de forudsagte resultater. Så funktionen matrix har

n

rækker og

m

kolonner angiver de

n

regulatorer og deres udtryk værdier i

m

prøver. Som det første skridt, vi filtreret funktionen sæt af hvert mål ved hjælp af en effektiv mrmr metode (minimal-redundans-maksimal-relevant tekst) [19] baseret på gensidig information, som er et almindeligt anvendt foranstaltning til at definere afhængighed af variabler. Konkret lad

s Hotel (

x

) og

s Hotel (

y

) være de marginale sandsynlighed fordeling funktioner af to variable

x

og

y

s Hotel (

x, y

) være fælles sandsynlighed fordelingsfunktionen er gensidig information defineres som: (1) Antag et mål

x

med udtryk værdi

E

x

har to regulatorer

y

jeg

og

y

j

med udtryk værdier

E

yi

E

yj

. For eksempel, hvis

y

Jeg

og

y

j

repræsenterer en miRNA og et TF derefter

E

yi

E

yj

vil blive opnået fra de parallelle miRNA og mRNA udtryk data, hhv. Det endelige feature sæt

S

efter filteret skridt vil opfylde to kriterier, der anvendes i mrmr metoden, dvs. maksimal relevans med målet og den minimale redundans mellem myndighederne (dvs. at vælge regulatorer, der ikke kun minimal redundans i gensidig information med hensyn til de eksisterende regulatorer, men også maksimal gensidig information med målet), som er formuleret af ligning (2) og (3) hhv. Her

jeg

repræsenterer den gensidige information af to variable. Fra ranking resultater af mrmr, valgte vi op til 20 top kandidat regulatorer, der er mest tilbøjelige til at have interaktioner med målet til yderligere undersøgelse, som bør omfatte alle mulige regulatorer. (2) (3) Næste blev features for hvert mål yderligere optimeret ved wrapper funktionen udvælgelsesmetode, og i dette trin vi ansat en rekursiv baglæns elimination procedure. Vi modelleret udtryk værdier af mål

i

(

E

xi

) og dens

s

regulatorer (

E

yi1

, … ,

E

yip

) med lineær regression (ligning 4), hvor

β

jeg

er regression koefficient og

ε

jeg

repræsenterer fejlleddet eller støj genereret fra regressionen processen. For hver gang, vi slettede regulatoren med den mindste regression koefficient fra featureset og gentog processen ovenfor med de resterende regulatorer, indtil funktionen indstillet blev tom. De optimale egenskaber blev bestemt ved mindste

s

-værdi (mindre end 0,01) for den lineære regression model ved hjælp af F-testen. (4)

Genopbygning og validering af TF-miRNA samregulerede FFLs

De samreguleringsforanstaltninger interaktioner identificeret ved filter-wrapper funktion udvælgelsesmetode består af tre slags regulatoriske forhold: TF-gen , miRNA-genet og TF-miRNA. For at rekonstruere samreguleringsforanstaltninger FFLs, vi udførte en udtømmende søgning base på dybde-først metode til alle målgener i resultaterne. For TF-FFLs, først en liste over potentielle målgener, som kontrolleres af mindst en TF og miRNA blev dannet. De miRNA regulatorer af hvert mål gen blev derefter undersøgt én efter én og en TF-FFL blev genereret, hvis målet genet og dets miRNA regulator blev begge kontrolleret af en TF. For miRNA-FFLs blev den samme målgen liste anvendes, og en miRNA regulering både et target-gen i listen og dens TF blev udvalgt til at bygge en miRNA-FFL. Endelig, for at identificere de sammensatte-FFLs de rekonstruerede miRNA-FFLs blev yderligere undersøgt iterativt at se, om TFS i disse FFLs også regulere de tilsvarende miRNA.

For at validere FFLs rekonstrueret fra parallelle udtryk datasæt og forudgående information fra forudsagt regulatoriske interaktioner, valgte vi tilfældigt det samme antal interaktioner fra forudsagt regulatoriske par hvorfra vi rekonstrueret de FFLs hjælp af ovennævnte fremgangsmåde. Denne fremgangsmåde blev gentaget 1000 gange for at generere den empiriske distribution under nulhypotesen at FFLs rekonstrueret ved vores tilgang faktisk opstår tilfældigt. Vi udførte derefter en-prøve t-test baseret på antallet af TF-FFLs, miRNA-FFLs og sammensatte-FFLs rekonstrueret fra pan-cancer datasæt og beregnet den

s

-værdi at afgøre, om denne nul-hypotesen kan være afvist på signifikansniveau på 0,01.

Desuden til yderligere at validere betydningen af ​​FFLs til kræft, vurderet vi udførelsen af ​​de identificerede FFLs ved klassificering prostatakræft og normale prøver ved hjælp af parallel genekspression data. LIBSVM [29], et offentligt SVM bibliotek, blev udvalgt til klassificering. Leave-one-out cross validering (LOOCV), som er den mest objektive og stringent metode til at vurdere en klassificeringen, blev vedtaget for at evaluere klassificering ydeevne FFLs. For sammenligning, vi brugte også en baseline metode, hvor etiketterne for kræft og normal udtryk datasæt blev permuterede 100 gange. For hver gang, blev SVM klassificører med de samme FFLs genereret fra de permuteret udtryk data og derefter testet med den samme procedure evaluering. De klassificering resultater af samtlige permutation tests blev gennemsnit at få baseline performance.

Tre klassifikation præstationsmålinger anvendt i denne undersøgelse, nøjagtighed (

Nøjagtig

), følsomhed (

Sn

) og specificitet (

Sp

) defineres som folllows: (5) (6) (7) Her

TP

,

TN

,

FP

og

FN

repræsenterer sande positive, sande negative, falsk positive og falsk negative hhv. I mellemtiden, da størrelsen af ​​kræft og normale prøver er meget forskellige, Matthews korrelationskoefficienten (

MCC

) blev anvendt, som er en afbalanceret måling af kvaliteten af ​​klassificeringer [30]: (8) Desuden vi også plottet modtageren operatør karakteristiske (ROC) kurver for performance sammenligning, hvor x-aksen repræsenterer 1-

Sp

og y-aksen repræsenterer

Sn

.

Resultater

filter-wrapper funktion valg

Et eksempel på filteret-wrapper funktion udvælgelsesprocedure hjælp pan-cancer datasæt det er illustreret i figur 1. i filter funktionen udvælgelse, udvalgte top-ranking regulatorer af mrmr demonstrere stor gensidig information, hvilket indikerer stor relevans med målgenet (figur 1A). Figur 1B viser i begyndelsen, er der alt 20 kandidatlande funktioner med mulige falske positiver og

s

-værdi af tilhørende lineære regressionsmodel er 0,27. Når wrapper funktion valg er udført, -værdi den tilsvarende

s

dramatisk falder, hvilket tyder på en bedre model, der er mere tæt på virkeligheden genregulering mekanisme. Den endelige model består af tre regulatorer med en optimal

s

-værdi på 3,9 × 10

-4. Desuden boxplot af

p

-værdier for alle mål undersøgt i denne undersøgelse (figur 2A) viser, feature udvalg generelt gør mere præcise regressionsmodeller. Vi evaluerede også den foreslåede metode ved at beregne Pearson korrelationskoefficient (PCC), en meget anvendt måling til at identificere reguleringsmæssige relationer [31], mellem kandidat regulatorer og mål. Som et resultat, signifikant højere PCC’er (U-test

s

-værdi: 4,4 × 10

-167) blev observeret i de regulatoriske interaktioner efter funktion valg (figur 2B). Tilsammen filteret-wrapper funktion udvælgelsesmetode i høj grad forbedrer pålideligheden af ​​identificerede regulatoriske interaktioner ved præcist at modellere parallelle udtryk data og effektivt fjerner falsk forudsete vekselvirkninger.

(A) Et eksempel, der viser gensidig information af alle lovgivere i filter funktionen udvælgelsesprocessen. Vi valgte de top-ranking regulatorer udvalgt af mrmr, der viser større gensidig information værdier, der indikerer stor relevans med målgenet. (B) Et eksempel, der illustrerer

s

-værdi ændring af lineær regressionsmodel i wrapper funktionen udvælgelsesprocessen. Når 17 funktioner er fjernet, det optimale

s

-værdi (markeret med rødt ‘*’) findes ved wrapper funktion valg er 3,9 × 10

-4.

( A)

P

-værdier af de lineære regressionsmodeller for alle målgener før og efter funktionen udvælgelse.

P

-værdier faldt betydeligt efter funktion selektion blev udført. (B) Pearson korrelationskoefficienter (PCC’er) mellem alle target gener og deres regulatorer før og efter funktionen udvælgelse. Højere PCC’er (U-test

s

-værdi: 4,4 × 10

-167) blev observeret i de sidste identificerede regulatoriske interaktioner

For yderligere at vurdere resultaterne af den. foreslåede metode, vi ionbyttet udtrykket værdier af udtryk data tilfældigt for 100 gange og beregnet falsk discoveryrate (FDR) ved at betragte interaktioner genereret fra de randomiserede datasæt som falske positiver. Til sammenligning, vi evalueret også udførelsen af ​​to andre metoder: Lasso [17] og STEP [18]. Afprøvningen blev gentaget 3 gange, og resultaterne er vist i tabel 1. Med sammenlignelige varians, middelværdien af ​​FDR for filter funktion valg er 0,11, hvilket er væsentligt mindre end for Lasso og STEP. Desuden ved hjælp af filter og wrapper funktion udvalg sammen, observerede vi en drastisk reduktion i FDR varians 1,24-0,38, hvilket indikerer en bedre konsistens og robusthed i forhold til andre tilgange. Desuden er denne metode gav en gennemsnitlig FDR på 0,06, hvilket er 5% bedre end filteret metode. Tilsammen viser disse resultater den overlegne ydeevne filter-wrapper funktion udvælgelsesmetode.

Endelig har vi undersøgt miRNA regulatoriske interaktioner før og efter funktionen udvælgelse. Som vist i tabel 2, der var fuldstændig 190.976 forudsagt miRNA målgruppen interaktioner, og de fleste af dem blev fjernet, da funktionen udvælgelse blev anvendt, hvilket indikerer disse forudsagte regulatoriske interaktioner var enten falske positiver eller relateret til menneskelige kræftformer. Hertil kommer, ved at ty til miRTarBase [32], der indeholder eksperimentelt validerede miRNA mål, fandt vi den del af kendte regulatoriske interaktioner blev øget markant i resultaterne (tabel 2, hypergeometrisk-test,

s

-værdi: 2.4 × 10

-3 for filter funktionen udvælgelse, 4,0 × 10

-4 for filter-wrapper funktionen udvælgelse), der også understøtter anvendeligheden af ​​funktionen udvælgelse i opdager regulatoriske interaktioner.

TF og miRNA samregulerede FFLs i humane kræftformer

fra 24,033 regulatoriske interaktioner identificeret ved funktionen udvælgelse, vi identificerede tre typer FFLs i humane kræftformer (figur 3A): TF-FFL, miRNA-FFL og composite- FFL. I TF-FFL, TF er den vigtigste regulator, som direkte regulerer miRNA og målgenet mens miRNA også regulerer målgenet. Den miRNA-FFL har den samme struktur med TF-FFL, men den vigtigste regulator er stedet miRNA. Den sammensatte-FFL er en kombination af TF-FFL og miRNA-FFL, hvor TF og miRNA regulere hinanden, mens de også regulerer samme målgen. Bemærk disse FFLs er også blevet rapporteret i andre studier af kræft [7], [13], [14], [33], [34], hvilket tyder på forekomsten af ​​FFLs i genregulering og mekanisme af carcinogenese. Fra pan-cancer datasæt den, vi med succes rekonstrueret 98 TF-FFLs, 106 miRNA-FFLs og 4 sammensatte FFLs fra de identificerede regulatoriske interaktioner med funktionen valg. For yderligere at validere disse kræftrelaterede FFLs, udførte vi one-sample t-test ved at sammenligne rekonstruerede FFLs til dem, der frembringes af tilfældigt udvalgte interaktioner fra forudsagte regulatoriske par (se metode), og det gennemsnitlige antal TF-FFLs, miRNA-FFLs og sammensatte FFLs i randomiserede interaktioner var 56, 26 og 0,2, som var alle signifikant lavere (

s

-værdi: 1,2 × 10

-8 for TF-FFL, 2,0 × 10

-43 til miRNA-FFL, 9,9 × 10

-11 til komposit-FFL) end antallet af FFLs identificeret i humane kræftformer.

(A) Tre typer af 3-vertex FFLs fundet i humane kræftformer. Ifølge forholdet mellem miRNA og TF, de blandede FFLs fundet i humane kræftformer blev klassificeret som TF-FFL (TF direkte regulerer miRNA og målgenet mens miRNA også regulerer målgenet), miRNA-FFL (miRNA direkte regulerer TF og målgenet mens TF også regulerer målgenet), et sammensat-FFL (TF og miRNA regulere hinanden, mens de også regulerer samme målgen). (B) Fælles TF-FFLs findes i både pan-cancer og prostatakræft datasæt. Røde cirkler angiver målgener; blå trekanter og orange firkanter indikerer TF’er og miRNA.

I mellemtiden har vi rekonstrueret TF-miRNA samreguleringsforanstaltninger FFLs hjælp af prostatakræft datasæt og sammenlignede dem med dem, der genereres fra normale prostata udtryk data. Antallet af samreguleringsforanstaltninger FFLs i prostatakræft var 110, og meget mere FFLs (425 i alt) blev identificeret i normale prostata celler. Desuden fandt vi sammensætningen af ​​FFLs var også signifikant forskellige (chi-square test,

s

-værdi: 1,7 × 10

-2), for eksempel, den procentdel af miRNA-FFLs var 79% i prostatacancer, mens dette tal steget til 89% i normalt prostatavæv. Dette fænomen indebærer mange normale samreguleringsforanstaltninger FFLs dramatisk undertrykt eller ændret i prostatakræft. Endelig har vi sammenlignet de FFLs rekonstrueret fra pan-kræft og prostatakræft datasæt og identificeret 2 TF-FFLs (figur 3B), der dukkede op i begge datasæt. Interessant, miRNA i disse to FFLs, HSA-lad-7a og HSA-lad-7e, hører til HSA-let-7 familie, der er relateret til prostata [35], bryst [36], lunge [37] kræftformer.

Derudover har vi udført klassificering analyse af prostatakræft og normale prøver ved hjælp af udtrykket data for miRNA og gener i førnævnte samreguleringsforanstaltninger FFLs. Udførelsen af ​​normale og cancer FFLs blev evalueret ved hjælp LOOCV og vist i Tabel 3. Både normale og cancer FFLs give meget gode resultater med klassificering

Nøjagtig

af 95,0% og 95,7%, repectively. Også

Sn

,

Sp

MCC

målinger viser Tarifering resultaterne af begge former for FFLs er meget afbalanceret. Hertil kommer, ved hjælp af alle disse FFLs klassificeringen ydeevne forbedres yderligere med

Nøjagtig

,

Sn

og

Mcc

stigende til 97,1%, 99,1% og 0,909 henholdsvis som er signficantly bedre end baseline metoden. Disse resultater er også bekræftes af ROC kurver af ovenstående tilgange (figur 4), hvilket tyder på effektiviteten af ​​disse FFLs ved klassificering prostatakræft og normale prøver og betydning for kræft.

Den grå, blå, grøn og rød kurver er ROC-kurver for baseline (én permutation), cancer FFLs, normale FFLs og alle FFLs hhv. Det største areal under kurven angiver de bedste præstationer af klassificeringen.

Centrale aktører i kræftrelaterede FFLs

Vi beregnede forekomsten af ​​TFS og miRNA i pan kræft og prostatakræft FFLs. Som vist i tabel 4, de højest rangerede TF og miRNA er STAT3 og HSA-let-7e hhv. Interessant, fandt vi STAT3 optrådte i 18 FFLs på prostatakræft (tabel 5), som i væsentlig grad blev beriget i forhold til dem i normal prostata væv (chi-square test,

s

-værdi = 2,6 × 10

-12) og i pan-cancer (chi-square test,

s

-værdi = 3,8 × 10

-3). Dette fænomen indebærer STAT3 er impliceret i prostatacancer. Det er blevet rapporteret, at STAT3 konstitutivt aktiveres i prostatakræft væv [38] og induktion af STAT3 ekspression kan inducere en malign forandring af normale prostata-epitelceller [39]. Endvidere STAT3 er blevet vist som et lovende terapeutisk mål for prostatacancer [40]. Alle disse observationer viser, at STAT3 er en vigtig cancerrelateret TF og har en fremtrædende indvirkning på forekomst og udvikling af prostatacancer. Desuden opdagede vi mere end 24% af målet for STAT3 fundet i pan-cancer også dukkede op i prostatakræft. Yderligere analyse af funktionelle berigelse af STAT3 mål i prostatacancer viste disse mål spillede en vigtig rolle i forskellige cellulære proces forordninger impliceret i carcinogenese, for eksempel celleoverfladen binding og aktiviteten regulering af forskellige former af proteinaser (tabel 6). Resultaterne af sti analyse indikerede også disse mål var rigelige i Fruktose og mannose metabolisme og Notch signalvejen. Vejviser

TF-miRNA co-regulerende net i humane kræftformer

Baseret på de FFLs rekonstrueret i de to datasæt, vi yderligere bygget pan-kræft og prostatakræft specifikke TF-miRNA samregulering netværk, og visualiseret dem ved hjælp af Cytoscape software [41]. Som vist i figur 5, den pan-cancer co-regulerende netværk indeholder et samlet antal af 213 knuder, herunder 37 TF’er, 17 miRNA og 159 andre gener. Den prostatacancer specifikt netværk består af 118 knuder med 27 TF’er, 8 miRNA og 83 andre gener (figur 6). Vi beregnede graden (connectivity) af hver node og fandt, at navet med den største grad i begge netværk var den samme miRNA HSA-lad-7e. Dette resultat er aftalt med FFLs analyse beskrevet ovenfor, hvilket indikerer, at HSA-lad-7e kan være afgørende i forskellige menneskelige kræftformer. Yderligere litteratur undersøgelse viser, at HSA-lad-7e er medlem af lad-7 familie, der opstod som tumorsuppressor [36] og er blevet rapporteret til at spille en vigtig rolle i reguleringen af ​​onkogener i multipletumors [42], [43].

Røde cirkler angiver målgener; blå trekanter og orange firkanter indikerer TF’er og miRNA. Rød T-form kant: miRNA regulering; blå pil form kant:. TF regulering

Røde cirkler angiver målgener; blå trekanter og orange firkanter indikerer TF’er og miRNA. Rød T-form kant: miRNA regulering; blå pil form kant:. TF regulering

undernetværk af HSA-lad-7e hentet fra pan-cancer FFLs (figur 7) indeholder 57 målgener og 12 TF’er herunder mange cancer-relaterede gener såsom MYB, E2F2 og HAND1. MYB er proto-onkogen, som er blevet identificeret til at forårsage en række leukæmi [44]. E2F2 er celle-cyklus regulator, hvis ekspression niveau stigninger i prostatacancer væv [45]. HAND1 er også blevet rapporteret at spille en kritisk rolle i carcinogenese proces [46]. Vi har udført også funktionelle berigelse analyse af HSA-lad-7e mål i pan-cancer og resultaterne i tabel 7 viser, at de er betydeligt beriget med fem veje (hsa05200: veje i kræft, hsa05220: Kronisk myeloid leukæmi, hsa00270: Cystein og methionin stofskifte, hsa05222: småcellet lungecancer, hsa05219: Blærekræft), blandt hvilke fire veje er relateret til menneskelige kræftformer. I alt viser disse resultater, at HSA-lad-7e kan hæmme processen med tumor forekomst og udvikling i forskellige tumorer ved at regulere forskellige onkogener.

subnetværket blev trukket med alle direkte forbundne knudepunkter i HSA-lad-7e , der viser sig at være hub af samregulering netværk.

diskussion

Menneskelige kræftformer er normalt karakteriseret ved spredning af alsidige gener på forskellige stadier af udvikling med kompliceret reguleringsmekanisme, derfor rekonstruktion af genregulering i menneskelige kræftformer, især med hensyn til dets komplekse, dynamiske og betingede træk, kan i høj grad fremme vores viden om oprindelsen af ​​kræft og dens ondartet adfærd. I denne undersøgelse, vi udnyttet filter-wrapper funktion udvælgelsesmetode til at identificere reguleringsmæssige interaktioner mellem målgener og regulatorer, hvorfra vi yderligere rekonstruerede TF-miRNA samregulering FFLs i humane kræftformer. Den foreslåede metode tager fuld fordel af parallelle udtryk datasæt og forudgående information fra forudsagte regulatoriske interaktioner at modellere og karakterisere den komplicerede samreguleringsmekanisme i humane kræftformer.

Be the first to comment

Leave a Reply