PLoS ONE: Identifikation Cancer Specifikke Funktionelt Relevante miRNA fra Gene Expression og miRNA-til-Gene Networks Brug normaliseret Regression

Abstrakte

Identifikation microRNA signaturer for de forskellige typer og undertyper af kræft kan resultere i forbedret påvisning, karakterisering og forståelse af kræft og bevæge os i retning af mere personlige behandlingsstrategier. hjælp microRNA s differential udtryk (tumor versus normal) til at bestemme disse underskrifter, kan dog føre til unøjagtige forudsigelser og lav for fortolkning på grund af den larmende natur miRNA udtryk data. Vi præsenterer en fremgangsmåde til udvælgelse af biologisk aktive microRNA ved hjælp genekspression data og microRNA-til-gen-interaktion netværk. Vores metode er baseret på en lineær regression med et elastisk net regularisering. Vores simuleringer viser, at med vores metode, kan de aktive miRNA påvises med stor nøjagtighed og vores tilgang er robust for høje niveauer af støj og manglende oplysninger. Desuden er vores resultater på reelle datasæt for glioblastom og prostatakræft bekræftet af microRNA ekspression målinger. Vores metode fører til udvælgelse af potentielt funktionelt vigtige microRNA. De sammenslutninger af nogle af vores identificerede miRNA med mekanismer kræft er allerede bekræftet i andre undersøgelser (hypoxi relateret HSA-mir-210 og apoptose-relaterede HSA-mir-296-5p). Vi har også identificeret yderligere miRNA, der ikke tidligere undersøgt i forbindelse med kræft, men er sammenhængende forudsagt som aktiv ved vores metode og kan berettige yderligere undersøgelse. Koden er tilgængelig i Matlab og R og kan downloades på https://www.cs.toronto.edu/goldenberg/Anna_Goldenberg/Current_Research.html

Henvisning:. Mezlini AM, Wang B, Deshwar A, Morris Q, Goldenberg A (2013) Identifikation Cancer Specifikke Funktionelt Relevante miRNA fra Gene Expression og miRNA-til-Gene Networks Brug normaliseret regression. PLoS ONE 8 (10): e73168. doi: 10,1371 /journal.pone.0073168

Redaktør: Xin-Yuan Guan, The University of Hong Kong, Kina

Modtaget: Marts 28, 2013; Accepteret: 18 juli 2013; Udgivet: 2 Oktober 2013

Copyright: © 2013 Mezlini et al. Dette er en åben adgang artiklen distribueres under betingelserne i Creative Commons Attribution License, som tillader ubegrænset brug, distribution og reproduktion i ethvert medie, forudsat den oprindelige forfatter og kilde krediteres

Finansiering:. Ingen strøm eksterne finansieringskilder til denne undersøgelse

konkurrerende interesser:.. forfatterne har erklæret, at der ikke findes konkurrerende interesser

Introduktion

som en stærkt bevaret væsentlig faktor af post-transkriptionel regulering , microRNA menes at have en betydelig indvirkning på genekspression og derfor på de fleste biologiske mekanismer og funktioner. Forbindelsen mellem miRNA og kræft har været genstand for flere nylige undersøgelser og anmeldelser [1] – [4]. Troen på, at miRNA profil forandring er ikke blot en tilskuer konsekvens af kræft, men kan også have en aktiv rolle i det, er konsolideret ved flere observationer. Først miRNA udtryk data viser, sammenhængende og drastiske ændringer i niveauer af ekspression mellem tumorvæv og deres sunde modparter. For det andet er det blevet observeret, at mange miRNA er placeret på genomet i regioner, der er tilbøjelige til CNVs /deletioner i cancer [5]. Endelig og vigtigst, har mange miRNA vist sig at have en direkte virkning på kræftrelaterede mekanismer såsom apoptose [6], proliferation [7], angiogenese [8] og metastase [9].

Differential analyse miRNA udtryk profiler i cancer vs sundt væv alene kan føre til et stort antal falske positiver grundet den støjende karakter miRNA udtryk data. Derudover har vi ringe kendskab til, hvor meget afvigelse i ekspression af et bestemt miRNA kan inducere funktionelt relevante ændringer i genekspression. Det er muligt, at genekspression profil er meget følsom over for selv små ændringer i nogle miRNA ‘mængder, mens drastiske ændringer i andre miRNA ikke har væsentlig indflydelse på det.

Tidligere metoder til påvisning af vigtige miRNA i kræft at gøre en række centrale antagelser. F.eks RegulatorInference [10] er en meget ny metode, der har til formål at finde de aktive miRNA via en regression tilgang. Den antager implicit, at alle gener påvirkes af kopital variationer på samme lineær måde, og at virkningen af ​​en miRNA på et målgen er lineær i antallet af bindingssteder. Derudover bruger RegulatorInference miRNA udtryk data til forvalg potentielt aktive miRNA, selvom dette trin er valgfrit. I [11], genekspression, miRNA udtryk og genet-gen interaktion netværk bruges til at konstruere en formodet kompleks miRNA-target indflydelse netværk med miRNA indflydelse koefficienter, der er beregnet baseret på miRNA direkte /indirekte effekt på gener og gen-gen kommenteret interaktioner.

I dette papir, præsenterer vi en metode til at forudsige funktionelt relevante miRNA fra differential genekspression data ved hjælp af miRNA-gen interaktion information og mRNA-ekspression alene. I modsætning til tidligere metoder, bruger vi ikke miRNA udtryk data i vores forudsigelser og vi gør ingen antagelser om, hvordan forskellige miRNA kan CNVs eller interaktioner påvirke forskellige gener. Ideen er at vælge et sæt af miRNA ansvarlige for de fleste af de observerede i genekspression baseret på forudgående kendskab til eksisterende miRNA-gen interaktioner med ingen yderligere antagelser om de stærke sider af disse interaktioner ændringer. Vores tilgang er baseret på en regressionsmodel for genet differentiel ekspression. Vi har tilføjet et elastisk net legalisering [12] for at undgå overfitting det høje støj i data og vælg et minimalt sæt af aktive miRNA. Den miRNA differential udtryk data bruges kun til validering. I det omfang vi ved, er dette den første metode til at bestemme aktive miRNA i kræft fra genekspression kun data (ingen miRNA data), og derfor kan vi vurdere vores ydelse med forskellen miRNA udtryk data fra de samme patienter.

vores simuleringer viser, at vores metode er robust overfor flere typer af støj og manglende data, og at det er i stand til at forudsige de relevante miRNA så længe input genekspressionssystemer ændringer er i det mindste delvis skyldes miRNA. Vi brugte vores data på 157 glioblastom patienter og 111 prostata cancer patienter og forudsagde flere relevante miRNA virkninger, som blev bekræftet af miRNA udtryk målinger på de samme patienter.

Vores resultater på reelle data identificerede miRNA, hvis roller er tidligere valideret i cancer, såsom mir-210 og mir-296-5p, sammen med andre potentielt vigtige miRNA: MIR-1, MIR-154, mir-339-3p, MIR-539, MIR-561, mir-607 i glioblastom og mir- 143 *, mir-30c-2 *, mir-330-3p, mir-526b og mir-939 i prostatakræft.

Metoder

1 data forbehandling

En stor del af variationen i gen /miRNA udtryk målinger på tværs af forskellige tumorprøver skyldes de forskellige niveauer af forurening med raske celler. Typisk til en tumorvæv består af raske celler, hvis gen /miRNA ekspression signal vil forstyrre kræft signal til en anden grad for de forskellige prøver (patienter).

Vi bruger Isopure [13] for at udtrække det oprensede kræft signal til alle patienter. Det giver en bedre sammenhæng mellem kræftpatienter og mere præcise resultater for miRNA forudsigelse.

2 Normalized forskellen udtryk beregning

Efter at vi rense tumordata, vi tager log af genet målinger hos patienter og i kontrol. Så for hver patient vi beregne den normaliserede differentielle ekspression af et gen eller en miRNA ifølge [14] 🙁 1) hvor E og Y er henholdsvis den oprindelige og den normaliserede genekspression for patienten, n og m er henholdsvis antallet af raske kontroller og cancerpatienter, og er gennemsnittet og variansen af ​​udtrykket for dette gen i de raske kontroller. Udtrykket straffer de gener, der har høj varians mellem kræftpatienter. Det samme normalisering bruges til de miRNA data for at opnå differentieret miRNA udtryk for tumor vs sunde prøver, når vi bruger miRNA udtryk for validering.

3 Valg aktive miRNA

Vi afgør listen over aktive miRNA ved at vælge miRNA, der skulle have være aktiv for at observere den resulterende mRNA-ekspression ændre mønstret på tværs af genomet. Mere specifikt vi modellere hele genomet ændring i mRNA-ekspressionsniveauer som en sum af ukendte miRNA påvirkninger. De påvirkninger har ikke-nul-bidrag til alle miRNA, der er målrettet et givet gen. Vi bruger miRNA-til-gen-netværk for gen-target information og repræsentere det som en matrix. Vi opnåede netværket fra den europæiske Bioinformatics Institute (ww.ebi.ac.uk/enright-srv/microcosm/cgi-bin/targets/v5/download. Pl), leveres et sæt af target gener for hver miRNA (711 miRNA, 16799 gener og 470.000 kanter). Hvis der ikke er nogen mærkbar effekt af miRNA udtryk ændring på de mål ‘udtryk forandring, er den indflydelse, skønnes at være nul. De miRNA påvirkninger er estimeret på en per patient grundlag. Hvis den forudsagte miRNA indflydelse er forskellig fra nul og har samme fortegn tværs flertal af patienterne, vi formoder, at den givne miRNA er aktiv og kan være en vigtig faktor for en given sygdom. Rutediagrammet for vores fremgangsmåde er fanget i figur 1, og formuleringen er angivet nedenfor: (2)

Vi kan forudsige de aktive miRNA for hver enkelt patient, så undersøger vi sammenhængen af ​​de aktive miRNA tværs patienter.

matrix af microRNA-gen interaktioner er defineret som følger: (3)

de negative værdier i matricen indikerer, at miRNA normalt nedregulere genekspression. Da de oplysninger om, hvor meget en bestemt miRNA påvirker et givet gen ikke er tilgængelig, koefficienterne i opløsningen repræsenterer den “indflydelse” af miRNA på genekspressionsprofilen stedet miRNA differentiel ekspression (dvs. hvor meget af ændringen i genekspression af miRNA mål kan henføres til den pågældende miRNA). indikerer to ting: 1) om miRNA var aktiv (); og 2) på hvilken måde det påvirkede ekspressionen, dvs. om målgenerne er overudtrykt i cancervæv sammenlignet med normalt væv indikerer, at miRNA niveauer blev depleteret () eller under-udtrykt indikerer overekspression af den givne miRNA () .

Hvis indflydelse af en aktiv miRNA er af samme skilt med den givne patients observeret miRNA differential udtryk, vi siger, at miRNA forudsigelse er valideret af de miRNA målinger.

Da vi ønsker at undgå overfitting og tilskynde modeller med et lille antal aktive miRNA (enklere modeller med kun få aktive miRNA er lettere at fortolke og er biologisk mere relevant), bruger vi et elastisk net typen straf. Den resulterende objektive funktion at minimere er: (4) hvor og er det elastiske net parametre, er valget af parametre beskrevet nedenfor. Elastisk net straf vælges her, fordi det er i stand til at undgå nogle af de begrænsninger, vi kan støde hjælp af en simpel straf som i [10]. For eksempel, når vi har højt korrelerede variabler (miRNA med en masse mål i fælles) en straf vil være tilbøjelige til at vælge en variabel tilfældigt og ignorere de andre, mens elastisk net vil vælge alle relevante variable.

4 Valg af parametre (cross validering)

parametrene for det elastiske net definerer sparsomme løsningen: antallet af miRNA, der er forudsagt til at være aktivt drive generne differential udtryk. For at bestemme, vi brugte korset validering rammer foreslået i [12] (Gennemførelse fås i R glmnet pakke). Acceptable resultater opnås med svarende til den minimale prædiktive fejl under anvendelse af 10-fold krydsvalidering. At vælge den højeste, der svarer til en forudsigelse fejl af en standard fejl plus minimale prædiktive fejl kan føre til mere præcise resultater i simuleringer med lavere niveauer af støj. Men det giver ofte alt for sparsomme løsninger, når forudsigelsen fejl har høj varians og derfor bruger vi den minimale forudsigelse fejl konvention i disse tilfælde. I vores resultater, vi ordne det samme for alle patienter til at være den gennemsnitlige valgte værdi på tværs patienter. For valg af vi gentog hele forsøget (simulering og reelle data) med forskellige værdier (0,1, 0,25, 0,5), og ingen større forskel blev observeret for den endelige forventede miRNA, så vi satte vores til 0,25 for alle eksperimenter.

Resultater

1 Simuleringer og robusthed for støj

først testede vi evne vores metode til at vælge den korrekte delmængde af gen-ekspression-kørsel miRNA blandt mængden af ​​alle miRNA, og evnen til at bestemme de korrekte påvirkninger for de valgte miRNA (log af i (2)). At gøre det, valgte vi tilfældigt 30 miRNA til at være de aktive miRNA driver genekspression ændringer, og vi tildelt store positive eller negative gennemsnitlig udtryk værdier til dem (absolut værdi ensartet valgt fra og tegn opnås ved uvildig mønt tossing). Vi tildelt nul middelværdier til alle andre miRNA, der ikke simuleres som aktiv. Vi derefter simuleret 100 patienter med miRNA differential udtryk profiler centreret omkring disse middelværdier (Gauss-fordeling med given middelværdi og standardafvigelse 0,5). Som følge heraf opnår vi for hver patient et sæt miRNA differentiel ekspression målinger, hvor de 30 miRNA simuleret som aktiv vil konsekvent differentielt udtrykt og alle andre miRNA vil repræsenterer en baggrundsstøj. Endelig for hver patient, vi formere miRNA simulerede forskellen udtryk foranstaltninger af miRNA-genet interaktion netværk (matrix i ligning 2) for at opnå simulerede gen differentierede udtryk foranstaltninger (Dette trin vil blive senere omtalt som det gen forskellen udtryk simulering trin). Netværket bruges her er den samme som den, der er nævnt i afsnit 2.3, og produceret af den europæiske Bioinformatics Institute opfange interaktioner mellem 711 miRNA og 16799 gener, medianen miRNA har omkring 650 potentielle målgener.

Målet med dette eksperiment er at teste, om problemet kan løses på trods af, at de miRNA ofte har hundredvis af overlappende potentielle mål og at multiple miRNA kan have modsatrettede effekter på genekspressionsniveauer.

Vi løb tusind simuleringer generere data som beskrevet ovenfor. Vi fandt, at i de tilfælde, vi var i stand til at identificere den nøjagtige tilfældigt udvalgt delmængde af miRNA kørsel ændringer i genekspression og korrekt forudsige alle indflydelse tegn. I praksis betyder dette, at vores metode virker korrekt for en prøve i reelle data, hvor miRNA ‘forskellen udtryk er ansvarlig for en forholdsvis stor andel af den differentierede udtryk for mRNA. Det betyder også, at den konsekvens, hvor grupper af gener er over /under udtrykt et stærkt nok signal til påvisning af aktive miRNA selvom forskellige miRNA kan have modsatrettede virkninger på almindelige målgener.

Næste testede vi robustheden af vores metoder til de forskellige typer støj. Vi undersøgte effekten af ​​fire typer af støj, der kunne gøre dette problem sværere at løse:

Vi tegnede sig for strukturel støj (falsk negative interaktioner) i miRNA-genet netværk ved at tilføje tilfældige kanter før gen-differential udtryk simulering og derefter bruge den originale miRNA-gen netværk for forudsigelserne, hvilket resulterer nogle af miRNA indflydelse oplysninger, der anvendes til at generere data manglede på forudsigelsen scenen.

Vi tegnede sig for forkerte kanter (falske positive interaktioner) i miRNA-genet netværk ved at fjerne tilfældige kanter forud for gen differentiel ekspression simulering. Den oprindelige miRNA-gen netværk bruges stadig i forudsigelser.

Vi simulerede effekten af ​​uobserverede gen-gen interaktioner på gener udtryk (vi bruger protein-protein interaktion netværk).

Vi øge niveauet af støj i udtrykket data (ved at tilføje Gaussisk støj med 0-middelværdi og varians i forhold til de ekspressionsniveauerne) at tage højde for andre mekanismer ændrer gen-ekspression i kræft såsom kopi nummer variationer.

Figur 2 viser effekten af ​​modellering manglende /forkerte oplysninger i miRNA-genet netværk. Vi bemærker, at fremgangsmåden er i stand til ca. bestemmelse af det korrekte delmængde af miRNA selv når vi formoder af miRNA-genet annoterede interaktioner er forkert (vi fjerner af kanterne i netværket grafen under genekspression simulation trin), eller når vi formoder anmærkninger indeholder kun halvdelen af ​​de reelle miRNA-gen interaktioner (vi tilføjer kanter under genekspression simulering trin). Der er beviser for, at metoden er mere robust over for manglende oplysninger (Falsk negative kanter) end at urigtige oplysninger (Falsk positive kanter), hvilket betyder, at det er at foretrække at bruge konservative netværk i denne sammenhæng. Figur 3 viser robustheden af ​​metoden til høje niveauer af støj i genekspression. Genekspressionen støj parametriseret af den variable styre styrken af ​​støj: for hvert gen, er variansen af ​​den sidste type støj multipliceret med det gennemsnitlige niveau af ekspression (giver en Poisson typen varians). Endelig er det gen-gen interaktion støj kontrolleret af diffusion variabel som følger: (5)

(A) Følsomhed og (B) af metodens nøjagtighed at forudsige gen-ekspressions-kørsel miRNA når vi varierende proportioner forkerte kanter og mangler kanter i miRNA-Gene interaktioner netværk (slette kanter /indsætte nye kanter). Alle miRNA blev også forudsagt at have den rigtige retning af indflydelse (suppressor vs onkogen effekt).

(A) Følsomhed og (B) af metodens nøjagtighed at forudsige de gen-ekspression-kørsel miRNA når at variere niveauet af gen-interaktioner støj (via diffusion parameter) og intensiteten af ​​støjen i differentiel genekspression niveau (via variabel). Alle forudsagte miRNA har de korrekte indflydelse tegn.

Hvor er det gen forskellen ekspressionsvektoren, er det gen-gen direkte interaktion matrix og er matricen med anden ordens gen-gen interaktioner (anden ordens naboer i gen-gen interaktioner netværksgengivelsen den). Dette betyder en genekspression påvirker til en vis grad ekspressionen af ​​interagerende gener (direkte naboer) og i mindre grad de gener, der vekselvirker med de direkte naboer (anden ordens naboer). Genet-gen interaktion netværk vi brugte her er en delmængde af den kombinerede menneskelige netværk downloades fra Biogrid hjemmeside. Det fanger oplysninger for de 16,799 gener, som er til stede i vores miRNA-genet netværk og indeholder 85,590 kanter. Figur 3 viser, at evnen hos vores metode til at inddrive de sande miRNA er høj selv i nærvær af andre påvirkninger, såsom påvirker af interagerende gener, som vores model ikke udgør. Vores simulation resultater viser, at vores metode er robust over for forskellige former for støj.

2 Analyse af kræft data

2.1 Vurderingskriterier.

Ved hjælp af vores metode, vi forudsagde funktionelt relevante miRNA og deres indflydelse på genekspression fra den differentierede genekspression data for glioblastom multiforme og prostatakræft. Da vores forudsigelser er på en per-patient grundlag, vi vælger disse miRNA, der blev forudsagt aktiv () med samme retning indflydelse i mere end af patienterne. Disse miRNA er mere tilbøjelige til at afspejle en reel biologisk mekanisme fælles for kræft, da de konsekvent blev forudsagt som aktiv ved vores metode i et stort antal uafhængige patienter. Så vi ser på miRNA ‘udtryk målinger for de samme patienter. Hvis de aktive miRNA ‘differentierede udtryk har de samme tegn som deres forudsagte påvirkninger i mere end af patienterne, vi betragter dem valideret af miRNA-målinger.

I de miRNA differentieret udtryk data, nogle miRNA er sammenhængende over- eller under-udtrykt tværs patienter og nogle er ikke. Vi estimerer betydningen af ​​vores aktive miRNA indstilles ved beregning af p-værdi:. Sandsynligheden for at have så god eller bedre validering resultater end vores metode, hvis de miRNA forudsigelser var tilfældig

Vi beregner, at p-værdi ved først udvælgelse af en tilfældig delmængde af miRNA fra dataene, med den indstillede størrelse lig med antallet af miRNA forudsagt som aktiv ved vores metode. Derefter tildeler vi tilfældigt retning af indflydelse (tegn) til disse udvalgte miRNA. Endelig vurderer vi andelen af ​​disse tilfældige forudsigelser, der er valideret af miRNA-målinger ved hjælp af miRNA data, der svarer til de samme undersøgte patienter (en miRNA er valideret, hvis det er sammenhængende overudtrykt /under-udtryk, når dens tegn virkningen er henholdsvis positiv /negativ). Vi gentager dette eksperiment 10.000 gange. Den p-værdi er andelen af ​​tilfældige eksperimenter med højere validering end vores metode forudsigelse. En lille nok p-værdi indikerer, at de udvalgte af vores metode miRNA ikke var tilfældig, og at der sandsynligvis er en funktionel betydning i forhold til kræft angivet ved sammenhængen i miRNA /genekspression tværs patienter.

2.2 glioblastoma .

glioblastom genekspression data blev produceret af Broad Institute hjælp af Affymetrix HT_HG-U133A eksperimenterende design. Den indeholder 157 tumor tilfælde og 10 kontroller. Disse data sammen med miRNA udtryk vi bruger til validering findes på TCGA hjemmeside.

Efter oprensning af genekspression data (se afsnit 2.1), og omdanne den til normaliseret differentielle ekspression (se afsnit 2.2), vi forudsagde 11 miRNA aktive på tværs af mere end af patienterne. Ud af disse 11 miRNA forudsigelser, blev 7 valideret af den tilgængelige miRNA udtryk (verificeret i flere end af tilfældene) og 2 andre blev verificeret i mere end af tilfældene. Disse resultater svarer til en p-værdi på 0,0005 (se afsnit 3.2.1 for flere detaljer). Figur 4 viser miRNA sammenhængende forudsagt tværs patienter. Blandt de miRNA, der blev forudsagt og bekræftet, fandt vi mir-210, mir-339-3p, mir-561, mir-1, mir-154, mir-539, mir-607.

Pink er for overudtrykt miRNA og blå er for under-udtryk. Hver kolonne repræsenterer en patient og hver række et miRNA.

MIR-210 er inducerbar af hypoxi og er tidligere identificeret som en uafhængig markør for flere kræftformer (bryst [15], bugspytkirtel [16], leder og hals [17]). Det er også nævnt som en regulator for normoxisk genekspression, som er involveret i tumor initiering [18]. Vi forudsagde det som aktiv og bekræftede sin overekspression aktivitet under anvendelse af observerede data i glioblastom.

Vi har også forudsagt og bekræftede overekspression af mir-339-3p, og under-ekspressionen af ​​mir-1, mir-154, mir-539, mir-561 og mir-607. I øjeblikket er der ingen viden om de funktionelle roller disse miRNA i cancer. er behov for yderligere validering eksperimenter for en bedre forståelse af funktionen af ​​disse miRNA i glioblastom. mir-548b-5p, mir-548c-3p, mir-548c-5p blev også forudsagt i næsten alle patienter, selvom deres mål gen sæt var meget forskellige, men de var kun valideret i henholdsvis, af tilfældene.

2.3 prostatakræft.

prostatakræft data blev produceret af Memorial Sloan-Kettering cancer center (MSKCC) og er tilgængelig fra GEO under tiltrædelsen nummer GSE21032. Dataene indeholder oplysninger omkring 111 patienter og 28 kontroller, for hvilke både gen og miRNA udtryk data er tilgængelige.

Efter forbehandling af genekspression data for at opnå den rensede normaliserede forskellen udtryk og bruge vores metode til at forudsige sæt aktive miRNA for hver patient, valgte vi 10 miRNA: 7 af disse miRNA valideret ved anvendelse af de observerede miRNA udtryk data i mere end patienter, der bekræfter retningen af ​​miRNA indflydelse. En anden miRNA: mir-574-5p blev valideret i af patienterne. Disse resultater svarer til en statistisk signifikant p-værdi på.

Blandt de miRNA, der blev forudsagt og bekræftede, mir-210 blev overudtrykt på lignende måde som vores resultater i glioblastom data, og mir-296-5p ( overudtrykt) blev tidligere forbundet med apoptose af androgen-uafhængige prostatacancerceller [19] mir-143 * blev forudsagt og bekræftet af de observerede data, som under-udtryk i alle patienter, men ikke tidligere nævnt som en kræft markør i litteraturen . Tilsvarende mir-30c-2 *, mir-526b, mir-330-3p og mir-939 (alle forudsagt og bekræftet som overudtrykt) blev sporadisk nævnt som differentielt udtrykte miRNA i kræft litteratur, men med nogen fast eksperimentelle beviser til at karakterisere deres præcise roller i kræft endnu.

Endelig blev mir-569 og mir-607 forudsagt i størstedelen af ​​både prostatakræft og glioblastom patienterne, men blev kun valideret i glioblastom, fordi de ikke blev målt i prostatakræft data. Tilsvarende blev mir-574-5p forudsagt i begge datasæt, men dens målinger var utilgængelig for glioblastom patienter, derfor blev det kun bekræftet i prostatakræft.

Den samlede oversigt over vores resultater med højeste validering satser i prostatakræft og glioblastom er beskrevet i figur 4.

diskussion

i dette papir, vi præsenterede den første metode, der forudsiger aktive miRNA i kræft fra miRNA-gen regulatoriske netværk og mRNA udtryk data uden at henvise til miRNA udtryk selv. Vi bruger Elastisk net-legaliseret regression rammer for at gøre disse forudsigelser robust. Da mRNA udtryk data er ofte let tilgængelige, kan vores metode bruges til at styre analysen af ​​miRNA ved at prioritere dem til fremtidige eksperimenter. Vi valideret vores metode ved hjælp af både simulering og reelle data kombineret med miRNA udtryk målinger for at bekræfte vores resultater. Vores simuleringer har vist, at vores metode håndfast identificerer aktive miRNA og retningen af ​​deres indflydelse (undertrykkere eller onkogener) på de globale genekspression mønstre. Vores resultater på reelle data angivet potentielt vigtige miRNA i glioblastom og prostatacancer, hvoraf nogle allerede blev valideret i tidligere undersøgelser (The hypoxi relateret mir-210 og prostatacancer celle apoptose relateret mir-296-5p) og andre, for hvilke det nøjagtige rolle i cancer er endnu ikke fastslået.

Fremtidige forbedringer af vores metode er tæt knyttet til en bedre modellering af støj i data. For eksempel under hensyntagen til de ekspressionssystemer ændringer, der induceres af karyotypic variationer eller kopital variationer i cancer ville hjælpe isolere effekten af ​​funktionelt relevante miRNA, især hvis virkningen af ​​disse variationer på genekspression præcist forstået og modelleret i fremtiden. Bedre resultater kan også opnås, hvis vi har en solid model af genet-gen interaktioner, der kan ændre ekspression uafhængigt af miRNA.

Be the first to comment

Leave a Reply