PLoS ONE: Modul Network inferens fra en Cancer Gene Expression datasæt Identificerer miRNA Regulerede Modules

Abstrakt

Baggrund

MikroRNA’er (miRNA) er små RNA, som genkender og regulerer mRNA målgener. Flere linjer af beviser tyder på, at de er vigtige regulatorer af talrige kritiske funktioner i udvikling og sygdom, herunder kræft. Men at definere stedet og funktionen af ​​miRNA i komplekse regulerende netværk er ikke ligetil. Systemer tilgange, ligesom slutning af et modul netværk fra udtryk data, kan bidrage til at nå dette mål.

Metodologi /vigtigste resultater

I det sidste årti er der gjort store fremskridt i udviklingen af robuste og kraftfulde modul netværk inferensalgoritmer. I denne undersøgelse har vi analysere og vurdere eksperimentelt et modul netværk udledes både miRNA og mRNA-ekspression data, ved hjælp af vores nyligt udviklet modul netværk inferens algoritme baseret på probabilistiske optimeringsteknikker. Vi viser, at flere miRNA forudsiges som statistisk signifikante regulatorer til forskellige moduler af stramt co-udtrykte gener. En detaljeret analyse af tre af disse moduler viser, at den konkrete opgave af miRNA er funktionelt sammenhængende og understøttet af litteratur. Vi yderligere udarbejdet et sæt eksperimenter for at teste tildelingen af ​​MIR-200a som den øverste regulator af en lille modul af ni gener. Resultaterne antyder kraftigt, at MIR-200a regulerer modulet gener via transskriptionsfaktoren ZEB1. Interessant er dette modul sandsynligvis involveret i epitel homeostase og dens dysregulering kunne bidrage til malign proces i cancerceller.

Konklusioner /Signifikans

Vores resultater viser, at et stærkt modul netværk analyse af ekspression data kan tilvejebringe nye indsigter af miRNA funktion i vigtige cellulære processer. Sådan en beregningsmæssige tilgang, der starter fra udtryk data alene, kan være nyttigt i processen med at identificere funktionen af ​​miRNA ved at foreslå moduler af co-udtrykte gener, hvor de spiller en regulerende rolle. Som det fremgår af denne undersøgelse, kan disse moduler derefter testes eksperimentelt undersøge og forfine funktionen af ​​miRNA i de lovgivningsmæssige netværk

Henvisning:. Bonnet E, Tatari M, Joshi A, Michoel T, Marchal K , Berx G, et al. (2010) Modul Network inferens fra en Cancer Gene Expression datasæt Identificerer miRNA regulerede moduler. PLoS ONE 5 (4): e10162. doi: 10,1371 /journal.pone.0010162

Redaktør: Simon Rogers, University of Glasgow, England

Modtaget: 15. december, 2009; Accepteret: 22 marts 2010; Udgivet: 14 April, 2010

Copyright: © 2010 Bonnet et al. Dette er en åben adgang artiklen distribueres under betingelserne i Creative Commons Attribution License, som tillader ubegrænset brug, distribution og reproduktion i ethvert medie, forudsat den oprindelige forfatter og kilde krediteres

Finansiering:. Dette arbejde understøttes af en Innovatie dør Wetenschap en Technologie (IWT) tilskud til Strategisch BasisOnderzoek (SBO) Bioframe projekt, og ved et universitetscenter Type Pole (IUAP) tilskud til BioMaGNet projektet (Bioinformatik og modellering:. fra genomer til Networks, ref p6 /25). De finansieringskilder havde ingen rolle i studie design, dataopsamling og analyse, beslutning om at offentliggøre, eller forberedelse af manuskriptet

Konkurrerende interesser:.. Forfatterne har erklæret, at der ikke konkurrerende interesser findes

Introduktion

MikroRNA’er (miRNA) er små endogene regulatoriske RNA’er, der er til stede i en lang række eukaryote organismer. De er indarbejdet i et RNA induceret tavshed kompleks (RISC), der binder til steder med variabel komplementaritet i mål messenger RNA, udløser deres nedbrydning og /eller undertrykke deres oversættelse [1]. Bevis for deltagelse miRNA i cellevækst, celledifferentiering og kræft er i øjeblikket hober sig op. Næsten halvdelen af ​​den kommenterede menneskelige miRNA kort inden skrøbelige kromosomale regioner, som er områder, der er forbundet med forskellige typer af humane cancerformer. De seneste oplysninger tyder på, at miRNA samt de faktorer, der deltager i miRNA biogenese kan fungere som tumor undertrykkere og /eller onkogener [2]. Ifølge den seneste miRBase repository release [3], er der 700 humane modne miRNA sekvenser identificeret med eksperimentel understøttelse, mens nogle beregningsmæssige undersøgelser udvide denne liste til mere end 1000 [3], omtrent svarende til det antal transkriptionsfaktorer [4] . Computational og eksperimentelle undersøgelser har også forudsagt, at mellem 30% og 100% af det humane protein-kodende gener kan være under post-transkriptionel regulering af miRNA [5], [6]. Det er ikke svært at se, at selv ved at tage de mest konservative værdier, de lovgivningsmæssige netværk fremkaldt af et så stort antal af regulatorer og mål er potentielt meget store. Desuden har miRNA ikke handle i isolation, men er en del af et komplekst regulatorisk netværk, der involverer transkriptionsfaktorer, signal transducere og andre typer af regulatoriske molekyler [7]. Rekonstruktion og analysering af disse regulatoriske netværk er således en kompleks, men afgørende udfordring at tackle.

Findes

Forskellige algoritmer til at udlede regulerende net fra udtryk data [8], [9], [10]. En af de mest kraftfulde metoder, især for eukaryote organismer, antager en modulær opbygning af den underliggende tilsynsnetværk, hvor en gruppe co-udtrykte gener reguleres af et fælles sæt regulatorer (også kendt som den regulerende program) [10]. Den lovgivningsmæssige program bruger ekspressionsniveauerne af det sæt af regulatorer til at forudsige tilstanden-afhængige gennemsnitlig udtryk for de co-udtrykte gener. Således er moduler består af klynger af co-udtrykte gener sammen med deres tilknyttede regulatorer. Som en regulator kan være forbundet med mere end ét modul, ensemblet danner et modul netværk. Vi har for nylig udviklet en ny algoritme, der udvider det oprindelige modul netværk begrebet Segal og medarbejdere [10] ved hjælp af probabilistiske optimering teknikker, der muliggør prioritering af de statistisk set signifikante klynger af co-udtrykte gener og deres kandidat regulatorer [11], [12]. Den største fordel ved denne algoritme er, at det ekstraherer flere repræsentative centrum-lignende løsninger fra et ensemble af mulige statistiske modeller, for at undgå suboptimale løsninger. Ved at teste det på forskellige biologiske datasæt, har vi vist, at denne fremgangsmåde skaber mere sammenhængende moduler, og at tilsynsmyndighederne konsekvent tildelt et modul oftere understøttes af eksterne datakilder [11], [12].

i denne undersøgelse har vi tilpasset vores modul netværk algoritme til at tage som input en heterogen datasæt af både miRNA og messenger RNA (mRNA) udtryk data målt på de samme prøver. Flere miRNA tildeles som højt scorer kandidat regulatorer til flere moduler, sammen med kendte transkriptionsfaktorer eller signal transducere. En detaljeret analyse af tre moduler, hvor miRNA er udvalgt som højt scorer regulatorer viser, at denne opgave er meget sammenhængende med modulet funktion og er også støttet af forskellige eksterne datakilder. Vi har også valideret en af ​​disse moduler eksperimentelt, der viser, at overekspression eller hæmning af miRNA tildelt som en regulator markant ændrer udtryk for et udvalg af modul gener, hvilket bekræfter slutning af algoritmen. Disse resultater bekræfter modul netværk inferens som en robust og nyttig tilgang til at få mere præcise indsigt i miRNA-funktion.

Resultater

Inferens af et microRNA modul netværk fra udtryk data

Lemone algoritme, startende fra et udtryk datamatrix og en liste over indstillede regulatorer, vil producere et modul netværk sammensat af moduler af co-udtrykte gener og deres tilknyttede regulatorer. Algoritmen er også klyngedannelse betingelserne (kolonner) for hvert sæt af co-udtrykte gener, skaber tilstand klynger. Listen over regulatorer for en given modul er bestilt i henhold til deres individuelle score. Denne score tager kun højde for forskellen udtryk for regulatoren på tværs af de forskellige forskellige tilstand klynger, og ikke deres absolutte værdi. Denne måde, vi på samme tid kan vurdere og sammenligne mRNA og miRNA kandidat regulatorer, hjælp ekspressionsniveauerne af hver klasse af regulatorer. Som input til vores algoritme, brugte vi et datasæt bestående af udtryk data målt på 89 tumor og normale vævsprøver (som repræsenterer 11 tumor klasser) både for 11,833 messenger RNA og 124 miRNA [13]. I modsætning til tidligere forsøg [14], [15], [16], vores tilgang til integration af miRNA i netværket er ikke baseret på miRNA mål forudsigelse, eller en blanding mellem mål forudsigelse og udtryk data, men bygger udelukkende på udtryk data. Algoritmen genererede et sæt af 76 stramt co-udtrykt gen klynger, svarende til i alt 2.987 gener. Vi beregnede GO berigelse for alle moduler [17] og fandt i alt 44 klynger med mindst en GO kategori beriget (p 0,05), for i alt 589 berigede kategorier (den komplette liste af moduler og deres GO kategorier er tilgængelig som tabel S2). For tildeling af regulatorer, vi samlet en liste over 1.841 kandidat regulatorer baseret på deres GO annotation (enten transkriptionsfaktorer eller signal transducere), plus en liste over 124 miRNA. Efter tildeling af regulatorer tog vi en stringent cutoff svarende til de øverste 2% mest betydningsfulde forudsagte regulatoriske interaktioner (figur 1), opnåelse af et endeligt sæt 294 unikke regulatorer (den komplette liste af modul gener og regulatorer findes i tabel S1). Inden dette sæt blev ti miRNA udvalgt som regulatorer for i alt syv moduler (tabel 1). For at vurdere gyldigheden og relevansen af ​​den udledte modul netværk, vi her præsentere en detaljeret analyse af tre moduler, med vægt på de typiske træk ved miRNA medierede regulatoriske moduler. Disse moduler blev udvalgt på grundlag af deres iboende interesse, funktionel sammenhæng og det høje antal litteraturhenvisninger diskutere deres formodede funktion.

De histogrammer repræsenterer fordelingen af ​​randomiseret (grøn) og sand (gul) regulatorer scoringer for modul netværk. Pilen for tilfældige regulatorer repræsenterer den maksimale score for randomiseret regulatorer med værdien angivet i parentes. Pilen for de sande regulatorer repræsenterer cutoff score værdi, med den rå værdi angivet i parentes.

MIR-133 og miR-145 er tildelt som regulatorer af en glat muskel actomyosin modul

modul 29 er et lille modul består af fire gener og fem tildelte regulatorer (figur 2A). GO overrepræsenterede kategorier for dette modul er knyttet til glat muskel udvikling og actomyosin struktur (figur 2a og tabel S2). MYH11 koder en glat muskel myosin tung kæde familiemedlem. ACTG2 er en gamma 2 actin protein fundet i enteriske væv. De to andre gener i modulet (MYLK og CNN1) er velkendte regulatorer af actin-myosin interaktioner. MYLK er myosin letkæde-kinase, en dedikeret calcium-afhængig kinase, der phosphorylerer et specifikt sted på den regulerende lette kæde af myosin, øge dets aktivitet. MYLK er allestedsnærværende i alle voksne væv med de højeste mængder der er fundet i glat muskelvæv [18]. CNN1 (calponin) er et calcium-bindende protein, der inhiberer ATPase aktivitet af myosin i glat muskulatur. Den øverste regulator (PPP1R12B) valgt til dette modul er en myosinphosphatase underenhed. Myosin phosphatase er også et velkendt kerne regulator af actomyosin pathway, inhibering af myosin aktivitet [18]. Det andet høj scoring kandidat regulator er en miRNA, MIR-133, mens den tredje regulator er TGF-beta stimuleret klon-22 element 1 (TSC22D1) genet, der koder for et leucin zipper domæne-protein, et medlem af TGF-beta1 pathway som er involveret i reguleringen af ​​transskription. De sidste regulatorer er ANGPTL2, en vaskulær endotel vækstfaktor, og en anden miRNA, miR-145.

Gene udtryk værdier er farvekodede, der spænder fra mørk blå (lave udtryk niveauer) til lyse gule (høje ekspressionsniveauer) . I hver figur, søjler angiver en anden prøve. Den farvekodede bar i bunden af ​​grafen repræsenterer vævsoprindelse (se legenden), mens de grå firkanter lige under indikere, om prøven væv var normal (lysegrå) eller tumor (mørkegrå). Kandidatlandene regulatorer er ordnet efter faldende score værdi (fra top til bund). Prøverne er grupperet i blade af homogene udtryk værdier ifølge de hierarkiske træer angivet på toppen af ​​hver figur. De orange bokse i højre i figuren indikerer overrepræsenterede GO kategorier (p ≤ 0,05).

De to miRNA udvalgt som regulatorer for dette modul viser klart en tæt positivt korreleret udtryk mønster med modulet gener ( figur 2a). Da de fleste miRNA er blevet karakteriseret for så vidt negative regulatorer af genekspression, dette tyder på en indirekte regulering mellem miRNA og modul 29 gener. Nylige undersøgelser afslører flere sandsynlige kandidatgener, der kunne fungere som mellemliggende regulatorer mellem miRNA og modul 29 gener. MIR-133, udvalgt som den næstbedste regulator for dette modul (figur 2a), blev for nylig vist at være et centralt regulator til skeletmuskel udvikling og hjertemuskel hypertrofi [19], [20]. I disse studier har MIR-133 blevet vist at direkte regulere SRF transskriptionsfaktoren. SRF er anerkendt som en afgørende faktor for normale cytoskeletale og kontraktile celle aktiviteter og alle modul 29 gener (

MYH11

,

CNN1

,

ACTG2

,

MYLK

) vides at være direkte mål for SRF [21]. Disse litteratur resultater understøtter hypotesen om en indirekte regulerende forbindelse mellem miR-133a og modul 29 gener via SRF. De fleste undersøgelser af SRF aktivitet har hidtil præget denne faktor som en transkriptionel aktivator [21], men nogle resultater også foreslå, at SRF kan virke som en transskriptionsrepressor af sine mål gener [22], [23], [24]. SRF medieret gen repression er ikke klart, men det kan indebærer ansættelse af SRF af transkriptionelle lyddæmpere [23], [24]. Hvis vi hypotesen, at SRF undertrykker transskription af modul 29 gener, så lovgivningskæden miR-133 – SRF – modul 29 gener kan forklare den positive genekspression korrelation, der er observeret i figur 2a. De andre miRNA udvalgt som en regulator, blev MIR-145 nylig vist sig at være en vigtig regulator for glatte muskelceller skæbne [25]. Denne undersøgelse [25] viser desuden, at MIR-145 aktiverer en af ​​dens direkte mål, den myocardin (Myocd), som er en transkriptionsfaktor velkendt at aktivere glat muskel-genekspression ved interaktion med SRF [26]. Således har vi også en regulerende kæde miR-145 – Myocd – modul 29 gener, der kan forklare det mønster af udtryk observeret i figur 2a. Hverken SRF eller Myocd tildeles som regulatorer eller grupperet sammen med de andre modul 29 gener. Desværre myocardin-genet ikke var til stede i de microarrays anvendes til fremstilling af datasættene [13]. Profilen af ​​SRF transskription faktor synes at korrelere dårligt med ekspression af modul 29 gener i vores datasæt (Data-fil S1), der forklarer, hvorfor dette gen ikke kunne vælges som en regulator. Flere faktorer kan måske forklare, hvorfor profilen er divergent, ligesom post-translationelle modifikationer eller det faktum, at miRNA handle på post-transkriptionel niveau, muligvis forhindre regulerende effekt, der skal registreres (ved at undertrykke oversættelsen).

MiR -142s tildeles som regulatorer af et immunrespons modul

modul 18 er sammensat af seks gener (figur 2b), hvoraf fem koder immunoglobuliner svarer enten til den tunge kæde (IGHG4, IGHA2, IGHA1) eller til let kæde (IGKV1-5, IGLV3-21), mens IGLL1 er surrogat lette kæde, en kritisk komponent i den præ-B-celle-receptorkomplekset. Ikke overraskende fandt vi den kategori immunrespons GO overrepræsenteret for dette modul (figur 2b og tabel S2). Alle modulet gener er kendt for at være overvejende udtrykkes i udviklingslande og modne B-celler, afslører en sammenhængende modul [27]. Ni høje scoring regulatorer blev udvalgt til dette modul. Den øverste regulator er en homeobox-gen, HOXC5. Den HMGA1 genet er valgt som den næstbedste regulator for dette modul. Høj mobilitet gruppe proteiner (HMGA) regulere aktiviteten af ​​et bredt udvalg af gener ved at ændre DNA konformation af deres målgener. HMGA1 er kendt at co-aktivere transkription i B-celler og at være vigtige for B-celler udvikling [28]. Den tredje og fjerde kandidat regulatorer er to miRNA forarbejdet fra samme forløber, miR-142-5p og miR-142-3p. HLA-DRB1-genet tilhører HLA klasse II beta kæde paraloger. Det vides at spille en central rolle i immunsystemet ved at præsentere peptider afledt af ekstracellulære proteiner [29]. CCL5 er en kemotaktisk cytokin spille en aktiv rolle i at rekruttere leukocytter til inflammatoriske steder [30]. AXL er en receptortyrosinkinase, der omdanne i fibroblast og hæmatopoietiske celler, og er involveret i mesenkymal udvikling [31]. CXCL14 er en lille cytokin tilhører CXC kemokin-familien. Dette gen er kemotaktisk for monocytter og kan aktivere disse celler i nærvær af en inflammatorisk mediator [32]. CXCL14 ekspression formindskes eller fraværende fra de fleste cancerceller [33]. Dette modul er sandsynligvis knyttet til et immunrespons udløst af forskellige tumor stater. Sådanne persistente pro-tumor immunrespons vides at potensere primær tumor udvikling og malign progression.

MIR-142s er fortrinsvis udtrykkes i hæmatopoietiske væv og deres ekspression reguleres under hæmatopoiese, hvilket antyder en rolle i immune celler differentiering [34 ]. Transkriptionsfaktoren TCF12 forudsiges som mål for MIR-142-3p [35]. I en tidligere undersøgelse blev en kombineret dosis af de faktorer E2A, E2-2 og TCF12 vist at være nødvendig for normal B-celle udvikling. Mere præcist TCF12 er vigtigt for dannelsen af ​​normale antal pro-B-celler [36]. Fordi modul 18 gener udtrykkes i udviklingen B-celler, kan reguleringen af ​​TCF12 af MIR-142-3p være vigtig for denne proces. Desuden fandt vi bevaret bindende motiver til TCF12 for de fleste modul 18 gener (data fil S1), hvilket indikerer, at denne transskription faktor kan være vigtigt for deres regulering. Ligesom for modul 29 og SRF, udtrykket profil TCF12 er meget divergerende fra udtrykket profiler af modul 18 gener, forklarer hvorfor dette gen ikke blev valgt som modul gen eller regulator (data ikke vist).

Mir- 200A er en vigtig regulator af et modul involveret i epiteliale homeostase

modul 25 er sammensat af ni gener (figur 2C). SCNN1A (også kendt som ENaC) er den subunit alpha af amilorid følsomme epitel natriumkanal udtrykt i mange epitelvæv [37]. PRSS8 (prostasin) er et trypsinogen, som regulerer aktiviteten af ​​epitel natriumkanalen [38]. FDXY3 er en lille membran protein, der er stærkt transkriberes i væv, såsom uterus, mave og tyktarm, og kan fungere som en Na /K-kanal regulator [39]. TACSTD1, tumor-associerede calcium signal transducer 1, fungerer som en calcium-uafhængig celleadhæsionsmolekyle [40]. Andre gener som ATAD4 eller TMEM63A er trans-membranproteiner med ukendt funktion. RAB25 er et lille GTP-bindende protein. RAB proteiner er blevet involveret i reguleringen af ​​vesikeltrafik [41]. Modulet top regulator er miR-200a. Hvad angår de andre regulatorer, PPP1R1B er et phosphoprotein reguleret af dopamin og cAMP, og er en inhibitor af proteinphosphatase 1. Udover sin velkendte rolle i det centrale nervesystem, er det stærkt udtrykkes i en række af epitelvæv, hvor det kan spille en rolle i epitel signalering og tumorigenese [42]. GPR30 er en trans-membran G-protein koblet østrogenreceptor [43], mens PTGER3 er en G-protein-koblet prostaglandin E2 receptor, som er involveret i forskellige fysiologiske processer og blev vist at påvirke intracellulære koncentrationer af Ca ++ og cAMP [43]. ZNF157 er et zinkfinger-protein med ukendt funktion, mens GNB3 og GNG5 er G-proteiner subunits involveret i signaltransduktion. Fra funktioner af disse gener, kan vi konkludere, at de fleste af modulet 25 gener og regulatorer sandsynligvis involveret i epitel homeostase, selv om vi ikke finde en bestemt GO kategori beriget til dette modul. Det er også værd at bemærke, at flere af disse gener er relateret til tumor progression [40], [41], [44].

MIR-200a, der blev valgt som den bedste kandidat regulator til modul 25, er et medlem af en miRNA familie på fem nært beslægtede miRNA (miR-200a, miR-200 mia, miR-200C, miR-141 og miR-429). Nylige publikationer viser epitelial-ekspression af miR-200a og miR-200b [45], [46]. Vi designede et sæt eksperimenter at validere rolle MIR-200a som en regulator af ekspressionen af ​​gener i modul 25. MIR-200A blev indført i en human dedifferentierede epithelial brystcancer cellelinje MDA-MB-231, kendt af udtrykke aberrerende lave niveauer af mIR-200a. Udtrykket af seks gener (

RAB25

,

IRF6, SCNN1A, PRSS8, ATAD4

,

TACSTD1

) ud af ni tilhører modul 25 blev overvåget ved hjælp af RT-qPCR ( figur 3). Uden undtagelse, de seks overvågede gener viser en klar opregulering på eksogen udtryk for miR-200a (figur 3a). Den omvendte eksperiment, inhibering af nogle medlemmer af MIR-200 familie (MIR-200a, b, c) i MDA-MB-231-celler under anvendelse antagomirs, resulterede i signifikant nedregulering af fire ud af fem testede gener, (

SCNN1A

er ikke signifikant nedreguleret,

ATAD4

ikke udtrykkes i normale forhold i denne cellelinie) (figur 3b). Disse resultater viser klart, at MIR-200a er en central regulator af modul 25, sandsynligvis med andre medlemmer af MIR-200-familien.

(a) Real time kvantitativ PCR (RT qPCR) analyse af ekspressionen af modul 25 gener

RAB25

,

IRF6, SCNN1A

,

PRSS8

,

ATAD4 og TACSTD1

og ved overekspression af miR-200a i MDA- MD-231-celler (gennemsnit ± standardafvigelse). Y-aksen repræsenterer den relative mRNA-ekspression værdi. MIR-1 blev anvendt som kontrol (Ctrl), da det ikke vides at målrette hvilket som helst af de overvågede gener (b) RT qPCR analyse af den relative ekspression af generne

RAB25

,

IRF6

,

SCNN1A

,

PRSS8

og

TACSTD1

i MDA-MB-231 celler infiltreret med miR-200a, b, c antagomirs. Y-aksen repræsenterer den relative mRNA-ekspression værdi (middelværdi ± standardafvigelse). MIR-1 blev anvendt som kontrol (Ctrl) (c), RT qPCR analyse af de relative ekspressionsniveauer i modul 25 gener

RAB25, IRF6, SCNN1A, PRSS8, ATAD4, TACSTD1, TMEM63A

FXYD3

i MDA-MB-231 celler, hvor

ZEB1

er slået ned. Den første barplot (sort) viser effektiv undertrykkelse af

ZEB1

niveauer ved transfektion med

ZEB1

specifikke siRNA. Par = forældrenes cellekultur, Mock = mock transfektion, si-ZEB1 = transfektion med ZEB1 specifikke siRNA.

I dette modul, vi observerer igen en klar positiv sammenhæng mønster mellem miR-200a og modulet gener udtryk, hvilket antyder en indirekte regulerende kredsløb mellem mIR-200a og modul 25 gener (figur 2C og fig 3a og 3b). Nyere eksperimentelle arbejde viste, at miR-200 familiemedlemmer direkte målrette transskription faktorer ZEB1 og ZEB2 [47], [48], [49]. Disse transskriptionsfaktorer er kendt som vigtige transkriptionelle repressorer af epitheldifferentiering orkestrere epitelial mesenkymale overgang (EMT) [50]. EMT er en proces, der driver epitelceller fra en polariseret fænotype til en yderst motile, non polariseret mesenkymale fænotype og vides at forekomme i epiteltumorer giver anledning til meget maligne cancerceller. De ZEB transkriptionsfaktorer har været funktionelt relateret til medlemmer af miR-200 familie via en dobbelt negativ feedback loop og dermed fremme EMT og kræft invasion [47], [51], [52]. Vi fandt bevaret ZEB bindende motiver for flere modul 25 gener (data fil S1), tyder på, at ZEB faktorer kunne være de mellemliggende regulatorer mellem miR-200 og modul 25 gener. For at teste denne hypotese, vi nedreguleres den ZEB1 transkriptionsfaktoren i MDA-MD-231-celler med en specifik siRNA under overvågning af ekspressionen af ​​otte modul 25 gener (figur 3C). Alle generne viser en stærk opregulering mønster, med undtagelse af genet RAB25 (figur 3c). Disse resultater viser, at ZEB1 faktor er afgørende for reguleringen af ​​modul 25 gener. Tilsammen vores eksperimentelle resultater (figur 3) tyder stærkt eksistensen af ​​en regulerende kæde mellem miR-200 og modul 25 gener via ZEB1 transskription faktor (figur 4). Som både miR-200 og ZEB1 spiller en vigtig rolle i EMT [47], [48], [49], [51], [52] vi hypotesen, at modul 25 undertrykkelse kan bidrage til den maligne EMT-processen i kræftceller.

MIR-200-gener undertrykke ZEB faktorer, som igen undertrykke ekspressionen af ​​modulet 25 gener. Den lysegule angiver gener tildelt som lovgivere, den lysegrønne indikerer modul gener, mens lys orange angiver gener ikke er tildelt som lovgivere, men understøttet af litteratur (indirekte regulering). Denne reguleringsmodel understøtte den positive korrelation af ekspressionsmønstre mellem mir-200a og modul 25 gener.

Diskussion

miRNA er dukket ganske nylig som et nyt og vigtigt lag af regulering. De fleste af de undersøgelser hidtil har fokuseret på deres identifikation og på påvisning af deres mål. Adskillige eksperimentelle undersøgelser har vist, at i det mindste nogle af dem spille nøgleroller i forskellige udviklingsmæssige og cellulære veje. Integration miRNA i regulatoriske netværk er derfor af fundamental betydning og bør ideelt foretages under hensyntagen til de andre typer af regulatoriske molekyler. Hidtil har et par undersøgelser foreslået en beregningsmæssige strategi til at udlede miRNA medierede modul net [14], [15], [16]. Disse blev primært baseret på miRNA mål forudsigelse, eller på en kombination af mål forudsigelse og udtryk data. Vi har anvendt en robust og fordomsfri modul netværk inferens algoritme til en kræft-relaterede udtryk datasæt af både mRNA og miRNA. I vores tilgang, blev miRNA betragtet som kandidat regulatorer, sammen med andre typer af regulatorer, som transkriptionsfaktorer og signal transducere. Selv efter at anvende en stringent cutoff blev flere miRNA bevares som høj scoring, statistisk signifikant kandidat regulatorer til forskellige moduler. Gennem en grundig analyse af tre af disse moduler, viste vi, at tildelingen af ​​specifikke miRNA som regulatorer understøttes af forskellige eksterne kilder og er funktionelt sammenhængende. Desuden kunne vi vise eksperimentelt, at en miRNA, tildeles som den bedste regulator, er faktisk en vigtig regulator for modulets gener udtryk. Antallet af miRNA tildelt i denne undersøgelse (10) kan forekomme ret beskedne, men dette antal må vurderes i forhold til det samlede antal miRNA, for hvilke ekspression blev målt i prøverne (124). Forholdet tildelt pr samlede antal miRNA er lig med 8%, mens det samme forhold er 15% for de ensemble transkriptionsfaktorer plus signaltransducere (284/1841). De to-forhold værdier er sammenlignelige og derfor kan vi med rimelighed forvente et højere antal miRNA tildelt, når en øget dækning af miRNome udtryk landskab vil være tilgængelige.

Men ligesom med andre lignende metoder, pleje skal være taget for fortolkningen af ​​den udledte reguleringsmodel. Især ville korrelation af genekspression ikke altid indikerer en direkte interaktion. Ja, for de tre moduler, vi har undersøgt i detaljer, har vi fundet en indirekte regulering pathway mellem regulatoren og modulet generne. Desuden blev ingen af ​​disse indirekte regulator gener tildelt af algoritmen i reguleringen program eller endda grupperet sammen med modulet gener. Som vi kunne vise for modul 29 og SRF transskription faktor, årsagen er, fordi de indirekte regulatorer udtryk profil adskiller sig væsentligt fra de modulet gener. Forskellige årsager kan forklare denne forskel, for eksempel reguleringen kan ske ved post-transkriptionel niveau, eller måske være resultatet af post-translationelle modifikationer. Indirekte regulatorer kan naturligvis komplicere fortolkningen af ​​resultaterne, men de kan forventes, især i højere eukaryote organismer hvor regulatoriske netværk forventes at være mere kompleks [53].

Tilsammen vores resultater viser, at hidtil ukendte indsigt kan opnås fra et robust modul netværk analyse af miRNA og mRNA-ekspression data og støtte den opfattelse, at i det mindste nogle miRNA har vigtige regulatoriske roller i vigtige cellulære processer. Vores tilgang har også den fordel, at en direkte visning af post-transkriptionelle modifikationer gennem integration af miRNA, hvor mRNA-ekspression alene måske ikke være nok til at afsløre eksistensen af ​​regulatoriske interaktioner. Alle tre moduler, som vi gjorde en detaljeret analyse i denne undersøgelse har hver et sammenhængende sæt af gener, der er involveret i den samme proces og funktion. ved at forbinde miRNA til sammenhængende moduler, Desuden mener vi, at denne tilgang kan bidrage til at belyse miRNA funktion og kunne effektivt køre eksperimentelt arbejde hen imod at identificere vigtige regulatoriske komponenter i forskellige processer. Med den hurtige spredning af forskellige teknikker til at måle med stor nøjagtighed ekspressionsniveauerne for hundreder af miRNA, og den samtidige tilgængelighed af mRNA-ekspression data, vil det være meget tiltrækkende at anvende beregningsmæssige strategier som den, vi beskriver her at udvide vores viden på globale regulatoriske netværk.

Materialer og metoder

Expression datasæt

Vi brugte et normaliserede kræft udtryk datasæt tidligere offentliggjorte [13]. Udførte vi yderligere filtrering skridt til at forbedre kvaliteten af ​​den indstillede datainput. Probesets med ingen kendte Ensembl gen identifikatorer blev kasseret, samt miRNA sekvenser, der ikke blev kommenteret som menneskelige miRNA i den seneste miRBase frigivelse [3]. Den endelige data matrix indeholdt 11,833 gener og 124 miRNA, for hvilken ekspression blev målt på tværs 89 prøver, der dækker 11 forskellige tumor klasser.

Modul netværk inferens

Vi brugte Lemone algoritme til at udlede modulet netværk [11], [12], [54]. I et første trin, er algoritmen søger efter en partition af gener i klynger af co-udtrykte gener. I et andet trin, algoritmen definerer en regulatorisk program (et sæt af regulator gener) for hver klynge.

Be the first to comment

Leave a Reply