PLoS ONE: Tab af Connectivity i Cancer Co-Expression Networks

Abstrakt

Differential genekspression profilering undersøgelser har ført til identifikation af flere sygdom biomarkører. de onkogene ændringer i kodende regioner, kan dog ændre gen funktioner uden skader deres egne udtryk profiler. Desuden kan post-translationelle modifikationer ændre aktiviteten af ​​det kodede protein uden ændring af ekspressionsniveauer af det kodende gen, men fremkalde ændringer af ekspressionsniveauer af de regulerede gener. Disse overvejelser motivere studiet af omfortrådning af netværk co-udtrykte gener som følge af de førnævnte ændringer med henblik på at supplere informativt indhold af differentieret udtryk. Vi analyserede 339 mRNAomes af fem forskellige typer kræft at finde enkelte gener, der præsenteres co-ekspressionsmønstre stærkt differentierede mellem normale og tumor fænotyper. Vores analyse af differentielt forbundne gener indikerer tab af tilslutningsmuligheder som en fælles topologiske træk af kræftnetværk, og afslører nye kandidat cancer gener. Desuden er vores integrerede tilgang, der kombinerer den differentielle ekspression sammen med forskellen tilslutningsmuligheder forbedrer klassiske berigelse pathway analyse giver nye indsigter om formodede kræft gen biosystemer ikke stadig fuldt undersøgt

Henvisning:. Anglani R, Creanza TM, Liuzzi VC , Piepoli A, Panza A, Andriulli A, et al. (2014) Tab af Connectivity i Cancer Co-Expression Networks. PLoS ONE 9 (1): e87075. doi: 10,1371 /journal.pone.0087075

Redaktør: Filippo Castiglione, National Research Council of Italy (CNR), Italien

Modtaget: September 11, 2013; Accepteret: 18. december 2013; Udgivet: 28 Januar 2014

Copyright: © 2014 Anglani et al. Dette er en åben adgang artiklen distribueres under betingelserne i Creative Commons Attribution License, som tillader ubegrænset brug, distribution og reproduktion i ethvert medie, forudsat den oprindelige forfatter og kilde krediteres

Finansiering:. Dette arbejde blev delvist støttet af tilskud fra Regione Puglia PO FESR 2007–2013 Progetto BISIMANE (Cod. n. 44), Progetto FIRB RBAP11B2SX, Progetto di Ricerca Finalizzata 2009 RF /2009 til 1.471.624. De finansieringskilder havde ingen rolle i studie design, indsamling og analyse af data, beslutning om at offentliggøre, eller forberedelse af manuskriptet

Konkurrerende interesser:.. Forfatterne har erklæret, at der ikke findes konkurrerende interesser

Introduktion

i de seneste år har kræftforskning oplevet bemærkelsesværdige fremskridt, som de nye systembiologi tilgange efter udviklingen af ​​avanceret teknologi koblet til nye statistiske teknikker [1], [2]. En af de mest anvendte metoder til undersøgelse af genetiske mønstre i cancervæv er genekspression profilering via RNAseq eller microarray analyse, der giver målinger af mRNA niveauer i hele genetiske landskab i en given biologisk prøve. Generelt er syge væv sammenlignet med normale kontroller for at identificere grupper af gener, hvis ekspression niveauer er signifikant forskellige i de to fænotype betingelser og dermed associeret med sygdomme [3], [4]. Denne population af gener, defineret som differentielt udtrykt (DE), anses normalt lavet af kandidat biomarkører for indtræden og progression af patologien og er blevet bredt undersøgt til identifikation af sygdomsrelaterede veje [5], [6].

Selvom differentierede udtryk undersøgelser har været bredt og anvendt med succes i mange tilgange, de præsenterer alvorlige mangler i efterforskningen af ​​komplekse patologier. En afgørende eksempel er repræsenteret ved carcinogenese som er en multi-trins proces, der involverer den gradvise ophobning af genetiske mutationer, som kan forekomme ligegyldigt i regulatoriske eller kodende lokaliteter af gener. Som en kendsgerning, kan den kodende region ændringer og de post-translationelle modifikationer (fx fosforylering, acylering, methylering, etc.) modificere proteinaktivitet uden at påvirke genekspression niveau, men ændring af interaktionen mønster med andre gener. [7 ]. For eksempel kunne missense og sense-mutationer på de arealer, der koder for proteinbindende regioner forstyrre flere grundlæggende protein-protein-interaktioner uden at ændre ekspressionsniveauer. Et velkendt tilfælde af denne slags ændringer i cancere involverer adenomatøs polypose Coli (APC), som er den mest almindelige muterede gen i kolorektalcancer [8], [9]. Den hyppigste APC mutationen fører til et trunkeret protein, som mangler bindingsstederne for nogle interagerende proteiner [10]. Derfor kunne en analyse baseret entydigt på differentierede udtryk undersøgelser være ineffektiv for fremhævelse af nogle vigtige genetiske bilister i neoplastiske læsioner. På den anden side, en anden vigtig ulempe ved den differentielle ekspression Analysen består i, at generne bliver behandlet individuelt, således at interaktioner ikke tages i betragtning. Faktisk er det almindeligt accepteret, at forståelsen af ​​mekanismer bag udviklingen af ​​genetiske sygdomme som kræft skal overveje bidrag interaktioner blandt gener [11]. Endvidere er det vigtigt at undersøge, hvordan disse interaktioner ændrer i sygdomsfænotypen, i forhold til vildtype-tilstand [12] – [14], da det er velkendt, at ikke alle gener er aktive i begge tilstande. For eksempel, [15] viste, at interaktion mønstre af transkriptionsfaktorer som reaktion på forskellige perturbationer kan ændres forårsager en omfortrådning af netværket.

I forbindelse med genekspression profilering, studiet af statistisk signifikante korrelationer mellem genpar kan afsløre formodede interaktioner, afhængigheder eller koordinerede aktiviteter af gener i en given biologisk tilstand. Især kan netværk baseret på genekspression parvise korrelationer repræsenterer direkte gen regler og omfatter også gener, der er indirekte forbundet gennem regulatoriske veje [16]. Da transskription er resultatet af en kompleks multi-level proces, en afledt korrelation netværk tager hensyn til ikke blot transskription faktor-DNA interaktioner, men også de faktorer, der biokemisk regulerer systemerne. Derfor er det muligt at gætte på, at ændringer af interaktioner mellem gener under forskellige eksperimentelle betingelser vil reflektere over forskellige korrelation mønster udgange. I dette billede, seneste tiltag med fokus på identifikation af ændringer i gen-co-ekspression strukturer (kvantificeret ved parvise korrelationer) mellem raske og syge væv til formål at give bedre indsigt i mekanismer ændrede regulering og indikerer kritiske lidelse driver gener [7 ]. Især har differentieret co-ekspression netværk analyser været almindeligt anvendt og har vist vigtige beviser til undersøgelse af kræft gen net [17] -. [19] og identifikation af muterede, men ikke differentielt udtrykte gener [20]

ideen bag den foreliggende undersøgelse er, at modifikationer af genet tilslutning i biologiske netværk er forbundet til væsentlige fænotypiske ændringer. En opmuntrende bevis er rapporteret i [15], hvor forfatterne fandt, at forbinde genregulering i

Saccharomyces cerevisiae

undergår dramatiske ændringer i cellulære processer. Faktisk viste de, at mange transkriptionsfaktorer til stede kun et lille antal af interaktioner tilbageholdt på tværs af de forskellige forhold, mens de resterende forbindelser er kun aktiv i specifikke betingelser for systemet.

I den foreliggende undersøgelse, viser vi, at den netværksforbindelse kan fornuftigt ændre i neoplastiske væv. Som konnektivitet foranstaltning af et gen vi anvendte graden fordi det er et grundlæggende observerbar i grafteori og har en klar biologisk fortolkning [15]. Især vi studerede gen interaktion ændringer, der opstå i kræft væv med hensyn til raske kontrolpersoner ved at sammenligne de specifikke afledte co-ekspression netværk. Til dette formål undersøgte vi på de enkelte noder, der præsenterede en forbindelse struktur stærkt modificeret mellem to biologiske fænotyper. Ikke-parametriske tilfældige permutation tests blev vedtaget for at fremhæve dem, gen med grad variationer forbundet til patologi og ikke skyldes tilfældigheder.

Vi fandt, at et tab af tilslutningsmuligheder i kræftnetværk med hensyn til normale dem er en fælles træk blandt de forskellige former for kræft. Dernæst fandt vi, at en undersøgelse af forskellen tilslutningsmuligheder kan indikere tumor-relaterede gener ikke afsløret af differential udtryk analyser. Endelig viste vi, hvordan integrationen af ​​differentieret udtryk med differential-forbindelse, kan forbedre den klassiske berigelse analyse afslører veje forbundet til kræft kendetegnende og giver indsigt om nye formodede biomarkør-systemer.

Resultater

Vi analyserede udtryk niveauer af menneskelige 339 mRNAomes herunder normale og neoplastiske vævsprøver relateret til fem genekspression datasæt distinkte neoplasier fra GEO og ArrayExpress: kolorektal, lunge-, mave, bugspytkirtel og livmoderhalskræft. Alle prøver blev profileret med Affymetrix teknologier og forbehandles med Affymetrix Expression Console-softwaren (se Materialer og Metoder).

Tab af tilslutningsmuligheder i kræftnetværk

Vi undersøgte de topologiske egenskaber af co-ekspression netværk i de raske og syge forhold i form af gen-forbindelse eller grad (se Materialer og metoder). Vi udledte de normale og cancer co-ekspression netværk baseret på Spearman korrelationskoefficienter: to gener var forbundet med en kant, hvis korrelationskoefficienten mellem deres udtryk profiler var ikke-nul på signifikansniveau 5% med en Benjamini-Hochberg [21] falsk opdagelse sats (FDR) under 20% (se figur 1 og Materiale og metoder).

Sund tilstand til venstre og sygdomsramte væv til højre. Grønne links forbliver uændret i de to fænotyper. Røde forbindelser er tab fra sundt at kræft netværk. Blu kanter er nye forbindelser i kræftvæv.

Som forventet topologien af ​​de afledte gen netværk viste sig at fraviges en tilfældig model (se figur 2A-E og Materiale og metoder), idet deres grad distributioner resulterede forskellige fra de for de tilsvarende tilfældige grafer med samme gennemsnitlige grad og det samme antal knudepunkter (, Kolmogorov-Smirnov test). Desuden kræft og normale netværk var præget af noder med meget varierende grader, fra gener med få forbindelser til ‘hubs’ med tusindvis af links (Figur 2A-F).

(AE) fordelingsfunktion af gen grad. (F) Boxplots af genet grader for de fem væv i de to betingelser. Rød farve refererer til cancerfænotypen. Blå farve refererer til den normale fænotype. Den mediane grad i kræft er lavere end i normale forhold

På den anden side, sammenligningen mellem normale og kræftnetværk bragt ud en bemærkelsesværdig træk fælles for de forskellige tumor typer:. Co-ekspression gen-netværk af neoplastiske væv udgør en reduceret tilslutning i forhold til sund tilstand (se figur 2F). Faktisk viste en Kolmogorov-Smirnov test, at alle kræftnetværk er kendetegnet ved et gen grad, der er stokastisk faldt i forhold til de tilsvarende normale grafer ().

Gene differential tilslutning og dens samspil med den differentielle ekspression

de væsentlige ændringer af netværksforbindelse i kræft viser, at gener med stærkt ændret forbindelser kan have en rolle i cancer biologi og motivere en undersøgelse af en forbindelse baseret scoring foranstaltning til identifikation af formodede kræft drivere. Til dette formål for hvert gen, evaluerede vi den differentielle konnektivitet (DC) som forskellen af ​​gen grader i de to fænotypiske betingelser, og vi vurderede sin statistisk signifikans med en p-værdi og en falsk opdagelse sats. Desuden studerede vi udførelsen af ​​denne foranstaltning og dens relative værdi i forhold til den differentielle ekspression (DE) i form af p-værdi og FDR (se Materialer og Metoder).

En analyse af FDR som en funktion af p-værdier for begge differentierende foranstaltninger viste, at for p-værdier mindre end 0,01, der var en del af falske opdagelser under 22% for DC og 10% for DE (figur 3A-E). Det betyder, at for begge foranstaltninger, antallet af de resulterende differentierede funktioner er betydeligt højere end det kunne forventes ved en tilfældighed, selv om FDR af DC er større end FDR i DE for hver p-værdier.

Red farve repræsenterer de differentielt udtrykte gener (dE). Blå farve repræsenterer de differentielt forbundne gener (DC).

Som en yderligere undersøgelse, analyserede vi samspillet mellem tabet tilslutningsmuligheder og den differentielle ekspression og differentieret tilslutning p-værdier. Vi fandt, at jo mindre er p-værdi på DC jo større er antallet af tabte forbindelser for alle datasæt (, Spearman korrelation, se figur 4A-E). Dette resultat bekræfter hypotesen om, at en væsentlig differentieret forbindelse svarer mere sandsynligt, at et tab af links fra normal til kræft væv. Analogt fandt vi en positiv korrelation mellem forstærkningen af ​​graden og den differentielle ekspression p-værdi i enhver sygdom med undtagelse af tyktarmskræft, for hvilken der er en negativ korrelation (Figur 4F). Dette indikerer, at differentielt udtrykte gener er mere sandsynligt kendetegnet ved en reduceret grad i cancer, undtagen i tyktarmen sag, som de differentielt udtrykte gener har tendens til at erhverve forbindelser i tumorvævet (figurerne 4A-F).

( AE) (øvre panel) Gene differential tilslutning p-værdi som funktion af graden ratio. (Nedre panel), Gene differentiel ekspression p-værdi som funktion af graden ratio. Hvert punkt repræsenterer et gen og tendensen linje er den mindste kvadraters linie. (F) korrelationer mellem den differentielle ekspression p-værdi, og forstærkningen af ​​tilslutninger. P-værdier på søjlerne refererer til højre hale tests for de positive sammenhænge, ​​og venstre hale tests for de negative sammenhænge. (G) Korrelationer mellem differentierede udtryk p-værdier og forskellen tilslutning p-værdier.

Differential tilslutningsmuligheder højdepunkter kendte kræft gener

For at undersøge, om forskellen tilslutningsmuligheder kan finger mod tumor -specifikke gener og udkonkurrerer den differentielle ekspression analyse, vi indsamlet kendt kræft gen lister fra litteratur og kurateret databaser skal testes for berigelse. Derfor er valget af en bestemt tærskel betydning for DC og DE p-værdier viste sig at være nødvendigt. Derfor for hver kræft datasæt, vi byggede to lister indsamle gener med betydelig forskellen udtryk og tilslutningsmuligheder på samme niveau på 0,05, (se tabel S1).

Undersøgelsen af ​​kolorektal cancer datasættet resulteret i 1870 differentielt forbundne gener og 6792 differentielt udtrykte gener på en række 17400 analyseret gener. Befolkningerne viste sig at være selvstændig med (figur 4G). DC-genet liste er beriget i tumorsuppressorgener og onkogener almindeligvis er forbundet med kolorektal cancer som rapporteret i arbejdet i [22] (,,) hvor er størrelsen af ​​listen over kendte cancer-gener, er antallet af DC-gener i listen og er den Fishers eksakte test p-værdi. Vedtagelsen af ​​en strengere niveau på 0,005, er DC-generne også beriget med kendte kræft gener fra Cancer Gene Census [23] (,, Fishers eksakte test), i Kegg Disease H00020 Tyktarmskræft gen liste [24] (,) og i gener muteret i tarmkræft som rapporteret i arbejdet i Wood

et al.

[25] (,). Tværtimod resulterede de differentielt udtrykte gener ikke er beriget med de førnævnte kendte kolorektale cancer gen lister: i [22] (,), Cancer Gene Folketælling [23] (,), i Kegg Disease H00020 kolorektal cancer gen liste [24] ( ,) og i [25] (,).

for det sæt lungekræft data, listerne over gener, der er forskelligt forbundne og udtrykte mellem normale og cancer lungevæv omfattede 2749 og 7125 gener henholdsvis (på en antal 12157 analyserede gener). Selvom vi fundet en positiv sammenhæng () mellem p-værdierne for differentiel ekspression og p-værdierne med differentiel tilslutning (fig 4G), nogle bemærkelsesværdige undtagelser, dvs. differentielt tilsluttet, men ikke udtrykte gener, resulterede kritisk forbundet til patologien. For eksempel er den

EGFR

gen, viste sig at være DC (), men ikke DE (), er en vigtig hyppigt muteret onkogen og et lægemiddel mål for lungeadenocarcinom [26], [27]. Desuden er DC-genet liste beriget med gener huser abnormiteter (mutationer, amplifikationer og /eller fusioner), der er involveret i udviklingen af ​​ikke-småcellet lungekræft, som rapporteret i arbejdet i [28] (,,). Listen over disse cancer gener viste sig at være ikke overrepræsenterede i listen over de differentielt udtrykte gener (,).

Vores analyse på mavekræft datasæt resulteret i 3016 DC og 11108 DE gener (på en række 19520 analyseret gener) med de to lister signifikant forskellige (se figur 4G). Vi fandt så forskelligt forbundet receptor-regulerede Smads (R-Smads) for TGF-beta (

SMAD2

SMAD3

) og for BMP signalvejen (

SMAD1

SMAD5

) og den fælles-mediator Smad (

Smad4

). Disse gener, med den eneste undtagelse af

SMAD5

, ikke udtrykkes forskelligt (se tabel S1). Desuden fandt vi, at listerne over gener med er beriget i gener, der deler en

TCF3

-bindingssite motiv (E47_01,,), og i gener, der deler en

Smad4

-bindingssite motiv (SMAD4_Q6,,) [29]. Vi bemærker, at det er kendt, at TGF – aktiverede Smads inhibere ekspression af Id-proteiner, som igen inhiberer DNA binding af bHLH transkriptionsfaktorer, såsom E12 og E47 [30], [31]. Derfor er forskellen tilslutningsmuligheder analyse tyder ændringer i de førnævnte signalering aktiviteter i mavekræft væv.

undersøgelse af kræft i bugspytkirtlen datasæt resulteret i 12434 forskelligt forbundne gener og 14726 differentielt udtrykte gener i løbet af i alt 19520 gener på chippen. På grund af den store overlapning mellem de to grupper (figur 4G), er det ikke overraskende, at begge grupper er beriget med de almindeligt differentielt udtrykte gener i pancreas duktalt adenokarcinom følge af meta-analysen undersøgelse foretaget på fire forskellige datasæt i [32] . Desuden er de tre gener (

KRAS

,

TP53

,

STK11

) i forbindelse med kræft i bugspytkirtlen OMIM indtastning 260.350 [33] blev fundet både forskelligt forbundet og differentielt udtrykt med samme. Men med en mere konservativ signifikansniveau på 0,005, kræft gen liste fra Cancer Gene Census den [23] blev fundet, at være betydeligt beriget med DC-gener (,,), men ikke i DE gener (,).

Endelig er analysen om livmoderhalskræft datasæt afslørede 2302 DC og 6186 dE gener (på en række 12507 analyseret gener) med de to populationer er væsentligt forskellig med (figur 4G). En berigelse analyse af DC og DE generne blev udført på den liste, som det arbejde, [34] lavet af gener almindeligvis alterated sammen med dem, der findes muteret ved deres hel-exome sekventering studie i endometrie og ovariecancer. Denne undersøgelse var motiveret af tanken om at udnytte DNA-data indsamlet fra Papanicolau test for at afsløre somatiske mutationer, der involverer den cervikale væv efter at være blevet udgydt fra endometrie eller ovariecancer. Dette panel af gener resulterede beriget af 6 DC gener i løbet af i alt 15 (, Fishers eksakte test), mens inkluderet 8 DE gener (, Fishers eksakte test), hvilket gav en signifikant overlapning kun i det første tilfælde.

Vi skitse en vigtig bemærkning. Selvom, fandt vi, at p-værdier for forskellen forbindelse negativt korrelere med dem for differential udtryk kun for kolon, gastrisk og livmoderhalsen datasæt, den overordnede betydning af de 5 uafhængige tests foreslog, at DC og DE p-værdier er relateret gennem en betydelig negativ korrelation (se figur 4G). Som konklusion kan DC og DE gener opfører sig som særskilte bestande og vores bioinformatik analyse understøtter ideen om, at gener involveret i kræft, der ikke ændrer deres udtryk kan fremhæves af en analyse af forskellen tilslutningsmuligheder. Derfor kan man gætte på, at DC-gener er gener huser mutationer, der ændrer interaktioner mellem genprodukter uden at påvirke deres ekspressionsniveauerne.

Differential-forbindelse foreslår nye netværksbaserede kræft biomarkører

Vores undersøgelse kan også oplyse gener, hvis cancer-specifikke roller kan gættet fra litteraturen eller stadig noget af debat og yderligere kan motivere funktionelle eksperimenter om inddragelse af disse gener i patogenesen af ​​sygdommen. Fra vores analyse af mavekræft datasættet, det hæmmer af Bruton s tyrosinkinase (

IBTK

) resulterede som genet med den største tab i forbindelse () (se tabel S3). Som en kendsgerning, at proteinet kodet af

IBTK

nedregulerer kinase aktivitet af

BTK

der i vende en negativ regulator af Wnt-beta-catenin signalering [35]. På den anden side,

IBTK

protein regulerer negativt aktiveringen af ​​nuklear faktor-kappa-B-drevet (

NF-kB

) transkription. Da det er velkendt, at

NF-kB

Wnt /catenin signalveje aktiveres i de fleste af gastrisk kræft [36], [37], er det muligt at gætte en inddragelse af

IBTK

i udviklingen af ​​tumor.

i tilfælde af tyktarmskræft, den anden top-rangerede gen for tab af tilslutningsmuligheder med (se tabel S3) er den aryl hydrocarbon receptor (

AhR

) at i studiet af [38] viste sig at have en afgørende rolle i suppression af intestinal carcinogenese ved proteasomalaktivitet nedbrydning af catenin, der interagerer med den kanoniske

APC

-afhængig reaktionsvej. Desuden sjette top-rangerede gen “ slettes i polypose 1 ” (

DIP1

) har vist sig at have en rolle i tumor suppressor i colon carcinogenese [39].

En yderligere eksempel kommer fra lungekræft datasættet hvor genet

TNFSF11

viste den højeste tab af tilslutningsmuligheder (se tabel S3). Tidligere undersøgelser tydede på, at dette protein kan regulere celle apoptose aktiverende anti-apoptotisk kinase

AKT /PKB

gennem en signaleringskompleks som involverer SRC kinase og tumornekrosefaktor-receptor-associeret faktor (

TRAF

) 6 (se EntrezGene Resumé:.. [40] Desuden er

SRC

og

TRAF6

proteiner er kendt for at være involveret i flere aspekter af tumorigenese i human lunge [41], [42] arbejde [8] bekræfter inddragelse af

TNFSF11

i migreringen af ​​humane lunge tumorceller. Faktisk genet

TNFSF11

bidrager til tumor metastase handler gennem

MEK /ERK

, som igen aktiverer

NFKB

, hvilket resulterer i aktiveringen af ​​

ICAM1

.

som en sidste bemærkning, vores analyse af lungen tumor datasæt fremhævet som den anden top-rangerede gen for tab af tilslutningsmuligheder O-glykosylering initiativtager enzymet N-acetylgalactosaminyltransferase-14 (

GALNT14

). [50] viste, at

GALNT14

kan være en prædiktiv biomarkør for dulanermin-baseret behandling i NSCLC fordi de fandt, at følsomheden over for dulanermin (et protein, der inducerer apoptose i tumorceller) var stærkt korreleret med overekspression af

GALNT14

. De fandt også en funktionel sammenhæng mellem døden receptor O-glykosylering og apoptotisk signalering viser, at både farmakologiske hæmning af glykosylering og enzym knockdown gennem små interfererende RNA målretning

GALNT14

reduceret dulanermin-induceret apoptose [45].

Disse fund indikerer, at en differentieret connectivity analyse kan påvise kendte cancer-gener og også at foreslå nye biomarkør kandidater (nogle potentielt druggable) tilvejebringelse hidtil ukendte hypoteser for specifikke funktionelle eksperimenter.

differential tilslutning er komplementær til differential udtryk for at afsløre kræft relaterede veje

motiveret af beviser dukker op i de foregående afsnit, kan man gætte på, at en sti analyse på foruddefinerede gen sæt, der anser både ændringer i genekspression og ændringer i tilslutningsmuligheder kan forbedre den molekylære karakterisering af sygdomsmekanismer. Derfor vi først fokuseret på den klassiske berigelse undersøgelsen udfører en Random-Set-baserede pathway analyse (se Materialer og fremgangsmåder) til identifikation af veje for funktionelt beslægtede gener beriget for differentiel ekspression [46]. Derfor undersøgte vi de veje, der resulterede dereguleret fra en kombineret analyse af berigelse af gener, der enten var differentielt udtrykt eller differentielt forbundet (DEC) (se Lign. 5 i Materiale og fremgangsmåder). Vores analyse testet gen lister

a priori

tilhører kanoniske sti (C2-CP) samlinger af Molecular Signature Database (MSigDB) [5], som samler 1452 veje fra Reactome, Kegg, Biocarta og andre databaser. Opførslen af ​​FDR som funktion af berigelse p-værdi blev separat undersøgt i DE og DEC tilfælde (se figur 5A-E). For alle cancerformer (undtagen for pancreas tilfælde), sammenligning af FDRs i de to målinger viste, at DE-værdier var altid større end de tilsvarende DEC dem og sidstnævnte resulterede mindre end 15% ved et signifikansniveau på mindre end 0,01. Desuden er der for colon og lunge datasæt, kurverne i FDR resulterede godt adskilt, f.eks under hensyntagen til forskellen tilslutning foranstaltning gav en reduktion 91% af FDR værdi for en p-værdi på 0,003. Som en konsekvens, vi spekuleret på, at de er involveret i tumor biologi veje er dereguleret i genekspression og karakteriseret ved ændrede gen interaktioner ikke nødvendigvis rammer de ekspressionsmønstre. En biologisk validering af denne antagelse kræves en vurdering af den relative effektivitet af DEC foranstaltning i identifikationen af ​​veje ligger til grund for generelle mekanismer og vævsspecifikke træk af neoplasier.

(AE) Benjamini-Hochberg Falsk Discovery Rate (FDR) som en funktion af p-værdien. Rød farve refererer til de veje beriget af differentielt udtrykte gener (DE). Blu farve refererer til de veje beriget af differentielt udtrykte gener eller differentielt forbundne dem (dec). (F) Reactome veje for immunsystemet. Berigelse meta-analyse p-værdier på tværs af væv til “ Reactome immunsystem ”, sit første og andet sub-veje. Histogrammet i indsatte viser vævsspecifikke berigelse p-værdier for “ Reactome Immunsystemet ”. (G-H) Core sæt pathway berigelse analyse. Antallet af core sæt veje fundet som signifikant på 0,01 niveau (G) og i top-rangerede positioner (H) vises på søjlerne. I det indsatte rapporteres det p-værdien associeret til den relative værdi DEC foranstaltning med hensyn til DE opnået ved en permutation test.

I forbindelse med den almene cancerfænotypen, som et specifikt eksempel, vi valideret de to målinger i identifikationen af ​​Reactome immunsystemet, som er relateret til en af ​​de vigtigste kræft kendetegn [46]. Vi udførte en meta-analyse af DE og Dekl berigelse kombinere p-værdier, der er forbundet til de forskellige væv (Fishers kombinerede sandsynlighed test). Interessant DEC metaanalyse p-værdi forbundet til Immune System () viste sig at være meget mindre end den tilsvarende DE-værdi (), som er over signifikansniveau på 0,01 (Figur 5F). Vi gør opmærksom på, at hvis man ser på den vævsspecifikke berigelse analyse, DEC berigelse p-værdier resulterer altid mindre end de tilsvarende DE-værdier. Desuden den klassiske pathway analyse er ikke i stand til at angive, for alle organer, den Reactome immunsystemet som signifikante ved niveauet på 0,05 enten (se indsat i figur 5F).

På den anden side, evnen til at detektere organ-specifikke kræft træk blev testet på passende “ core sæt ”, der indsamler kendte tumor-specifikke kendetegnende systemer (se Materialer og metoder). Især vi undersøgt, om december berigelse analyse udkonkurrerer den klassiske DE tilgang prioritere de veje i centrale sæt.

Vi studerede separat opførelser af DE og DEC foranstaltninger til at identificere som væsentlige de kræft core sæt veje. Især for hver foranstaltning, vurderede vi betydningen af ​​antallet af kerne-sæt veje har et (figur 5G) ved hjælp af Fishers eksakte test. Vi bemærker derfor, at udnyttelsen af ​​DEC gener giver mulighed for bedre afsløre kendte kræft veje. Faktisk DEC berigelse udkonkurrerer DE analyse både med hensyn til antallet af betydende veje og p-værdier for tyktarms-, lunge- og livmoderhalsen. Forskellen mellem DEC og DE forestillinger blev vurderet ved en tilfældig permutation test. Især vi sammenlignet de vægtede antal væsentlige kerne sæt veje som følge af de to analyser (se materialer og metoder). Selv om der er et stærkt bevis for den relative værdi DEC analyse kun i colon og lunge samt en lille indikation for cervix, ser vi, at i betragtning af DEC gener i pathway’en berigelse analyse globalt afslører flere signaler knyttet til patologien, da den samlede betydning er (se indsat i figur 5G).

Endvidere har vi kvantificeret hvor meget pathway placeringer opnået med de to målinger er forskellige fra en tilfældig bestilling i identifikationen af ​​kræft pathways (figur 5H). Til dette formål, for hver foranstaltning, vi rangeret veje i form af berigelse p-værdier og tælles antallet af kerne-sæt veje til stede i de første toprangerede positioner i listerne (se tabel S2). For eksempel, i kolorektal cancer, i de første 104 stillinger, vi fandt 11 kerne-sæt veje beriget af DE gener () versus 18 veje beriget af DEC gener (). Interessant, kan vi konstatere, at DEK berigelse analyse altid udkonkurrerer DE foranstaltning med undtagelse af gastriske og bugspytkirtel tilfælde, hvor der de to målinger er lige effektive i identifikationen af ​​de centrale sæt veje. Faktisk DEC tilgang globalt rangeret i højere stillinger kræftrelaterede veje end den klassiske DE berigelse analyse som bekræftes af Fisher kombinerede sandsynlighed test p-værdier viser (DE, DEC)

Endelig har vi påpege, at for. bugspytkirtel tilfælde, kræft kerne er uventet underrepræsenteret blandt både dE og DEC veje (Figur 5G-H). Som en kendsgerning, snarere end de veje der almindeligvis er forbundet til pancreascancer, DEC analyse fundet mere ændret disse veje (se tabel S2) vedrører neuroaktive ligand-receptor interaktion og det olfaktoriske transduktion sammen med deres superfamilien af ​​rhodopsin-lignende G protein- koblede receptorer (GPCR’er).

Be the first to comment

Leave a Reply