PLoS ONE: Identifikation af nøgleprocesser Underliggende Cancer fænotyper Brug Biologic Pathway Analysis

Abstrakt

Kræft er anerkendt for at være en familie af gen-baserede sygdomme, hvis årsager findes i forstyrrelser af grundlæggende biologiske processer. En stadig dyb katalog over kanoniske netværk beskriver den specifikke molekylære samspil mellem gener og deres produkter. Imidlertid er kortlægning af sygdomsfænotyper til ændringer af disse netværk af interaktioner opnået indirekte og ikke-systematisk. Her har vi objektivt identificere veje er forbundet med malignitet, iscenesættelse, og resultat i kræft ved anvendelse af en analytisk tilgang, der systematisk vurderer forskelle i aktiviteten og konsekvens af interaktioner inden kanoniske biologiske processer. Brug store samlinger af offentligt tilgængelige genom-dækkende genekspression, vi identificere små, fælles sæt af veje – trkA receptor, Apoptosis svar på DNA-skader, Ceramide, Telomerase, CD40L og Calcineurin – hvis forskelle robust skelne forskellige tumortyper fra tilsvarende normale prøver, forudsige tumor kvalitet, og skelne fænotyper såsom østrogen receptor status og p53 mutation tilstand. Pathways identificeret gennem denne analyse udføre så godt eller bedre end fænotyper, der anvendes i de oprindelige undersøgelser forudsige kræft resultat. Denne fremgangsmåde giver mulighed for at bruge genom-dækkende karakteriseringer at kortlægge vigtige biologiske processer til vigtige kliniske funktioner i sygdom

Henvisning:. Efroni S, Schaefer CF, Buetow KH (2007) Identifikation af nøgleprocesser Underliggende Cancer fænotyper Brug Biologic Pathway Analysis. PLoS ONE 2 (5): E425. doi: 10,1371 /journal.pone.0000425

Academic Redaktør: Nick Monk, University of Sheffield, England

Modtaget: Januar 5, 2007; Accepteret: 29 2007; Udgivet: 9. maj 2007

Dette er en åben adgang artiklen distribueres under betingelserne i Creative Commons Public Domain erklæring hvori det hedder, at når det først er i det offentlige rum, dette arbejde kan frit gengives, distribueres, overføres, ændres, bygget på, eller på anden måde bruges af alle til ethvert lovligt formål

Funding:.. Denne forskning blev støttet af murene forskningsprogrammet for NIH, National Cancer Institute

Konkurrerende interesser :. forfatterne har erklæret, at der ikke findes konkurrerende interesser

Introduktion

Biologiske fænomener fremstå som følge af virkningen af ​​gener og deres produkter i veje. Sygdomme opstår gennem ændring af disse komplekse netværk [1] – [5]. For at gøre mekanistiske påstande, der supplerer de nuværende tilgange til genom-dækkende analyse [6] – [9], kort vi kanoniske biologiske veje til kræft fænotyper. I alt 2011 Affymetrix GeneChip array-hybridiseringer opnået fra 9 forskellige offentligt tilgængelige datakilder [10] – [17] blev analyseret. De hybridiseringer repræsenterede 70 forskellige tumortyper (1348 prøver). Derudover 83 forskellige typer af prøver af normal histologi blev inkluderet (663 prøver). Ekspressionsniveauer blev justeret med RMA [18]. Definitionen på normal anvendt her udelukker uengagerede og /eller tumor tilstødende prøver fra personer med kræft.

Anvendelse af veje som ramme for analyse er ikke i sig selv roman. Disse omfatter projektionen af ​​kendte cancer gener og genekspression data på veje [19], [20]. Hvad adskiller det arbejde præsenteres her er den systematiske evaluering af samspillet struktur på tværs foruddefinerede kanoniske netværk. Ved at måle tilstanden af ​​interaktionen den kombinerer information fra gen tilstand og netværk struktur. Multiple gen stater kan resultere i en fælles syntesevej score. Omvendt kan pathway scores viser større forskelle end gen signaturer.

Approaches to Pathway Analyse

Denne undersøgelse supplerer andet arbejde udnytter pathway oplysninger.

Mere specifikt Segal et. al. [6] definerede biologiske moduler og raffineret dem til et sæt af statistisk signifikante moduler. De var i stand til at bruge disse moduler til at få et bedre perspektiv på de forskellige biologiske processer, der aktiveres og de-aktiveres i forskellige kliniske tilstande. Vi noterer to vigtigste forskelle mellem det, vi præsenterer her og arbejdet i Segal et. al. [6]: første, de biologiske moduler, der bruges i papiret, selv om meget informative og nyttige, er internt defineret i papiret. Bestemmelsen af ​​gener i disse moduler blev afledt fra de samme data, som de er senere anvendelse. De kanoniske veje vi anvender, er eksternt definerede uafhængig af de data, vi analyserer, repræsenterer nuværende forståelse på området, og blev ikke afledt ad hoc. For det andet, Segal et. al. ikke eksplicit brug af de indbyrdes forbindelser, eller nettets struktur, der eksisterer mellem gener, der omfatter biologiske moduler. De scorer for aktivitet og konsistens vi præsenterer her, afhænger af netværket struktur og specifikke forbindelser (såsom hæmning og markedsføring), som er funktioner i informationsnettet.

En anden vigtig tilgang er, at Rhodos et. al. [21], hvori det humane interactome netværk anvendes til at identificere undernet aktiverede i cancer. Den fremgangsmåde Rhodes el. al. bruge, i modsætning til den ene, der præsenteres her, forsøger ikke at beregningsmæssigt og algoritmisk fremhæve forskellene i fænotyper ved at bygge en sorterer rundt målbare netværksfunktioner. I stedet genererer undernet af deres tilknytning til sæt af gener identificeret gennem de over (eller under) udtryk i hvert biologisk fænotype. Rhodes et. al. tilgang gør brug af nettet struktur at bygge undernetværk, men ikke gør yderligere brug i observere co-ekspression eller co-dæmpning af sæt af gener, som det er tilfældet i arbejdet præsenteret her.

Bild et. al. [14] og Glinski et. al. [22] vise, at gen-signaturer bestemt af lille sæt af forudvalgte kanoniske veje kan skelne tumor egenskaber. I deres arbejde, de starter med et begrænset sæt veje, (fx Bild et. Al. Anvende 5 veje), og vise, at de er forskellige i forskellige fænotyper. Da denne metode starter med et lille sæt af veje forfatterne valgte at undersøge, betyder det ikke har kapacitet til at opdage nye pathway foreninger med fænotyper. I modsætning til den nuværende arbejde, betyder det ikke anvender en objektiv metode til at identificere sæt af veje, der kan skelne fænotyper.

Gene sæt Tilsætningsgrænser Analyser [23] gør det muligt for forfatterne at vælge et sæt af gener og til at bestemme deres relative statistisk betydning i en liste af gener, der adskiller fænotyper. Gene sæt berigelse starter med den forudsætning af enkelte gener som klassificører. Pathway medlemskab er målt til at vurdere kombinerede bidrag. Igen kræver fremgangsmåden ikke brug af strukturen af ​​nettet, heller ikke giver en systemisk konto for den kombinerede viden om veje til at reducere til en optimal sæt klassificering processer. Da metoden starter med diskrimination af enkelte gener, kan det kun bygge videre på dette statistisk inferens, og tager ikke højde for eventuelle forskelle, der kommer fra den indbyrdes afhængighed af flere gen interaktioner. For eksempel, hvis gen A synes at permutate tilfældigt i de to fænotyper og gen B synes at permutate tilfældigt i de to fænotyper derefter hvert af generne vil score dårligt i en statistisk signifikans test. Men scoren er defineret af deres samlede afhængighed (fx (hvis A og derefter B)) kan give meget større diskrimination.

Den metode Tomfohr, et. al. [24] er måske tættest på den ene præsenteres her i at det ser på kombinerede grupper af gener og rangerer dem i overensstemmelse hermed. Imidlertid Tomfohr, et. al. ikke bruger nettets struktur viden til at opnå resultater, men i stedet udføre Singular Value Forrådnelse (SVD) til at vælge et bestemt metagene, og definere en sti aktivitet som udtryk for, at genet. Som sådan, er resultatet ikke udnytter den indbyrdes afhængighed af netværket som gør arbejdet præsenteret ovenfor

Metoder

Evaluering et gen status:.

Gene status i evalueringen af ​​netværket interaktion er beregnet ud fra de observerede data som en af ​​to alternative tilstande: ned og op. At være i stand til at identificere, om et gen er i en “ned” tilstand eller “op” tilstand, vi ser på sin (RMA justeret [18]) udtryk værdi i en prøve, i forhold til udtrykket værdier af det samme gen i alle andre prøver. For at kunne rumme en lang række sandsynlighedsfordelinger, bruger vi en gammafordelingen som template til både “ned” distribution form såvel som “op” fordeling, og omdefinere problem som en blanding af to gammafordelingen. Den undertrykte form følger ofte en eksponentiel fordeling, som er et særligt tilfælde af en gamma fordeling. Den fremmes tilstand følger ofte en form, der svarer til en normal fordeling, som kan tilnærmes ved en gamma fordeling af en stor middelværdi. Per hver probe sæt målt ved microarray ser vi på udtrykket distribution og forsøge at passe denne fordeling i en blanding af to gamma-fordeling. Det gør vi ved hjælp af en forventning-Maximization (EM) algoritme, iteration over data i en måde, der sikrer øget sandsynligheden for montering af data, som de modellerede distributioner. I tilfælde af to gamma-fordeling, vi først opdele dataene i to grupper: “ned” værdier og “op” værdier. Antallet af gener i “op” gruppe er

N

U

og antallet af gener i undertrykt gruppe er

N

D

. De forudgående sandsynligheder er derfor:

Vi antager hver gruppe fordeler ifølge en gammafordelingen:

Formålet med EM-algoritmen er at give os maksimal-likelihood estimater til

en

U, b

U

værdier for fremmet gruppe og til

en

D, b

D

værdier for den undertrykte gruppe. Derudover beregner det for maksimal sandsynlighed estimater af blandingen koefficienter, η

1, η

2.

Vi antager, at udtrykket fordeling af hvert gen er enten kommer fra en blanding af to fordelinger (en til “op” sag og en til “ned” tilfælde) eller fra en enkelt distribution (for eksempel, når genet er “op” i alle prøverne, vi har). Vi bestemme antallet af underliggende fordelinger (en eller to) ved hjælp af EM-algoritmen i kombination med et udvalg model metode, se nedenfor.

For at finde den maksimale af log sandsynlighed, er vi nødt til at finde maksimum af ekstrafunktion

Q

[25]: whereHere,

θ

er en samling af parametre, der definerer fordelingen, og hævet 0 betegner størrelser, der var blevet fastlagt det foregående iteration

.

for at finde maksima, vi differentierer

Q

med hensyn til modellens parametre, og sammenlign zero.And den coefficientswhere Ψ (

x

) er den psi funktion.

Ved hjælp af en Lagrange multiplikator at indarbejde Bevar vi nødt til at maksimere målet functionwith forhold til

η

jeg

, vi deriveand obtainWe løse dette numerisk (ved hjælp Matlab®) i hvert iterativ skridt, indtil vi nå nogle foruddefinerede kriterier konvergens

Valg et optimalt antal distributioner:.

det er klart, jo flere distributioner vi tager som vores grundlag for de overordnede fordelinger, jo bedre pasform vi har for dataene og bedre sandsynlighed vil være. Overvej, for eksempel som mange distributioner, som der er datapunkter. Det ville passe dataene præcis og producere maksimal sandsynlighed. For at overvinde dette, og for at kunne vælge et optimalt antal, vi sammenligner modeller med forskellige antal distributioner ved hjælp af Bayesian Information Criterion (BIC) [26], beregnet asThis omkostningsfunktion kompenserer for den yderligere forøgelse i kompleksitet. Den statistiske model er valgt, er den med den største BIC

Beregn Og tilsvarende:. Men vi har brug sandsynligheden for at være i “forfremmet” tilstand for et bestemt udtryk værdi: Og sincewe kan opnå de nødvendige værdier ved: for eksempel, ekspression af genet CDKN1A i datasættet [13] (en samling af 698 tumorprøver) følger denne fordeling (se figur 1):

op /ned opfordrer til gen-stater er baseret på en udtryk værdi klassificeret som bosat i en af ​​de to forskellige distributioner.

de to forskellige distributioner (ned og op) er indlysende og algoritmen giver parametrene for de to gamma-fordeling.

pathway aktivitet og sti konsistens

pathway konsistens score: for at bestemme vejen konsistens score på en given signalvej i en prøve, vi følger disse trin:

Hver vej er en samling af interaktioner. Input gener og output gener definere hver interaktion. For hver interaktion i vejen, vi først se på input gener og bestemme, for hver sådan gen, er sandsynligheden for at være i en “ned” eller “op” tilstand (se “gen tilstand” ovenfor)

vi afgør så er sandsynligheden for materialisering af den specifikke interaktion som fælles sandsynlighed for alle nødvendige komponenter (gener)

dernæst ser vi på det molekylære udgang interaktion. Normalt denne udgang er en liste over gener, som vi etablerer sandsynligheden for at være i en “ned” eller “op” tilstand (se “gen tilstand” ovenfor)

Dernæst beregner vi sandsynligheden for output gen (er) er i en af ​​de to tilstande, under given sandsynlighed for interaktionen (beregnet i (b))

Endelig, for at opnå pathway konsistens score, beregner vi konsistensen point for hver vekselvirkning i vejen, og gennemsnittet af scores over alle de interaktioner, som vi var i stand til at opnå en score. I figur 2 vises et eksempel for beregning af konsistens af en interaktion taget fra sti “signaleringshændelser medieret af stamcellefaktor receptor (c-Kit)”, en af ​​NCI-Nature Sorterede veje fra Pathway Interaktionsdatabasen (PID ) [27]. De specifikke skridt til at beregne sammenhængen i dette eksempel er:

Etablere sandsynligheder for alle gener involveret i interaktionen. Dette sker i henhold til de trin, der er beskrevet nedenfor (se afsnittet “gen tilstand”). De værdier, vi opnår, er: P (CREBBP) = 0,95; P (STAT5A) = 0,8; P (KIT) = 0,7

Beregn fælles sandsynlighed for et aktivt samspil. Da input molekyler til interaktionen er ikke co-afhængige, den samlede sandsynlighed for interaktionen er P (CREBBP) × P (STAT5A) = 0,95 × 0,8 = 0,76

Beregn sandsynligheden for, at output-molekylet er resultat af interaktionen. Da molekylet er udelukkende afhænger af samspillet sandsynligheden er ligetil:

gentage denne beregning i alle interaktioner i vejen. Det endelige resultat en vej er et gennemsnit over alle interaktioner. Vejviser Vejviser

En sti aktivitet score er gennemsnittet overaktivitet af interaktioner i et forløb. For eksempel i det foregående eksempel, samspillet aktivitet er 0,76. Den største fordel ved at beregne pathway aktiviteter oven på pathway konsistenser er, at aktiviteterne kan beregnes, selv når der ikke er nok data til at arbejde med output, som det er tilfældet, for eksempel, når interaktionen er baseret på aktivering eller ændring molekyler uden frembringelsen af ​​et hidtil ukendt molekyle som output. I sådanne tilfælde kan vi stadig beregne aktiviteten, selv om konsistens mister sin betydning.

Se Metoder til detaljer.

At vælge et minimalt sæt veje til at klassificere fænotype

Som vi opnår pathway aktivitet og konsistens scorer for hver vej, er vi i stand til at transformere repræsentationen af ​​hver bio-prøve fra en liste af genekspression målinger i et hidtil ukendt repræsentation, der viser hver prøve med indsamling af pathway aktivitet og konsistens scoringer. Som vi bruger denne repræsentation til at skelne mellem fænotyper, ønsker vi at finde den minimale sæt af veje scores der er i stand til at skelne mellem fænotypiske klasser. Vi bruger funktionen udvalg at vælge et optimalt minimalt sæt (se resultater). Vi brugte forskellige metoder til feature extraction og har klassifikation [28], [29], herunder frem udvælgelse, baglæns udvælgelse, og flydende søgning [29]. Disse metoder hjælper med at fjerne pathway scores der ikke bidrager til at gøre sondringen og fremhæve bestemte veje, der tilsammen opnå en optimal klassifikation sats.

Pathway metrisk at forudsige udfaldet

Repræsenterer hver bio-prøve ved hjælp dens pathway målinger giver os mulighed for at kigge efter mønstre i indsamling af veje. Ved at bruge klyngedannelse algoritmer, ser vi, at pathway metriske værdier adskille prøver i grupper. Hvis vi ser på de overlevelse mønstre af disse grupper, ser vi, at i nogle tilfælde og for nogle veje, grupperne korrelerer med forskellige mønstre af overlevelse.

Resultater

Analysen anvendes her behandler en vej som et netværk af gener, hvis interaktioner er logisk vurderet i vejen sammenhæng at generere sæt af bedømmelser. Biologisk vej struktur oplysninger er indhentet fra offentlige kilder [27], [30], [31].

Hver vej er vurderet for konsistens og aktivitet. En sti konsistens score er beregnet som den gennemsnitlige sandsynlighed for den logiske konsekvens af samlingen af ​​interaktioner givet de beregnede tilstande af generne (se metoder). En sti aktivitet score er beregnet som den gennemsnitlige sandsynlighed for pathway individuelle interaktioner være aktiv givet de beregnede gen stater. Brug af grundlæggende principper for maskine overvåget læring [28], [29] en klassificering algoritme, der adskiller hver onkogen fænotype (fx kræft prøve vers normalt) blev genereret og valideret. Baseret på enkelhed og sammenlignelighed af alternative tilgange testet, blev en Bayesian lineær diskriminant klassificeringen anvendes.

Først blev en klassifikation algoritme afledt til at skelne forskellige kræft fænotyper fra normale fænotype væv. En klassifikatør stammer fra en 1800 prøve træning sæt (10 gange validering) viste 98% succes i en uafhængig validering test sæt af 211 prøver (se figur 3 og tabel 1).

Hvert panel i figuren svarer til en anden fænotypisk forskel, ifølge panel billedtekster. Den vandrette akse i hvert panel svarer til det endimensionale fremspring beregnet ved klassificeringen algoritme, der betyder afstanden mellem biologiske prøver ifølge de flerdimensionelle pathway metrics. Den lodrette akse er en jitter scatter af prøverne for at muliggøre en klar opfattelse af adskillelsen.

Da lineære klassificører vende hver af de veje i problemet ind i en variabel i klassificeringen, det er muligt gennem funktionen analyse for at identificere undergrupper af klassificeringen variable (stier), der, som en gruppe, skelne fænotyper med stor nøjagtighed. Feature valg blev brugt til at identificere et sæt viser den optimale 98% nøjagtighed af den oprindelige klassificering i valideringen analysen. Det består af aktivitet snesevis af seks veje:. TrkA Pathway, DNA Damage vej, Ceramide Pathway, Telomerase Pathway, CD40L Pathway og Calcineurin Pathway

Kræft er en sygdom af stor fænotypisk og molekylær heterogenitet. Selv inden for en given organ websted, er fænotypisk heterogenitet forbundet med betydelige forskelle i kræft resultat. Det er derfor af yderligere interesse at identificere molekylære processer, der ligger til grund for fænotypiske forskelle, og at forudsige udfaldet. Vi har derfor afledt signaturer til forskellige undertyper af brystkræft. Disse undertyper omfatter: histologisk bedømmelse (Elston kvaliteter 1 vs. 3, eller kvaliteter 2 vs. 3); P53 status (muteret /vildtype); østrogen receptor positiv /negativ status (ER +/-); og progesteron receptor positiv /negativ status (PgR +/-). Udførelsen Klassificørernes vises i figur 3. I alle tilfælde klassificører med et lille antal veje (tre til seks) opnået et højt niveau af nøjagtighed (83% til 95%). Tabel 1 viser de forskellige pathway grupper, der klassificerer forskellige fænotyper.

Vi næste evaluerede evnen af ​​kræft subtype-specifikke signaturer til at stratificere de 236 brystcancer prøver ved resultatet. Efter uovervåget gruppering af kræft prøver ved hjælp af veje er identificeret ovenfor, Kaplan Meier analyser blev udført (figur 4). I tre tilfælde en enkelt vej fra undertype signatur betydeligt forventede resultat: den døgnrytmen vej, fra karakteren 1/3 signatur (P = 2.9E-11); Sonic Hedgehog pathway, fra karakteren 2/3 signatur (P = 4E-8); og Agrin i Postsynaptisk Differentiering, fra P53 signatur (P = 4.6E-7). De tre veje i PgR +/- signatur adskilt prøverne i to grupper med en P-værdi 0,0001, med Bone Ombygning pathway tegner sig for det meste af effekten. Desuden er de fem veje i ER +/- signatur adskilt prøverne i to grupper med en P-værdi på 0,004, med SREBP pathway udgør størstedelen af ​​effekten.

(A) (1) Kaplan -Meier overlevelse plot af brystkræftpatienter fra [15], stratificeret efter clustering baseret på pathway aktivitet. Panel (2) i (A) viser aktiviteten score på Sonic pindsvineoverføringsvejen farvet efter tilknytning til nogen af ​​de tilsvarende farvede overlevelse kurver i (1); (B) De samme analyser udført med brystkræftpatienter fra [15], baseret på vejen Bone Remodeling (se tekst for pathway valg). (C) Kaplan Meier overlevelse plots af lungekræft patientdata fra [17], stratificeret efter aktivitet CSK-vejen og (D) NFKβ vej. I hvert panel, (2) sub-panel viser den mest indflydelsesrige vej metriske ud af gruppen for at stratificere veje. Dette betyder ikke, at vejen repræsenterede er ansvarlig for hele adskillelse i to grupper.

Det er vigtigt at bemærke, at en række fund i litteraturen dukke uafhængigt af vores vej analyse af brystkræft prøver. Som betydningen af ​​ER +/- skelnen i ledelse af brystkræft er veletableret, vi kiggede på hver af disse undergrupper separat. Det er blevet observeret [32], at trkA Pathway (identificeret i både den generiske onkogene signatur og karakteren 2/3 underskrift) spiller en væsentlig rolle i ER- tilfælde. Vores analyse viser, at den generiske onkogene signatur separerer ER- prøver i to grupper (P = 4.6E-9) med trkA-vejen udgør størstedelen af ​​effekten, høje aktivitet af denne vej korrelerer med dårlig prognose. Ligeledes er det blevet observeret [33], [34], at beta-catenin spiller en væsentlig rolle i respons på tamoxifen, en standardbehandling for ER + sygdom. For at analysere beskaffenheden af ​​tamoxifen-inducerede respons, vi udledt en klassifikator til at skelne mellem ER + sager, der var blevet behandlet med tamoxifen fra de tilfælde, som ikke var blevet behandlet hermed, og derefter bruges de veje i den resulterende signatur til klynge sagerne efter udfaldet . Beta-catenin pathway sig som den mest signifikante (P = 1E-13) pathway forudsige udfaldet.

Det har længe været foreslået, at molekylære klassifikationer af kræft kan have kapacitet til at overskride organ- eller vævsspecifikke definitioner . Mere specifikt er det blevet foreslået, at molekylære definitioner, der afspejler de universelle egenskaber af celletype eller ontologi, og at understøtte en fælles molekylær ætiologi kan opstå på tværs af orgel websted definitioner. For at vurdere, om de observerede ovenfor i kræft i bryst epitel underskrifter kan generalisere til andre kræftformer, vi undersøgte deres evne til at forudsige fænotyper i lunge- og tyktarmskræft. Vi anvendte signaturer afledt af brystkræft undertyper at klynge de lungekræft resultater (figur 4). Pathways forudsige resultatet omfattede IL-7 Pathway (P = 0,002) og CSK Pathway (P = 3E-11). Det er tidligere blevet bemærket, at disse veje er forbundet med udfaldet i lungecancer [35], [36]

Endelig undersøgte vi generelt onkogene signatur evne til at forudsige orgel-stedspecifik resultat. Interessant signatur veje skilles de 236 brystcancer prøver i fem forskellige overlevelse undergrupper (P = 2E-8) og 90 lungekræft prøver i to forskellige undergrupper (P = 5E-17).

Diskussion

ovenstående resultater tyder på, at bruge vejen som enhed for analyse kan forøge nuværende individuelle gen tilgange til kortlægning fænotype til underliggende molekylære proces. Mål identifikation af processer tidligere var forbundet med fænotyper udnytte genom-dækkende datasæt giver en delvis validering af de observerede resultater. Nyligt observerede proces tilknytninger til fænotyper imidlertid klart kræver enten verifikation fra uafhængige datasæt eller eksperimentel bekræftelse.

De bemærkninger gennem denne analyse er provokerende. Mange af disse pathways (fx apoptose, telomer vedligeholdelse) er tidligere blevet beskrevet som universelle komponenter af onkogenese [2]. Derudover er fremgangsmåder identificeret, som kan være afgørende for fælles kræft relaterede fænotyper, såsom inflammation. Interessant er nye veje også identificeret som en del af det generelle onkogene signatur som afbildet i de seks veje kollektive (fx Ceramide og Calcineurin veje). Seneste interesse i Ceramide understøtter denne hypotese. Ceramide har været længe kendt for at være involveret i apoptose [37] – [39] og de seneste arbejde er at se på relevansen af ​​ceramid i kræft [40] – [42], og i behandlingen af ​​kræft [43], [44]. Lignende interesse har udviklet i calcineurin. Ud fra følgende betragtninger interesse var tidligere begrænset til dets aktivitet i immunrespons, er det nu ved at blive anerkendt som en dominerende deltager i onkogenese [45], [46]. Kombinationen af ​​dette sæt af veje kan definere vigtige processer, der er karakteristiske for en universel stamcelle type.

Omvendt vejen analyse af kræft sub-fænotyper kan også give nye mekanistiske indsigt, der afslører underliggende biologi. For eksempel tamoxifen er effektiv til behandling nogle tilfælde af ER + brystkræft. I disse tilfælde skal tamoxifen påvirke aktiviteten af ​​interaktionsnetværk. Det er derfor logisk at hypotesen, at der vil være observerbare forskelle i netværk aktivitet mellem de tilfælde, hvor tamoxifen er effektiv og de tilfælde, hvor stoffet ikke er effektiv. Vores tilgang bruger pathway signaturer til at forudsige variansen i resultat, som tages som mål for narkotika effektivitet. Vi spekulere at vores tilgang kan afsløre de net, der både forskelligt aktiveres i respons på behandling med tamoxifen og vigtige for tumor vækst og bæredygtighed.

Den tilgang anvendt her har paralleller til brugen af ​​gen kort til at oversætte fænotyper i den molekylære domæne. Først pathway modeller repræsenterer en reproducerbar ramme, der kan testes på tværs undersøgelser og udvidet som yderligere viden bliver tilgængelig. Også, veje og deres struktur giver en højere orden konstruere til vurdering rolle gener.

Hver interaktion inden en sti kræver bidrag af flere gen observationer. Hver enkelt gen aktivitetsniveau bidrager kun i forbindelse med andre gener, der deltager i en vekselvirkning i processen netværket. Dette fremgår af den iagttagelse, at vi var ude af stand til at udlede effektive klassificører, direkte fra gen-statslige værdier alene (for de gener, der udgør de vigtigste seks veje).

Det er også interessant, at fem af de seks veje vi bruger til at klassificere normal og tumorprøver danner en enkelt tilsluttede netværk (figur 5, telomerase pathway forbliver uden forbindelse). Denne sammenkobling kan tilvejebringe nye muligheder for at udvikle interventioner. Kendskab til forbindelserne kan foreslå alternative mål, der ville have flere pathway effekter. Minimalt, kan det bruges til identifikation af kompleksiteten forbundet med target valg før interventionsdesign.

sammenføjede veje farve delte noder.

Det er underforstået, at den probabilistiske klassificering af gener i alternative tilstande af ned og op er en forenkling af langt større kompleksitet mønstre af gen-adfærd og handling. empirisk evaluering af de observerede data finder imidlertid, at genekspressionsmønstre almindeligvis kan passe en af ​​to alternative udtryk niveau distributioner. Desuden har en sådan forenkling bevist værdifulde i andre forskningsområder. For eksempel den forenkling, abstracts digital logik fra den underliggende kontinuerlig strøm af elektroner i kredsløb har muliggjort design af udstyr for svimlende kompleks funktionalitet [47].

Det er klart, at den nuværende viden om biologiske veje er ufuldstændig og ufuldkommen. Som sådan, processer identificeret næsten sikkert ikke de eneste faktorer, der påvirker fænotyper af interesse. Ikke desto mindre, hvor der identificeres processer, de tjener som vigtige mål for yderligere undersøgelse. Desuden procesorienteret tilgang gør det muligt at skelne mellem, hvilke dele af de komplekse netværk, hvor generne deltager differentielt bidrager til en fænotype af interesse. Kombineret anvendelse af aktivitet og konsistens score tillader diskrimination af processer aktiveres på grund af fænotype versus dem, hvis logik varierer mellem fænotyper. Sidstnævnte (konsistens), potentielt er kausalt tilskrives fænotypen og foreslår kandidater der er blevet ændret. Men udnytter genekspression data, konsistens scoringer kan kun beregnes for interaktioner, der involverer transskription begivenheder, hvilket begrænser deres diskriminerende magt.

Be the first to comment

Leave a Reply