PLoS ONE: Computational Surprisal Analyse Hastigheder-Up Genomisk karakterisering af Cancer Processes

Abstrakt

Surprisal analyse i stigende grad anvendes til undersøgelse af transskription niveauer i cellulære processer, i retning af at afsløre indre netværksstrukturer og forudsige respons. Men for at opnå sit fulde potentiale, bør surprisal analyse integreres i en bredere vifte beregningsmæssige værktøj. Formålet med dette papir er at kombinere surprisal analyse med andre vigtige beregnings procedurer, såsom let manipulation af analyseresultaterne – f.eks at vælge ønskelige resultat sub-sæt til yderligere inspektion -, hentning og sammenligning med relevante datasæt fra offentlige databaser og fleksible grafiske displays til heuristisk tænkning. Hele sæt af beregningsmetoder procedurer integreret i en enkelt praktisk værktøj er det, vi kalder

Computational Surprisal analyser

. Denne kombinerede form for analyse bør betydelig lettere kvantitativ forståelse af forskellige cellulære processer for forskere, herunder anvendelser i proteomics og metabolomics. Ud over dette, vores vision er, at

Computational Surprisal Analyse

har potentialet til at opnå status som en rutinemæssig analysemetode til praktikere. Den opløsningsevne af

Computational Surprisal Analyse

er her demonstreret af dens anvendelse til en række cellulære kræft proces transskription datasæt, vores og fra litteraturen. Resultaterne giver et kompakt biologisk billede af den termodynamiske betydning af de førende genekspression fænotyper i alle faser af sygdommen. For hver udskrift vi karakterisere både dens iboende steady state vægt, dens sammenhæng med de øvrige udskrifter og dens variation som følge af sygdommen. Vi præsenterer et dedikeret websted for at lette analysen for forskere og praktikere

Henvisning:. Kravchenko-Balasha N, Simon S, Levine RD, Remacle F, Exman I (2014) Computational Surprisal Analyse Hastigheder-Up Genomisk karakterisering af Cancer Processer. PLoS ONE 9 (11): e108549. doi: 10,1371 /journal.pone.0108549

Redaktør: Jose M. Sanchez-Ruiz, Universidad de Granada, Spanien

Modtaget: Februar 18, 2014 Accepteret: August 31, 2014; Udgivet: November 18, 2014

Copyright: © 2014 Kravchenko-Balasha et al. Dette er en åben adgang artiklen distribueres under betingelserne i Creative Commons Attribution License, som tillader ubegrænset brug, distribution og reproduktion i ethvert medie, forudsat den oprindelige forfatter og kilde krediteres

Finansiering:. Dette arbejde blev støttet af en EMBO postdoc stipendium til NKB og Europa-Kommissionen FP7 fremtidige og fremspirende teknologier-Open Project BAMBI 618.024 (til FR og RDL). De finansieringskilder havde ingen rolle i studie design, indsamling og analyse af data, beslutning om at offentliggøre, eller forberedelse af manuskriptet

Konkurrerende interesser:.. Forfatterne har erklæret, at der ikke findes konkurrerende interesser

Introduktion

Surprisal Analysis, i sin mest generelle betydning, er en procedure til at karakterisere sandsynligheden for forskellige tilstande af et system, stater, der kan have et rigt indre struktur. Endvidere kan systemet ikke være i en stabil tilstand. Proceduren begynder ved at antage, at et sæt af et relativt lille antal af begrænsninger er kendt. Disse begrænsninger anses for at være tilstrækkeligt til at karakterisere afvigelserne af udlodningen fra det steady state på grund af de pålagte betingelser på systemet. Hvis de forventede begrænsninger er utilstrækkelige til faktisk gengive sandsynlighedsfordelingen, den ene er

overrasket

og derfor må søge efter ændrede og /eller yderligere begrænsninger.

Surprisal Analyse har sit udgangspunkt i de fysiske videnskaber og er blevet anvendt med succes til en overflod af fysiske, kemiske og tekniske problemer, og overbevisende demonstreret at være relevante, nyttige og producerer verificerbare resultater [1] – [4].

Den nuværende arbejde tilhører en række papirer [ ,,,0],5] – [9], hvis formål er at vise, at Surprisal Analysis er også relevant og som gælder for biologiske fænomener, især cellulære kræft processer. En nylig kommentar til tilgangen i biologi er [10]. Brug surprisal analyse identificerer vi de mest stabile afbalancerede mRNA distributioner på alle stadier af sygdommen fra de eksperimentelle data og også de mindre stabile mRNA netværk, der opretholder cellerne væk fra afbalanceret tilstand. Disse netværk ligger til grund for kræftudviklingsproces. Vi sammenligner mellem celle system /patient netværk deltager i transformation kræft og relatere dem til de netværk, der bidrager mest til den balancerede tilstand.

Dette papir har yderligere to specifikke formål.

For det første at kombinere Surprisal Analyse med andre vigtige beregnings procedurer, såsom let manipulation af analyseresultaterne – fx at vælge ønskelige resultat sub-sæt til yderligere inspektion -, hentning og sammenligning med relevante datasæt fra offentlige databaser og fleksible grafiske displays til heuristisk tænkning. Hele sæt af beregningsmetoder procedurer integreret i en enkelt praktisk værktøj er det, vi kalder

Computational Surprisal analyser

. Denne kombinerede form for analyse bør være meget hurtigere for praktikere og forskere, end at have uafhængige, men forkerte værktøjer til at blive integreret i logisk og praktisk konsekvens.

For det andet, over en længere tidshorisont, vores vision er at nå status,

Computational Surprisal analyse

vil være en rutinemæssig analyse for kræftdiagnostik. Således desuden billeddiagnostiske teknikker, minimalt invasiv kirurgi, kemoterapi, kontrollerede strålebehandlinger, forventes det, at

Computational Surprisal Analyse

vil finde sin plads i klinisk praksis, hastighedsoverskridelser-up diagnostik.

Derfor dette papir har til formål at vise:

relevansen af ​​Surprisal Analyse til

forstå

af biologiske fænomener, ved at diskutere nye resultater på området for Cellulær Cancer processer i laboratoriet miljøet

at

Computational Surprisal analyser

faktisk accelererer Surprisal Analysis, ved først at beskrive de integrative aspekter af værktøjet, og derefter forklare speed-up gevinster i beregning og i heuristisk tænkning;

anvendeligheden af

Computational Surprisal analyser

til diagnostisk for Cellulær Cancer Processer, ved at sammenligne resultaterne for syge i modsætning til raske forsøgspersoner.

Cellular Cancer Processer

Kræft er en meget heterogen sygdom viser en betydelig fænotypisk variation blandt patienter med samme form for kræft. Derfor forståelse af de underliggende onkogene processer, der er involveret i processen med transformation, kræver systemniveau tilgange til identifikation og karakterisering af systemets bestanddele.

De seneste tekniske fremskridt, herunder cDNA microarrays og masse spec analyse af cellen proteomer, gøre det muligt at fastsætte globale og kvantitative funktionelle profiler af kræftceller og væv. Derfor er der en stigende efterspørgsel efter teoretisk-beregningsværktøjer bistår med til dybere forståelse af dataene.

Ved hjælp af en teoretisk-beregningsmæssige tilgang, vi analyserede flere genekspression datasæt, herunder nyre kræftpatienter, HPV16 inducerede transformerede keratinocytter og WI-38 transformerede fibroblaster [7], [8]. Desuden kan anvendes analysemetoden ikke kun til messenger RNA, mRNA som vi gør her, men også til microRNA [9] og ud til alle genomenbaserede datasæt, herunder proteomics og metabolomics.

I dette papir vi centrere opmærksomheden på en analyse af de mRNA-niveauer som anvender samme kvantitative principper som i ikke-ligevægt flerkomponentsystemer i fysik og kemi. Ved hjælp af biologiske systemer udvikler sig i tid som reaktion på forstyrrelser, vi sigter mod at definere mRNA signaturer på det mest stabile, steady state af systemet og de grupper af mRNA, der afviger fra den steady state på grund af forstyrrelse. Til dette formål anvender vi surprisal analyse som en teknik, der gør os i stand til at anvende termodynamiske principper i biologi [4], [6], [8], [14].

Produktionen af ​​surprisal analyse omfatter flere grupper af mRNA, dem, der bidrager mest til den steady state og anden gruppe af mRNA’er bidrager væsentligt til afvigelserne fra steady state på alle stadier af transformation. Den sidste gruppe omfatter yderst heterogene ustabile transskription fænotyper [6] ligger til grund for processen med transformation. Ud over identifikation kræft specifikke gen /protein underskrifter, tillader surprisal analyse sammenligner af sygdommen mRNA fænotyper til de mest stabile og modstandsdygtige over for forstyrrelser steady state transskription mønstre i alle faser af sygdommen, tilføjer et nyt lag til karakteriseringen af ​​forskellige dele kræft transkriptomet.

Surprisal Analyse

Surprisal Analysen er baseret på princippet om maksimal entropi. Entropi er en fysisk størrelse, der opstod i disciplinen Termodynamik, derefter dukkede op i statistisk mekanik og senere i Information Theory. Kvalitativt talende entropi er et mål for forstyrrelse eller mangel på information. Entropi stiger, når chancen for et system til at være i en given tilstand blandt sine mange mulige tilstande er mere ensartet. Hvis sandsynligheden for systemet at være i en bestemt tilstand er meget større end de sandsynligheder for at være i enhver anden tilstand, vi ikke mangler information om systemet og entropi er minimal.

tilgang baseret på princippet om maksimal entropi, siger, at vores oplysninger om en fordeling af systemtilstande opnås ved at maksimere entropien under de kendte information begrænsninger. I mangel af oplysninger, lidelsen er maksimal og oplysningerne er minimal.

Vi stiller de begrænsninger ved hjælp af en metode, indført af Lagrange (for yderligere oplysninger se File S1). Det kræver maksimering udtrykket for Lagrange som en funktion af de lagrangemultiplikator: (1)

Hver multipliceres med en koefficient en Lagrange multiplikator, hvis talværdi fortæller om den relative betydning af den respektive begrænsning i særlige omstændighed . Alle de vægtede begrænsninger summeres og begrænse Entropy reduceres fra dens absolutte maksimale værdi.

I vores anvendelse af denne teknik til cellulære kræft processer, er begrænsninger betragtes som såkaldte transskription /oversættelse mønstre /kræft signaturer f.eks relateret til specifikke cellulære processer. Disse biologiske mønstre forhindre kræftceller at nå den maksimale entropi, der forventes at eksistere ved den balancerede tilstand af det biologiske system. Surprisal analyse identificerer begge stater på alle stadier af sygdommen: den afbalanceret tilstand og begrænset tilstand, hvor specifikke kræft mønstre er mest aktive [6] – [8]. På ethvert givet tidspunkt bestemte mønstre bidrager mere end andre. Derved kan man udlede om den relative betydning af specifikke cellulære processer i forskellige stadier af kræft debut. I denne analyse hver udskrift kan deltage i mere end én transskription mønster, ligger til grund for kræftudviklingsproces.

Computational Surprisal Analyse

For at demonstrere konceptet og opnåede hastighed-up af

Computational Surprisal Analyse

blev en integreret værktøj designet og implementeret, der har den overordnede softwarearkitektur vist i figur 1. Dens softwaremoduler (fra nu af kaldet softmodules) blive beskrevet i detaljer i afsnittet Metoder af papiret (for yderligere detaljer se også File S1).

Software Arkitektur af den integrerede værktøj.

for at få den integrerende smag af

Computational Surprisal Analyse

værktøj vi nu nævne de fire softmodules ‘input og det endelige output af analysen:

Surprisal analyser

– input er en stor rektangulær matrix af data af genekspression niveauer opnået fra målinger i en chip array. En af dimensionerne af datamatrixen er meget større end den anden (for eksempel 4 tidsstempler ved ca. 22.000 gener). Et mål af surprisal analyse er at reducere datamatrix til håndterbare dimensioner, nemlig. til opnåelse af en kvadratisk matrix, hvis dimension er mindre eller højst lig med den lille dimension af de data matrix;

Gene profilering Z – indgang er en lille matrix af data, hvis størrelse er fastsat af antal mønstre er relevante for de oplysninger målt, siger en 4 af 4 matrix, der er relevante for 4 tidsstempler i de cellulære processer

DB Retrieval

– indgang består af sub-sæt af gener opnået af genet profilering. Hver undergruppe indeholder mere indflydelsesrige gener i de respektive mønster,

Heuristisk Analyse Z – input er data opnået i de tidligere softmodules. Beregning er udført for at analysere og interaktivt vise at analysere heuristisk.

En prøve output ses i to heat maps, der beskriver protein-forbindelse, i figur 2.

Den øverste varme kort opnås ved hjælp af Surprisal Analysis. Den nederste zonekort er baseret på helt uafhængige data opnået ved DB Retrieval. Akserne i begge heatmaps er identiske, nemlig. de indeholder de samme transskription navne i samme rækkefølge. Som sædvanlig for heatmaps, farver står for relative intensiteter (numeriske skalaer set over hver Heatmap): rød er høj intensitet og blå er lav intensitet. Regionerne med den samme farve i begge heatmaps klart overlapper hinanden, dvs. deres resultater passer meget godt, hvilket indebærer, at

Computational Surprisal analyser

– i den øverste Heatmap – kan give prædiktiv information om transkriptionelle og protein netværksstrukturer – i den nederste heatmap. Hvide prikker i den nederste Heatmap betegne manglende oplysninger om de specifikke udskrifter

Resultater

I dette afsnit præsenterer vi resultaterne af vores arbejde set fra tre forskellige perspektiver:. A- genomisk karakterisering af kræft processer: b- karakteren af ​​

Computational Surprisal analyser

; c- visionen om

Computational Surprisal analyser

som et praktisk kræftdiagnose værktøj.

A- Genomisk karakterisering af Cancer Processer

For genomisk karakterisering af kræft behandler relevante eksperimentelle input er de transkriptionsniveauer af de forskellige mRNA’er. De begrænsninger i surprisal analysen etiketten fænotyper og en egnet terminologi er givet ved en ansøgning og specialisering af ligning (1) ovenfor, som følger: (2), hvor indeksene refererer til gen

jeg

og til fænotype . er den eksperimentelle ekspressionsniveauet af gen

jeg

, er den (tids-uafhængige) omfanget af deltagelse i et givet udskrift

jeg

i transskription mønster og den Lagrange multiplikator på ligning (1) er her vægten af ​​den respektive transkription mønster. Denne terminologi vil blive yderligere præciseret i afsnittet Metoder med særlig henvisning til den særlige rolle af udtrykket.

Det endelige output af

Computational Surprisal Analyse

er heatmaps viser omfanget af deltagelse transkripterne især transskription mønstre indekseret af. Disse teoretiske heatmaps sammenlignes med eksperimentelle heatmaps beskriver den funktionelle konnektivitet af de undersøgte transkripter, ved hjælp af tilslutningsmuligheder scorer på STRING database (Se metoderne afsnit). På den måde relaterer vi værdier til de funktionelle netværk, der har den højeste STRING tilslutningsmuligheder scoringer, som blev verificeret eksperimentelt.

De koefficienter, hvor indekset 0 refererer til den nulte fænotype, har negative værdier, hvilket betyder, at udskrifter mest bidrager til

steady state

har de laveste værdier. værdier – for første fænotype – repræsenterer omfanget af deltagelse af en bestemt udskrift i den vigtigste transskription mønster ligger til grund for

proces med cellulær transformation

. værdier kan være både negativ og positiv, peger på korrelation eller inverse korrelation af transkripterne inden transkriptionen mønster. De udskrifter er mærket i henhold til Gene ontologi kategorier

HF1 celler -.. HPV16 Immortaliserede keratinocytter

Brug HPV-16 inducerede udødeliggjort keratinocytter, vi analyserede gen udtryk mellem forskellige stadier af HPV-16-induceret transformation af keratinocytter [11]. Gene ekspressionsniveauerne blev målt ved

fire diskret tid peger

, kaldet henholdsvis:

K (normale celler ikke-transformerede af papillomvirus),

E (HPV16 transformerede celler fra en

tidligt

fase af transformation),

L (transformerede celler fra en

sent

fase af transformation)

BP (cellerne fra sent, at blev behandlet af

benzo [a] pyren

) [11].

Brug surprisal analyse identificerede vi den store transskription mønster bidrager på alle tidspunkter (for flere detaljer se [8 ]). Denne transskription mønster omfattede udskrifter ansvarlige for svind i de veje, der kontrollerer apoptose og forbedring i cellecyklus netværk i de sene stadier af transformation. Alle disse underskrifter blev valideret ved biokemiske midler [11].

Surprisal analyse peger også sekundære transskription mønstre, der ikke er signifikant på alle stadier af forvandling HF1 [8]. I dette arbejde undersøger vi de mest stabile udskrifter bidrager til en afbalanceret, invariant tilstand HF1 systemet og sammenligne dem med de store transskription mønster involveret i processen med transformation. Vi bruger

Computational Surprisal analyser

at bygge symmetriske matricer – for at generere heatmaps – f.eks hvis

ij

element er.

I figur 3 kan man se resultaterne for HF1 celler (HPV16 Immortaliserede keratinocytter) af

Computational Surprisal Analyse

i fem forskellige former. Disse er henholdsvis:

(A) En Heatmap af de 100 mest stabile (set i (a) i rød farve) og 100 mest bidrager til den vigtigste transskription mønster (højest) og op-regulerede udskrifter (set i (a) i blå farve) som opnået ved surprisal analyse. I denne figur: PS – proteinsyntese, SG – signalering og vækst. (B) En Heatmap af samme transkript listen i (A) under anvendelse STRING DB scores. (C) Listen samme udskrifter blev anvendt til at generere. (D) Connectivity Kort over de 100 mest stabile udskrifter som bruger STRING DB; den røde farve ellipse omslutter de mest stabile og forbundne transkripter involveret i proteinsyntese. Tykkelsen af ​​linierne viser den omtrentlige sandsynlighed for protein-protein funktionel link til de relaterede udskrifter, som foreskrevet af String score (se Metoder sektioner for flere detaljer). For eksempel, tykke linjer (som for de proteiner, fremhævet af røde stjerner inde i ellipse, String score = 0,999) repræsenterer stor sandsynlighed for funktionelle konnektivitet baseret på biokemisk verifikation, mens tynde linier (som for de proteiner, fremhævet af sorte stjerner, i venstre bund uden for ellipsen, String score = 0,507) udgør mindre sandsynlighed for den funktionelle forbindelse. (E) Connectivity kort over de 100 udskrifter mest bidrager til den vigtigste transskription mønster (blå farve)

Øverste venstre – Heatmap repræsenterer værdier.

Øvre midten – Heatmap af samme udskrifter liste i (a) ved hjælp af STRING DB scores;

Øverst til højre – Heatmap på listen samme udskrifter i (a) med værdier

Nederste venstre – Connectivity kort over de mest stabile udskrifter i (a) ved hjælp STRING DB;.

Nederste højre – Connectivity Kort over den højeste

fra figur 3 kan man bemærke, at de mest stabile udskrifter (med de laveste værdier hører meste til proteinsyntese kategori. der er en god overensstemmelse mellem (Fig.3A) og (3B) heatmaps, hvilket betyder, at de mest stabile udskrifter, som defineret af surprisal analyse, er mere funktionelt forbundet som vist på STRING DB heatmap . den heatmap (fig. 3B) er den kvantitative repræsentation af tilslutningsmuligheder kort (fig. 3D og 3E).

(fig. 3C) heatmap af det samme gen liste med værdier er ukorreleret med (fig . 3A) og (fig. 3B), hvilket betyder, at transkripterne med det største bidrag til den stabile invariante tilstand deltage næppe i transformationsprocessen. Disse transkripter, der bidrager mest til transformationsprocessen genererer mindre tilsluttede kort (3B, 3E) i sammenligning med de mest stabile transkripter (fig. 3B og 3D), der har meget små relative ændringer (den laveste værdi for).

Wi-38 celler – WI-38 transformerede fibroblaster

i figur 4 kan man se resultater for WI-38 celler (WI-38 transformerede fibroblaster) af

Computational Surprisal Analyse

i. de samme fem former og overenskomster som i figur 3. Denne cellulære system omfatter 12 stadier af forvandling kræft, hvor der blev anvendt forskellige genetiske ændringer [12]. Denne cellesystemet undergik omkring 12 molekylære manipulationer såsom hTERT insertion, cellefordoblinger, undertrykkelse af p53 funktion og indsættelsen af ​​onkogene H-Ras som rapporteret i [12], hvorved udvikling af den normale WI-38 immortaliserede ikke-transformerede fibroblaster i fuldt transformerede celler. I denne kræft mobilsystem var stabil i alle 12 tidspunkter i transformation den afbalanceret tilstand, mens betydningen af ​​transskription mønstre involveret i processen for forarbejdning varierede på forskellige tidspunkter [7].

(A) A heatmap af 100 mest stabile (set i (A) i rød farve) og de 100 mest bidrager til den vigtigste transkription mønster (højest) og opreguleret transkripter (set i (A) i blå farve) som opnået ved surprisal analyse. (PS – proteinsyntese, SMP – signalering, migration, spredning). (B) En Heatmap af samme transkript listen i (A) under anvendelse STRING DB scores. (C) Listen samme udskrifter blev anvendt til at generere. (D) Connectivity Kort over de 100 mest stabile udskrifter som bruger STRING DB; den røde farve ellipse omslutter de mest stabile og forbundne transkripter involveret i proteinsyntese. (E) Connectivity kort over de 100 udskrifter mest bidrager til transskription mønster (blå farve)

Fra figur 4 man gør de samme observationer som ovenfor:.. Der er en god fitness mellem (fig 4A .) og (fig 4B) heatmaps; (C) værdier Heatmap er ukorreleret med (fig. 4A) og (fig. 4B). Den Heatmap (fig. 4B) er den kvantitative repræsentation af tilslutningsmuligheder kort (fig. 4D og fig. 4E). Udskrifter med de højeste værdier og den største absolutte generere mindre tilsluttede kort (Fig. 4E) med flere biologiske moduler (ikke at forveksle med softmodules). Den vigtigste netværk modul i figur 4E omfatter udskrifter, der deltager i NFicB (Nuclear faktor kappa B) signalering. Interessant dette modul tilhører den ekstra (mindre) transskription mønster, der har store vægt i de sidste stadier af udvikling af kræft [7]. Dette modul blev valideret og tidligere defineret som “tumor-dannende genetiske signatur” i WI-38 kræft modelsystem [12]

Man opsummerer Genomisk Karakterisering underafsnit af følgende punkter:.

Stabil netværk

(udskrifter med de laveste værdier) generere stærke funktionelle forbindelser ifølge STRING DB. Hvert protein der er en hub protein, med mange forbindelser og broer, der kan kvantitativt visualiseres i surprisal og STRING DB heatmaps. Sandsynligheden for, at en dødelig mutation, såsom deletion, idet navet protein ville føre til en celledød forventes at være højere i sammenligning med de mindre forbundne proteiner.

Transformation netværk og tilslutningsmuligheder

– udskrifter med de højeste værdier, der bidrager mest til den transformationsproces, generere mindre tilsluttede gruppe i alle datasæt. Således sletning af en af ​​dem eller udskiftning af et andet protein, kan ikke påvirke netværket betydeligt. Det samme resultat blev opnået for de udskrifter med de laveste værdier [6]. Som vist ovenfor, kortet indeholder normalt flere adskilte netværk moduler (se for eksempel Fig. 4E). Disse moduler kan undersøges yderligere som potentielle mål for medicinsk behandling.

b- Karakteren af ​​Computational Surprisal Analyse

Her beskriver vi karakteren af ​​

Computational Surprisal analyse

. Den består hovedsagelig af følgende tre aspekter: a- synergistisk integration af forskellige former for beregning; b- kvantitativ speed-up; c- roman slags slutninger udelukkende bygger på surprisal analyse.

Synergistisk Integration med forskelligartede former for Computation.

Efter softmodules afbildet i figur 1, er der to former for betjening af

Computational Surprisal Analyse

systemet:.

1-

Sekventiel

– at sammenkæde de softmodules nøjagtigt som vist i figur 1, ved hjælp af hvert softmodule output som input til den næste softmodule

2

cyklisk

-. visse softmodules er valgt til at være cyklisk gentages, med eventuelt varierende input indtil man kommer ud af løkken, med tilfredsstillende resultater

i begge veje en effektiv beregning er væsentlige kun begrænset af interaktionerne med menneskelig bruger. Disse interaktioner kan være så simpelt som at vælge /læsning input /output. De kan være mere sofistikeret, som f.eks dedikere tid til heuristisk tænkning og gøre slutninger af flere typer.

For at muliggøre cykliske gentagelser, skal man være i stand til vilkårligt at starte med en softmodule, uafhængigt af andre softmodules. Dette er faktisk muligt, da softmodules er bygget sådan, at de enten direkte kan modtage produktionen af ​​en tidligere softmodule i en kæde mode eller for at få en anden ekstern indgang. Der er ingen grund til at spilde tid på eksplicit datamanipulation, såsom konvertering formater i mellem softmodules. Dette bliver automatisk gjort, er et iboende træk ved den synergistiske integration

Med hensyn til 1

st softmodule -. Surprisal Analyse – vi har allerede set, at dens output omfatter flere grupper af f.eks mRNA: dem, der deltager i steady state og andre, der bidrager væsentligt til afvigelserne fra steady state. Den softmodules synergi er nødvendig for at forstå den biologiske betydning af disse grupper, nemlig. vi udnytter fx STRING DB adgang [15] for at tegne funktionelle netværk for hver gruppe

2

nd softmodule -. Gene Profilering – er en effektiv integration bro mellem de 1

st og 3

rd softmodules . Det gør det muligt udvælgelse af de betydelige gener fra surprisal analyseresultater til at hente de relevante oplysninger fra offentligt tilgængelige databaser.

Med hensyn til 3

rd softmodule, at adgangen til en database som STRING DB sker gennem en egnet interface – gennemsigtig for den menneskelige bruger – så ligetil udvælgelse og hentning af de ønskede data i softmodule, for forward beregninger. Systemet modularitet muliggør simple fremtidige grænseflader til yderligere databaser af interesse.

Endelig 4

th softmodule muliggør forbindelse kvantitativt output surprisal analyse til den funktionelle forbindelse mellem mRNA. To slags heatmaps leveres:

1- teoretisk Heatmap af tilslutningsmuligheder hjælp grader af kapitalinteresser f.eks mRNA ved steady state /afvigelser fra steady state som beregnet af Surprisal analyse (fra 1

st softmodule) og valgt ved hjælp af Gene profilering (2

nd softmodule)

2 -.. funktionel heatmap beregnet ud fra STRING DB kombinerede scoringer

Disse integrerede procedurer tillader meget

effektiv og kvantitativ

forståelse af den funktionelle forbindelse mellem mRNA, der bidrager til de forskellige stadier af forvandling

Kvantitative Speed-Up Evaluering.

Som det ses ovenfor,

Computational Surprisal Analyse

involverer forskellige former for beregnings- procedurer. Disse har varighed gange med meget forskellig rækkefølge af størrelser, der kan klassificeres som følger:

Automatisk rent beregningsmæssige procedure

– for eksempel Surprisal Analyse udført af en

st softmodule. Varigheden af ​​en sådan beregning kan være, og faktisk har været målt meget præcist. Denne varighed kan sikkert forkortes ved effektiv sekventiel beregning i gængs forstand eller sige ved parallelisering. På den anden side er dette så meget hurtigere end de næste procedurer, at der for alle evalueringsformål gangen uslebne øvre grænse af størrelsesordenen nogle få sekunder er tilstrækkeligt tilfredsstillende

Menneskelig interaktiv procedure -.

for eksempel Gene profilering af 2

nd softmodule eller lidt længere heatmaps sammenligning. Dette er de hastighedsbestemmende trin i

Computational Surprisal Analysis

. Deres varighed kunne være i princippet forkortes ved hjælp af menneske-computer interaktion analyseteknikker. På den anden side er det rimeligt sikkert at antage, at dens nedre grænse er begrænset af den menneskelige formåen, groft anslået til at tage en tid i størrelsesordenen minutter.

For at vurdere den kvantitative hastighed- up opnås ved modulerne i

Computational Surprisal Analyse

, bør de ovennævnte varighed gange sammenlignes med ikke-synergistisk ydelse:

Manuel datakonvertering og manipulation

– for eksempel, manuelt at flytte data fra databaser, mens konvertere dem til et passende format til en heatmap skildring procedure. Det kan tage et groft anslået varighed mindst i størrelsesordenen ti minutter selv for ekspert softwareingeniører.

Ud fra ovenstående beregninger, man evaluerer den samlede kvantitative speed-up opnås ved

Computational Surprisal analyser

, at være i størrelsesordenen ti. Dette er forholdet mellem den længst mulige varighed, nemlig.

manuel data manipulation

til den kortere hastighedsbestemmende trin, nemlig.

menneskelig interaktiv procedure

medieret af synergistisk automatisk datakonvertering og manipulation.

Dette hurtigere ekspeditionstid giver forskere og praktikere til at anvende den opnåede tid for lønsom analyse. I den forstand, det fremskynder op potentialet heuristisk tænkning. Heuristisk tænkning har en associativ karakter, som blev antydet at ved at sætte side om side (for eksempel i figur 3 og 4 i nærværende dokument) forskelligartet resultat viser som Surprisal Analyse genererede heatmaps og tilslutningsmuligheder kort.

En vigtig Inferens:. Stabilitet af steady state

Ud over at integrere forskellige typer af beregninger med surprisal analyse, analysen muliggør nye former for slutninger. Her diskuterer vi slutning af stabiliteten af ​​de grundlæggende, husholdning cellulære processer, såsom proteinsyntese.

Den kvantitative argument bruger eq. (2), der indebærer, at de eksperimentelle ekspressionsniveauerne af udskrifter med signifikant (negativ

Be the first to comment

Leave a Reply