PLoS ONE: Robuste Prognostiske genekspression Signaturer i blærekræft og lungeadenokarcinom Afhænger Cell Cycle Relaterede Gener

Abstrakte

Få prognostiske biomarkører er godkendt til klinisk brug primært fordi deres oprindelige ydeevne ikke kan gentages i uafhængige datasæt. Vi postulerede, at robuste biomarkører kunne opnås ved at identificere deregulerede biologiske processer deles blandt tumortyper, der har en fælles ætiologi. Vi udførte et gen sat berigelse analyse i 20 offentligt tilgængelige genekspression datasæt omfattende 1968 patienter, der har en af ​​de tre mest almindelige tobaksrelaterede kræftformer (lunge, blære, hoved og hals) og identificerede cellecyklus relaterede gener som mest konsekvent prognostiske klasse af biomarkører i blæren (BL) og lunge adenocarcinom (LUAD). Vi fandt også prognostiske værdi af 13 af 14 offentliggjorte BL og LUAD underskrifter var afhængige af cellecyklus relaterede gener, støtte betydningen af ​​cellecyklus relaterede biomarkører for prognose. Interessant nok blev der ikke prognostiske genklasser identificeret i planocellulært lungecarcinom eller hoved og hals pladecellekarcinom. Dernæst blev en specifik 31 gen cellecyklus proliferation (CCP) underskrift, der tidligere udledt i prostata tumorer evalueret og fundet forudsigelse af resultatet i BL og LUAD kohorter i univariate og multivariate analyser. Konkret CCP score væsentligt forbedret den prædiktive evne multivariate modeller baseret på standard kliniske variabler for progression i BL patienter og overlevelse i LUAD patienter i flere kohorter. Vi derefter genereret tilfældige CCP signaturer i forskellige størrelser og fundet sæt af 10-15 gener havde robust ydeevne i disse BL og LUAD kohorter, en konstatering, der blev bekræftet i en uafhængig kohorte. Vores arbejde karakteriserer betydningen af ​​cellecyklus relaterede gener i prognostiske underskrifter for BL og LUAD patienterne og angive et specifikt signatur tilbøjelige til at overleve yderligere validering

Henvisning:. Dancik GM, Theodorescu D (2014) Robuste Prognostisk genekspression Underskrifter i blærekræft og lungeadenokarcinom Afhænger cellecyklus gener. PLoS ONE 9 (1): e85249. doi: 10,1371 /journal.pone.0085249

Redaktør: John D. Minna, Univesity of Texas Southwestern Medical Center på Dallas, USA

Modtaget den 22. april 2013; Accepteret: November 24, 2013; Udgivet: 22 januar, 2014

Copyright: © 2014 Dancik, Theodorescu. Dette er en åben adgang artiklen distribueres under betingelserne i Creative Commons Attribution License, som tillader ubegrænset brug, distribution og reproduktion i ethvert medie, forudsat den oprindelige forfatter og kilde krediteres

Finansiering:. Dette arbejde understøttes delvist af National Institutes of Health giver CA075115 og CA104106. De finansieringskilder havde ingen rolle i studie design, indsamling og analyse af data, beslutning om at offentliggøre, eller forberedelse af manuskriptet. Ingen yderligere ekstern finansiering blev modtaget til denne undersøgelse

Konkurrerende interesser:. Forfatterne har erklæret, at der ikke findes konkurrerende interesser

Introduktion

Gen-ekspression profilering af humane kræftformer har revolutioneret. vores forståelse af sygdommen og fremskyndede opdagelsen af ​​prognosticering og prædiktive biomarkører [1] – [3]. Imidlertid har nogle multi-gen-biomarkører blevet godkendt til klinisk anvendelse [4] til dels fordi de mangler robusthed på tværs af flere datasæt. Dette er især slående for blærekræft, hvor Lauss og associerede virksomheder [5] evalueret 28 offentliggjorte gen underskrifter designet til diagnostiske og prognostiske formål for blærecancer og konstateret, at ingen af ​​de 6 overlevelse underskrifter klaret sig bedre end chance, når den anvendes til uafhængige datasæt.

Her har vi fat denne mangel på robuste prognostiske biomarkører ved at postulere eksistensen af ​​fælles cellulære processer (moduler) på tværs af flere tumortyper af fælles ætiologi, hvis unormal aktivitet kunne opfanges af en transkriptionel signatur. Som vores mål var at udvikle robuste blærekræft biomarkører, valgte vi yderligere cancertyper med at ryge som en veldefineret væsentlig ætiologisk faktor. Identifikationen af ​​en sådan proces vil formentlig give mulighed for udvikling af robuste biomarkører, der er prognostiske tværs af flere patientkohorter og tumortyper.

En oversigt over vores analyse er tilvejebragt i figur 1. Først et gen sæt berigelse analyse af genekspressionsprofiler fra 1968 patienter med tobaksrelaterede kræftformer (blære urothelial cell carcinoma, lunge adenocarcinom, lunge pladecellekarcinom, og hoved- og hals pladecellecarcinom) blev udført og identificeret cyklus moduler så konsekvent prognostiske i blæren og lunge adenocarcinom. Vi fandt, at en bestemt celle cyklus gen underskrift var prædiktiv for udfaldet i blære og lungeadenokarcinom og at udførelsen af ​​offentliggjorte blære og lunge adenocarcinom underskrifter afhang cellecyklus-korreleret gener. Næste vi udviklet og evalueret en 12-gen panel af cellecyklus relaterede gener og fundet dem effektivt i stratificering kliniske resultat i en uafhængig kohorte. Vores resultater karakterisere centrale betydning cellecyklus relaterede biomarkører i prognostiske gen underskrifter hos patienter med almindelige typer kræft og implicerer celledeling som den primære drivkraft for resultatet sygdom. Mere generelt, denne tilgang definerer funktionelt dominerende biologiske moduler kørsel human cancer prognose og identificerer robuste prognostiske biomarkører.

A, Biologiske processer forbundet med overlevelse i tobaksrelaterede tumorer blev identificeret gennem et sæt berigelse gen-analyse. Denne analyse identificerede cellecyklus som den eneste biologiske proces konsekvent forbundet med udfaldet, i blære og lungeadenokarcinom mens ingen processer blev identificeret som var prædiktive for resultatet i lunge adenocarcinom, pladecelle-lungecarcinom, eller hoved og hals pladecellekarcinom. B, I betragtning af resultaterne i A, blev den kliniske relevans af cellecyklus relaterede gener vurderes på to måder. Først, vi vurderet den prognostiske værdi af en specifik 31 gen cellecyklus proliferation (CCP) signatur i blære og lungeadenokarcinom i univariate og multivariate analyse. For det andet, fandt vi, at den prognostiske værdi af tidligere offentliggjorte gen signaturer forudsige overlevelse i blæren progression og lungeadenokarcinom var afhængig af celle-cyklus korrelerede gener. C, fordi yderligere analyse viste, at prognostiske værdi af CCP score var afhængig af signatur størrelse, vi optimeret CCP signatur og fandt, at en mindre 12 gen signatur (CCP-12) var prognostisk i en ekstern datasæt.

Materialer og metoder

Gene udtryk datasæt og kliniske endpoints

Vi analyserede 20 genekspression datasæt omfatter 1968 patienter med blære urothelial celle carcinom (BL, fem kohorter, 42

%

), lungeadenocarcinom (LUAD, otte kohorter, 39%), lunge pladecellecarcinom (LUSC, tre kohorter, 8%), og hoved og hals pladecellecarcinom (HNSCC, fire kohorter, 10%). Alle genekspression datasæt, der anvendes i denne analyse er offentligt tilgængelige og kan downloades fra Gene Expression Omnibus (GEO) [6] eller som supplerende materiale til offentliggørelse, som angivet i tabel S1-S4 i File S2. Henvisninger til den oprindelige undersøgelse for hver kohorte er også i tabel S1-S4 i File S2. For flere detaljer se Støtte Materialer og metoder i File S1.

endepunkter omfattede progression i BL patienter. Tre BL kohorter havde progression oplysninger, som blev defineret ved de oprindelige forfattere som stigning fra NMI til MI sygdom (Lindgren og Dyrskjøt kohorter, Ref # [7], [8]), eller en stigning i fase (CNUH, Ref # [9 ]). For to kohorter (Lindgren og CNUH) tid til progression var ikke tilgængelige og evnen af ​​et gen eller signatur score til at forudsige progression (Progressor vs. non-Progressor) blev evalueret ved arealet under receiver opererer karakteristik kurven (AUC). I Dyrskjøt, klinisk opfølgning tidspunkt var til rådighed så for progressionsfri overlevelse (PFS) analyse.

overlevelse endepunkt blev valgt som følger. Sygdomsspecifikke overlevelse (DSS) blev altid brugt, hvis tilgængelige (tre BL kohorter). Samlet overlevelse (OS) blev anvendt, hvis DSS var utilgængelig (to BL, syv LUAD, og ​​to LUSC kohorter). Gentagelse overlevelse (RFS) blev anvendt, hvis hverken DSS eller OS var til rådighed (en LUAD og to HNSCC kohorter). Begivenhederne for disse endepunkter er død af sygdom, død uanset årsag, og sygdom tilbagefald, for DSS, OS, og RFS hhv. I et yderligere HNSCC kohorte (Colo, Ref # [10]) gentagelse status blev leveret, men de kliniske opfølgende tider var ikke, og evnen af ​​et gen til at forudsige tilbagefald blev vurderet ved AUC. Desuden kirtelinvolvering tæt korreleret med resultatet i HNSCC [11] og blev anvendt som et surrogat for overlevelse i to kohorter giver mulighed for en mere omfattende analyse. De kliniske endepunkter for hver kohorte er sammenfattet i tabel S1-S4 i File S2.

Cell cyklus proliferation (CCP) score

I microarray datasæt blev sonder konverteret til gen symboler baseret på Affymetrix annotation , GenBank deponeringsnummer, eller Unigene cluster id. For gener med multiple prober, blev proben med den højeste gennemsnitlige udtryk værdi anvendes [12]. Ekspressionen af ​​hvert gen var

z

-normalized tværs prøver at have en middelværdi på nul og en standardafvigelse på én. CCP resultat er gennemsnittet udtryk for alle normaliserede CCP signatur gener på array. I prostatacancer datasæt, CCP resultat er gennemsnittet ekspression af 31 CCP gener målt ved kvantitativ RT-PCR. For detaljer se Støtte Materialer og metoder i File S1.

Gene sæt berigelse og generelle statistiske analyser

Database til Visualisering og Kommenterede Discovery (DAVID, Ref # [13]) blev anvendt til gen sæt berigelse analyse for at identificere overrepræsenteret Gene Ontology (GO) [14] vilkår og Kegg veje [15] i lister over gener. Yderligere oplysninger om denne og generelle statistiske analyser findes i støtte materialer og metoder i File S1. Alle blev udført under anvendelse af analyser bortset fra gensæt berigelse analyse

R

(https://cran.r-project.org). Prøve

R

kode og output findes i form af et Sweave dokument, der indeholder output fra vores analyse flettede med tilsvarende

R

kode (File S3). Yderligere R-kode er til rådighed efter anmodning.

Resultater

sæt berigelse Gene analyse identificerer cellecyklus relaterede gener som mest konsekvent prognostiske klasse af biomarkører i blære og lungeadenokarcinom

Data fra 1968 patienter blev undersøgt for resultaterne af tumor progression (hvor muligt) og overlevelse (defineret i materialer og metoder). I hver kohorte identificerede vi lister af gener prædiktive af resultatet (P 0,01) og udførte en berigelse analyse, der identificerer overrepræsenteret moduler (GO vilkår [14] og Kegg veje [15], figur 2, figur S1, og tabel S5 i File S6 ) i disse gen-lister. Cellecyklus relaterede moduler var de mest konsekvent beriget moduler på tværs af BL og LUAD patientkohorter (for detaljer se Støtte Resultater og diskussion i File S1). I modsætning hertil LUSC og HNSCC patientkohorter ikke en fælles overrepræsenteret vejen (for detaljer se Støtte Resultater og Diskussion i File S1).

hver kohorte, overrepræsenterede Gene ontologi (GO) vilkår og Kegg veje blev identificeret fra lister over gener betydeligt prædiktive for sygdom udfald (P 0,01) ved hjælp af DAVID gen annotation berigelse analyse toolkit. Konsekvent prognostiske moduler blev identificeret ved rangordning alle moduler først med antallet af kohorter med betydelige resultater (FDR 20%) og derefter ved gennemsnitlig p-værdi. Hver subfigure indeholder ti moduler: de mest konsekvent prognostiske moduler og den “top hit ‘for hver kohorte, markeret med en stjerne (*), der er defineret som modulet med den laveste FDR i den kohorte, der har en FDR 20% i flere kohorter. A, overrepræsenteret GO vilkår forbundet med overlevelse i blærekræft. B, overrepræsenteret GO vilkår forbundet med overlevelse i lunge adenocarcinom. C, overrepræsenteret GO vilkår forbundet med overlevelse i planocellulært lunge karcinom. D-F, samme som A-C, dog overrepræsenterede identificeres Kegg pathways. Der var ingen signifikant overrepræsenteret prognostiske moduler i hoved og hals pladecellekræft kohorter på FDR 20%. LUSC: Planocellulært lunge karcinom, FDR:. Falsk opdagelse sats

univariate og multivariate analyse af en cellecyklus spredning score i blære og lungeadenokarcinom

For at bestemme den kliniske relevans af disse fund vi evaluerede en tidligere publiceret cellecyklus proliferation (CCP) score (gennemsnitlig udtryk for 31 cellecyklus gener), der forudsagde tid til tilbagefald eller død i prostatacancer [16], [17]. Hvis overrepræsenteret cellecyklus moduler var afgørende for klinisk udfald, så ville man også forvente CCP score for at være

Samlet set CCP score var signifikant prædiktiv (P 0,05). Af progression og overlevelse i alle BL kohorter med disse endepunkter, og for overlevelse i 5/8 LUAD kohorter, med høje CCP scores forbundet med dårlig prognose i alle tilfælde. Konkret CCP score var prædiktiv for progression i CNUH (AUC = 0,68, P 0,05), Lindgren (AUC = 0,70, P 0,05), og Dyrskjøt (HR = 4,73, P 0,001, figur 3A) kohorter. CCP score var prædiktiv for overlevelse (P 0,05) i alle fem BL kohorter (HR 1,81-4,73, figur 3B) CCP score var også prædiktiv for udfaldet (P 0,05) i 5/8 LUAD kohorter (HR 1,53-2,68, figur 3C).

A, prognostisk værdi af CCP score for progression i blærekræft i CNUH (N = 165), Lindgren (N = 97), og Dyrskjøt (N = 353) kohorter. I CNUH og Lindgren kohorter, follow-up tid var ikke tilgængelig, så vi evaluerede evne CCP score til at skelne mellem ikke-progressorer (NP) og progressorer (P) som beskrevet i Materialer og metoder. I Dyrskjøt kohorte blev Kaplan-Meier (KM) kurver for progressionsfri overlevelse (PFS), der genereres for patienter med CCP score ved den nederste (grøn), midterste (blå), og øvre (rød) 33% og log rank P-værdien af ​​den kontinuerte CCP score rapporteres. B, prognostiske værdi af CCP score for overlevelse i blærekræft. KM kurver blev genereret som i (A) for samlet overlevelse (OS) i Blaveri (N = 74) kohorte og for sygdomsspecifik overlevelse (DSS) i CNUH (N = 165), Dyrskjøt (N = 366), Lindgren (N = 142), og MSKCC (N = 87) kohorter. C, prognostiske værdi af CCP score for overlevelse i lunge adenocarcinom. KM kurver blev genereret for OS eller fornyet overlevelse (RFS) i CAN /DF (N = 82), MSK (N = 104), Son (N = 62), Takeuchi (N = 90), og Tomida (N = 117) kohorter. Forkortelser:. HR, hazard ratio, svarende til 1-enhed stigning i CCP score

Vi næste vurderet, om CCP score bidrager uafhængig prognostisk information. Vi udførte en multivariat analyse og omfattede klinisk relevante variabler som alder, køn og klasse i BL og LUAD kohorter, hvor CCP score var prognostisk i univariate analyser. For hver kohorte udviklede vi også en bedste multivariat model (dvs.

endelige model

) gennem fremad trinvis udvalg af informative variabler (P 0,05). En sådan model vælger en kortfattet, “optimal ‘sæt variabler og kan vælge CCP score over standard kliniske variable. Fordi kliniske variabler er let tilgængelige dette

endelige model

kan ikke være omkostningseffektivt i øjeblikket, men kan være det i miljøer, hvor kræft er iscenesat og klassificeres efter deres molekylære patologi. Endelig evalueres vi hvis CCP score steg den prognostiske værdi af en

bedste tilgængelige

model, der omfattede kliniske variable, som er let tilgængelige i de aktuelle indstillinger. En sådan stigning tyder på, at CCP score har klinisk anvendelighed. For flere detaljer ved se Støtte Materialer og metoder i File S1.

CCP score blev udtaget til

endelige model

i alle BL kohorter når progression var endpoint (tabel 1, tabel S6 i File S4), og var den eneste signifikante variable i den multivariate analyse. Når overlevelse var endepunktet, CCP score var den mest konsekvent signifikant variabel i den multivariate analyse (P 0,05), sammen med scenen, som var hver væsentlig i tre kohorter. CCP point er udvalgt til

endelige model

i to af disse kohorter (tabel 1, tabel S7 i File S4). Hos patienter med LUAD, CCP score var den mest konsekvent signifikant variabel i den multivariate analyse og også den hyppigst valgte variabel i

endelige model

(tabel 2, tabel S8 i File S4). I

bedste tilgængelige

modeller, tilsætning af CCP score førte til en stigning i prognostisk evne (P 0,05) i to BL, en BL, og tre LUAD kohorter når progression, overlevelse og overlevelse var endepunkter, henholdsvis (tabel S9-S10 i File S5). Disse resultater tyder på, at CCP score kan være overlegen end standard kliniske variabler i både BL og LUAD kræftformer, og at CCP score kan have øjeblikkelig kliniske anvendelighed til at forudsige progression i BL patienter og overlevelse i LUAD patienter. For flere detaljer se Støtte Resultat og diskussion i File S1. I overensstemmelse med genet sæt berigelse analyse ovenfor, CCP score var ikke prognostiske hos patienter med planocellulære tumorer (LUSC og HNSCC) (Figur S2).

Prognostiske signaturer i blære og lungekræft afhænger cellecyklus relaterede gener

Fordi moduler mest konsekvent forbundet med progression i BL patienter og overlevelse i LUAD patienter var relateret cellecyklus (figur 2 og figur S1), vi hypotese, at udførelsen af ​​tidligere definerede BL progression og LUAD overlevelse underskrifter ville være afhængig af cellecyklus relaterede gener. BL overlevelse underskrifter blev ikke undersøgt, fordi en tidligere undersøgelse viste, at deres præstation var fattige i uafhængige datasæt [18]. Vi har testet vores hypotese på offentliggjorte gen signaturer ved hjælp af en justering tilgang (for detaljer se Støtte Materialer og metoder i File S1), der dæmper den prædiktive evne signatur gener, der er korreleret med CCP score [19].

I hvert datasæt, blev ekspressionsniveauer for signatur gener justeret for CCP score eller ved et konstant udtryk, der omfatter en “negativ kontrol” (se Støtte Materialer og metoder i File S1 for detaljer) og vurderet for progression i BL kohorter og overlevelse i LUAD kohorter. En Heatmap angiver hver signatur er prognostisk værdi, og om dens prædiktive evne er tabt, når der korrigeres for CCP score (figur 4). Generelt underskrifter mistede deres prædiktive evne efter CCP score justering. Konkret blære underskrifter mistet deres prædiktive evne i alle uafhængige kohorter, mens lunge underskrifter, der var prædiktiv i 2 kohorter mistet deres prædiktive evne i 83% af de kohorter de var forprogrammeret i gennemsnit. For detaljer se Støtte Resultater og Diskussion i File S1.

Udtrykket værdier af prognostiske signatur gener blev justeret for CCP score eller med en konstant (negativ kontrol) som beskrevet i støtte materialer og metoder i File S1. A, Heatmap viser virkningen af ​​CCP score justering på prædiktive evne hver signatur (rækker) på hver kohorte (kolonner). Underskrifter enten mister deres prædiktive evne efter justering (P 0,05 i kontrolgruppen, men P 0,05 i CCP-justeret kohorte, blå boks); forblive prognostiske efter justeringen (P 0,05 i både kontrol- og CCP-justerede kohorter, grønne boks); eller var ikke prognostisk i begge tilfælde (P 0,05 i begge grupper, hvid boks). B, stablet søjlediagram opsummerer den prognostiske værdi af hver signatur i kategorier, der er beskrevet i (A). Tab af prædiktiv evne er beregnet som den procentdel af underskrifter, der mister deres prædiktive evne efter justering (blå bokse) i forhold til det samlede antal kontrol kohorter en signatur er prognostisk i (blå + grøn feltet). C-D, justering resultater i lunge adenocarcinom kohorter, i samme format som A-B.

Ekstern validering af raffinerede cellecyklus udtryk underskrifter i human prostatacancer

Fordi CCP signatur gener er stærkt korreleret [16] og måle den samme biologiske proces, vi den hypotese, at en mindre gen signatur ville udføre sammenligneligt til den fulde 31-genet signatur. Først, kendetegnet vi vigtigheden af ​​signatur størrelse ved gentagen stikprøvekontrol af CCP gener for at generere gen signaturer i forskellige størrelser og vurderet deres prognostisk værdi i BL og LUAD kohorter. Vi fandt, at den prædiktive effekt af CCP score afhænger af signatur størrelse og ikke nødvendigvis gen sammensætning, og at 10-15 gener er tilstrækkelig til at opretholde prognostiske effekt af den fulde signatur (Tal S3, S4) (se Støtte Resultater og Diskussion i File S1 for detaljer). Til selvstændigt at bekræfte dette fund og vurdere mindre raffinerede underskrifter, vi analyserede 4 “robuste” signaturer (CCP-4, -7, -10, og -12) (tabel S12 i File S8), som omfatter gener prædiktive af resultatet i flere kohorter ( se Støtte Materialer og metoder i File S1 for detaljer).

CCP-4, -7, -10, og -12 underskrifter blev leveret til Myriad Genetics (Salt Lake City, UT) for “blindet” evaluering , dvs. uden angivelse af vores hypotese om forholdet mellem signatur størrelse og prognostisk værdi. Den intelligente evne af signatur scorer for biokemisk recidiv i prostatakræft blev evalueret i 353 patienter, der fik radikal prostatektomi [17], med genekspression målt ved kvantitativ RT-PCR (se Støtte Materialer og metoder i File S1). Alle scoringer var forudsigende (P 0,05) i univariate og multivariate analyser, som omfattede CAPRA-S [20], et mål for klinisk risiko tegner sig for præoperativ PSA, patologisk Gleason score, kirurgiske margener, ekstra-kapsulær forlængelse, sædblæren invasion og lymfeknude invasion. Generelt hazard ratio steg og p-værdier faldt med stigende gen nummer (tabel 3). De raffinerede signatur scoringer blev derefter analyseret i en multivariat analyse afprøvning af, om fuldstændig underskrift tilføjet prædiktiv værdi til en model, der også inkluderet CAPRA-S. Den fulde signatur tilføjet betydelig prædiktiv værdi (P 0,05) til CCP-4, CCP-7, og CCP-10 modeller, men ikke til CCP-12 model, der definerer denne signatur (BIRC5, BUB1B, CDC20, CDCA8, CENPF , FOXM1, KIF11, NUSAP1, PTTG1, TK1, TOP2A) som tilstrækkelig.

Endelig har vi vurderet den CCP-12 signatur i en ekstra kohorte bestående af 88 patienter med lunge adenocarcinom af blandede undertyper. Gene udtryk profiler for disse patienter blev opnået gennem RNA-sekventering (RNASeq) og downloades fra The Cancer Genome Atlas (TCGA) (https://cancergenome.nih.gov). CCP score blev beregnet som før (den gennemsnitlige række-normaliseret udtryk for de 12 CCP generne) ved hjælp af de normaliserede RNA tæller (RNAseq af Forventning-Maximization, [21]) fås fra TCGA. Fig. 5 viser, at CCP-12 betydeligt forudsiger OS hos disse patienter (HR = 1,95, P = 0,023), hvilket bekræfter den prædiktive evne CCP-12 i en ekstern kohorte og indikerer, at CCP score er robust på tværs af flere genekspression profilering teknologier (microarray og RNAseq).

prognostiske værdi af en raffineret 12-genet cellecyklus proliferation (CCP-12) score i lungeadenocarcinom patienter med genekspression profilering af RNASeq vises. Kaplan-Meier (KM) kurver for samlet overlevelse (OS) blev genereret for patienter (N = 88) med CCP-12 scoringer i den lavere (grøn), midterste (blå), og øvre (rød) 33% og log rank P-værdien af ​​det kontinuerlige CCP-12 score rapporteres. Forkortelser:. HR, hazard ratio, svarende til 1-enhed stigning i CCP-12 score

Diskussion

Vi udførte et sæt berigelse gen analyse af genekspression profiler hos patienter med fire tobaksrelaterede kræftformer og identificeret cellecyklus som funktionelle proces mest konsekvent forbundet med patient resultat i tumorer med ikke-planocellulære histologier. Aberrerende celle proliferation er kendetegnende for cancer [22], og øget ekspression af cellecyklus-gener findes i flere forskellige tumortyper [23], herunder de der ikke kausalt forbundet med rygning, såsom bryst [19] og prostatacancer [16], [17 ]. Det er imidlertid interessant at bemærke, at rygere med prostatakræft har en øget risiko for tilbagefald og mortalitet [24]. Overraskende cellecyklus associerede gener var ikke prognostisk i tobaksrelaterede tumorer med skællede histologi. vi konstatere Men disse kohorter havde relativt få patienter ( 85), som kan have udelukket identifikation af funktionelle processer i forbindelse med resultatet i disse tumortyper

Vores data giver vigtige indsigter ud over identifikation af en specifik prognostisk signatur (CCP-12). For det første tyder på, at i BL og LUAD kræft, vil prognostiske biomarkører ikke validere på tværs af flere grupper, medmindre de er (direkte eller indirekte) i forbindelse med cellecyklus (figur 4). For det andet, vores fund, at genekspression signaturer kunne forudsige overlevelse i flere blærekræft kohorter var uventet, fordi en nylig validering undersøgelse viste, at flere signaturer [25], [26] stammer fra datasæt undersøgte her (Blaveri, MSKCC) havde dårlig prædiktive evne [18 ]. Tredje, vores data viser for første gang, at der findes robust overlevelse genekspression signaturer i blærekræft men kun når defineret på basis af funktionelt gen moduler. Hvis de bruges på andre tumortyper, kan dette koncept føre til udvikling af robuste underskrifter, der er mere tilbøjelige til at nå klinisk praksis.

Vores arbejde tackler også en vigtig, men sjældent behandlet emne i biomarkør udvikling, virkningen af ​​signatur størrelse på prædiktiv evne. Omkostningseffektivitet og muligheden for at vurdere flere gener i en lille mængde biopsi væv vejer mod behovet for store nok underskrifter, der overvinder teknisk variabilitet fra analysen og biologisk variation fra tumor prøve heterogenitet. Vores resultater viser den prognostiske ydeevne cellecyklus gener plateauer ved 10-15. I modsætning hertil Haibe-Kains

et. al

. fandt, at den prognostiske værdi af AURKA ekspression i brystcancer var sammenlignelig med multi-gen-modeller. AURKA er en af ​​de cellecyklus gener vi undersøgt, men var ikke så robust som CCP score, være forudsigende (P 0,05) på kun 5/13 BL og LUAD kohorter (Figur S5). Generelt kan redundans opnås fra multiple gener overvinde den svingende kvalitet af RNA afledt af fikseret væv, hvilket kan bevirke, at enkelte gen assays til at mislykkes, hvilket sikrer solide analytiske resultater. Mens vi fandt, at CCP-12 forventede resultat i en uafhængig kohorte yderligere trin som tærsklerne, der ville adskille patienter i høj og lav risikogrupper og potentielle evaluering i uafhængige kohorter anvender foruddefinerede effektmål er nødvendige, før dette panel er klar til klinisk brug.

Støtte Information

File S1.

Støtte Materialer, Resultater og Diskussion

doi:. 10,1371 /journal.pone.0085249.s001

(DOCX)

File S2.

Resumé af blærekræft (tabel S1), lunge adenocarcinom (tabel S2), lunge pladecellekræft (tabel S3), og hoved og hals pladecellekræft (tabel S4) patientkohorter

doi:. 10,1371 /tidsskrift .pone.0085249.s002

(PDF)

File S3.

Sweave dokument, der indeholder prøve

R

kode og output

doi:. 10,1371 /journal.pone.0085249.s003

(PDF)

File S4.

Multivariat analyser af progression i blærekræft (tabel S6), overlevelse i blærekræft (tabel S7), og overlevelse i lunge adenocarcinom (tabel S8)

doi:. 10,1371 /journal.pone.0085249.s004

(PDF)

File S5.

Sammenligning af prognostisk magt CCP score og bedste tilgængelige kliniske variabler i blæren (tabel S9) og lunge adenocarcinom (tabel S10)

doi:. 10,1371 /journal.pone.0085249.s005

(PDF)

File S6.

Prognostiske moduler forbundet med resultatet i tobaksrelaterede kræftformer (tabel S5) (Excel XLSX-fil). I hver kohorte, overrepræsenteret Gene ontologi (GO) vilkår og Kegg veje blev identificeret fra lister over gener betydeligt prædiktive af udfald sygdom (progression i BL patienter og overlevelse i BL, LUAD, LUSC, og HNSCC patienter, P 0,01) ved hjælp af DAVID gen annotation berigelse analyse toolkit. Konsekvent prognostiske moduler blev identificeret ved rangordning alle moduler først med antallet af kohorter med betydelige resultater (FDR 20%) og derefter ved gennemsnitlig p-værdi. Der var ingen signifikant overrepræsenteret prognostiske moduler i HNSCC patientkohorter på FDR 20%

doi:. 10,1371 /journal.pone.0085249.s006

(XLS)

File S7.

Prognostiske blære progression og lunge adenocarcinom overlevelse gen signaturer, der anvendes i justeringen analyse (tabel S11) (Excel XLSX-fil)

doi:. 10,1371 /journal.pone.0085249.s007

(XLS)

Fil S8.

CCP gener i fem raffinerede signaturer (tabel S12). Signaturer er angivet med antallet af CCP gener

doi:. 10,1371 /journal.pone.0085249.s008

(DOCX)

File S9.

Prognostiske moduler forbundet med blære progression og lunge adenocarcinom overlevelse signaturer (tabel S13) (Excel XLSX-fil). Overrepræsenteret Gene ontologi (GO) vilkår og Kegg veje blev identificeret for hver signatur ved hjælp af DAVID gen annotation berigelse analyse toolkit. Moduler er rangeret først med antallet af underskrifter med betydelige resultater (FDR 20%) og derefter ved gennemsnitlig p-værdi

doi: 10,1371 /journal.pone.0085249.s009

(XLSX)

figur. S1.

Prognostiske moduler forbundet med progression i blærekræft. I hver kohorte, overrepræsenteret Gene ontologi (GO) vilkår og Kegg veje blev identificeret fra lister over gener betydeligt prædiktive af progression (P 0,01) ved hjælp af DAVID gen annotation berigelse analyse toolkit. Konsekvent prognostiske moduler blev identificeret ved rangordning alle moduler først med antallet af kohorter med betydelige resultater (FDR 20%) og derefter ved gennemsnitlig p-værdi. Hver subfigure indeholder ti moduler: de mest konsekvent prognostiske moduler og den “top hit ‘for hver kohorte, markeret med en stjerne (*), der er defineret som modulet med den laveste falsk opdagelse sats (FDR), idet kohorte, der har en FDR 20% i flere årgange. A, overrepræsenteret GO vilkår forbundet med progression i blærekræft. . B, overrepræsenteret Kegg veje er forbundet med progression i blærekræft

doi: 10,1371 /journal.pone.0085249.s010

(TIF)

Figur S2.

Prognostisk værdi af CCP score i pladecellekræft celle lungekræft og hoved og hals planocellulært karcinom. A, prognostiske værdi af CCP score i pladecelle-lungecarcinomer (SCLC). Kaplan-Meier (KM) kurver blev genereret for samlet overlevelse (OS) i Bild (N = 53) og Takeuchi (N = 35) kohorter og for tilbagefald overlevelse (RFS) i Sønnen (N = 76) kohorte.

Be the first to comment

Leave a Reply