PLoS ONE: Genomisk Kopier Antal Variationer i genomer af Leukocytter Forudsige Prostata Cancer Clinical Outcomes

Abstrakt

Præcis forudsigelse af prostatakræft kliniske kurser er fortsat undvigende. I denne undersøgelse udførte vi hele genomet kopital analyse på leukocytter 273 prostatacancerpatienter under anvendelse Affymetrix SNP6.0 chip. Kopital variationer (CNV) blev fundet i alle kromosomerne i det humane genom. Et gennemsnit på 152 CNV fragmenter pr genom blev identificeret i leukocytter fra patienter med prostatacancer. De størrelsesfordelinger af CNV i genomet af leukocytter var meget korrelative med prostatakræft aggressivitet. En prostatakræft udfald forudsigelse model blev udviklet på baggrund af stor størrelse forholdet CNV fra leukocyt genomer. Denne forudsigelse model genererede en gennemsnitlig forudsigelse på 75,2%, med følsomhed på 77,3% og specificitet på 69,0% for prostatakræft tilbagefald. Når det kombineres med Nomogram og status for fusion udskrifter, blev den gennemsnitlige forudsigelse sats forbedret til 82,5% med følsomhed på 84,8% og specificitet på 78,2%. Derudover leukocyt forudsigelsesmodel var 62,6% nøjagtigt forudsige korte prostataspecifikt antigen fordoblingstid. Når det kombineres med Gleason lønklasse, Nomogram og status for fusion udskrifter, forudsigelsen model genererede en korrekt forudsigelse på 77,5% med 73,7% følsomhed og 80,1% specificitet. Så vidt vi ved, er dette den første undersøgelse, der viser, at CNVs i leukocyt genomer er prædiktive for kliniske resultater af en human malignitet

Henvisning:. Yu YP, Liu S, Huo Z, Martin A, Nelson JB, Tseng GC et al. (2015) Genomisk Copy Number Variationer i genomer af Leukocytter Forudsige Prostata Cancer kliniske resultater. PLoS ONE 10 (8): e0135982. doi: 10,1371 /journal.pone.0135982

Redaktør: Zoran Culig, Innsbruck Medical University, ØSTRIG

Modtaget: April 24, 2015; Accepteret: 28 Juli 2015; Udgivet: 21 August, 2015

Copyright: © 2015 Yu et al. Dette er en åben adgang artiklen distribueres under betingelserne i Creative Commons Attribution License, som tillader ubegrænset brug, distribution og reproduktion i ethvert medie, forudsat den oprindelige forfatter og kilde krediteres

Data Tilgængelighed: Alle relevante data er inden for papir og dens Støtte Information filer. Rå data information af SNP6.0 fra disse prøver blev deponeret i Gene Expression Omnibus (GEO, tiltrædelse nummer GSE70650)

Finansiering:. Denne undersøgelse blev støttet af en bevilling fra National Cancer Institute til JHL (RO1 CA098249) og en bevilling fra University of Pittsburgh Cancer Institute. De finansieringskilder havde ingen rolle i studie design, indsamling og analyse af data, beslutning om at offentliggøre, eller forberedelse af manuskriptet

Konkurrerende interesser:.. Forfatterne har erklæret, at der ikke findes konkurrerende interesser

Introduktion

Prostatakræft er en af ​​de førende dødsårsager for mænd i USA. Det har en betydelig heterogenitet i biologisk aggressivitet og klinisk prognose [1-3]. Siden gennemførelsen af ​​serum PSA-screening, har den kliniske opdagelse sats af prostatakræft er øget betydeligt primært skyldes identifikation af små, lave kvalitet kræftformer, der ville sandsynligvis ikke fremskridt [1]. Endnu, tæt på 30.000 patienter dør af prostatacancer årligt [4]. Præcis forudsigelse af den aggressive adfærd prostatakræft er fortsat undvigende.

I øjeblikket flere behandlingsmuligheder er tilgængelige for patienter med prostatacancer, herunder vågent venter, stråling, hormonelle /kemo-terapi og radikal prostatektomi. Gleason sortering alene eller i kombination med andre kliniske indikatorer såsom serum prostata specifikt antigen niveauer og patologisk eller klinisk iscenesættelse har været det ledende redskab i udvælgelsen af ​​disse behandlingsmuligheder. Et betydeligt antal af patienter med prostatacancer, men oplevede tilbagefald efter kirurgisk resektion af prostata. Der er et klart behov for en bedre forudsigelse af prognose for prostatakræft. Forrige cytogenetiske og andre genom undersøgelser antydet en klar sammenhæng mellem genom abnormiteter og prostatakræft [5-21]. Nylige analyser af genom kopi antal prostatakræft, godartede væv støder op til kræft og blodprøver fra patienter med prostatacancer foreslog, at genom sletning og forstærkning af visse regioner i prostata cancer prøver var forbundet med dårlige kliniske resultater [14; 22]. Hele genomet og transkriptom sekventering afslørede fusionstranskripter i prostatacancer prædiktive for prostatacancer tilbagefald [23]. I denne undersøgelse udførte vi hele genomet kopital analyser på leukocytter fra patienter med prostatacancer. Væsentlige kopital variationer (CNV) blev identificeret i genomet af leukocytter fra patienter med prostatacancer. Vi fandt, at størrelserne af CNVs i leukocytter for prostatacancer prøver var stærkt korreleret med prostatakræft tilbagefald. Prediction modeller blev bygget til at forudsige prostatakræft resultater baseret på størrelsen af ​​CNVs af leukocytter.

Materialer og metoder

Protokollen af ​​undersøgelsen blev godkendt af University of Pittsburgh Institutional Review Board.

Tissue behandling, dna-ekstraktion, amplikon generation, mærkning, hybridisering, vask og scanning af SNP 6,0 chips

prostatakræft prøver blev opnået fra University of Pittsburgh Medical center Tissue Bank. Disse prøver blev indsamlet fra 1998 til 2012. To hundrede treoghalvfjerds buffy coat prøver fra patienter med prostatacancer blev analyseret. Blandt disse prøver blev 143 prøver fulgt mindst 90 måneder, 35 patienter var ikke-tilbagevendende i 90 måneder eller mere, 55 patienter, der oplever recidiv med kort PSADT (PSA fordoblingstid 4 måneder), og 53 patienter, der oplever recidiv med lange PSADT (PSA fordoblingstid 15 måneder) efter radikal prostatektomi (S1 tabel). Den Gleason er snesevis af alle prostatakræft prøver blev revurderet af UPMC patologer før undersøgelsen. Klinisk opfølgning blev foretaget af kontor undersøgelse rekord, blod PSA undersøgelse og radiografisk opfølgning. Disse opfølgninger blev udført i op til en 15 års periode, efter at patienten havde en radikal prostatektomi. Protokollen blev godkendt af “University of Pittsburgh Institutional Review Board”. Fem hundrede nanogram af genomisk DNA blev fordøjet med Sty1 og Nsp1 i 2 timer ved 37 ° C. Det fordøjede DNA blev oprenset og ligeret med primer /adapter ved 16 ° C i 12-16 timer. Amplikoner blev dannet ved udførelse af PCR under anvendelse af primere, som fabrikanten (Affymetrix, CA) på ligeringsprodukterne anvendelse af følgende program: 94 ° C i 3 minutter, derefter 35 cykler ved 94 ° C 30 sekunder, 60 ° C i 45 sekunder og 65 ° C i 1 minut. Dette blev efterfulgt af forlængelse ved 68 ° C i 7 min. PCR-produkterne blev derefter oprenset og fordøjet med DNAseI i 35 min ved 37 ° C for at fragmentere det amplificerede DNA. Det fragmenterede DNA blev derefter mærket med biotinylerede nukleotider gennem terminal deoxynukleotidtransferase i 4 timer ved 37 ° C. To hundrede halvtreds mikrogram fragmenteret DNA blev hybridiseret med en præækvilibreret Affymetrix chip SNP 6,0 ved 50 ° C i 18 timer. Procedurer for vask og scanning af SNP 6,0 chips fulgte manualerne, som Affymetrix, Inc. Rådata information af SNP6.0 fra disse prøver blev deponeret i “Gene Expression Omnibus” (GEO, tiltrædelse nummer GSE70650).

Statistisk analyse

Kopier nummer variation analyse.

CEL filer blev analyseret med Genotypning Console til kvalitetskontrol analyse. Prøver med QC opkald over 80% og QC kontrastforhold over 0,4 blev optaget i analysen. For at analysere CNV, blev CEL-filer importeres til Partek GenomeSuite 6,6 til generere kopi nummer fra rå intensitet. For at plotte histogrammer, sletning eller forstærkning af genomer blev analyseret ved første begrænsende til regionerne med p-værdi mindre end 0,001. De udvalgte regioner blev efterfølgende filtreret ved at begrænse til regionerne med mindst 10 markører og 2 kb i størrelse. Regionerne blev derefter kortlagt til kendte gener. Hyppigheden af ​​amplifikation og deletioner blev afbildet til genomet svarende til genet steder (Fig 1A). For hvert gen blev Fishers eksakte test anvendes til at teste forbindelsen mellem CNV engagement og prøve fornyet status. Så minus log p-værdier blev afbildet på Manhattan plot med deres tilsvarende gen kromosom steder at generere Fig 1B. Benjamini-Hochberg (BH) metode blev anvendt til at korrigere p-værdierne. CNV-gen beriget veje blev selekteret ved Kolmogorov-Smirnov test af genet justeret p-værdier. Pathway p-værdier blev også korrigeret med BH metode.

(A) Histogram af hyppigheden af ​​amplifikation (rød) eller deletion (blå) af genom-sekvenser af leukocytter (øvre panel, n = 273) fra prostatacancerpatienter . (B) Manhattan plots af p-værdier i forbindelse med prostatakræft gentagelse af hvert gen CNV fra leukocytter.

Machine læringsmetoder til at forudsige tilbagevendende og hurtigt tilbagevendende status.

Vi konstrueret forudsigelsesmodeller for to typer af kliniske sammenligninger: (1) ikke-tilbagevendende versus tilbagevendende; (2) ikke-fast tilbagevendende (dvs. ikke-tilbagevendende eller tilbagevendende men har prostata specifikt antigen fordoblingstid [PSADT] ≥15 måneder) versus hurtigt tilbagevendende (tilbagevendende PSADT≤ 4 måneder). For hver sammenligning blev modellerne konstrueret ved anvendelse Gleason score (G), Nomogram score (N), fusion transkript status (F) eller blod CNV information (L) separat. For Gleason score diskrimination, vi brugte binært forudsigelse (0 betydning Gleason score ≤ 7 og en mening Gleason score 7). For Nomogram score blev syv år overlevelse sandsynlighed fås fra https://www.mskcc.org/nomograms/prostate anvendt [24]. For fusion status, vi anvendte otte fusion udskrifter (TRMT11-GRIK2, SLC45A2-AMACR, mTOR-TP53BP1, LRRC59-FLJ60017, TMEM135-CCDC67, KDM4-AC011523.2, MAN2A1-FER og CCNH-C5orf30) tidligere identificerede og valideret i et multicenter undersøgelse [23]. En binær fusion score blev anvendt (0 betyder ingen af ​​de otte fusioner detekterede; 1 betyder en eller flere fusionstranskripter detekteret). For forudsigelse ved hjælp gen CNV af leukocytter, fandt vi lidt forudsigelseskraft fra gen-baserede forening (Fig 1B). Som et resultat har vi udviklet et stort størrelsesforhold (LSR) model baseret på den antagelse, at ikke-målrettede CNV aberrationer i blod spillede en væsentlig rolle i disponerende prostatatumorer til aggressivitet. Som vist i figur 2A, blev LSR defineret som andelen af ​​stor størrelse CNV identificeret i blodet genomet af en given patient, hvor store størrelse blev defineret ved tærskel δ. I hver dobbelt krydsvalidering blev prøver tilfældigt og ligeligt fordelt i to datasæt. I det første datasæt behandles som træningsdata, blev den bedste δ parameter i LSR model og de bedste cutoffs af nomogram og LSR scorer udvalgt ved at maksimere den højeste AUC (areal under kurven) og Youden indeks (dvs. sensitivitet + specificitet-1). Modellerne blev derefter påført på den anden datasæt som testdata. Den krydsvalidering blev derefter gentaget med den anden datasæt som træningsdata og det første datasæt som testdata. ROC kurver blev plottet ved at variere cutoffs i både træning og test datasæt. Det tilsvarende samlede nøjagtighed, følsomhed, specificitet, Youden indeks og AUC blev beregnet til at vurdere resultatet. Den lige-splitting validering blev gentaget i 14 gange, og top 2 og bund 2 opsplitning med den højeste og laveste sum af AUC blev fjernet for at undgå uheld ekstrem træning /test opgave. De resterende 10 krydsvalidering resultater blev endelig gennemsnit (tabel 1 og tabel 2). ROC og Kaplan-Meier overlevelse kurver i figurerne 3-6 er de repræsentative resultater af de 10 forudsigelser tættest på midlede værdier.

(A) Skematisk diagram af LSR model af leukocyt CNV. (B) LSR’er fra leukocytter er associeret med aggressiv prostatakræft tilbagefald adfærd. Øverste panel: Korrelation af LSR’er fra leukocyt genomer med prostatakræft, der var tilbagevendende; Lavere panel: Korrelation af LSR’er fra leukocyt genomer med prostatakræft, der var ikke-tilbagevendende 90 måneder efter radikal prostatektomi. (C) LSR’er fra leukocytter er associeret med kort PSADT. Øverste panel: Korrelation af LSR’er fra leukocyt genomer med prostatakræft, der havde tilbagevendende serum prostata specifikt antigen fordoblingstid (PSADT) 4 måneder eller derunder; Lavere panel: Korrelation af LSR’er fra leukocyt genomer med prostatakræft, som ikke var tilbagevendende eller tilbagevendende, men har PSADT 15 måneder eller mere

(A) LSR afledt leukocyt genom CNV forudsiger prostatakræft tilbagefald.. Modtager drift kurve (ROC) analyser bruger LSR’er afledt af leukocyt CNVs som forudsigelse parameter (rød) til at forudsige prostatakræft tilbagefald, versus Nomogram (blå), Gleason lønklasse (grøn) og status for 8 fusion udskrifter [14] (gul). Prøverne blev ligeligt delt tilfældigt i træning og test sætter 10 gange. ROC-analyse viser resultaterne fra de mest repræsentative split. (B) Kombination af LSR (L), til Gleason s bedømmelse (G), Nomogram (N) og status for fusionstranskripter (F) forudsige prostatakræft tilbagefald. ROC-analyse af en model, der kombinerer LSR, fusionstranskripter, Nomogram og Gleason lønklasse hjælp LDA er angivet med sort. ROC-analyse af en model kombinerer fusion udskrifter, nomogram og Gleason s klasse ved hjælp LDA er angivet med rødt. ROC-analyse af en model, der kombinerer LSR, fusionstranskripter og Gleason lønklasse hjælp LDA er angivet med blåt. ROC-analyse af en model, der kombinerer LSR, fusionstranskripter og Nomogram hjælp LDA er angivet med grønt. ROC-analyse af en model kombinerer LSR, Nomogram og Gleason lønklasse angives med gult. Lignende tilfældige opdelinger af uddannelse og afprøvning datasæt blev udført som i (A).

Kaplan-Meier analyse på patienter forudsagt af LSR baseret på CNV af patienternes leukocytter som sandsynligvis tilbagevendende versus sandsynligt ikke-tilbagevendende (øverst til venstre). Lignende overlevelse analyser blev også udført på case segregations baseret på Gleason s kvaliteter (øverste midterste), Nomogram sandsynlighed (øverst til højre), status for 8 fusion udskrifter (nederst til venstre), eller en model ved at kombinere LSR, Nomogram og fusion udskrift status ved hjælp LDA (lavere midten), eller en model ved at kombinere LSR, Nomogram, Gleason kvalitet og fusion transcript status ved hjælp LDA (nederst til højre). Antal analyserede prøver og p-værdier er angivet.

LSR stammer fra leukocyt genom CNV forudsiger PSADT 4 måneder eller derunder. ROC-analyse ved hjælp LSR’er afledt af leukocyt CNVs som en forudsigelse parameter (rød) til at forudsige PSADT 4 måneder eller mindre, versus Nomogram (blå), Gleason lønklasse (grøn) og status for 8 fusion udskrifter [14] (gul). Prøverne blev analyseret ved den samme fremgangsmåde som Fig 3. (B) Kombination af LSR (L), Gleason s bedømmelse (G), Nomogram (N) og status for fusionstranskripter (F) til at forudsige prostatakræft tilbagevendende PSADT 4 måneder eller mindre . ROC-analyse af en model, der kombinerer LSR, fusionstranskripter, Nomogram og Gleason lønklasse hjælp LDA er angivet med sort. ROC-analyse af en model kombinerer fusion udskrifter, nomogram og Gleason s klasse ved hjælp LDA er angivet med rødt. ROC-analyse af en model, der kombinerer LSR, fusionstranskripter og Gleason lønklasse hjælp LDA er angivet med blåt. ROC-analyse af en model, der kombinerer LSR, fusionstranskripter og Nomogram hjælp LDA er angivet med grønt. ROC-analyse af en model kombinerer LSR, Nomogram og Gleason lønklasse angives med gult.

Kaplan-Meier analyse på patienter forudsagt af LSR baseret på CNV af patienternes leukocytter som sandsynlige tilbagevendende og har PSADT 4 måneder eller mindre versus sandsynligt ikke-tilbagevendende eller tilbagevendende men har PSADT 15 måneder eller mere (øverst til venstre). Lignende overlevelse analyser blev også udført på case segregations baseret på Gleason s kvaliteter (øverste midterste), Nomogram sandsynlighed (øverst til højre), status for 8 fusion udskrifter (nederst til venstre), eller en model ved at kombinere LSR, Nomogram og fusion udskrift status ved hjælp LDA (lavere midten), eller en model ved at kombinere LSR, Nomogram, Gleason kvalitet og fusion transcript status ved hjælp LDA (nederst til højre). Antal prøver analyseret og p-værdier er angivet. Vejviser

For at teste, om at kombinere flere oplysninger data forbedrer forudsigelse resultat, vi anvendte lineær diskriminant analyse (LDA) til at kombinere to eller flere prædiktive faktorer. Alle mulige kombinationer blev udført. Modeller ved hjælp (1) L + N + F (2) L + N + G (3) N + F + G (4) L + F + G (5) L + N + F + G er vist i fig 3 og 5.

Kaplan-Meier-kurve analyse

for overlevelse evaluering (fig 4 og 6), vi kombineret den dobbelte kors validering af “Træning = Test”. resultat at sammenligne effektiviteten af ​​forskellige metoder, bortset fra Gleason score, som vi brugte (≤7 VS 7 som cut-off for hele prøver). Kaplan-Meier kurver blev afkortet ved 90 måneders opfølgning. Log-rank test blev udført for at beregne p-værdien mellem overlevelseskurverne for to forudsagte resultater. For at vurdere, om overlevelse forskel for én model var signifikant bedre end den anden, definerer vi en test statistik U som den absolutte forskel i log-rank test statistik fra de to modeller. Teoretisk under nulhypotesen (to modeller var ikke-diskriminant), test statistikken U fulgte en fordeling af absolutte forskel på to uafhængige chi-squared (frihedsgrad = 1) distributioner. Som et resultat, vi stikprøven 10.000.000 gange fra den absolutte forskel mellem to uafhængige chi square distributioner til dannelse null distribution og evaluere de p-værdier.

Resultater Salg

genomkopi abnormiteter er nogle af de kendetegnende for prostatakræft. Men lidt er kendt om genom kopi abnormaliteter i ikke-kræft væv fra patienter med prostatacancer. For at analysere regionerne amplifikation og deletion i genomet af leukocytter fra prostatacancerpatienter blev 273 buffy coats fra prostatacancerpatienter analyseret for CNV tværs af hele genomet ved hjælp Affymetrix SNP6.0. Brug af cutoff kriterier for størrelse ≥2 Kb, markør nummer ≥ 10 og p 0,001, blev identificeret i alt 41589 CNV fragmenter, herunder 24213 segmenter af sletning og 17376 af forstærkning, der involverer 17865 gener baseret på Partek gen annotation (Fig 1A ). Dette svarer til et gennemsnit på omkring 152 CNVs per prøve. Den gennemsnitlige størrelse af CNV i genomet af leukocytterne er omkring 147 Kb. I gennemsnit blev der 256 gener fundet at have enten kopi nummer gevinst eller tab pr genom. Blandt de 273 blodprøver, 143 blodprøver har mere end 90 måneders klinisk opfølgning i form af prostatakræft tilbagefald. Det er interessant, når kategorisere blodprøverne baseret på status for prostatakræft tilbagefald, CNV af leukocytter fra patienter, som oplevede tilbagefald efter radikal prostatektomi havde et gennemsnit på 3.2 fold større størrelse af CNV versus CNV fra patienter, som ikke havde nogen gentagelse i mindst 90 måneder. To-sidet t-test viste en stærk sammenhæng mellem størrelsen af ​​CNV i leukocytter og prostatakræft tilbagefald (p = 2,2 x 10

-16), hvilket tyder på, at størrelsen af ​​kønsceller CNV kan spille en væsentlig rolle i disponerende prostatakræft til aggressive kliniske kurser. Men ingen specifik (FDR = 0,05) gen involveret i CNV af genom fragment når den tærskel, der adskiller tilbagevendende prostatakræft versus dem af ikke-tilbagevendende (Fig 1B). Sammen indikerer resultaterne, at genet-baserede forudsigelse model er usandsynligt, at lykkes i leukocyt CNV analyse, men størrelsesfordelingen af ​​CNVs kan være forudsigende.

For at undersøge om kønsceller CNV er prædiktiv for fornyet prostatakræft, en algoritme udnytter forhold mellem antallet af store størrelse fragmenter blev udviklet. Som illustreret i fig 2A, for hver prøve, stor størrelse ratio (LSR) defineres som forholdet mellem CNV fragmenter, hvis størrelser er større end en størrelse cutoff (δ) over den samlede antal CNV fragmenter. For eksempel 3 i 7 detekterede CNVs i fig 2A findes “store størrelse fragmenter” (størrelse ≥ A) og LSR af denne patient er beregnet som 3/7 = 0,43. I fig 2B, fordelingen af ​​LSR fra patienter, som oplevede prostatakræft tilbagefald viste signifikant højere værdier end dem, der ikke oplever tilbagefald. Tilsvarende fordelingen af ​​LSR fra patienter med hurtig recidiv (PSADT≤ 4 måneder) var signifikant højere end dem fra ikke-hurtige tilbagevendende patienter (ikke-tilbagevendende eller tilbagevendende, men har PSADT≥ 15 måneder, fig 2C). I LSR model er tærsklen størrelse δ bestemt ved at maksimere AUC. Når A-værdier blev optimeret (S1 Fig, δ = 10

4,5 = 31.622 bp for tilbagevendende forudsigelse model og 1B valgt δ = 10

5.7 = 501.187 bp til hurtig tilbagevendende forudsigelse), det forudsiger prostatakræft tilbagefald med nøjagtighed 77,6%, med følsomhed på 80,4% og specificitet på 68,6%, mens hurtige recidiv med nøjagtighed på 62,4%, med følsomhed på 72,9% og specificitet på 54,1%.

for at validere denne model, 143 blodprøver (S1 tabel) fra prostatacancerpatienter blev tilfældigt opdelt i et træningssæt (72 prøver) og en test sæt (71 prøver). Den optimerede stor størrelse cutoff δ og LSR-cutoff blev opnået fra træningsanalyse ved at maksimere Youden indekset. De parametre blev derefter påført på de testdata, der er at vurdere forudsigelse nøjagtighed. Valideringen blev derefter gentaget 14 gange og de bedste 2 og værste 2 blev fjernet for at undgå ekstrem randomisering. De resterende 10 resultater fra disse uddannelse og afprøvning analyser blev gennemsnit (tabel 1). Som vist i figur 3A (repræsentant analyser i S2 Table) og tabel 1, uddannelse nøjagtigheden af ​​LSR model til at forudsige prostatakræft tilbagefald når 76,5%, med 77,8% følsomhed og 72,4% specificitet. Når parametrene blev anvendt til den indstillede testning, forudsigelsen nøjagtighed når 73,9%, med 76,8% følsomhed og 65,6% specificitet. Disse forudsigelse satser er bedre end de Nomogram (66,0% nøjagtighed for uddannelse og 61,3% til test, tabel 1), og er væsentligt højere end de af Gleason kvalitet er med enkelt cutoff (40,3% for uddannelse og 39,4% til test; p = 8.6×10

-3 til træning og p = 5.8×10

-3 til test af ROC sammenligning se tabel 1 og S3 tabel).

for at undersøge, om en kombination af forskellige modaliteter vil forbedre forudsigelsen model, blod LSR, Nomogram, Gleason lønklasse og status for 8 fusion udskrifter (TRMT11-GRIK2, SLC45A2-AMACR, mTOR-TP53BP1, LRRC59-FLJ60017, TMEM135 -CCDC67, KDM4-AC011523.2, MAN2A1-FER og CCNH-C5orf30 ) [23] i prostata cancer prøver blev kombineret gennem lineær diskriminant analyse (LDA) at træne forudsigelse model i træningssættet. En sådan model genererede en forudsigelse nøjagtighed på 87,9%, med 88,8% følsomhed og 85,4% specificitet for prostatakræft tilbagefald i træningssættet, og nøjagtigheden af ​​75,7%, med 81,7% følsomhed og 64,0% specificitet i afprøvningen sæt (Fig 3B og tabel 1). Interessant, kombinationen af ​​LSR, Nomogram og status for fusionstranskripter synes at give de bedste forudsigelsesresultater: 86,4% nøjagtighed i træningssættet og 78,6% nøjagtighed i sættet testning. Disse forudsigelse satser synes væsentligt bedre end dem, der genereres fra en enkelt modalitet (tabel 1). At vurdere bidraget af hver af disse modaliteter være kombinationen model blev subtraktion af en af ​​hver modalitet ad gangen foretaget på model til evaluering af deres virkninger hhv. Som vist i fig 3B og tabel 1, subtraktion af LSR modalitet syntes at have den største indvirkning på forudsigelse af prostatakræft tilbagefald: De forudsigelse nøjagtighed satser falde fra 87,9% til 75,1% (ROC p = 0,044, se S3 tabel) i uddannelse sæt og fra 75,7% til 64,0% (ROC p = 0,037) i test sæt. Dette blev efterfulgt af fusionsgener (p-værdi mellem de to ROC kurver var 0,109 for træning og 0,159 til test). På den anden side, subtraktion af Nomogram eller Gleason kvalitet ikke havde nogen mærkbar virkning på forudsigelse udførelsen af ​​modellen (tabel 1, figur 3 og S3 tabel).

For at undersøge forudsigelse udførelsen af ​​LSR score på PSA- overlevelse af patienter med prostatacancer, Kaplan-Meier analyser blev udført på 143 patienter, som havde endelige kliniske oplysninger (S1 tabel). Gentagelse status for test prøver blev forudsagt af modellen er uddannet fra træningssættet, og forudsigelsen model af uddannelse prøver blev uddannet fra test sæt. De fusionerede to-fold cross-validering forudsigelse resultater blev brugt til at opdele de 143 patienter i forudsagt tilbagevendende gruppe og ikke-tilbagevendende gruppe. Som vist i figur 4, når patienter blev forudsagt af LSR så høj risiko for prostatakræft tilbagefald, kun 12,1% af patienterne overlevede i 90 måneder uden tilbagefald, mens mere end 52,3% patienter med LSR model forudsiges at være sandsynligt ikke-tilbagevendende overlevede 90 måneder uden nogen tegn på tilbagevendende prostatacancer (gennemsnit p = 9,9 x 10

-5 ved log-rank test, figur 4 og S4 tabel). I modsætning hertil Gleason score undladt at producere statistisk signifikante forskellige resultater for tilbagevendende og ikke-tilbagevendende grupper (p = 0,113 ved log-rank test). Nomogram dog genereret statistisk signifikante bedre kliniske resultater (33,9% versus 18,4% overlevelsesrate og p = 0,0038 for log-rank test), når patienter blev adskilt baseret på forudsagt tilbagevendende versus ikke-tilbagevendende ved Nomogram. Når fusionstranskripter, leukocyt genom LSR og Nomogram blev kombineret, det forbedrede resultaterne af prostatacancer forudsigelse til 58,1% PSA overlevelse, hvis de var forudsagt til at være ikke-tilbagevendende model versus 16,9%, hvis de blev forudsagt så sandsynligt tilbagevendende ved den kombinerede model (p = 2.9×10

-6 for de to overlevelseskurver). Dette kombineret modalitet model betydeligt udkonkurrerer en enkelt modalitet prognosemodel (p = 6.6×10

-3 versus LSR, p = 1.8×10

-5 versus Gleason, p = 3.5×10

-4 versus Nomogram, s = 0,017 versus fusionstranskripter, se S5 tabel). Da Gleason sortering blev tilføjet til model, gjorde det ikke forbedre nøjagtigheden af ​​forudsigelse, men forbedret overlevelseskurverne.

Prostatakræft dødsfald er tæt forbundet med stigende hastighed af tilbagevendende seral PSA. Korte PSADT ( 4 måneder) blev anvendt som et surrogat for prostatacancer dødsfald i de sidste 15 år [25; 26]. For at undersøge om LSR i genomet af leukocytter er også prædiktiv for korte PSADT blev blodprøver (S1 tabel) tilfældigt opdelt i uddannelse (65 prøver) og prøvning (64 prøver) sæt. Tilsvarende processer blev udført på disse prøver som beskrevet i fornyet forudsigelse. Som vist i tabel 2, LSR modellen i uddannelse og afprøvning datasæt gav en nøjagtighed på forudsigelse af PSADT = 4 måneder som 67,7% og 57,5%, hhv. ROC kurve LSR model versus den diagonale linje (tilfældig gæt) har p-værdi = 0,016 for træningssættet og 0,017 til test sæt (figur 5, tabel 2 og S6 tabel). Forudsigelsen er baseret på Gleason score gav 42,3% nøjagtighed for uddannelse sæt, og 44,5% for den indstillede test data. På den anden side, Nomogram genereret en forudsigelse nøjagtighed på 67,8% og ROC p-værdi på 0,0082 i træningssættet og 64,5% nøjagtighed og 0,0014 ROC p-værdi i sættet testning. Status for fusion udskrifter i prostata cancer prøver produceret en nøjagtighed på 68,8% og 68,4% i uddannelse og afprøvning datasæt, hhv. Disse 4 metoder syntes ikke at være signifikant bedre end en anden, når parvise andel blev udført. Men når alle 4 metoder blev kombineret, det gav en nøjagtighed på 83,0% (ROC p = 5,3 x 10

-9) til den indstillede uddannelse og 72,0% (ROC p = 1.3×10

-4) for test sæt. Disse resultater var bedre end nogen enkelt forudsigelse modalitet med hensyn til nøjagtighed, AUC og Youden Index værdier (tabel 2). For at undersøge effekten af ​​hver af disse modaliteter på forudsigelse model blev hver modalitet individuelt trukket fra den samlede forudsigelse model. De forudsigelse Resultaterne viste en række 72,8-82,5% nøjagtighed i sættet træningsdata og 65,0-73,6% nøjagtighed i sættet test data, når en modalitet blev fratrukket. Det er interessant, når enten blod LSR eller kræft fusion udskrift status blev trukket, de kombinerede modeller gav ingen signifikant bedre forudsigelser end nogen enkelt modalitet forudsigelse undtagen Gleason s (S7 Table), hvilket tyder på, at blod LSR og fusion udskrift status var de væsentligste bidragsydere i den kombinerede forudsigelse model.

for at analysere virkningen af ​​korte PSADT forudsigelse om prostatakræft PSA-fri overlevelse, Kaplan-Meier analyser blev udført på prøver adskilt baseret på PSADT forudsigelse af leukocyt genom LSR. Som vist i figur 6 og S8 tabel, når prøver forudsagt af blod LSR at have PSADT≤4 måneder, PSA overlevelse sats var 17,1% ved 90. måned efter radikal prostatektomi, mens overlevelsesraten forbedret til 41,5% for dem forudsagte at have PSADT≥15 måneder eller ikke-tilbagevendende (log-rank test p = 0,0039, se figur 6 og S8 tabel). I modsætning hertil overlevelseskurver forudsagt af Gleason score endte med lignende overlevelsesrate på 90 måneder, og p-værdien mellem to kurver var 0,0816 ved log-rank test. Nomogram havde PSA-fri overlevelse på 21,4%, når patienter blev forudsagt at have PSADT≤4 måneder. Denne overlevelsen var 31,5%, når patienterne blev forudsagt at være ikke-tilbagevendende (p = 0,0021 ved log-rank test). Men når modellen kombinere Gleason, nomogram fusionstranskripter og blod LSR blev påført, PSA overlevelse sats var kun 7,9%, når patienter blev forudsagt at have PSADT≤4 måneder, mens overlevelsesraten var 52,1%, når patienterne var forventes at have PSADT 4 måneder eller ikke-tilbagevendende (p = 1.6×10

-7). Modellen kombinerer 4 modaliteter væsentligt bedre end de prognosemodeller baseret på Gleason bedømmelse (p = 1,5×10

-6) eller Nomogram (p = 3.0×10

-5) eller LSR (p = 1.9×10

-5 ) eller fusionstranskripter (p = 0,0018) alene (S9 tabel). Disse analyser indikerer klart, at størrelserne af kopiantal variation af humane leukocytter er korrelative med klinisk opførsel af prostatacancer. Kombinationen af ​​genomet CNV af leukocytter med klinisk information af patienter med prostatacancer ville give meget forbedrede forudsigelsesmodeller for prostatakræft adfærd.

Diskussion

Omfattende tilstedeværelse af CNV er et af de vigtige elementer i humane maligniteter. CNV i normale væv fra raske individer blev også veldokumenteret [14; 27; 28]. Da CNV analyse er stort set ufølsom over for små forurening, kan det kræve mere end 25% forurening til at detektere en ændring af antal kopier i genomet. Lille kontaminering af blodstrømmen ved prostatacancerceller er generelt uopdaget. Den detekterede fra buffy coats i vores undersøgelse CNVs sandsynligvis repræsenterer genomet CNVs fra leukocytter. Vores undersøgelser tyder på, at størrelserne af CNV fra leukocytter af prostatakræft patienter er meget korrelative med de kliniske resultater af prostatakræft. Disse CNVs spreder sig på tværs af alle kromosomer. De fleste af disse CNVs overlapper med genet kodende sekvenser af genomet. Interessant, hverken specifikke CNV fragment eller gen involveret i disse CNVs signifikant associeret med udfaldet af prostatakræft, hvilket tyder på, at virkningen af ​​CNVs på prostatakræft er af kollektiv art. cross-validations).

doi:10.1371/journal.pone.0135982.s017

(DOCX)

Acknowledgments

We

Be the first to comment

Leave a Reply