PLoS ONE: Klassificering af ikke-småcellet lungekræft Baseret på Copy Number Ændringer

Abstrakte

Lungekræft er en af ​​de førende årsager til dødelighed af kræft på verdensplan og ikke-småcellet lungekræft (NSCLC) tegner sig for det meste. NSCLC kan yderligere opdeles i adenocarcinom (ACA) og pladecellecarcinom (SCC). Det er af stor værdi til at skelne disse to undergrupper klinisk. I denne undersøgelse, vi sammenlignede genom-dækkende kopi nummer ombygninger (CNA’er) mønstre af 208 tidligt stadium ACA og 93 tidlige stadie SCC tumor prøver. Som et resultat, 266 CNA prober stod for bedre diskriminering af ACA og SCC. Det blev afsløret, at de gener, der svarer til disse 266 prober blev beriget med lungekræft relaterede pathways og beriget med kromosomområder hvor CNA sædvanligvis forekommer i lungekræft. Denne undersøgelse kaster lys på CNA undersøgelse af NSCLC og giver nogle indsigter på epigenetiske af NSCLC

Henvisning:. Li BQ, du J, Huang T, Cai YD (2014) Klassificering af ikke-småcellet lungekræft baseret på Copy Number Ændringer. PLoS ONE 9 (2): e88300. doi: 10,1371 /journal.pone.0088300

Redaktør: Giuseppe Viglietto, UNIVERSITY Magna Graecia, Italien

Modtaget: August 12, 2013; Accepteret: 6 jan 2014; Publiceret: 5 feb 2014

Copyright: © 2014 Li et al. Dette er en åben adgang artiklen distribueres under betingelserne i Creative Commons Attribution License, som tillader ubegrænset brug, distribution og reproduktion i ethvert medie, forudsat den oprindelige forfatter og kilde krediteres

Finansiering:. Dette arbejde blev støttet af tilskud fra National Basic Research Program Kina (2011CB510101, 2011CB510102), Innovation Program for Shanghai Municipal Education Kommissionen (12ZZ087), og tildelingen af ​​”The First-class Disciplin af universiteter i Shanghai”. De finansieringskilder havde ingen rolle i studie design, indsamling og analyse af data, beslutning om at offentliggøre, eller forberedelse af manuskriptet

Konkurrerende interesser:.. Forfatterne har erklæret, at der ikke findes konkurrerende interesser

Introduktion

Lungekræft er en af ​​de førende dødsårsag kræft verdensplan [1]. Baseres på i 2011 International Association for Study of Lung Cancer /American Thoracic Society /European Respiratory Society (IASLC /ATS /ERS) lunge adenocarcinom klassificering, er det nu klassificeres i 5 forskellige undertyper: Atypisk adenomatøs hyperplasi (AAH), Adenocarcinom in situ (AIS) (nonmucinous, mucinous, eller blandet nonmucinous /mucinous), minimalt invasiv adenokarcinom (MIA) (≤3 cm lepidic fremherskende tumor med ≤5 mm invasion), invasiv adenokarcinom, og varianter af invasiv adenokarcinom, og hver af dem har sin egen histologisk træk [2]. Ikke-småcellet lungekræft (NSCLC) tegner sig for 85% af alle lungekræft. De hyppigste histologiske undertyper af NSCC er adenocarcinom (ACA) og pladecellecarcinom (SCC), der tegner sig for 50% og 30% af NSCLC tilfælde henholdsvis [3]. ACA er den mest almindelige histologiske undertype rapporteret med lungekræft i de aldrig rygere (LCINS) [4], som er en kræft i en epitel, der stammer fra kirtelvæv. SCC er en kræftform i skællede epitel celle, som opstår oftest i segmental bronkier og relateret til lobar og hovedstammen bronkie sker ved dens udvidelse [5], og forekomsten er korreleret med rygning periode [6] i forhold til ACA. Historisk set godt differentierede SCC celler indbefatter de morfologiske funktioner såsom intercellulær brodannelse, squamous perle dannelse og individuel celle keratinisering [5]. I dag har medicin udvikling i NSCLC introduceret histologiske subtypning, differentieringen af ​​ACA fra SCC i biopsi prøver, som en vigtig faktor for effektiv behandling valg og molekylær terapi mål. For eksempel pemetrexed, antifolat, er effektivt til behandling af patienter med ikke-squamous NSCLC men bør ikke anbefales til behandling af pladecellecarcinom [7]. Bevacizumab, kombineret med paclitaxel /carboplatin, har store toksiske virkninger i pladecellekræft [8], mens det i væsentlig grad kan øge den samlede overlevelsesrate for patienter med kræft i ikke-pladecellekræft histologi [9], [10]. Traditionelle diagnosemetode at skelne adenocarcinom fra pladecellecarcinom, er baseret på det histologiske snit og patienternes rygevaner. Men på grund af den individuelle heterogenitet lungekræft, denne metode kan ikke skelne korrekt ACA og SCC i nogle tilfælde effektivt. For nylig er immunhistokemi anvendes i biopsi og cytologi materiale [11] som et supplement, og flere gener er blevet opdaget som den immunhistokemiske markør. Kargi et al. fundet thyroid transkriptionsfaktor-1 (TTF-1) er en markør i immunfarvning for ACA, mens P63 og cytokeratiner (CK) 5/6 er mærker for SCC [12]. Desuden har molekylær målrettet terapi blevet mere og mere brugt i NSCLC som lovende behandlingsstrategi i de seneste år. Det påvises, at overlegen effekt af tyrosinkinasehæmmere (TKI’er) sammenlignet med standard kemoterapi for patienter med EGFR-mutant tumorer [13]. Kwak et al. også undersøgt med lille molekyle hæmmer af ALK-tyrosinkinasen kan anvendes som den effektive behandling i avancerede ALK-positive tumorer i en klinisk tidlig-fase forsøg [14]. Derfor er det meningsfyldt at identificere gener, som har distinkte genetik funktioner i ACA og SCC, der kunne bruges som prognostisk faktor eller potentielt mål for medicinsk behandling.

Forrige analyse har viste CNAs er almindelige i næsten alle menneskelige kræftformer [ ,,,0],15], [16]. I NSCLC, CNAs stigning med sygdomsprogression og CNAs er både positionelt og funktionelt klynger [17]. Desuden Giovanni Tonon el på. fundet på trods af deres forskellige histopatologiske fænotyper, viste ACA og SCC genomiske profiler en næsten fuldstændig overlapning, med kun én klar SCC-specifikke amplikon på 3q26-29 [18].

I denne undersøgelse at finde ud af de centrale gener skelne ACA og SCC fra hinanden, vi sammenligner genom-dækkende kopi nummer ændringer (CNA’er) mønstre af 208 tidligt stadium ACA og 93 tidlige stadie SCC tumor prøver. Ved hjælp af funktionen udvælgelse og analysemetoder, herunder Maximum Relevans Minimum redundans metode (mrmr) og Incremental Feature Selection (IFS) metode blev 266 optimale CNA sonder udvalgt til diskrimination af ACA og SCC. Klassificeringen model blev bygget med Nærmeste nabo Algoritme (NNA). Som et resultat heraf foretager klassificeringen opnået en samlet MCC på 0,6616. Yderligere analyse af de 266 CNA relaterede gener viste, at de var tæt forbundet med lungekræft.

Materialer og metoder

Datasæt

Vi brugte kopi nummer ombygninger data fra den ikke -lille celle lungekræft undersøgelse af Huang et al. [19]. I deres undersøgelse blev en række af 301 snap-frosne tumorprøver fra NSCLC patienter indsamlet under operation eller biopsi fra Massachusetts General Hospital (MGH), Boston, MA og National Institute of Occupational Health, Oslo, Norge. Den kliniske oplysninger af disse 301 prøver blev givet i File S1. Kopien nummer profilering af 208 tidlige fase adenocarcinom tumorer (ACA) prøver og 93 tidlige fase pladecellekræft tumorer (SCC) blev hentet fra NCBI Gene Expression Omnibus (GEO) med tiltrædelse antal GSE34140. Kopien nummer profil blev opnået ved hjælp af den hjælp Affymetrix 250 K Nsp GeneChip. Kun 256.554 sonder på somatiske kromosomer blev analyseret. De SNP sonder blev kortlagt til RefSeq gener med 2 kb udvidelse både opstrøms og nedstrøms ved hjælp af UCSC Genome Browser. Blandt de 256,554 sonder på somatiske kromosomer, blev 104,256 sonder kortlagt til 11.700 gener [19].

mrmr metode

Vi brugte Maximum Relevans Minimum Redundans (mrmr) metode til at rangere vigtigheden af ​​sonderne [20]. mrmr metode kunne rang sonder baseret på både deres relevans for klassen af ​​prøver og redundans blandt sonder. En mindre indeks over en sonde angiver, at det har en bedre afvejning mellem maksimal relevans for klasse af prøver og minimum redundans.

Både relevans og redundans blev kvantificeret ved gensidig information (MI), som anslår, hvor meget man vektor er relateret til en anden. Den MI ligningen blev defineret som nedenfor: (1)

I ligning (1), er vektorer, er deres fælles probabilistiske tæthed, og og er de marginale probabilistiske tætheder

Lad betegne den. hele sonde sæt, betegne den allerede valgte probe sæt indeholder

m

sonder og betegne den til-være-udvalgt probe sæt indeholder

n

sonder. Relevansen mellem en probe i og klassen af ​​prøve kan beregnes ved: (2)

redundans mellem en probe ind og alle sonderne i kan beregnes ved: (3)

for at få sonden i med maksimal relevans og minimum redundans, det mrmr funktionen kombinerer ligning (2) og ligning (3) og er defineret som følgende: (4)

mrmr sonde rating ville blive henrettet N runder når givet en probe sæt med N (N = m + n) prober. Efter N runder af udførelse, er en sonde sæt produceret: (5)

, indeks

h

indikerer hvor runde, at sonden er valgt. Jo mindre indekset

h

er, jo tidligere sondens tilfredsstiller ligningen (4) og den bedre sonden er.

Nærmeste nabo algoritme (NNA)

Nærmeste nabo algoritme (NNA) [21], [22], som har været meget anvendt i bioinformatik og datamatisk biologi [23], [24], [25], [26], [27], blev vedtaget for at forudsige klassen af ​​prøver. Den “nærhed” blev beregnet efter følgende ligning (6) hvor og er to vektorer, der repræsenterer to prøver, er deres dot produkt, og er deres moduluses. Jo mindre, jo mere lignende de to prøver er.

For en intuitiv illustration af, hvordan NNA værker, se Fig.5 af [28].

overdrejningsalarm Cross-Validation Method

overdrejningsalarm Cross-Validation Metode [23], [24], [29], [30] (også kaldet Leave-one-out cross-validering, LOOCV) blev anvendt til at evaluere resultaterne af en klassificeringen. I overdrejningsalarm Cross-Validering Method, er hver prøve testet af forudsigelse, der er uddannet med alle de andre prøver. Lad TP betegner sand positiv. TN betegner sand negativ. FP betegner falsk positive og FN betegner falsk negativ. For at evaluere resultaterne af vores prædiktor, forudsigelse nøjagtighed, specificitet, sensitivitet og MCC (Matthews korrelationskoefficient) blev beregnet som nedenfor: (7)

Trinvis Feature Selection (IFS)

Baseret på de klassificeret sonder bedømt af mrmr evaluering, brugte vi Incremental Feature Selection (IFS) [31], [32], [33] for at bestemme det optimale antal sonder. Under IFS procedure, er prober i den rangeret probe sæt tilsat en efter en fra højere til lavere rang. En ny probe sæt består, når der tilsættes en probe. Således N probesæt skal bestå givet N rangeret prober. Den i’te sonde sæt er: (8)

For hver af de N probe sæt blev en NNA prædiktor konstrueret og testet ved hjælp LOOCV. Med N forudsigelse nøjagtighed, følsomheder, særpræg og MCC’er beregnet, vi får en IFS bord med en kolonne er indekset i og de andre kolonner for at være den forudsigelse nøjagtighed, sensitivitet, specificitet og MCC. Den optimale sonde sæt () er den ene, ved brug som prædiktor opnår den bedste forudsigelse ydeevne.

Funktionel berigelse analyse af CNA’er gener

Funktionel annotation værktøj samle [34] blev brugt til Kegg vej, GO og kromosom region berigelse analyse. Alle gener i det humane genom blev valgt som baggrund under berigelse analyse.

Resultater og Diskussion

Den mrmr Resultat

Opført i File S2 er to slags udfald opnået ved at køre mrmr software: en kaldes “MaxRel feature liste”, der rangerede alle sonder efter deres relevans for klassen af ​​prøver; den anden er den “mrmr feature liste”, der rangeret sonderne i henhold til kriterierne for maksimal relevans og minimum redundans. I mrmr sonden listen, jo mindre indekset for en sonde var, ville jo vigtigere sonden være for den diskriminering af to slags NSCLC. Derfor kunne mrmr feature liste bruges til at etablere den optimale funktion sat i IFS procedure.

IFS og Final Optimal Feature Set

På baggrund af disse to tabeller, 1000 har delmængder blev bygget efter til Eq.8. En NNA prædiktor blev modelleret for hver delmængde og blev evalueret ved LOOCV. Vist i figur 1 er IFS kurve plottes baseret på data i File S3. X-aksen er antallet af prober, der anvendes til klassificering, og y-aksen er MCC-værdier af klassificører evalueret af LOOCV. Den maksimale MCC var 0,6616, når 266 prober blev anvendt. Med sådan en sorterer, forudsigelsen følsomhed, specificitet og nøjagtighed var 0,9567, 0,6452 og 0,8605, henholdsvis. Disse 266 sonder blev betragtet som de optimale biomarkører for diskrimination af to slags NSCLC. Oplysningerne af disse 266 sonder blev givet i File S4. Vist i figur 2 er den Heatmap baseret på disse 266 prober. Det kan ses, at de fleste af de 208 ACA prøver og 93 SCC prøver kan skelnes.

De IFS kurver blev tegnet på grundlag af data i File S3. MCC nået toppen, når antallet af prober var 266. 266 prober således opnåede blev anvendt til at komponere den optimale probe sæt for diskriminering af adenocarcinom (ACA) og pladecellecarcinom (SCC).

prøver er anbragt langs X-aksen og proberne langs y-aksen. Hvert felt repræsenterer kopiantallet af en given probe i en individuel prøve. Rød er øget kopi nummer og blå reduceres kopi nummer i forhold til mellemtiden og prøve-centreret skaleret kopi nummer tværs prøverne. Adenocarcinom (ACA) og pladecellekræft (SCC) prøver blev præsenteret med grøn og blå, henholdsvis.

Kegg og GO berigelse resultater af CNA’er gener

Kegg vej berigelse analyse af CNA’er gener viste, at de var beriget i Wnt signalvej, Focal adhæsion, ECM-receptor interaktion og så videre (tabel 1). Det er rapporteret Wnt signalvejen aktiveres under carcinogenese af NSCLC [35], og inhibering af Wnt-2-medieret signalering kunne inducere ikke-småcellet lungecancer-celler apoptose [36]. Fokal adhæsion og ECM-receptor-interaktionen er veje i de biologiske processer vekselvirkninger af celler med ekstracellulær matrix (ECM), som spiller afgørende roller i cellemotilitet, celleproliferation, celledifferentiering, regulering af genekspression og celleoverlevelse [37], [38 ]. Proteinerne ifølge disse veje er opreguleret i NSCLCs [39], og deltage i aktiveringen af ​​lokal invasion og fjernt metastase af cancerceller [40]. Som Kegg pathway berigelse resultat, GO berigelse resultat af disse CNA’er gener viser også berigelse i form af celleadhæsion og intracellulær signalering kaskade. GO berigelse resultat af disse CNA’er gener optaget i File S5.

Kromosom region berigelse resultat af CNA’er gener

Det er rapporteret kopi nummer gevinst i region 3q26 [18], [ ,,,0],41] og i region 8p12 [42] synes at være mere almindelige i skællede histologi sammenlignet med adenocarcinom. Analysen af ​​vores resultat viser, at medtage disse to regioner, kopi nummer ændringer i 2q34, 10p15, 18q11, 8p23, 3p21, 3q27, 22q12, Xq13, 2q36, 10p11, 10p12 har også betydning i forskelsbehandling mellem SCC og ACA, og fortjent yderligere research på dem (tabel 2).

CNA’er gener identificeret i denne undersøgelse

i denne undersøgelse har vi identificeret flere kandidatgener svarende til 266 CNA’er sonder, der kan bruges til at skelne to slags NSCLC. 50 af dem har også en signifikant sammenhæng til Smoking Pack-år, herunder TP63, SOX2 og PPP2R2B (se File S4). Med litteraturindsamling af genfunktioner og betydning sammenligning med p-værdi, fokuserede vi på 8 gener, som højst sandsynligt relateret til at skelne ACA og SCC fra hinanden. Blandt dem, der TP63 blevet rapporteret som en biomarkør til at skelne mellem SCC og ACA, og den er optaget top i vores resultat. Nogle af andre gener er rapporteret at have forskellige genekspression niveau i ACA og SCC eller til patienter med forskellige rygevaner. I overensstemmelse med den Kegg og GO berigelse resultat, PPP2R2B er et gen i Wnt signalvej, mens ITGA9 tager en del i fokal adhæsion og ECM-receptor-interaktion. Alle ovenfor illustrerer, at vores resultat er biologisk signifikant og de 8 gener kan være kandidat biomarkører til at skelne ACA og SCC fra hinanden og fortjente yderligere undersøgelser på dem. Nedenfor vil vi kort diskutere deres relationer med NSCLC.

TP63 (Tumor protein 63) er opført øverste i den optimale sonde sæt med en CNA fold ændring på 0,7827 sammenligne ACA med SCC. Det er en tumorsuppressor p53 homolog og afgørende for p53 afhængig apoptose i respons på DNA beskadigelse [43]. Mi Jin Kim et al. fundet P63 er en nyttig immunohistokemisk panel til differentiering ACA fra SCC af lungen med den positive rate 91% af SCC og 9% af ACA i deres studier [44]. Kromosom Placeringen af ​​TP63 er 3q27-29. Derfor er vores resultat er sammenfaldende med tidligere undersøgelser og TP63 kan spille en nøglerolle i skelne ACA og SCC fra hinanden.

EPHA4 (Ephrin type A receptor 4) er relateret til den fjerde probe i vores optimale probe sæt med en CNA gange ændring af 1,0846 sammenligne ACA med SCC, og er medlem af Eph-receptor familien, den største receptortyrosinkinase-familien af ​​transmembrane proteiner med deres ligander, de ephriner, der påvirker vækst, migration og invasion af cancerceller i kultur samt tumorvækst, invasivitet, angiogenese og metastase in vivo [45]. Junya Fukai et al. fundet EphA4 fremmer celledeling og migrering gennem en roman EphA4-FGFR1 signalvejen i den menneskelige gliom U251 cellelinje [46]. En af Eph-receptorerne EphA2 rapporteret over ekspression i rygere og forudsiger ringe overlevelse i ikke-småcellet lungecancer [47]. En mutation i EphA2 (G391R) blev identificeret i to af 28 pladecelle-lungecancer (7%), men ikke i nogen adenocarcinomer eller store-celle lungecarcinomer [48]. Disse alle indikerer, at EphA4 kan være en kandidat biomarkør til at skelne ACA og SCC fra hinanden og fortjente yderligere undersøgelser på den.

PPP2R2B (Serin /threonin-protein fosfatase 2A 55 kDa regulatoriske subunit B beta isoform) er relateret til femte probe i vores optimale probe sæt med en CNA gange ændring af 1,0781 sammenligne ACA med SCC. Det er den regulatoriske underenhed B beta isoform af PP2A, og er impliceret i den negative kontrol af cellevækst og division [49]. For nylig genom-dækkende forening undersøgelse (GWAS) af lungekræft i den kinesiske befolkning viste, at kromosom 5q32 (rs2895680 i PPP2R2B-STK32A-DPYSL3, P = 6,60 × 10-9) var lungekræft modtagelighed loci og interageret med rygning dosis [50] . Samt PPP2R2B er på toppen af ​​vores resultat, bidraget fra det i NSCLC er værdig til at blive yderligere belyst.

ITGA9 (Integrin alpha-9) er relateret til den tolvte probe i vores optimale probe sæt med en CNA gange ændring af 1,1034 sammenligne ACA med SCC, som hører til integrinfamilien og udtrykkes på en lang række celletyper. Det interagerer med mange ligander for eksempel fibronectin, tenascin-C og ADAM12, og deltager i adskillige processer, såsom celleadhæsion, migrering, lunge udvikling, lymfe og venøs ventil udvikling, og ved sårheling [51]. ITGA9 har vist sig ned ekspression i NSCLC [52], og som udviser stærk cellevækstinhiberingen aktivitet [53]. Statistisk analyse af Alexey a. Dmitriev et al. foreslået, at methylering /sletning niveau af ITGA9 har betydelige ændringer i ACA og SCC [53]. Vores analyse præsenterede genet kopi antal ITGA9 er forskellig i NSCLC undertyper, hvilket indebærer ITGA9 som kandidat molekylær til at skelne mellem SCC og ACA.

SOX2 (Sex-bestemmende region Y-boks 2) er relateret til det nittende probe i vores optimale probe sæt med en CNA gange ændring af 0,7790 sammenligne ACA med SCC, og er blevet rapporteret at være differentielt udtrykt mellem ACA og SCC. Det er beliggende på kromosom 3q26 og højt niveau forstærkning af SOX2 er blevet rapporteret hos ca. 20% af lunge pladecellecarcinomer [54], [55]. SOX2 er en transkriptionsfaktor kontrollerer ekspressionen af ​​en række gener, der er involveret i embryonisk udvikling og holder neurale celler udifferentieret [56]. Undertrykkelse af SOX2 i forstærkede Sox2 celler har større antiproliferative effekter sammenlignet med andre gener på 3q26.33 herunder PIK3CA og TP63.

FHIT (skrøbelige histidintriade) er relateret til treogtredivte sonde i vores optimale sonde sæt med en CNA gange ændring af 1.1110 sammenligne ACA med SCC, og opfører sig in vitro som en typisk diadenosine triphosphat hydrolase spalte a-5′-PPP-5’a til opnåelse AMP og ADP [57], men kun lidt om dets fysiologiske funktion. Det betragtes som en tumor suppressor i mange menneskelige kræftformer og dens restaurering i Fhit-negative kræft cellelinjer undertrykker tumorigenicitet og inducerer apoptose [58]. Jennifer E. Tseng el på. fandt, at hyppigheden af ​​tab af FHIT udtryk relateret til rygning vane i fase I Ikke-småcellet lungekræft [59]. I undersøgelserne af Gemma Toledo et al. FHIT udtryk var relateret til tumor histologi: 52 54 (96,3%) SCC og 20 af 44 (45,5%) ACA var negative for FHIT (P 0,0001) [60]. Som SCC er tæt korreleret med en historie af tobaksrygning [6], og vores resultater viser kopien antal FHIT er betydeligt lavere i SCC, kan FHIT være en mulig biomarkør for NSCLC diagnose og ville være en potentiel medicinsk mål for kræftbehandling.

RBBP8 (retinoblastom-protein 8) er et ubikvitært nuklear protein, som binder til tumorsuppressorproteiner RB [61] og CtBP [62]. Det er også interagere med BRCA1 [63] og menes at regulere funktionerne af BRCA1 i transkriptionel regulering, DNA beskadigelse reparation, og G2 /M cellecyklus checkpoint kontrol [64], [65]. RBBP8 er påkrævet for DNA dobbelt-strenget pause (DSB) resektion, og dermed for rekruttering af proteinkinasen ATR og replikation protein A til DSBs, og fremmer ATR aktivering og homolog rekombination [66]. Det forlyder, at DNA reparationskomponenter var signifikant opreguleret herunder retinoblastoma protein 8 (RBBP8), i lunge SCC sammenlignet med normalt lungevæv, men sådan opregulering blev ikke fundet i lunge ACA [67]. Som en væsentlig molekylær i cellen processen DNA-skader reparation og cellecykluskontrol, RBBP8 har potentialet til at være en biomarkør og terapi mål for NSCLC og mekanismen af ​​dens særlige ekspressionsprofil i SCC og ACA fortjener yderligere undersøgelse.

GPC5 (glypican-5) er et medlem af den glypican gen familien, som er en familie af heparansulfat proteoglycaner der er knyttet til den exocytoplasmic overflade af plasmamembranen via glycosyl phosphatidylinositol [68]. Udtrykket niveau GPC5 var signifikant lavere i lunge adenocarcinom væv end i matchede normalt lungevæv i aldrig rygere [69]. Yang et al. fundet afdøde ekspression af GPC5 er korreleret med reduceret overlevelse i ACA, men ikke i SCC [70]. Disse alle indikerer, at GPC5 kan være en potentiel tumorsuppressorgen i NSCLC, og en kandidat bio-markør til at skelne mellem SCC og ACA.

Konklusion

I denne undersøgelse, vi konstrueret en klassifikatør baseret på eksemplar nummer forandringer (CNA) at skelne mellem to undergrupper af NSCLC. Som følge heraf blev 266 CNA prober valgt som de bedste diskriminatorer. Analyse af gener svarende til disse 266 CNA prober indikerer, at de er beriget i lungekræft relaterede pathways og beriget med kromosomområder hvor CNA sædvanligvis forekommer i lungekræft. Nogle af disse gener, såsom TP63, SOX2, EPHA4, PPP2R2B, ITGA9, FHIT, RBBP8 og GPC5 er tæt knyttet til lungekræft og disse kandidatgener kan give ledetråde til yderligere forskning og eksperimentere validering.

Støtte Information

File S1.

Klinisk information af adenocarcinom (ACA) og pladecellekræft (SCC) prøver

doi:. 10,1371 /journal.pone.0088300.s001

(DOCX)

File S2.

mrmr resultat for klassificering. Denne fil indeholder to ark. Den første er den MaxRel funktionen tabel, som rangeret top 1000 sonder efter relevans mellem funktioner og klasse af prøverne. Den anden er den mrmr funktionen tabel, som rangeret disse 1000 sonder i henhold til kriterierne redundans og relevans

doi:. 10,1371 /journal.pone.0088300.s002

(XLSX)

File S3.

følsomhed (Sn), specificitet (Sp), nøjagtighed (Ac), Matthews korrelationskoefficient (MCC) i hver kørsel af IFS for klassificering

doi:. 10,1371 /journal.pone.0088300.s003

(XLSX)

File S4.

annotation af de 266 udvalgte sonder

doi:. 10,1371 /journal.pone.0088300.s004

(XLSX)

File S5.

GO berigelse resultat af CNA’er gener

doi:. 10,1371 /journal.pone.0088300.s005

(XLSX)

Tak

Forfatterne vil gerne takke editor for at tage tid til at redigere dette papir. Forfatterne vil også gerne takke de to anonyme anmeldere for deres konstruktive kommentarer, som var meget nyttigt for at styrke præsentationen af ​​denne undersøgelse.

Be the first to comment

Leave a Reply