PLoS ONE: En omfattende karakterisering af Genome Wide Copy Number afvigelser i Kolorektal Cancer afslører Novel onkogener og Mønstre af Ændringer

Abstrakte

At udvikle et samlet overblik over kopi nummer afvigelser (CNA’er) i fase-II /III kolorektal cancer (CRC), vi karakteriseret 302 tumorer fra det kliniske PETACC-3 forsøg. Mikrosatellit-stabile (MSS) prøver (n = 269) havde 66 minimale fælles CNA regioner, med hyppige gevinster på 20 q (72,5%), 7 (41,8%), 8 q (33,1%) og 13 q (51,0%) og tab på 18 (58,6%), 4 q (26%) og 21 q (21,6%). MSS tumorer har betydeligt flere CNAs end mikrosatellitmarkørerne-ustabilt (MSI) tumorer: i MSI tumorer en roman sletning af tumor suppressor WWOX ved 16 q23.1 blev identificeret (p 0,01). Focal afvigelser identificeret ved transportcenter metode bekræftede amplifikationer af onkogener, herunder EGFR, ERBB2, CCND1, MET, og MYC, og sletninger af tumorsuppressorer herunder TP53, APC, og Smad4, og genekspression var meget overensstemmende med kopi nummer aberration for disse gener. Nye amplikoner inkluderet formodede onkogener såsom WNK1 og HNF4A, som også viste høj overensstemmelse mellem antal kopier og udtryk. Overlevelse analyse er forbundet en bestemt patient segment fremhævede ved kromosom 20 q gevinster til en forbedret samlet overlevelse, hvilket kan skyldes højere ekspression af gener såsom EEF1B2 og PTK6. CNA clustering også grupperet tumorer er kendetegnet ved en dårlig prognose BRAF-mutant-lignende signatur afledt af mRNA data fra denne kohorte. Vi afslørede yderligere ikke-tilfældige korrelation mellem CNAs blandt sammenkædet loci, herunder positiv korrelation mellem 20 q gevinst og 8 q gain, og 20 q gevinst og kromosom 18 tab, i overensstemmelse med co-udvælgelse af disse CNA’er. Disse resultater styrke ikke-tilfældige karakter af somatisk CNA’erne i fase-II /III CRC og fremhæve loci og gener, der kan spille en vigtig rolle som drivkraft for udviklingen og resultatet af denne sygdom

Henvisning:. Xie T, d ‘Ario G, Lamb JR, Martin E, Wang K, Tejpar S, et al. (2012) En omfattende karakterisering af genom-dækkende Kopier Antal afvigelser i Kolorektal Cancer afslører Novel onkogener og Mønstre af Ændringer. PLoS ONE 7 (7): e42001. doi: 10,1371 /journal.pone.0042001

Redaktør: Alejandro H. Corvalan, Pontificia Universidad Catolica de Chile, Chile

Modtaget dateret 25. april 2012; Accepteret: 28 juni 2012; Udgivet: 31 Jul 2012

Copyright: © Xie et al. Dette er en åben adgang artiklen distribueres under betingelserne i Creative Commons Attribution License, som tillader ubegrænset brug, distribution og reproduktion i ethvert medie, forudsat den oprindelige forfatter og kilde krediteres

Finansiering:. Dette arbejde blev delvist understøttet af en bevilling fra den schweiziske National Science Foundation (SNF 320030_135421) og Foundation Medic og et tilskud af Krebsforschung Schweiz (KFS 02697-08-2010) til AR og MD. ST er en ledende klinisk investigator for fonden for videnskabelig forskning Flandern og har modtaget forskningsmidler fra den belgiske føderation mod Kræft og fra den belgiske Kræftplan. De finansieringskilder havde ingen rolle i studie design, indsamling og analyse af data, beslutning om at offentliggøre, eller forberedelse af manuskriptet

Konkurrerende interesser:. TX, JL, KW, MM, SW, PR og JGH er eller var ansat af Pfizer Inc. det betyder dog ikke ændre forfatternes tilslutning til alle de PLoS ONE politikker om deling af data og materialer. Forfatterne har erklæret, at der ikke findes andre konkurrerende interesser.

Introduktion

Kolorektal cancer (CRC) andenpladsen til lungekræft i både forekomst og dødelighed i de udviklede lande [1]. Det er kendetegnet ved meget komplekse mønstre af somatiske genetiske ændringer af onkogener og tumor suppressorer, der drev initiering og progression [2], [3], [4]. Forståelse af de cellulære og molekylære mekanismer, hvormed disse genetiske ændringer letter tyktarmskræft dannelse er kritisk for udvikling af målrettede terapeutiske strategier rettet mod at kontrollere sygdomsprogression samtidig minimere toksiske bivirkninger.

En veletableret genetiske mekanisme, ved hvilken cancerceller ændrer aktiviteten af ​​onkogener og tumor suppressorer er gennem ændringer i gen dosering. Detaljeret karakterisering af DNA-kopi antal afvigelser (CNA’er) har hjulpet til at identificere vigtige onkogener herunder ERBB2 og EGFR samt tumorsuppressorer såsom TP53 [5]. Talrige undersøgelser har dokumenteret genom-dækkende somatiske CNA’erne i CRC [6], [7], [8], [9], [10], [11], [12], [13], [14], [15] [16], [17], [18], hvoraf nogle har været forbundet med kliniske resultater eller metastatisk progression [19], [20], [21], [22], [23], [24]. Men mange af disse undersøgelser er blevet begrænset af beskedne stikprøve størrelse, analyser lav opløsning, eller mangel af associerede kliniske anmærkning, især for den tidlige fase (II /III) tyktarmskræft. Derfor et samlet overblik over CNAs og deres forbindelse med resultat i fase II /III tyktarmskræft er ikke blevet udviklet.

Vi observerede somatiske CNAs i en samling af 302 trin II /III tyktarmskræft afledt af fælleseuropæiske europæiske forsøg med adjuvans Colon cancer (PETACC) -3 forsøg, et stort randomiseret fase III-vurdering af den rolle, irinotecan tilføjet til fluorouracil (FU) /leucovorin (FA) som adjuverende behandling for tyktarmskræft [25]. Resultaterne præsenteret heri udforske forholdet mellem CNA, mRNA [26] og resultat, og bidrage til en omfattende molekylær overblik over scenen-II /III tyktarmskræft, som er altafgørende for raffinering patient klassificering og effektiv behandling.

Materialer og metoder

klinisk og mRNA data for PETACC-3 patienter

Alle stadie II /III tyktarmskræft patienter inkluderet i dette studie stammede fra det kliniske PETACC-3 forsøg [25], med mindst 5 års klinisk opfølgning for hver patient. Den alder, køn, scene, MSI (mikrosatellit-ustabilt) samt BRAF og KRAS mutation status af patientpopulationen er anført i tabel S1. mRNA-ekspression data blev genereret på Almac Colorectal Cancer DSA platform (Craigavon, Nordirland), som tidligere [26] rapporteret. Patient og etik godkendelse til denne undersøgelse blev opnået fra PETACC-3 Translationel Research Working Party (PTRW).

Molekylær Inversion Probe data Generation

DNA ekstraktioner blev udført på macrodissected formalin-fikseret, paraffin -embedded (FFPE) tumorvæv afledt af en enkelt 5 uM slide fra 835 patientprøver. Tumorvæv inden for hver sektion blev identificeret og mærket af en kvalificeret patolog (F. Bosman). For normale kontroller, blev DNA ekstraheret fra prøver med tilstrækkelige mængder af histopatologisk normalt tilstødende væv godt væk fra randen af ​​tumoren. DNA blev kvantificeret ved anvendelse af PicoGreen assay. For prøver, der gav mindre end den anbefalede input DNA beløb (75 ng), blev alle DNA overført i Molekylær Inversion Probe (MIP) forstærkning, mærkning og hybridiseringsprotokoller hjælp Affymetrix s OncoScan V1.0 FFPE Express tjenester (Affymetrix, CA) . Prøver, der mislykkedes PCR-amplifikation eller vises en Median Gennemsnitlig Parvis Difference (MAPD) ​​ 0,6 efter hybridisering blev fjernet fra den endelige analyse, hvilket resulterer i 302 tumorprøver sammen med 44 tilstødende normale prøver som normal baseline komparator. Typisk prøver under 20 ng input DNA mislykkedes MIP forstærkning cutoff og blev ikke overført til matrix hybridisering. Prøver med mindst 75 ng input DNA universelt givet høj kvalitet kopi nummer data (MAPD 0,6). Resultater varierede for input DNA mængder af 20-75 ng, hvor MAPD . 0.6 filter tjente til at fjerne overdrevent støjende prøver

Kopier nummer Data Analysis

Kopiér nummer data blev analyseret med Nexus Copy nummer 6.0 software (BioDiscovery, Inc., CA, USA). De rå kopi nummer data for hver probe fra Affymetrix blev glattet af en kvadratisk korrektion fra NEXUS og centreret ved hjælp diploide regioner. CNA frekvens sammenligninger blandt prøvegrupperne (fx MSS versus MSI; fase-II versus stadium-III) blev udført under anvendelse NEXUS standard tærskler for 15% forskel og signifikans p 0,01 (Fishers eksakte test). For at generere kopi nummer segmenter og minimale fælles områder (MCRS), vi anvendt en modificeret version af den cirkulære Binary Segmentering (CBS) algoritme [27] hedder “Rank Segmentering” i NEXUS. Den p-værdi cutoff for CBS var 1,0E-6, og segmenter blev tildelt 1 af 5 spande: forstærket ( 3,8 kopier), tjente (2,3 til 3,8 kopier), uændret (1,7 til 2,3 kopier), slettet (0,5 til 1,7 kopier) eller homozygot slettet ( 0,5 kopier). For MCR frekvens signifikans test, brugte vi en p-værdi cutoff af 0,01 fra den statistiske signifikans Test for Aberrant Kopier nummer (STAC) metoden [28]. Hierarkisk gruppering af CNA blev udført i NEXUS også (komplet kobling, kønskromosomer ignoreret). For at detektere fokale amplifikationer, vi anvendte transportcenter (Genomisk Identifikation af væsentlige mål i Cancer) version 2.0 [29] ved hjælp af en Q-værdi cutoff 0,25. Gener rapporteret i GISTIC2 amplifikationsprodukter toppe blev undersøgt, om de er beriget med eventuelle biologiske veje. Vi brugte kanonisk vej database, som MSigDB [30]. Pathway gen sæt med mindre end 10 medlemmer eller mere end 500 medlemmer, blev udelukket. Fishers eksakte test blev anvendt til adgang, hvis disse gener er overrepræsenteret. FDR blev beregnet baseret på 100 permutationer hvor tilfældige sæt af gener af samme størrelse blev testet. Vi brugte også Fishers eksakte test for at se, om frekvenser af visse CNAs varierer blandt patientgrupper (fase II vs III, MSI vs. MSS osv). Overlevelse analyse blev udført under anvendelse af Kaplan-Meier-metoden med en p-værdi (log-rank test) cutoff på 0,01. Til analyse af CNA /CNA korrelationer blev Pearson korrelation beregnet på genniveau for alle par af gener som tidligere [31] beskrevne. At udlede resuméer gen niveau fra kopien nummer data, vi tildelt for kopiering talværdier fra segment (er) overlapper hvert gen: når der var flere segmenter inden for genet grænse, vi i gennemsnit for kopiering numre fra disse segmenter. Alle genombaserede data rapporteret i dette manuskript er baseret på NCBI build 36 (hg18) af det humane genom.

Expression Dataanalyse

Gene udtryk data fra PETACC-3 patienter blev rapporteret tidligere [26]. Vi matchede det med gen-niveau kopi nummer data efter ENTREZ ID. Kopiér nummer og genekspression data var samtidig tilgængelige for 213 af de 269 MSS patienter med tilgængelige CNA data. For at teste cis-sammenhæng mellem et gen kopi nummer og sin egen mRNA ekspressionsniveauet tværs tumorer, vi kategoriseret patienter i henhold til deres aberration status (forstærkning, gain, ingen ændring, tab eller homozygot tekst udgår) tilknyttet udtrykket værdier af sonde sætter kortlægning til det samme gen

Resultater

Kopier nummer aberrationer og mikrosatelitter ustabilitet

33 af de 302 prøver i vores analyse var mikrosatellit ustabilt (MSI):. i overensstemmelse med tidligere undersøgelser [ ,,,0],19], [32], det gennemsnitlige antal CNA’erne i MSI tumorer (10,2 ± 6,5) var signifikant mindre (p 0,01, to prøve t-test) end det gennemsnitlige antal CNA’erne i mikrosatellit stabil (MSS) tumorer (33,2 ± 17.6). Ikke desto mindre blev to fokale områder slettet signifikant hyppigere i MSI prøver: chr16q23.1 (chr16:77,231,391-77,261,567 bp) i 24,2% af MSI prøver vs. 7,1% af MSS prøver (p 0,01) og chr20q11.1 (chr20 :28,118,678-28,244,164) i 24,4% af MSI prøver vs. 8,9% i MSS prøver (p 0,01). Interessant nok eneste gen indeholdt i 16 q23.1 locus er WWOX tumorsuppressor, en inhibitor af WNT /beta-catenin pathway [33], som ofte aktiveres i tyktarmskræft.

Periodisk CNA’er, nye onkogener og Berørte veje

på grund af den relativt lave CNA prævalens i MSI tumorer, fokuserede vi vores analyser på de 269 MSS tumorer. Som det er blevet rapporteret tidligere [7], [8], [9], [10], [11], [12], [13], [14], [15], [16], [17], den frekvenser af kopi nummer gevinster og tab i hele genomet blev ikke tilfældigt fordelt (figur 1A), med CNAs fra enkelte kopi gevinster og tab på brede kromosomale regioner, til grupper homozygote sletninger og højt niveau amplifikationer (Figur 2). De hyppigste områder af gevinst omfattede kromosomale regioner 7 p, 8 q, 13 q, og 20 q, og de mest hyppige regioner tab omfattede 8 p, 17 p, og 18 q (figur 1A).

(A) Frekvensen af ​​kopi nummer gevinst (over akse, blå) og kopi nummer tab (under akse, rød) på tværs af humane genom. (B) Betydningen af ​​fokale amplifikationer opdaget af transportcenter 2.0. Kromosom positioner blev indikeret langs y-aksen med centromerfusioner positioner angivet med stiplede linjer. De ti mest betydningsfulde transportcenter toppe er vist i rød tekst. Yderligere transportcenter toppe koder etablerede onkogener er i sort tekst. Informationer om alle transportcenter toppe er tilvejebragt i tabel S3.

(A-H) kopital grunde til hele genomet arrangeret i kromosomal rækkefølge fra den korte arm af kromosom 1 (1pter) til den lange arm af kromosom X (Xqter) i 8 uafhængige tumorprøver. Amplikoner af særlig interesse er fremhævet med pile, sammen med etablerede onkogener. Detaljer om alle amplikoner og transportcenter toppe er i tabel S3.

For at få yderligere indsigt, vi sammenfattet tilbagevendende kromosomale gevinster og tab i Minimal Common Regioner (MCRS) ved hjælp Signifikant Test af Aberrant Copy Number (STAC) [28], og transportcenter [29] for at fremhæve kandidat onkogener i MCRS baseret på focality og amplituden af ​​kopi nummer forandring. I alt 66 MCRS blev identificeret ved frekvenser over 10% (tabel S2): der var 25 MCRS tilvækst i intervallet fra 251 Kb til 104 Mb, og 41 MCRS af tab i området fra 286 kb til 138 Mb. Transportcenter bidraget til at forfine MCRS at loci og gener af særlig betydning (tabel S3). Mange af de betydende toppe identificeret af transportcenter indeholdt etablerede onkogener herunder CCND1, CDX2, EGFR, ERBB2, MET, og MYC (figur 1B), sammen med tumorundertrykkere såsom APC, Smad4, og TP53. Flere af de onkogene toppe blev drevet af høje-amplitude fokale begivenheder i en delmængde af tumorer (figur 2), og disse fokale amplifikationer medført betydelige stigninger i mRNA-ekspression for flere af disse gener. Meget betydelige transportcenter toppe ikke forbundet med veletablerede onkogener eller tumor undertrykkere omfatter 12 p13.33 (Figur 2E, F) og 20 q13.12 (figur 2G, H), som havde tilbagevendende høj størrelsesorden fokale amplifikationer, samt 14 q32.31 der, selv om ikke meget forstærket, havde gevinster af tilstrækkelig tilbagefald og focality, at det gør en meget betydelig transportcenter Q-værdi (figur 1B, tabel S3). Med transportcenter amplicon data, vi opsummere 114 kandidat kræft bilister i tabel S4, som omfatter tolv (10%) etablerede onkogener såsom MYC, KRAS, og MET. Formodede onkogener herunder WNK1 (figur 3A) og HNF4A (figur 3B) har Q-score, forstærket frekvens, og cis-agerende virkninger på mRNA, der er sammenlignelige med etablerede onkogener (Figur S1). Vores analyse har indsnævret mere end 6.000 gener fra MCR områder af genomet til et overskueligt antal på omkring 100 for yderligere eksperimentelle validering.

Tumor prøver blev kategoriseret efter deres CNA status (sletning, tab, normal, gain, forstærkning ) i den angivne gen. Panelerne viser ekspressionsniveauet af kategori for hver probeset fra Almac platform (se materialer og fremgangsmåder), der repræsenterer den specifikke gen. Værdierne blev centreret for hver probeset; kategorier er plottet, hvis der var mindst én prøve i det.

For yderligere at søge efter mønstre af berørte pathway ændringer, vi kortlagt listen over gener forstærkede i CRC (tabel S4) på ​​kanoniske molekylære signalveje og cellulære processer. Tabel 1 viser top kanoniske veje muligvis berørt af de opformerede gener. Celle cyklus er en af ​​de mest berigede veje ramt af somatiske CNA involverer gener, såsom CCND1, MYC, TFDP1 og YWHAZ. Kegg “veje i kræft” ligger til grund for bredspektret effekt af somatisk CNA’erne i at målrette flere centrale veje i kræft på samme tid. Mere specifikt identificerede vi også individuelle kræftrelaterede veje, som er betydeligt overrepræsenteret blandt cis-virkende gener drevet af somatisk CNAs, herunder erbB signalvejen og MAPK kinase signalvejen. Tilsammen disse resultater tyder på, at disse somatiske CNAs indkode nye onkogene driver gener og potentielle terapeutiske mål i tyktarmskræft.

CNA Clustering og ikke-tilfældige CNA Korrelationer i CRC

Vi udførte ukontrollerede hierarkisk klyngedannelse af den globale CNA data og identificeret tre store klynger. Selvom vi ikke finde signifikante associationer til alder, køn, scenen eller KRAS mutation status, vi observeret, at BRAF vildtype tumorer blev betydeligt beriget i den største klynge og BRAF mutanter i en af ​​de mindre klynger (p 0,01). Tidligere vi [26] udviklet en BRAF-mutant genekspression signatur fra PETACC-3 kohorte og studerede sine prognostiske implikationer. Blandt 213 MSS patienter med mRNA udtryk data tilgængelige, underskrift identificeret 37 “BRAFm-lignende” prøver (herunder 8 BRAF mutanter) samt 176 “ikke-BRAFm-lignende” prøver. Vi re-løb clustering analyse på disse 213 prøver (Figur 4A), og fandt meget betydelig berigelse af “ikke-BRAFm-lignende” prøver (p 0,01) i den største klynge (cluster 2) og “BRAFm-lignende” prøver i cluster 1 (P 0,01, tabel 2). Sammenlignet med cluster 2, klynge 1 viser meget lavere frekvenser af amplifikation /sletning begivenheder, især på chr13 q, 14 q, 18 q og 20 q (figur 4B). Et nærmere kig afslører, at klynge 1 er helt afladet fra CNAs på chr20 mens 95% af klynge 2 prøver var chr20 forstærkes. Disse resultater underbygger med iagttagelsen af ​​relativ lavere ekspression af chr20 gener i BRAFm-lignende i forhold til resten af ​​BRAFwt prøver [26]. Salg

(A) Tre store klynger. Den højre annotation indikerer, i orden, BRAFm (i gul, BRAF mutanter, i blå, BRAF wild-typer), KRASm (mutanter i grønt), og BRAFm-lignende (i grøn, BRAFm-lignende, i rød, ikke-BRAFm-lignende). Lilla farve indikerer manglende værdier. (B) Genom-bred frekvens plot af kopi nummer gevinst (over akse, blå) og kopi nummer tab (under akse, rød) på tværs af tre store klynger.

Vi har tidligere rapporteret, at i cellelinier CNA’er ved sammenkædet loci blev ofte korreleret til hinanden, og at sådanne korrelationer var sandsynligvis et resultat af selektion [31]. For at vurdere, om et lignende fænomen var tydelig i klinisk fase II /III MSS tyktarmskræft, vi gennemførte parvise korrelationer af kopi nummer for alle gener (-22 k) i hele genomet. Som forventet blev tilstødende (forbundet) gener højt korreleret (figur 5A, tæt på diagonal). På et højere niveau nogle kromosomarmene blev sammenkædet (fx chr1p vs. 1 q, 10p vs. 10 q) eller anti-korreleret (fx CHR8 p vs. 8 q). Derudover der var talrige korrelationer mellem sammenkædet loci (figur 5A, off-diagonal), hvilket antyder co-udvælgelsen af ​​disse genomiske regioner. For eksempel blev kromosom 8 s tab korreleret til tab af kromosomer 17 p og 18, sammen med gevinst på kromosom 20 q. Kromosom 13 gevinster blev korreleret til kromosom 14 tab. Fordelingen af ​​gen-gen foreninger var signifikant anderledes end en randomisering af CNV data (figur 5b). Svarende til, hvad der blev fundet i andre indstillinger kræft [31], [34] var der en skala-fri struktur, hvor et par gener var stærkt korreleret til mange andre gener, mens de fleste gener korreleret til kun et par gener. Dette antyder, at et lille antal DNA loci fungerer som knudepunkter i en meget ikke-tilfældig hierarkisk struktur.

(A) Pair-kloge korrelationer beregnet fra genkopital bestilles pr kromosomale positioner gennem genomet på X og Y akser, med rød indikerer en positiv korrelation og blå indikerer en negativ korrelation. Den røde diagonal repræsenterer korrelationen af ​​et gen med sig selv. Nederste højre og øvre venstre afsnit af grafen repræsenterer spejlbilleder af hinanden viser kopitallet korrelationer af sammenkædet loci. (B) Log /log grunde til betydelig gen /gen korrelationer (

Be the first to comment

Leave a Reply