PLoS ONE: Kopier Antal analyse med Novel Interaktioner mellem Genomisk Loci i kræft i æggestokkene

Abstrakt

Kræft i æggestokkene er en heterogen sygdom viser komplekse genomiske forandringer, og derfor har det været vanskeligt at fastlægge de mest relevante kopi nummer ændringer med omfanget af undersøgelser til dato. Vi opnåede hele genomet kopital ændring (CNA) data fra fire forskellige SNP arrays platforme, med en endelige datasæt af 398 ovarietumorer, hovedsagelig af den serøse histologisk subtype. Hyppige CNA aberrationer målrettet mange tusinder af gener. Men højt niveau amplikoner og homozygote sletninger aktiveret filtrering af denne liste til de mest relevante. Den store datasæt aktiveret forfinelse af minimale regioner og identifikation af sjældne amplikoner såsom ved 1p34 og 20q11. Vi udførte en roman samtidig forekomst analyse for at vurdere samarbejdet og eksklusivitet CNAs og analyseret deres forhold til patient resultat. Positive associationer blev identificeret mellem gevinster den 19. og 20Q, gevinst på 20Q og tab af X, og mellem flere regioner i tab, især 17q. Vi fandt svage korrelationer af CNA på genomiske loci såsom 19q12 med kliniske resultat. Vi vurderede også genomisk instabilitet foranstaltninger og fandt en korrelation mellem antallet af højere amplitude gevinster med dårligere samlet overlevelse. Ved at samle den største samling af æggestokkene kopi nummer data til dato har vi været i stand til at identificere de hyppigste afvigelser og deres samspil

Henvisning:. Gorringe KL, George J, Anglesio MS, Ramakrishna M, Etemadmoghadam D, Cowin P, et al. (2010) Kopier Antal analyse med Novel Interaktioner mellem Genomisk Loci i kræft i æggestokkene. PLoS ONE 5 (9): e11408. doi: 10,1371 /journal.pone.0011408

Redaktør: I. Kong Jordan, Georgia Institute of Technology, USA

Modtaget: Februar 11, 2010; Accepteret: 16. april 2010. I Udgivet 10. september, 2010

Copyright: © 2010 Gorringe et al. Dette er en åben adgang artiklen distribueres under betingelserne i Creative Commons Attribution License, som tillader ubegrænset brug, distribution og reproduktion i ethvert medie, forudsat den oprindelige forfatter og kilde krediteres

Finansiering:. Dette arbejde blev støttet af National Health og Medical Research Council of Australia; den victorianske Breast Cancer Research Consortium (VBCRC), Australien; og Department of Defense (DOD), USA. JG er understøttet af en australsk Postgraduate Award. MR er støttet af en Cancer Råd Victoria Postgraduate Scholarship. Denne forskning blev også støttet af en victoriansk Life Sciences Computation Initiative (VLSCI) tilskud på Peak Computing Facility ved University of Melbourne og victorianske Partnerskab for Advanced Computing (VPAC). Australian Kræft i æggestokkene Study (AOCS) blev støttet af USA Army Medical Research og Materiel Kommando under DAMD17-01-1-0729, The Cancer Råd Victoria, Queensland Cancer Fund, The Cancer Råd New South Wales, The Cancer Råd South Australia, den Cancer Foundation of Western Australia, The Cancer Råd Tasmania, og National Health og Medical Research Council of Australia (NHMRC). De finansieringskilder havde ingen rolle i studie design, indsamling og analyse af data, beslutning om at offentliggøre, eller forberedelse af manuskriptet

Konkurrerende interesser:.. Forfatterne har erklæret, at der ikke findes konkurrerende interesser

Introduktion

Epithelial ovariecancer (EOC) er en af ​​de dødeligste maligniteter, med høj recidiv og fattige overlevelsesrater [1]. De genetiske afvigelser observeret i EOC er meget komplekse, omfattende hyppig aneuploidi og formere omlejrede kromosomer [2], [3]. Den heterogenitet kopi nummer ændringer (CNA) observeret i EOC har gjort det vanskeligt for små undersøgelser for at være i stand til præcist at identificere den sande hyppighed af den mindre almindelige CNA’er eller reproducerbart identificere CNAs der korrelerer med kliniske parametre. En lille prøve størrelse gør det også vanskeligt at identificere CNAs der sameksistere eller udelukker hinanden, hvilket er en forudsætning for at identificere eventuelle fælles veje, der kan være liberaliseret i EOC gennem ændringer i gen-kopi nummer. Paradigmet for gensidigt udelukkende afvigelser rettet mod samme vej blev sat i kolorektale tumorer for

APC

og

CTNNB1

mutationer [4] og udvidet i andre eksempler såsom eksklusivitet af

BRAF

og

KRAS

mutationer [5]. Omvendt er andre genetiske afvigelser observeret hyppigere i samme tumor, end man ville have forventet ved en tilfældighed, hvilket tyder på en co-operative effekt, for eksempel den betydelige sammenslutning af 11q13 og 8p12 amplikoner i brystkræft [6]. I kræft i æggestokkene, er blevet fundet associationer mellem

CCNE1

og 12p forstærkning [7], og mellem

MYC

og 20Q forstærkning [8] ved fluorescens

in situ

hybridisering. Kun få studier har undersøgt co-brugelighed eller komplementering af CNA på en genom-plan. Tab på 4q og 18q blev fundet at være forbundet i en undersøgelse [9], men dette blev ikke gentaget i en nylig analyse [10], som identificerede 7 CNA foreninger og 6 anti-korrelationer.

Tilstedeværelsen af ​​høj niveau gen amplifikationer i æggestokkræft er blevet observeret i nogen tid, men de fleste undersøgelser er underdimensioneret i prøvestørrelse [10] eller genomisk opløsning [11], [12] til præcist at detektere hyppigheden og mål for disse begivenheder. Ligeledes har nogle robuste sammenslutninger af CNA med kliniske parametre som overlevelse blevet identificeret [13], [14]. Påvisningen af ​​disse CNA er relevant ikke kun for identifikation af tumor-undergrupper og de berørte i tumorerne veje, men også til målretning af molekylære terapier i ovariecancer. I denne undersøgelse har vi samlet en stor kohorte af enkelt (SNP) kortlægning array-data til håndfast anmærke CNAs i serøse og endometrioide æggestokkene for at identificere de gener, er omfattet af disse genetiske begivenheder og hvordan disse hænger sammen med kliniske parametre. Derudover har vi vurderet samspillet mellem CNA ved at evaluere deres sammenslutninger og anti-foreninger

Materialer og metoder

Peter MacCallum Cancer Centre (PMCC) datasæt:. Vævsprøver og DNA-ekstraktion

Alle prøver blev opsamlet med patientens informerede samtykke, og undersøgelsen blev godkendt af alle deltagende hospital Menneskelige Research etiske komitéer. Patienter med kræft i æggestokkene blev identificeret gennem fire primære kilder mellem 1992 og 2006: a) 53 på sygehuse i Southampton, UK, b) 141 gennem den australske kræft i æggestokkene Study, herunder 20 fra Westmead Gynækologisk Onkologi Tissue Bank, c) 15 gennem PMCC Tissue Bank (Melbourne, Australien) og d) 41 fra Jikei University (Tokyo, Japan). Patologi anmeldelse blev gennemført fra enten fikseret i formalin, paraffin indlejret væv og /eller frisk-frosne snit støder op til det væv, hvorfra DNA blev ekstraheret (n = 141) eller ved undersøgelse af de oprindelige patologi rapporter diagnostik (n = 109) (Tabel 1 , tabel S1).

Alle vævsprøver blev indsamlet som frisk frosset materiale. En repræsentativ hæmatoxylin og eosin farvede sektion blev vurderet og prøver med 80% epitelceller blev anvendt direkte til DNA-ekstraktion fra hele væv. I øvrigt blev nål eller laser dissektion udført under anvendelse 10 um snit for at opnå høj procentdel tumor epitelcelle komponent. DNA blev ekstraheret som beskrevet tidligere [14], [15]. Normal DNA ekstraheret fra blod lymfocytter var tilgængelig for 106 patienter

The Cancer Genome Atlas (TCGA) datasæt:. Vævsprøver og DNA-ekstraktion

Prøver blev indsamlet som frisk frosset materiale fra hospitaler i USA (n = 163). Tumorprøver blev vurderet til at være 80% af epitelceller før DNA-ekstraktion fra hele væv, som skitseret [16]. Normalt DNA ekstraheret fra blodlymfocytter var tilgængelig for 161 patienter. De resultater, der offentliggøres her, er til dels baseret på data genereret af The Cancer Genome Atlas pilotprojekt etableret af NCI og NHGRI. Information om TCGA og efterforskere og institutioner, som udgør TCGA forskningsnetværk kan findes på https://cancergenome.nih.gov.

Kopier nummer arrays

Prøver blev behandlet som tidligere beskrevet for Affymetrix Kortlægning arrays a) n = 108 50 K

Xba

jeg [14], GSE 13813 b) n = 27 250 K

Sty

I arrays c) n = 32 500 K arrays (250 K

Sty

I og 250 K

Nsp

jeg, [17]) d) n = 83 SNP6.0 (1,8 M probe sæt [15], [18], GSE19539). Når tilgængelig, der matcher normal DNA blev også analyseret på samme array platform og i samme parti. TCGA SNP6.0 CEL-filer til 163 prøver blev hentet fra Data Portal (https://tcga-data.nci.nih.gov/tcga/homepage.htm).

Data forbehandling og analyse

Alle SNP Mapping arrays blev først normaliseret ved hjælp metoder til rådighed i R-pakken “aroma.affymetrix” [19], herunder teknikker til at fjerne systematiske afvigelser indført på grund af allel cross talk, PCR-fragment længde bias og forskelle i GC-indhold . DNA kopital blev estimeret probe set-wise ved at sammenligne den normaliserede signal fra en tumorprøve til data fra normal lymfocyt DNA fra den samme patient, hvis de er tilgængelige. På tumorprøver for hvilke matchede normalt væv ikke var tilgængelig, den gennemsnitlige signal fra alle de normaler, der genereres i samme laboratorium blev anvendt som reference. Kvalitetskontrol trin er beskrevet i Methods S1. Kun de medfølgende prøver er opsummeret i tabel 1.

Den cirkulære binære segmentering metode blev anvendt til at segmentere kopi normaliserede data [20], [21]. Eventuelle probe sæt inden for en CNA, der var til stede i 5% af normale prøver blev udelukket fra før segmentering at fjerne fælles kopi nummer polymorfier tumor analyse (CNP). Segmenter med færre end 10 probe sæt (SNP6) eller 5 probe sæt (500 K) blev fusioneret med den tilstødende segment af nærmeste kopi nummer som tidligere QPCR analyse foreslog, at afvigelser repræsenteret ved få sonder på disse platforme ikke kan være pålidelig [17]. Derudover brugte vi Genomisk Identifikation af væsentlige mål i Cancer (transportcenter), som er en metode, der samler data over forskellige tumorer til at forsøge at skelne mellem fører og passager afvigelser, der kombinerer prævalens og amplitude [22]. Denne teknik blev udført ved hjælp af en web-baseret interface (https://genepattern.broadinstitute.org) med CNA tærskler for ± 0,3, mindst 10 markører og en q-værdi tærskel på 0,25.

For hierarkisk klyngedannelse blev alle tumorer vurderet for tilstedeværelse ( “1”) eller fravær ( “0”) af hver transportcenter peak ændring (n = 89), hvor overlapning blev anset for tilstedeværelse. Hierarkisk klyngedannelse bruger gennemsnitlig euklidisk clustering af prøverne (n = 398) blev udført ved hjælp af Partek Genomics Suite v.6.4 (Partek Inc., St. Louis, MO).

associering mellem regioner afvigelser

vi foretog en analyse af foreningen på TCGA datasæt (som vi re-løb transportcenter) og derefter på de resterende prøver. To forskellige fremgangsmåder blev anvendt til at beregne associationer mellem regioner gevinst og tab. Transportcenter resultater blev sammenfattet som en matrix X med tumorer som rækker og regioner aberrationer som kolonner. For hver tumor (t) og fokal region aberration (i), måling X [t, i] var 1 hvis aberration var til stede for at tumor og 0 ellers. En Poisson log-lineær model var egnet til kontingenstabel beskriver aberration status. Statistisk signifikans af foreningen blev beregnet ved hjælp af en score test, der giver en standard normal z-statistik [23]. Det svarer til kvadratroden af ​​den sædvanlige Pearson teststørrelsen for uafhængighed, underskrevet i henhold til retningen af ​​foreningen. Den Benjamini og Hochberg fremgangsmåde blev anvendt til at korrigere for multiple test [24].

associering mellem regioner af aberrationer blev også testet under anvendelse af Monte Carlo permutation test. Kort fortalt blev hver kolonne i matrix X permuteret uafhængigt (opretholdelse af antallet af poster i de kolonner, der skal være den samme). En score for Foreningen blev beregnet ved hjælp af den permuteret matrix som beskrevet for parametriske test ovenfor. Den gennemsnitlige placering opnået for hvert par regioner fra et stort antal permutationer blev anvendt til at estimere den falske opdagelse sats og det antal gange en teststørrelse større end eller over den oprindelige teststørrelsen blev anvendt til at beregne p-værdien. Ved hjælp af en 5% falsk opdagelse sats de valgte 0,05

Overlevelse Foreninger

Cox proportional hazard model blev brugt til at beregne sammenhængen mellem regioner aberration opdaget af transportcenter og overordnet eller progressionsfri overlevelse, korrektion for multiple test ved hjælp af Benjamini-Hochberg metoden. For at beregne overlevelse sammen med par af regionerne blev prøver klassificeres i fire grupper baseret på aberration status par regioner. Tilsvarende for de genomiske foranstaltninger, prøver blev arkiveret lodret i en af ​​fire grupper baseret på data kvartiler for hver foranstaltning. Overlevelse association med de således identificerede blev beregnet ved hjælp af Cox proportional hazard model grupper.

Resultater

Integration af kopi nummer ændringer fra 398 ovariecarcinomer

Vi kompileret høj opløsning kopi nummer data fra næsten 400 æggestokkene prøver kræft repræsenterer to histologiske undertyper, serøs og endometrioide (tabel 1), 270, der var matchende normale lymfocyt DNA-data. Dataene blev indsamlet fra flere kilder: høj kvalitet Affymetrix SNP6.0 Mapping Array “CEL” filer blev indkøbt gennem The Cancer Genome Atlas (TCGA, 157 tilfælde) eller blev opnået på Peter MacCallum Cancer Centre (83 tilfælde [18]) SNP Mapping array-data fra lavere opløsning Affymetrix platforme, herunder 108 tilfælde analyseret på 50 K

Xba

i arrays [14], 27 sager om 500 K arrays [15] og 23 sager om 250 K

Sty

i arrays opnået fra Japan, blev også inkluderet. kriterier omfattende kvalitetskontrol blev anvendt på alle datasæt (se Metoder S1). Efter normalisering af hvert datasæt, kopiere nummer ændringer (CNA) blev opdaget af cirkulære binære segmentering [21]. Vi evaluerede en række muligheder for at kombinere datasæt, herunder kohorte-specifikke tærskler (se Metoder S1), men dette gjort lidt forskel til den endelige CNA mønster og en standard tærskel på +/- 0,3 (log

2) blev anvendt generelt som tidligere beskrevet af os [17] og andre [10].

Sammenligning mellem de fem kilder til data viste en bemærkelsesværdig konsistens CNA tværs af genomet, hvilket indikerer en høj grad af ikke-tilfældighed til CNA og lige vigtigere, der ikke findes væsentlige matrix batch virkninger (figur S1). Undtagelsen var den japanske datasæt, som syntes at vise et reduceret antal ændringer. Imidlertid blev en genom-dækkende test udført for at identificere områder afvigende ved forskellige frekvenser mellem forskellige platforme og kunne ikke identificere statistisk signifikante regioner efter korrektion flere test.

Vi vurderede muligheden for molekylære undergrupper i den kombinerede kohorte defineret ved kopi nummer med hierarkisk klyngedannelse (Figur S1). Kun en enkelt gruppe af prøver var skelnes; disse havde nogle CNAs og tendens til at være lav kvalitet prøver eller de japanske prøver, for hvilke klasse oplysninger var for det meste ikke er tilgængelige. Der var ingen andre distinkte klynger eller større grupperinger kan henføres til histologisk undertype eller klasse. Især blev den høje kvalitet serøs og høj kvalitet endometrioide jævnt integreret, hvilket er i overensstemmelse med den tidligere observerede lighed af disse undertyper som vurderet ved anvendelse af immunhistokemiske markører [25] og genekspressionsprofiler [26].

For at identificere de mest relevante CNAs vi udført en række supplerende analyser som hver metode har styrker og svagheder, som kan suppleres med den anden. For det første transportcenter blev anvendt på alle 240 SNP6 prøver at identificere “fokale” og “brede” toppe (som defineret i [22]) (figur 1, tabel S2). Imidlertid kan transportcenter ikke umiddelbart integrere prøver fra forskellige platforme. Vi har derfor valgt at bruge en anden supplerende metode til transportcenter: en samlet frekvens tilgang, der ville integrere segmenteret kopi antal data uafhængig af platform til analyse hele vores 398 prøve kohorte. Som forventet blev de væsentligste områder af kopi nummer gevinst forudsagt af både transportcenter og samlet frekvens ligger på 3. kvartal (63% af prøverne med KN forstærkning) og 8Q (62% prøver med KN forstærkning) (figur 1). Andre hyppige gevinster blev observeret på 20Q (47%) og 12p (39%). De hyppigste områder af tab er identificeret i denne undersøgelse (kromosomer X, 8P, 22q, 17, 4q, 19p og 16, 40%) er i overensstemmelse med tidligere undersøgelser af os [15] og andre [10], [27] . For at vælge de mest relevante gener, vi først indberette dem i områder af gevinst og tab med mindst 30% frekvens eller i transportcenter toppe og derefter identificeret gener, der blev også ramt af højere amplitude begivenheder selv om det var på en lavere frekvens (tabel S2 ). Da der ikke er nogen klar konsensus om, hvad der udgør en “high-level” forstærkning, rapporterer vi regioner med hyppige gevinster ved log

2 forhold mellem 0,6 (i 40 eller flere prøver, 10% +), 0,8 ( 5% +) og 1 (2,5% +). For tab, betragtede vi homozygote sletninger (log

2 forhold mellem -1) til stede i mindst 4 prøver. Listen over gener blev prioriteret under hensyn til hyppigheden af ​​høj amplitude CNA og overlapningen med transportcenter (tabel 2 og 3). Specifikke områder af gevinst er vist i figurer S2, S3, S4, S5, S6, og S7.

Fortjeneste (A) og tab (D) i 240 prøver på SNP6 arrays analyseret af transportcenter. Fortjeneste (B) og tab (C) i 398 prøver på forskellige array-platforme. Prøve segmenter blev overlappet i Partek Genomics Suite v 6.4, hvilket skaber et datapunkt for hvert segment defineres af kopital breakpoints, og derefter plottes ved prøvenummer. Vejviser

Ved at bruge denne fleksible tilgang, vi fandt, at visse regioner blev kun klart identificeret ved den ene eller den anden metode. Ved at inkludere en række højere KN tærskelværdier amplitude og toppene forudsagt af transportcenter, blev yderligere regioner identificeret som gevinster på kromosom 1, 6p, 11q, 19 og tab på 5q, 6q26, 10q23, 13q og 18q22. Hertil kommer, på høj opløsning platforme såsom SNP6 array, transportcenter tendens til at identificere meget små områder, potentielt mangler relevante gener. For eksempel på 3q26 der var to tætliggende toppe af betydning i transportcenter profil (figur S2). Den højeste af disse, ved en meget snæver margin (-log q-værdi 93,88

vs

. 93,43), ikke skærer med eventuelle gener, mens den anden peak overlapper med

Mecom Hotel (

MDS /EVI1

); Der er god evidens for dette gen er et onkogen i ovariecancer [28]. Således ville stole på transportcenter alene anmærke det 3q26 regionen som ikke har nogen gener af interesse. I modsætning hertil ved hjælp af en frekvens tilgang, den maksimale frekvens på alle kopi nummer tærskler vedrører generelt

Mecom

.

Ligeledes var der andre områder, for hvilke der bruger en frekvens tilgang ubesvarede gener eller gav modstridende oplysninger. For eksempel, på 19q12, hver kopiantal tærskel identificeret en lidt anden region af top frekvens, skiftevis identificere

CCNE1

,

C19ORF2

eller ingen gen i top (fig S3). I modsætning hertil evne transportcenter at integrere amplituden af ​​forstærkningen på tværs af alle prøver tydeligt identificeret

CCNE1

som genet i toppen. Der er god dokumentation for, at

CCNE1

er den korrekte opkald siden cyclin E er en vigtig cellecyklus protein og dets forstærkning og overekspression tidligere blevet identificeret som en vigtig drivkraft for patientens respons på kemoterapi i serøs ovariecancer [14 ]. Større konklusioner skyldes vores analyse af de enkelte sletninger og amplikoner, herunder indsigt i potentielle driver gener, findes i Discussion.

Foreninger mellem KN ændringer

Begrebet kooperative og gensidigt udelukkende genetiske ændringer er sjældent blevet undersøgt på niveau med CNA’er eller på en genom-plan. Vi ønskede at vide, om der er nogen CNA’erne som samarbejder i æggestokkene tumorigenese, eller som er funktionelt overflødige til hinanden, for eksempel hvis de handler i den samme vej. At måle denne vurderede vi, hvis der var nogen CNAs, der var mere eller mindre sandsynlighed vil være forbundet med hinanden, mere end tilfældigt, ved anvendelse af en statistisk analyse. Kort fortalt vi tælles antallet af prøver positive for CNA (fx en gevinst) på region A alene, region B alene, både regionerne og hverken regionen, og sammenlignet resultaterne til det forventede samtidig forekomst baseret på den samlede hyppighed af CNA på A multipliceret med frekvensen af ​​B. for eksempel til en frekvens på forstærkning ved 20q11 af 68/183 (37%) og ved 19q12 af 50/183 (33%), ville vi forvente 12% af prøverne at have begge gevinster. Men vi observere en egentlig hyppighed af prøver med begge ændringer, der er væsentlig forskellig fra denne, dvs. 35/183 (19%, p 0,0001), hvilket indikerer en stigning i co-forekomst over niveauet for chancen og dermed muligvis samarbejder CNAs. Fremgangsmåden kan også lige så anvendes til at detektere fald i samtidig forekomst. Ved anvendelse af denne metode genom-dækkende, vi anvendte en multiple korrektion test med en FDR af. 5%

Vi foretog denne analyse først ved hjælp af TCGA data, da det er mest homogene for kvalitet og undertype, og er høj opløsning. Vi gentog transportcenter analyse på dette datasæt alene for at opnå 46 toppe af kopi nummer gevinst og 27 i tab (eksklusiv områder af normal kopi nummer variation, eller kopi nummer polymorfier (CNPS)). Prøver blev identificeret som værende positiv eller negativ for hver CNA højdepunkt, med gain toppe scoret som positive for gevinster kun og tab toppe scoret som positive for kun tab, og en analyse af forening blev udført som beskrevet i metoder. Ved en falsk opdagelse sats på 5%, blev 305 par af områder af aberration positivt korreleret og 18 par var negativt korreleret (tabel S3, figur 2). Nogle co-forekommende transportcenter toppe blev placeret under den samme brede transportcenter region og selvom transportcenter analyse viste, at disse regioner af kopiantal ændring var tydelig, fordi de er fysisk tæt forbundet, kan de ikke være uafhængige af hinanden. Som uafhængighed er nødvendig for foreningen test, blev de ikke analyseret yderligere. Vi ekskluderede også de foreninger, hvor enten peak var en CNP, forlader 98 par af regioner, der var positivt korreleret, alle men hvoraf 16 blev placeret på forskellige kromosom arme (tabel 4). 12 par regioner var negativt korreleret.

(A) Proces til at identificere tilknyttede afvigelser (flere detaljer i Methods S1). (B) Sammenfatning af signifikante sammenhænge i hvert datasæt og dem signifikant i begge. Når bordet skrider frem, er visse foreninger filtreres ud med tallene resterende dem, passere filteret. For det første er forbundet loci, der er inden for samme brede transportcenter intra-kromosomale region fjernet og dels regioner, der overlapper med en CNP fjernes. (C) Circos plot. Udvendig ring angiver kromosom positionen af ​​hvert aberration (farvede søjler). De interne lilla linjer viser de betydelige inter-kromosom foreninger (eksklusiv dem, der involverer en CNP), der er blevet valideret i det andet datasæt.

For at validere de foreninger identificeret ved hjælp TCGA data, vi gentog foreningen analyse ved hjælp af de samme “TCGA transportcenter definerede” områder som ovenfor på alle andre høj kvalitet serøse og endometrioide prøver (n = 183). Til dette datasæt blev 296 regioner positivt korreleret og fem var negativt korreleret. I alt har 29 positive foreninger og ingen negative var fælles mellem de to datasæt (figur 2). Af disse 14 var sammenhænge mellem to gevinster, hvoraf 11 var på samme kromosom, og 14 foreninger var mellem to tab. Ingen af ​​de underskudsgivende tab foreninger var intra-kromosom, fordi alle sammenslutninger af denne type blev udelukket enten til at blive placeret i den samme brede transportcenter region eller for at være en CNP; faktisk flere af de transportcenter tab peak var CNP’er (n = 35) sammenlignet med de gevinster (n = 15) sandsynligvis skyldes afsløringen effekt tab af heterozygositet har på CNP detektion i tumoren [29]. Der var en enkelt association mellem en gevinst og tab, mellem en amplikon på 20q11 og tab af XQ. Den stærkeste positive sammenhæng mellem gevinster på forskellige kromosomer var for amplifikationer på kromosom 19q12 (sandsynligvis rettet mod

CCNE1

) og 20q11 (fem gener). For tab, den stærkeste fælles forening var mellem kromosom 4q og kromosom 17. 17q12 tab var den mest promiskuøse interactor, med 8 almindelige positive associationer.

Vi identificerede generne placeret i eller nær positivt tilknyttede toppe og brugt genekspression data til at vurdere, om nogen af ​​generne viste korrelation mellem kopital og ekspression, og hvis der var korrelation på niveauet af genekspression tværs regioner (tabel S4). Vi fandt, at de stærkeste foreninger på tværs af regioner involverede gener opnået i 19q12 eller 19p13.11, og gener vundet på 20q11. Andre positive genekspression foreninger inkluderet

CD47

(vundet på 3q13.12) med

UQCRFS1

eller

POP4

(begge vundet på 19q12). CD47 blev først identificeret som en æggestokkene tumor antigen [30], men der er ingen kendte funktionel sammenhæng med enten 19q12 partner.

Korrelation med kliniske parametre og resultatet

Vi brugte de kliniske TCGA data til vurdere forholdet kopi nummer og patient resultat ved hjælp af en univariate Cox proportionel risiko analyse på transportcenter toppe (tabel S5). Gevinst ved 3q29 var forbundet med total overlevelse, men dette sammenhæng var ikke signifikant efter korrektion flere test. Positive KN sammenslutninger af 17q12 /22q tab og 3q13 /19q12 gevinster blev hver korreleret med total overlevelse, men ikke progressionsfri overlevelse (tabel S5).

Specifikke mønstre af kopi nummer forandring og genetisk ustabilitet, der korrelerer med patientens udfald, herunder simplex, sawtooth og ildstorm, er blevet beskrevet i brystcancer [31]. Mønstrene af kromosomafvigelser i kræft i æggestokkene er vanskelige at kategorisere i de grupper, der er beskrevet af Hicks

et al

. som de fleste er en kombination af savtakket og ildstorm. Derfor definerede vi en række forskellige foranstaltninger af genom ustabilitet og analyseret deres korrelation med patientens udfald ved hjælp af TCGA datasæt (tabel S5). Disse foranstaltninger omfattede: antallet af kopier nummer ændrer dvs. gevinster, tab, højere gevinster niveau ( 0,6 log

2 amplitude) og det samlede antal segmenter; procentdelen af ​​genomet målrettet efter kopiantal ændring (gevinst, tab og højt gain); og en “Hicks index”, som beskrevet [31] for gevinster, tab og begge. Prøverne blev opdelt i kvartiler grundlag af hver af disse indeks og testet for forbindelse med kliniske resultater ved hjælp af en univariate Cox proportionel risiko analyse. Af disse foranstaltninger, kun antallet af højere amplitude gevinster (p = 0,019) viste en sammenhæng med progressionsfri overlevelse, men ikke samlet overlevelse (figur S8). Procentdelen af ​​genomet omfattet i højere niveau gevinster var ikke signifikant (p = 0,88), hvilket antyder, at det ikke er andelen af ​​DNA amplificeret men antallet af amplifikationsprodukter begivenheder, der er vigtigst.

Diskussion

Aneuploidi og cytogenetiske afvigelser har længe været anerkendt som kræft kendetegnende. I epiteliale cancere, har kopiantal ændringer blevet vist at være førere af cancerfænotypen gennem amplifikation og overekspression af onkogener som

ERBB2

og tab af tumorsuppressorer såsom

CDKN2A

. Kræft i æggestokkene er både heterogene og cytogenetisk kompleks gør det vanskeligt at dechifrere de centrale genomiske regioner ramt af CNA. Tidligere undersøgelser har generelt været underdimensioneret i forhold til opløsning og /eller prøve nummer, højst indeholdende omkring 100 sager [10], [11], [12]. Denne undersøgelse samler en stor samling af ovariecarcinomer profilerede for kopi nummer, som vi har analyseret ved hjælp af både transportcenter og frekvens tilgange til at give en endelig annotation af driver forandringer. Nøgleregioner er opsummeret i tabel 2 og 3, mens en mere omfattende katalog, der omfatter foreningen af ​​begge metoder er givet i tabel S2. På grund af det store antal gener og regioner involveret, er det ikke muligt at behandle alle i detaljer, men nedenstående regioner illustrere nogle af de indsigter afledt arbejde med dette store datasæt.

Vi valgte at bruge komplementære analytiske tilgange som hver teknik har sine egne styrker og svagheder: en frekvens tilgang til regioner som 3q26 var bedre i stand til at identificere den sandsynlige driver genet,

Mecom

, mens der for 19q12 evne transportcenter til at integrere størrelsen af kopi nummer gevinst for hver prøve identificeret

CCNE1

. Ved hjælp af en differentieret frekvens tilgang i koncert med transportcenter forudsat en større dybde af forståelse i komplekse regioner, for hvilke der ikke er nogen klar driver. Tidligere undersøgelser har identificeret en forstærkning på kromosom 11 i 18% af ovariecancer, og har foreslået, at målgenet af denne begivenhed er

EMSY

(

C11ORF30

) [32]. I andre typer kræft, såsom brystkræft, kan den maksimale forstærkning i denne region være anderledes, rettet mod

EMSY

og /eller

CCND1

[33], [34]. I de data, der præsenteres her, er den vigtigste amplikon ikke synes at være rettet mod

CCND1

, som er 5 Mb uden for peak region (Figur S4). Transportcenter identificerer et højdepunkt omfatter fire gener (

THRSP

,

NDUFC2

,

ALG8

KCTD21

), forstærkning er blevet vist i brystkræft at korrelere med overekspression og dårlig overlevelse [35]. Den hyppigst målrettede gen ved lavt niveau gevinst er

GAB2

(30%).

Be the first to comment

Leave a Reply