PLoS ONE: Identifikation af Druggable Cancer driverindstillinger Gener Amplified tværs TCGA datasæt

Abstrakt

Cancer Genome Atlas (TCGA) projekter har avancerede vores forståelse af føreren mutationer, genetiske baggrunde, og de vigtigste veje aktiveret tværs kræftformer. Analyse af TCGA datasæt har mest fokuseret på somatiske mutationer og omplantning, med mindre vægt på gen-amplificeringer. Her beskriver vi en bioinformatik screening strategi til at identificere formodede kræft driver gener forstærkede tværs TCGA datasæt. Vi udførte GISTIC2 analyse af TCGA datasæt spænder 14 cancer undertyper og identificeret 461 gener, der blev forstærket i to eller flere datasæt. Listen blev indsnævret til 73 cancer-associerede gener med potentielle “druggable” egenskaber. Størstedelen af ​​gener blev lokaliseret til 14 amplikoner spredt over hele genomet. For at identificere potentielle kræft driver gener, analyserede vi gen kopi nummer og mRNA udtryk data fra individuelle patientprøver og identificeret 40 formodede kræft driver gener forbundet med diverse onkogene processer. Onkogen aktivitet blev yderligere valideret af siRNA /shRNA knockdown og ved at referere de Project Achilles datasæt. De forstærkede gener repræsenterede en række af gen familier, herunder epigenetiske regulatorer, cellecyklus-associerede gener, DNA skader respons /reparation gener, metaboliske regulatorer, og gener forbundet med Wnt, Notch, Hedgehog, JAK /STAT, NF-KB og MAPK signalveje. Blandt de 40 formodede driver gener var kendt driver gener, såsom

EGFR

,

ERBB2

PIK3CA

. Wild-typen

KRAS

blev forstærket i flere kræfttyper, og

KRAS

-amplified kræftceller var mest følsomme over for

KRAS

shRNA, tyder på, at

KRAS

forstærkning var en uafhængig onkogen begivenhed. En række af MAP kinase adaptorer blev co-amplificeret med deres receptortyrosinkinaser, såsom FGFR adapter

FRS2

og EGFR familie adapter

GRB7

. Det ubiquitin-lignende ligase

DCUN1D1

og histon methyltransferase

NSD3

blev også identificeret som nye formodede kræft driver gener. Vi diskuterer patient skræddersy konsekvenser for eksisterende kræft lægemiddelvirkninger og vi yderligere at drøfte potentielle nye muligheder for lægemiddeludvikling indsats

Henvisning:. Chen Y, McGee J, Chen X, Doman TN, Gong X, Zhang Y, et al. (2014) Identifikation af Druggable Cancer drivere Gener Amplified tværs TCGA datasæt. PLoS ONE 9 (5): e98293. doi: 10,1371 /journal.pone.0098293

Redaktør: Masaru Katoh, National Cancer Center, Japan

Modtaget: Marts 6, 2014 Accepteret: April 30, 2014; Udgivet: May 29, 2014

Copyright: © 2014 Chen et al. Dette er en åben adgang artiklen distribueres under betingelserne i Creative Commons Attribution License, som tillader ubegrænset brug, distribution og reproduktion i ethvert medie, forudsat den oprindelige forfatter og kilde krediteres

Finansiering:. Denne undersøgelse blev finansieret af Eli Lilly and Company. Den bidragyder ydet støtte i form af lønninger til alle forfattere, men havde ikke nogen ekstra rolle i studie design, indsamling og analyse data, beslutning om at offentliggøre, eller forberedelse af manuskriptet. De specifikke roller disse forfattere er formuleret i afsnittet forfatter bidrag

Konkurrerende interesser:. Denne undersøgelse var fuldt finansieret af Eli Lilly and Company, arbejdsgiver for alle forfattere. Der er ingen patenter, produkter i udvikling eller markedsførte produkter til at erklære. Dette ændrer ikke forfatternes tilslutning til alle PLoS ONE politikker om datadeling og materialer, som beskrevet online i vejledningen for forfattere.

Introduktion

De seneste fremskridt inden for DNA-sekventering teknologi har gjort det muligt sekventering af hele kræft genomer og identifikation af almindeligt muterede, forstærkede, og slettede gener på tværs af kræftformer. Den Cancer Genome Atlas (TCGA) indsats blev oprettet for at sekventere og analysere flere tusinde individuelle kræftformer, hvilket giver et øjebliksbillede til sygdomsspecifikke genetiske baggrunde og kræft chauffører [1] – [6]. Integreret analyse af TCGA datasæt identificeret 127 betydeligt muterede cancer-associerede gener, der repræsenterer forskellige biologiske veje og cellulære processer [6]. Det gennemsnitlige antal af førerens mutationer pr tumorprøve var to år til seks, hvilket antyder, at et lille antal af muterede driver gener kunne inducere carcinogenese [6]. I brystkræft, at kun tre gener (

GATA3

,

PIK3CA

, og

TP53

) blev fundet muteres på 10% forekomst på tværs af alle patientens tumorer. Yderligere analyse afslørede pathway-specifikke genetiske driver mutationer i brystkræft undertyper, såsom

BRCA1 /2

ombygninger og

PIK3CA

ændringer i basal-lignende og luminale brystkræft henholdsvis [4]. I kolorektale cancere, blev fireogtyve gener almindeligvis muterede og de fleste af de gener kortlagt til den Wnt, TGF-b, PI3K, p53 og RAS signalveje [3]. I lungekræft, blev elleve gener almindeligt muteret, herunder

TP53

, oxidative stress respons gener og skællede differentiering gener [1]. Disse undersøgelser har kastet lys ind i de store genetiske årsager til kræft undertyper og har også identificeret potentielt druggable veje knyttet til disse undertyper. De fremskridt vil fremskynde udviklingen af ​​lægemidler ved at tilbyde nye patient skræddersy strategier for pathway-specifikke hæmmere. Imidlertid har de TCGA undersøgelser hovedsagelig fokuseret på mutationer og sjældne translokationer, med mindre opmærksomhed placeret på genamplifikationer i cancere. Da genamplifikation er en vigtig mekanisme i carcinogenese, vi søgte at udvinde de TCGA datasæt til at identificere nye targets og drivere forstærkes tværs kræftformer.

Gene forstærkning i cancerceller giver et middel til overekspression af kræft-fremme driver gener , såsom

EGFR

ERBB2

på kromosomerne 7 og 17, henholdsvis. Genamplifikation forekommer somatisk i et begrænset område af kræft genomet gennem forskellige mekanismer, såsom brud-Fusion-broer cyklusser [7]. Disse forstærkede områder, kendt som amplikoner, kan spænde kilobaser til et tocifret antal megabaser og kan omfatte flere onkogene gener samt passager gener i de forstærkede områder [8]. Længden af ​​amplikoner kan variere betydeligt baseret på den genomiske locus og cancer type. For eksempel, enkelt gen forstærkning af

KIT

på kromosom 4 kan forekomme i testikeltumorer [9], endnu større amplikoner indeholder

KIT

,

PDGFRA

, og

KDR

amplificeres i glioblastom [10]. Fordi amplikoner indeholder ofte mange gener, herunder passager gener ikke er relateret til onkogenese, er det ofte vanskeligt at identificere kræft driver gen (er) med ansvar for forstærkningen. Strategier for at identificere kræft gener driver en amplicon omfatter kortlægge minimale region forstærkning (MRA) på tværs af mange tumorprøver, identificere positiv korrelation mellem antal kopier og mRNA ekspression af gener, og eksperimentel validering med siRNA /shRNA knockdown i celler. Sådanne analyser har til dato identificerede opformerede gener med en dokumenteret rolle i carcinogenese [7]. Imidlertid har de fleste analyser til dato påberåbte små prøver størrelser, der resulterer i store MRA og potentielle falske positive gener. De TCGA datasæt tilbyder en enestående samling af tumorprøver med store stikprøvestørrelser at identificere forstærkede kræft driver gener i forskellige typer kræft.

Her beskriver vi en bioinformatik screening strategi til at identificere potentielt druggable kræft driver gener forstærkede tværs TCGA datasæt. Vi brugte GISTIC2 analyse af TCGA datasæt (cBio portal) og identificeret 461 gener, der blev statistisk forstærket i to eller flere TCGA datasæt omfatter 14 kræftformer. Gener med formodede eller verificerede roller i kræft blev identificeret ved hjælp af Cancer Genes cBio database. Vi tildelt en druggability score for hvert gen ved at integrere data fra fire eksterne druggability indekser. Fra de 461 gener identificerede vi 73 potentielt druggable opformerede gener med kendt eller formodet rolle i carcinogenese. Vi derefter brugt korrelationsanalyse med kopi nummer og mRNA-ekspression data fra flere tusinde TCGA patientprøver for at identificere potentielle kræft driver gener på listen. Dette resulterede i identifikationen af ​​40 formodede kræft driver gener forbundet med diverse onkogene processer, herunder epigenetiske regulatorer, cellecyklus-associerede gener, DNA skader respons /reparation gener, metaboliske regulatorer, og gener forbundet med Wnt, Notch, Hedgehog, JAK /STAT, NF-KB og MAPK signalveje. Den formodede cancer driver aktivitet blev yderligere valideret ved at åbne shRNA hårnål aktivitet i cancer cellelinjer ved hjælp af Project Achilles databasen [11]. Yderligere validering blev udført på en delmængde af de gener ved anvendelse af siRNA /shRNA knockdown i cancer cellelinjer, der indeholder genet amplifikation af interesse. Blandt de 40 formodede driver gener var kendt driver gener, såsom

EGFR

ERBB2

, samt nye mål, såsom

DCUN1D1

NSD3

.

KRAS

, en fremtrædende kræft driver med kendte aktiverende mutation i kræft [12], viste sig at blive forstærket i en delmængde af æggestokkene, gastrisk, lunge-, og livmoder kræft. Vi diskuterer konsekvenserne for lægemiddelforskning indsats, og vi identificerer nye patient skræddersy strategier for eksisterende terapeutiske mål.

Materialer og metoder

Bioinformatik analyse

TCGA datasæt fra 14 cancer undertyper var analyseres for genamplifikation ved hjælp af GISTIC2 algoritme i cBio portal (https://www.cbioportal.org). De 14 kræft undertyper omfatter BLCA – Blære urothelial Carcinoma, BRCA – Breast invasiv karcinom, CRC – Kolorektal Cancer (COAD og LÆS undersøgelser kombineres sammen), GBM – glioblastoma multiforme, HNSC – hoved og hals pladecellekræft, KIRC – Kidney renal klar celle karcinom, LGG – Brain Lavere Grade gliom, LUAD – Lung adenocarcinom, LUSC – Lung pladecellekræft, OV – æggestokkene serøs cystadenocarcinoma, Prad – Prostate adenocarcinom, SKCM – hud Kutan melanom, STAD – mave adenocarcinom, og UCEC – Uterin Corpus endometrioide carcinoma . Gener, der blev forstærket i to eller flere TCGA studier blev poolet sammen for at lave en liste over 461 gener. Niveau 3 SNP6 og RNAseq version 2 data blev hentet fra TCGA hjemmeside, og niveau 3 SNP6 data blev yderligere kortlagt til gen-niveau ved hjælp af R pakke CNTools. Pearson korrelationskoefficienter for genkopitallet (SNP6) versus genekspression (RNASeq) blev beregnet for gener af interesse ved hjælp af funktionen cor () i R. dataanalyse kode i R og Gawk kan leveres efter anmodning. Hvert gen blev tildelt en druggability score baseret på data fra de eksterne databaser Ensembl, InterPro-Blast, BioLT-Drugbank og Qiagen Druggability listen. For hver database, blev et gen givet en 0-4 druggability score, hvor 0 er undruggable og 4 er en etableret drug target. Et gen med et “1” druggability score i nogen af ​​de fire databaser blev betragtet som “potentielt druggable” og inkluderet i den endelige gen listen. Genet Listen blev også uploades til Cancer Gener database (cBio portal) og gener forbundet med onkogenese blev medtaget i den endelige gen listen.

Projekt Achilles

Projektet Achilles database består af shRNA udtømning scores fra en samlet genomisk bibliotek testet på tværs af en panel af kræft cellelinjer [11]. Vi udviklede en metode til at score gen afhængighed i hver cellelinje ved at vægte hver hårnål i henhold til graden af ​​sammenhæng med andre hårnåle designet mod det samme gen, på en måde svarende til den, der er beskrevet af Shao et. al [13]. Vi ræsonnerede, at hvis tumorcellelinjer varieret i deres afhængighed af en bestemt driver gen, bør derefter hårnåle effektivt rettet mod at gen giver tilsvarende shRNA udtynding scores i de afhængige linjer. Vi beregnede parvise korrelationer af nedbrydningen scores på tværs af panelet for alle hårnåle fra gruppen af ​​shRNA konstruktioner designet til at målrette et bestemt gen. Så hver shRNA blev vægtet med antallet af andre shRNAs fra det gen sæt, var stærkt korreleret til det (Spearman korrelationskoefficient er større end 0,35 med en p-værdi 0,01). Et gen-niveau sammensat score (shRNA score) blev derefter opnået ved vægtet summation af de shRNA nedbrydningen scores. Disse gen-afhængighed profiler blev anvendt til at beregne sandsynligheden forholdet scorer for sammenslutningen af ​​gen-mutation eller kopi nummer med shRNA følsomhed ved at sammenligne genmutation model til en “nul-model” (uden nogen genmutation).

Celler

Celler blev opnået fra American Type Culture Collection (ATCC) og blev dyrket i Dulbeccos modificerede Eagles medium (DMEM) medium suppleret med 10% føtalt bovint serum. Forstærket og ikke-amplificerede cellelinier blev udvalgt til hver kræft amplificeret gen af ​​interesse. For hver kræft forstærket gen, de cellelinjer benyttes til valideringsundersøgelser og deres tilsvarende gen kopi numre er som følger: (1)

NSD3

: H1581 (7 eksemplarer), H1703 (6 eksemplarer), SW48 (5 eksemplarer ), SW837 (ikke-forstærkede); (2)

DCUN1D1

: Kyse (6 eksemplarer), T47D (4 eksemplarer), SW48 (ikke-forstærket), HCT15 (ikke-forstærket). Kopier talværdier blev opnået fra offentliggjorte CCLE datasæt [14].

Gene knockdown

For gen knockdown gener, vi brugte shRNA lentiviral transduktion partikler købt fra Sigma (Mission, SHCLNV).

DCUN1D1

shRNA konstruktioner var TRCN0000133666, TRCN0000134440, TRCN0000134715, TRCN0000136858, og TRCN0000137482. For

NSD3

Knockdown undersøgelser, brugte vi On-Targetplus SMARTpool siRNA rettet mod human Nsd3 (Thermo Scientific). Celler blev inficeret med lentivirale shRNA partikler ved infektionsmultiplicitet (MOI) i området fra 5-10 i nærvær af 10 ug /ml polybren. siRNA /shRNA blev udført ifølge etablerede protokoller [15].

cellebaserede analyser

Antistoffer anvendt til Western blot-analyse indbefatter kanin-anti-DCUN1D1 (Sigma, HPA035911), kanin-anti- WHSC1L1 (Proteintech, 11.345-1-AP). Western blot blev udført ifølge traditionelle protokoller. Celleproliferation og apoptose blev udført med cellen Titer Glo og Caspase Glo assays (Promega) ifølge producentens instruktioner. Cell cyklus analyse blev udført med propidiumiodidfarvning af cancer cellelinjer ved hjælp af konventionelle protokoller [15].

Resultater

Identifikation af gen-opformeringer i TCGA datasæt

TCGA datasæt omfattende 14 cancertyper blev analyseret med GISTIC2 algoritme (cBio portal) for at identificere genamplifikationer i patienternes tumorprøver. Gener blev bedømt for statistisk sandsynlighed for amplifikation, og de gener, som viser amplifikation i to eller flere datasæt blev identificeret (figur 1). I alt 461 gener blev identificeret som potentielt opformerede gener (Tabel S1). I nogle tilfælde flere gener (fx

CD274

og

NDUFC2

) blev opformeret i to eller flere datasæt, der stammer fra en enkelt cancer undertype (figur 1, tabel S1). Genet liste blev yderligere indsnævret ved at identificere den delmængde af gener med etablerede eller formodede roller i onkogenese samt gener, der var potentielt druggable. Først genet listen var krydsrefereret med Cancer Genes database (cBio portal), som viste, at mindre end 25% af de 461 gener blev forbundet med onkogenese. Derefter blev generne tildelt en druggability score baseret på druggability indeks fra fire eksterne databaser (Ensembl, InterPro-Blast, BioLT-Drugbank og Qiagen Druggability liste). For hver database, blev et gen givet en 0-4 druggability score, hvor 0 er undruggable og 4 er en etableret drug target. Et gen med et “1” druggability score i nogen af ​​de fire databaser blev betragtet som “potentielt druggable” og inkluderet i den endelige gen listen. Fra analysen, blev i alt 73 potentielt druggable cancer forstærkede gener identificeret på tværs af TCGA datasæt (Figur 1).

TCGA datasæt blev udvundet for genamplifikation (GISTIC2 analyse cBio portal) og 461 gen amplifikationer blev identificeret . Listen blev indsnævret til 73 gener cancer-relaterede gener, der var potentielt “druggable” baseret på eksterne druggability databaser. Fra de 73 gener blev 40 formodede cancer driver gener identificeret på basis af kopiantal versus mRNA-ekspression analyse af TCGA data.

73 cancer amplificerede gener blev placeret på tværs af genomet og størstedelen af ​​generne klynge i sygdom loci (figur 2). Af de 73 gener, 57 gener grupperet i 14 loci i hele genomet, og de resterende 18 gener var fokale amplifikationer. I en klynge, generne tendens til at blive amplificeret i tilsvarende typer cancer. For eksempel, et kromosom 20q klynge bestående fire gener (

PTK6

,

SRM

,

RTEL1

, og

PRPF6

) blev alle forstærket i livmoderen /endometrie kræft og lunge adenokarcinomer. En kromosom 1q klynge indeholdt 12 gener, såsom

SETDB1

,

BCL9

,

PIAS3

, og

MCL1

, og 11 af de 12 gener var amplificeret i lung pladeceller cancere og blære kræft (figur 2). En velundersøgte klynge på kromosom 4q indeholder

PDGFRA

,

KIT

, og

KDR

blev forstærket i gliom og melanomer [10]. På grund af den stringens anvendes i Gistic2 analyse, vi sandsynligvis undervurderet cancertyper, hvori et gen-amplifikation fandt sted. Derfor er det sandsynligt, at de 73 cancer gener vi identificeret blev opformeret i andre typer kræft ikke er repræsenteret her (figur 2).

Fra den første liste over 461 gener forstærkede i en eller flere TCGA datasæt, 73 forstærkede gener var identificeret med potentielt “druggable” egenskaber som etablerede /formodede roller i onkogenese. Gener /amplikoner er arrangeret af kromosomal placering, med deres genomiske placering markeret som vist (Mb = megabase). Farvede felter angiver kræftformer med TCGA betegnelser, som følger: BLCA – Blære urothelial Carcinoma, BRCA – Breast invasiv karcinom, CRC – Kolorektal Cancer (COAD og LÆS studier kombineret sammen), GBM – glioblastoma multiforme, HNSC – hoved og hals pladecellekræft , KIRC – Kidney renal klar celle karcinom, LGG – Brain Lavere Grade gliom, LUAD – Lung adenocarcinom, LUSC – Lung pladecellekræft, OV – æggestokkene serøs cystadenocarcinoma, Prad – Prostate adenocarcinom, SKCM – hud Kutan melanom, STAD – mave adenocarcinom, UCEC – Uterin Corpus endometrioide Carcinoma

Blandt de 73 cancer forstærket gener var en række mål etablerede narkotika, såsom

EGFR

,

ERBB2

og

KIT

(figur 2).

ERBB2

på kromosom 17 blev forstærket i 5 cancertyper og blev co-forstærket med MAP kinase adapter

GRB7

PPP1R1B

.

EGFR

på kromosom 7 blev forstærket som et enkelt gen i 7 kræfttyper, validering betydningen af ​​dette stof mål i kræft [16]. Listen omfattede også en række mål i øjeblikket i klinisk udvikling på tværs af branchen, såsom

CDK6

,

PIK3CA

,

PIK3C2B

og

NOTCH2

.

CDK6

på kromosom 7q blev forstærket som et enkelt gen i lunge skællede kræft og glioblastom, mens

PIK3CA

boede på et kromosom 3q klynge med 6 andre gener og blev forstærket i flere typer kræft (figur 2) [17]. Adskillige tidligere validerede cancer forstærkede gener, såsom

FAK

/

pTk2-

blev ikke identificeret i analysen, dels som følge af høj stringens, der blev anvendt på bioinformatik analyse for at reducere falske positive hits [18].

Identifikation af amplificerede cancer gener med formodet cancer føreraktiviteten

da nogle af generne identificeret som cancer amplificerede gener kan være passager gener i amplikonnerne, vi yderligere analyseret genet sæt at identificere formodede cancer driver gener. Dette blev gjort ved at beregne Pearson korrelationskoefficienten mellem kopital og mRNA-ekspression værdi fra TCGA patient tumordata. Korrelationskoefficienter blev beregnet for hver af de 14 cancertyper og den gennemsnitlige korrelationer på tværs af alle kræftformer blev beregnet (figur 3-4). Analysen afslørede en bred vifte af kopiantal versus mRNA-ekspression korrelationer for generne. Formodede cancer driver gener forventes at vise højt kopiantal versus mRNA udtryk korrelation. Validerede kræft drivkræfter, som

ERRBB2

,

EGFR

, og

KRAS

demonstrerede højt kopiantal versus mRNA udtryk korrelation i de tilsvarende kræfttyper, de regulerer (

ERBB2

r = 0,9 i brystkræft,

EGFR

r = 0,8 i lunge adenocarcinom,

KRAS

r = 0,9 i kræft i æggestokkene) (figur 3-4).

Pearson korrelationskoefficienter blev beregnet ved at analysere gen kopi nummer og mRNA-ekspression fra individuelle patient-afledte prøver i TCGA datasæt. Vist er korrelationskoefficienterne for hver TCGA kræft undertype og den gennemsnitlige korrelation på tværs af alle typer kræft (rød betegner høj korrelation, blå angiver lav korrelation). Forkortelser af TCGA datasæt er angivet i figur 1.

Pearson korrelationskoefficienter blev beregnet ved at analysere gen kopi nummer og mRNA-ekspression fra individuelle patient-afledte prøver i TCGA datasæt. Vist er korrelationskoefficienterne for hver TCGA kræft undertype og den gennemsnitlige korrelation på tværs af alle typer kræft (rød betegner høj korrelation, blå angiver lav korrelation). Forkortelser af TCGA datasæt er angivet i figur 1.

Det eksemplar nummer versus udtryk analyse viste de potentielle driver gener, der blev forstærket i gen-klynger. For eksempel kromosomet 1q klynge med 12 opformerede gener indeholdt 4 gener med kopital vs. udtryk korrelation er større end 0,5 (

SETDB1

,

Arnt

,

APH1A

, og

CHD1L

), hvilket tyder på, at disse kan være føreren gener i amplikon (figur 3). Blandt de 12 gener,

SETDB1

viste den højeste samlede korrelation, i overensstemmelse med de seneste rapporter,

SETDB1

er en kræft forstærket gen med demonstreret driver aktivitet [19], [20]. De andre tre gener kan også spille potentielt betydningsfulde roller i carcinogenese –

APH1A

er en gamma sekretasekomplekset underenhed i Notch vej,

Arnt

er en underenhed i HIF1 kompleks, og

CHD1L

er en DNA helicase i DNA beskadigelse respons pathway [21]. Fire gener i amplikon viste kopi nummer versus udtryk korrelation mindre end 0,3 (

PDE4DIP

,

S100A11

,

S100A9

, og

S100A8

) (figur 3). Den kromosom 3 klynge med 7 gener indeholdt 2 gener med kopi nummer versus udtryk korrelation større end 0,5 (

DCUN1D1

PRKCI

) og 4 gener med kopi nummer versus udtryk mindre end 0,3 (

tert

,

SKIL

,

GNB4

, og

SOX2

).

PRKCI

er en serin /threonin-kinase i NF-KB-vejen og tidligere væv microarray data valideres dette gen som en potentiel hidtil ukendt cancer driver genet [22].

DCUN1D1

er en E3 ubiquitinligase kompleks underenhed med potentiel cancer driver aktivitet, som vi yderligere valideret med shRNA knockdown (nedenfor). Mens

PIK3CA

vises en overordnet korrelationskoefficient 0,4, det viste høj korrelation i brystcancer (r = 0,9), hoved og hals skællede cancer (r = 0,8), og uterus /endometriecancere (r = 0,7) ( Figur 3).

kromosom 11q klynge indeholdt 5 gener, herunder

CCND1

, en veletableret cellecyklus regulator og onkogen driver. Mens

CCND1

viste højt kopiantal versus ekspressionsvektorer korrelationer i leverkræft (r = 1,0), blærecancer (r = 0,8), lunge squamous cancer (r = 0,7), hoved og hals caner (r = 0,7) og brystcancer (r = 0,7), korrelationerne var lavere i andre typer cancer, hvilket antyder, at

CCND1

amplifikation er en sygdomsspecifik onkogen driver (figur 3). To andre gener i amplikon,

FADD

, og

PPFIA1

, vises større samlet korrelation på tværs cancertyper, implicerer disse gener som potentielle roman kræft drivere til yderligere undersøgelse.

FADD

, en apoptotisk effektormolekyle, er tidligere identificeret som en ny kræft driver gen i et panel af 167 larynx /svælg kræft, berettiger yderligere undersøgelser i sin mekanisme onkogenese [23]. Det er vigtigt at bemærke, at korrelationen af ​​mRNA-ekspression for at kopiere nummer er ikke afgørende i princippet et gen til at være en cancer driver gen. Derfor gener med lav mRNA-ekspression versus kopital korrelation er ikke nødvendigvis passager gener. For eksempel kromosomet 1q klynge indeholdt

MCL1

, et gen med en cancer driver signatur baseret på Project Achilles (data ikke vist), men med en gennemsnitlig mRNA-ekspression versus kopiantal korrelation på 0,31.

at identificere de forstærkede cancer gener med højeste samlede kræft driver aktivitet, vi rangeret generne i rækkefølge efter højeste antal kopier versus mRNA udtryk korrelation på tværs af alle typer kræft. Vi identificerede 40 gener med overordnet r større end 0,3 (tabel 1). Den r = 0,3 cutoff blev brugt, fordi flere gener viste høj r i et lille antal kræftformer. For eksempel,

FGFR3

vises r 0,7 i fire kræftformer (blærekræft, glioblastom, lunge skællede, og melanom), men r 0,5 i andre kræftformer. Tilsvarende

CDK6

demonstrerede r 0,7 i kun 4 kræftformer (glioblastom, hoved- og halscancer, lunge adenocarcinom, og lunge skællede kræft), mens

IGF1R

havde r 0,7 i kun én cancer ( brystkræft) (Figur 3-4). Blandt de 40 gener med højeste kræft driver aktivitet, de øverste to mest klassificeret gener var

NSD3

/

WHSC1L1

og

SETDB1

, to vigtige histon methyltransferaser (tabel 1) . Mens

SETDB1

blev for nylig etableret som en bona fide forstærket kræft driver i melanom og lungekræft [19], [20], den rolle,

NSD3

/

WHSC1L1

har ikke blevet godt karakteriseret og så vi yderligere valideret dets onkogene rolle in vitro (nedenfor). To andre kromatin regulatorer, den kromatin læser Brd4 og histonacetyltransferase

YEATS4

, blev også højt rangeret som formodede kræft driver gener. Andre gen familier, der var repræsenteret på listen omfatter Notch pathway gener (

NOTCH2

,

APH1A

), metaboliske regulatoriske gener (

NDUFC2

,

PRKAB2

), pindsvineoverføringsvejen gener (

DCUN1D1

), Wnt pathway gener (

BCL9

), NF-KB pathway gener (

ERC1

,

PRKCI

,

IKBKB

), JAK /STAT pathway gener (

PIAS3

), MAPK signalering effektorer (

KRAS

,

FRS2

,

GRB7

), receptortyrosinkinaser (

FGFR3

,

EGFR

,

ERBB2

,

IGF1R

), DNA skader respons /reparation gener (

RAD51AP1

,

RTEL1

,

ERCC5

,

RAD52

,

CHD1L

), p53-associerede gener (

MDM2

,

MDM4

,

GTPBP4

), og cellecyklus regulerende gener (

CCNE1

,

TPX2

,

CCND3

,

CDK6

) (tabel 1).

kopi nummerserier af kræft forstærkede gener blev analyseret i individuelle TCGA patient tumorer at bestemme omfanget af gen forstærkning (fig. S1, S2) . Nogle gener viste højt forstærkning svarende til 10-20 genkopier, mens andre gener viste lave niveau 3-8 kopital amplifikationer. Den kromosom 1q amplicon, som indeholdt

PRKAB2

,

APH1A

,

Arnt

, og

SETDB1

viste lavt niveau forstærkning (3-10 kopier) , mens kromosom 12q amplicon, som indeholdt

MDM2

,

YEATS4

, og

FRS2

viste højt amplifikation (10-20 kopier) (fig. S1, S2 ). Andre gener med højt niveau amplifikationer omfatter

PRKAB2

(6-10 eksemplarer i ovariecancer),

MDM4

(10-30 kopier i glioblastom),

MDM2

(10- 15 eksemplarer i lunge adenocarcinom),

PIK3CA

(5-20 eksemplarer i lunge skællede kræft),

DCUN1D1

(5-15 eksemplarer i lunge skællede kræft),

FADD

og

PPFIA1

(hver med 5-10 eksemplarer i hoved og halskræft),

NDUFC2

(5-15 eksemplarer i ovariecancer), og

RAP1B

(5- 15 kopier i lunge adenocarcinom). MAP-kinase associerede gener viste også højt forstærkning, med receptortyrosinkinaser

ERBB2

,

IGF1R

, og

EGFR

alle stærkt forstærket, som forventet. De MAP kinase adapter proteiner

FRS2

og

GRB7

blev også meget forstærket (10-20 kopier i lungeadenokarcinom og brystkræft, henholdsvis). Cellecyklus regulatorer, såsom

CCNE1

(10-20 kopier i ovariecancer), blev også stærkt forstærket, som forventet. Foruden kopiere nummerserier, blev hyppigheden af ​​genamplifikation i patientens tumorer beregnet ved hjælp kopiantal 4 som et cutoff til amplifikation (fig. S4). Et betydeligt antal gener blev forstærket i mere end 30 procent af kræftpatienter, herunder

DCUN1D1 Hotel (43% af lunge planocellulære kræft),

FADD

og

PPFIA1

(~ 30% af hoved og hals kræft), og

PRKCI Hotel (36% af lunge planocellulære kræft) (fig. S4). Mens forstærkning var den primære genomiske forandring for disse gener, en række gener, også foretaget somatiske mutationer, såsom

PIK3CA

,

KRAS

NOTCH2

. I disse tilfælde, de amplificeringer og mutationer var stort set udelukker hinanden (fig. S4).

MAPK pathway forstærkede gener

De 73 cancer forstærkede gener blev yderligere analyseret af shRNA validering at kontrollere kræft driver aktivitet . Projekt Achilles er en store forsøg til katalog genetiske svagheder i cancercellelinier ved anvendelse af en genom-dækkende shRNA bibliotek for at identificere gener, som påvirker cancercelleoverlevelse /proliferation [11]. Vi minerede Achilles databasen for at afgøre, hvilke af de 73 cancer forstærkede gener kan spille en rolle i cancer celle overlevelse /spredning. Den Achilles Biblioteket består af flere shRNA hårnåle og vi beregnet en sammensat shRNA score baseret på virkningerne af flere lentivirale shRNA hårnåle på inficerede kræftceller. Gener demonstrerer en lav shRNA score i inficerede cellelinjer formodes at være vigtige for kræftcellen overlevelse og kan repræsentere formodede kræft drivere. De shRNA score er kun gældende, når flere shRNA hårnåle konsekvent demonstrere kræftcellen hæmning (betegnet “large korrelation”). Den Achilles databasen blev forespurgt med de 73 gener og disse gener med “stor korrelation” shRNA aktivitet blev identificeret, og deres shRNA scoringer blev beregnet på tværs af flere hundrede cancer cellelinjer (fig. S3). Adskillige gener haft negative shRNA scores over det meste af de kræftcellelinjer og var formentlig afgørende for kræftcellen overlevelse /spredning. Disse gen omfattede

KRAS

,

PRKAB2

,

GRB7

,

BRD4

,

PRPF6

,

BCL9

,

PPFIA1

og

NOTCH2

. Andre gener viste negativ shRNA scorer i en delmængde af kræft cellelinjer, såsom

CCND1

,

NDUFC2

,

YEATS4

,

GTPBP4

, og

CHD1L

(fig. S3).

Be the first to comment

Leave a Reply