PLoS ONE: Bringing Down Cancer Aircraft: Søgning efter Essential Hypomutated Proteiner i Skin Melanom

Abstrakte

Vi foreslår en tilgang til påvisning af væsentlige gener /proteiner, der er nødvendige for kræftcellen overlevelse. Et gen betragtes som afgørende, hvis en mutation med høj indflydelse på funktionen af ​​kodede protein forårsager dødsfald af cancercellen. Vi trækker en analogi mellem væsentlige kræft proteiner og velkendte Abraham Wald arbejde på at skønne de plane kritiske områder ved hjælp af data om overlevelsesevne fly støde fjendtlig beskydning. Wald begrundet, at dele uden skudhuller på flyene tilbage til luftbase fra en kamp flyvning er de mest afgørende dem for flyet funktion: et hit i en af ​​disse dele nedture et fly, så det ikke vende tilbage til undersøgelsen. Vi har planlagt, at flyvemaskinen overfladen er en kræft genom og kuglerne er somatiske mutationer med høj indflydelse på protein funktion. Ligeledes foreslår vi, at gener specielt vigtige for tumorcelleoverlevelse bør bære mindre stor effekt mutationer i kræftceller end polymorfier fundet i normale celler. Vi brugte data om mutationer fra Cancer Genome Atlas og polymorfier fundet i raske mennesker (fra 1000 genomer Project) til at forudsige 91 protein-kodende gener er essentielle for modermærkekræft. Disse gener blev udvalgt ifølge flere kriterier, herunder negativ selektion, ekspression i melanocytter og fald i andelen af ​​slagfaste mutationer i cancer sammenlignet med normale celler. Gene Ontology analyse viste berigelse af essentielle proteiner relateret til membranen og celle periferien. Vi spekulere, at dette kunne være et tegn på immunsystemet drevet negative udvalg af kræft neo-antigener. Et andet resultat er den overrepræsentation af semaphorin-receptorer, som kan mediere karakteristiske signalleringskaskader og er involveret i forskellige aspekter af tumorudvikling. Cytokin receptorer CCR5 og CXCR1 blev også identificeret som kræft essentielle proteiner, og dette bekræftes af andre undersøgelser. Samlet set var vores mål at illustrere ideen detektere proteiner, hvis sekvens integritet og funktion er vigtig for cancer celleoverlevelse. Forhåbentlig kan denne forudsigelse af essentielle kræft proteiner pege på nye mål for anti-tumor behandlingsformer

Henvisning:. Pyatnitskiy M, Karpov D, Poverennaya E, Lisitsa A, Moshkovskii S (2015) Bringe Down Cancer Aircraft: Søgning for Essential Hypomutated Proteiner i Skin melanom. PLoS ONE 10 (11): e0142819. doi: 10,1371 /journal.pone.0142819

Redaktør: Roger Chammas, Universidade de São Paulo, Brasilien

Modtaget: 9. september 2015; Accepteret: 27 oktober 2015; Udgivet: November 13, 2015

Copyright: © 2015 Pyatnitskiy et al. Dette er en åben adgang artiklen distribueres under betingelserne i Creative Commons Attribution License, som tillader ubegrænset brug, distribution og reproduktion i ethvert medie, forudsat den oprindelige forfatter og kilde krediteres

Data Tilgængelighed: Alle relevante data er inden for papir og dens støtte Information filer

Finansiering:. arbejdet blev støttet af den russiske Videnskabelige Fond, give # 14-15-00395, til SM. De finansieringskilder havde ingen rolle i studie design, indsamling og analyse af data, beslutning om at offentliggøre, eller forberedelse af manuskriptet

Konkurrerende interesser:.. Forfatterne har erklæret, at der ikke findes konkurrerende interesser

Introduktion

den seneste udvikling i genomsekvensering i forbindelse med store undersøgelser kræft tillagt en ny vision om tumor som følge af mutator fænotype [1]. I stedet for tidligere synspunkt, at kræft celle har mutationer påvirker kun bestemte onkogener eller tumorsuppressorgener det blev klart, at dets genom bogstaveligt er fyldt op med forskellige somatiske aberration [2]. En cancercelle klon overlevelse og evolution strategi er at ændre dets genom hurtigt ved hjælp beskadigelse eller modulering af DNA-reparationssystemer [3]. Nogle mutationer er førere af kræft proces og forekommer i cancer-relaterede gener. Men de fleste mutationer forekommer i hele genomet er ikke relevante for tumor progression og repræsenterer passager mutationer. De hjælper ikke kræftceller til at overleve og kan opleve en negativ selektion [4].

I de seneste værker, hvor data fra kræft genomsekvensering blev analyseret en central opmærksomhed identifikation af gener betydeligt muteret i kræft i forhold til kimcellelinje-genomet. En statistisk undersøgelse foretaget på tusindvis af prøver har rapporteret mere end 200 potentielle kræft driver gener [5]. Købet af specifikke mutationer i disse gener er den drivende kraft af malign transformation.

Vores undersøgelse repræsenterer en alternativ tilgang til analyse af kræft genomdata. Ideen er inspireret af et velkendt faktum fra historien om anvendt statistik, nemlig Abraham Wald luftfartøj problem [6]. Wald foreslog at søge efter fly sårbarhed zoner ved estimering af bullet-fri pletter på flyvemaskiner, som vendte tilbage til luftbase fra en kamp flyvning. Mobilitet er de bullet-frie områder på maskinen overflade er afgørende for luftfartøjets ydeevne. Hvis kugler ramte de områder, så maskinerne styrtede ned samt de oplysninger om fly sårbarhed blev uobserverbare (figur 1, venstre panel). Så bullet-fri zoner på de returnerede fly var afgørende for flyet funktion og dermed brug for mere rustning.

Ubeskadigede områder på de returnerede fly er afgørende for luftfartøjets præstationer. Ligeledes foreslår vi, at proteiner med reduceret antal skadelige somatiske mutationer i forhold til kimcellelinje er afgørende for kræftcellen overlevelse.

Vi har forudset, at flyvemaskinen overfladen er en cancer genom og kugler er somatiske mutationer med høj effekt på protein funktion. De steder med nedsat antal af sådanne varianter kan være afgørende for kræft overlevelse, da cellerne med mutationer i disse steder dør, og deres genomer ikke sekventeret ved kræft projekter (Fig 1, højre panel).

Forventeligt, var vi ikke alene på en sådan måde at tænke på. I begyndelsen af ​​cancer genomforskning blev det foreslået at søge homozygote DNA deletioner som uforanderlige træk ved cancerceller [7]. I sit seneste arbejde, Polak et al. analyseret hypomutated steder i kræft genom og fundet dem i tilgængelige regulatorisk DNA grundet forøget reparation i disse steder [8].

Men vi fokuserer ikke på kræft genomet, men snarere på kræft proteomanalyse. Vi søgte efter den hypomutation fænomen fra synspunktet af protein funktion. Vores mål var at identificere proteiner, der er forårsaget af funktionelt vigtige aminosyreændringer i cancer. Disse proteiner er konserveret og derfor er essentielle for overlevelse celle under kræft evolution. Som reference vi anvendte polymorfier rapporteret i 1000 genomer Project [9]. Faktisk har vi sammenlignet udviklingen af ​​protein-sekvenser under udviklingen af ​​kræft med sådan udvikling i løbet af 200.000 års udvikling af menneskeheden fra dens sidste flaskehals [10]. Vi mener, at vores tilgang er i stand til at opdage proteiner, hvis sekvens integritet og fungerende er vigtigere for kræftceller end for normalt væv. Forhåbentlig kan disse forudsagte kræft-væsentlige proteiner repræsenterer sårbarhed zoner for tumorceller og dermed tjene som nye mål for anti-cancer medicin.

Resultater og Diskussion

Formålet med vores analyse var at identificere cancer proteiner under negativ selektion dvs. forarmet med funktionelt vigtige aminosyreændringer. Disse konserverede proteiner kan være afgørende for celleoverlevelse under kræft evolution og dermed kan betragtes som mulige mål for anticancerterapi (figur 1).

I vores analyse valgte vi melanom somatisk mutation datasæt tilgængelig fra TCGA hjemmeside. antages Vores tilgang til at være mere anvendelig til tumorer udløses af punktmutationer snarere end ved kopital ændringer [11], såsom lunge tumorer eller melanomer. De tidligere cancere give meget mere statistik om proteinsekvenser at gøre forudsigelse robust og melanom er kendetegnet ved den højeste somatisk mutation frekvens i forhold til andre cancere [12]. Også melanom datasæt indeholdt det højeste antal varianter i forhold til andre typer af kræft, i alt 181,175 varianter.

Definition af en delmængde af huden melanom proteiner under negativ selektion

For at finde protein-kodende gener oplever negativ selektion under kræft evolution vi brugte

d

N /

d

S som en indikator for selektivt pres [13]. Den samme logik blev accepteret af Ostrow et al. [14], når de studerede positiv selektion i kræft genomer.

Vi beregnede dN /dS forhold for al menneskelig protein-kodende gener ved hjælp SKCM data. Gener medfører mindre end 11 varianter blev udelukket fra analysen for at få mere robuste estimater af dN /DS-forholdet. Gene blev anset for at være under negativ selektion, hvis den tilsvarende dN /dS værdien var mindre end den foruddefinerede tærskelværdi. I forsøg på at undgå den tærskel valg ved en vilkårlig beslutning vi plottet genom-dækkende distribution af dn /dS værdier for tre kræftformer med flest punktmutationer: to typer af lungekræft og huden melanom (figur 2). Som det kan ses fra histogrammerne er den lokale minima observeret ved dN /dS-værdi på ca. 0,25. Vi brugte denne tærskel som et første filter til at vælge essentielle cancer gener, der skulle være under negativ selektion.

Skin melanom, livmoderendometrisk carcinom og lunge adenocarcinom indeholdt de fleste af de data om kræft mutationer. Lokale minimumsværdier er nået, når dN /DS er ca. 0,25 (angivet med pile). Vi overvejede proteiner med dn /dS under denne tærskel for at opleve negativ selektion.

Vores næste skridt var at fjerne gener, som ikke udtrykkes i melanom celler og kan derfor ikke anerkendes som afgørende for denne kræft. Vi beregnede den gennemsnitlige udtryk for hvert gen på tværs 374 kræft prøver og fjernede gener med ekspressionsniveauerne i laveste 20%.

Så vendte vi til evalueringen af ​​genetiske varianter observeret i SKCM og 1KG data. Vi delte mutationer i to klasser: dem med stor indvirkning på protein funktion og andre ikke-signifikante mutationer, herunder synonyme variationer. Den funktionelle effekt af ikke-synonyme substitutioner blev forudsagt via dbNSFP database (se metoder). Indels, stop gevinst /tab og splejsningssteder variationer blev også klassificeret som mutationer med høj funktionel effekt.

Endelig valgte vi gener, som forarmet ved funktionelt vigtige varianter i kræft i forhold til normale væv, dvs. generne hvor fraktion af mutationer med høj funktionel effekt

f

for 1KG data var større end den samme fraktion for kræft data,

f

1KG

f

SKCM. Efter alle trin opnåede vi 91 protein-kodende gener, der er udpeget i det følgende som “væsentlige kræft proteiner”, S1 Tabel

Skin melanom afgørende protein delmængde betydeligt beriget med plasma membranproteiner:. En mulig forbindelse til immun

overvågning

Ved manuel kigge gennem listen, kunne man markere nogle forskellige kategorier blandt disse proteiner (tabel 1). De fleste repræsenterede kategorier omfatter membran transport proteiner, såsom ionkanaler og opløste luftfartsselskaber, neurale proteiner af forskellige funktioner, celleadhæsionsmolekyler mv For at beskrive den resulterende liste mere formelt vi udførte funktionelle berigelse analyse ved hjælp WebGestalt hjemmeside [15].

Gener blev filtreret som beskrevet her. Kategorier blev defineret ved manuel biocuration.

berigelse af 91 væsentlige protein delmængde af Gene ontologi [16], Kegg [17] og PharmGKB drug target [18] kategorier havde vist en signifikant tendens til membranproteiner specifikt proteiner af plasmamembranen og celleperiferi (fig 3, S2 tabel). Naturligvis kan sådanne generelle kategorier ikke helt dechifrere mulige molekylære veje eller celleproliferation mekanismer. Dog kan der være en mekanistisk fortolkning af de overrepræsenterede plasmamembranproteiner. Det er almindeligt anerkendt, at kræft flygte fra vært immunitet gennem evolution af kræft kloner [19]. Vi har antaget, at en af ​​de mekanismer, der fører til bevarelse af plasmamembranen og celleperiferi proteinsekvens i melanom kunne være et resultat af en sådan immune escape. Mere specifikt kan høj slagstyrke mutationer i celle periferi og plasmamembranproteiner føre til dannelse af større histokompatibilitetskompleks (MHC) II-afhængige neo-antigener [20]. MHC II-begrænset protein epitoper reaktive til T-hjælper lymfocyt subpopulation, som almindeligt kendt, er dannet ved spaltning af fagocyteres ekstracellulære proteiner og celle perifere proteiner ledsager internaliserede membran dele. Den omstændighed, at sådanne mutationer er opbrugt i celleoverfladen og perifere proteiner afspejler udslip af melanomceller fra CD4

+ – T-celle-medieret immunitet. For nylig er det blevet rapporteret, at adoptiv immunitet induceret mod en T-hjælper-1 (MHC II-begrænset) neo-antigenepitop billede tumorregression hos en patient med metastatisk cholangiocarcinom [21]. Betydelig respons af CD4 + -T-celler mod personlig tumor neo-epitoper blev også fundet i patienter med metastatisk melanom [22]. Således kan vi observere berigelse ved celle perifere proteiner i mål delmængde som følge af rensende selektion mod dannelse af neo-antigen T-hjælper-epitoper. Når et plasma membranprotein udstrakt muteret i en kræftcelle, det er fordøjet efter vesikel internalisering og dens mutant peptider binder MHC II som neo-epitoper, som ikke anerkendes af immunsystemet som selv-epitoper. Under sådanne neo-epitoper udtrykt, kan en kræftcelle ikke undgå immunovervågning og udskilles (figur 4). Især trods MHC II selv udtrykkes i begrænsede celletyper, såsom faglige antigenpræsenterende celler, er melanomceller rapporteret at udtrykke forskellige typer af receptoren [23].

P-værdier blev justeret med Benjamini- Hochberg korrektion for multiple sammenligninger. Antal essentielle proteiner, der falder ind kategori er afbildet i hver søjle.

Differentieret inddragelse af overfladeproteiner til MHC-begrænset antigenpræsentation er kendt inden for teknikken [20]. Cancerceller blotlægger MHC-II-epitoper med muterede antigener er mere tilbøjelige til at blive elimineret af T-cellemedieret immunovervågning.

Immunoediting af kræft genomet mod antigen-dannelse som beskrevet for nylig [24] er i en god korrespondance med vores hypotese.

CCR5 og CXCR1- kemokinreceptorer som væsentlige melanom proteiner

en af ​​proteinerne i vores delmængde er en CC-kemokinreceptor type 5 (

CCR5

) , kemokinreceptoren der udførligt blev undersøgt på grund af sin evne til at levere HIV fusion med målcellen. Desuden en deletion af dette protein kendt som CCR5-Δ32 beskytter dets bærer mod udvalgte stammer af viruset [25]. Således i tilfælde af ændret aminosyresekvens af receptoren tjener ikke som en cofaktor for viruspartiklen. Lægemidler blokerer CCR5, f.eks maraviroc, betragtes som en terapi af valg til behandling af HIV-infektion.

Samtidig, en rolle CCR5 i kræft har været meget diskuteret. Det er kendt, at denne receptor ofte overudtrykkes i visse cancertyper [26]. CCR5 udtryk er blevet fremkaldt efter onkogen transformation af celler [27]. Beviser er akkumulerende, at denne receptor signalering gennem sin ligand, CCL5, giver kræft progression, f.eks metastase. CCR5 antagonist-lægemidler har vist sig at blokere metastaser af basal brystcancer [28] og Src-induceret prostatacancer [29] i mus. Det blev foreslået at bruge godt tolerable CCR5 hæmmer narkotika, som allerede er godkendt til brug i HIV-infektion, i kliniske forsøg for metastatisk kræft [28]. Et observationsstudie forsøg, der undersøgte effekten af ​​maraviroc på metastatisk colorectal cancer var afsluttet, men er blevet rapporteret endnu ingen resultater [29].

Som for melanom, blev det konstateret, at funktionel CCR5 er vigtigt for udviklingen af ​​dette tumor: CCR5

– /- mus viser reduceret tumorvolumen og forøget overlevelsesrate sammenlignet med vildtypemus [30, 31]. Vivanco et al. også rapporteret, at melanom vækst og metastase blev inhiberet i CCR5

– /- mutantmus [32]. Forfatterne har foreslået, at CCR5 /CCL5 signalering negativt påvirker CD8 T-lymfocyt virkninger. Således kan melanom celler, der udtrykker funktionel CCR5 dermed bidrage til immun flugt.

Det faktum, at C-C kemokinreceptor type 5 er en af ​​væsentlige kræft proteiner positivt illustrerer anvendeligheden af ​​vores tilgang. Denne receptor er en druggable cancer target mindste for adjuverende behandling.

Et andet vigtigt cytokin receptor i vores liste er CXCR1. Det binder interleukin-8-protein (CXCL8), som er en vigtig kemotaksi middel i medfødte immunitet. Især CXCR1 og ovennævnte CCR5 bruge de samme signalveje og er nært beslægtede i deres funktion [33]. Som for sidstnævnte, er CXCR1 kendt for at blive brugt af melanom celler til udvækst og metastase [34]. For nylig blev det vist, at forhøjede ekspression af denne receptor er korreleret med tumor malignitet [35]. Mest sandsynligt, CCR5 og CXCR1 anvendes af melanomceller at overleve i inflammatorisk miljø.

semaphorin pathway er potentielt vigtigt for melanom overlevelse

En anden lovende berigelse blandt de væsentlige cancer proteiner er relateret til semaphorin receptorkomplekset og Axon vejledning pathway (fig 3, S2 tabel). Semaphorins er involveret i celle vejledning under udvikling og i voksent væv [36]. Disse proteiner blev for nylig vist at fungere som undertrykkelse og fremmende midler i forskellige cancertyper via transaktivering af receptortyrosinkinaser [37]. Især begge typer semaphorin-bindende receptorer, plexins og neuropilins, er repræsenteret i vores liste, og kan være involveret i kræft celle overlevelse [38]. Plexin A2 (

PLXNA2

) beskyttet kræftceller fra døden efter human papillomavirus [39]. For neuropilin-2 (

NRP2

), der er et bevis på sin rolle i malignt melanom, hvor dens udtryk var korreleret med tumor progression [40]. Disse resultater giver en baggrund for yderligere eksperimenteren at opdage kræft lægemiddelkandidater blandt semaphorin komplekse proteiner [36].

Protein interaktioner mellem essentielle melanom proteiner

For at forstå, hvordan forudsagte væsentlige melanom proteiner samarbejder med hinanden, analyserede vi tilsvarende protein-protein-interaktioner ved anvendelse STRING database [41]. Vi har valgt kun høj tillid interaktioner med score større end 0,9. Interagerende byttedyr blev rapporteret for 46 af 91 gener af interesse (tabel 2). De fleste af protein-interaktioner er kendt for cytokinreceptorer CCR5 (115 byttedyr) og CXCR1 (77 byttedyr), af dem omkring 70 interaktioner omfatter fælles partnere. Et andet par af interaktionskandidater som er karakteriseret ved mange almindelige partnere består af caspase-10 (CASP10) og TRAIL-R1 dødsreceptor (TNFRSF10A).

Kun meget pålidelige interaktioner med score større end 0,9 blev overvejet.

samspillet kort over proteiner hypomutated i melanom (Fig 5) kan nemt opdeles til flere store netværk. Først tre G-koblede receptorer CCR5, CXCR1 og MCR2 danner en trekant af mange interaktioner. En rolle af disse receptorer i melanom, hvor de sandsynligvis fremme kræftcellen overlevelse og metastase er delvist beskrevet ovenfor.

Kortet blev bygget ved hjælp af STRING-database med høj tillid interaktion score tærskel 0.9. Størrelsen af ​​ottekant er proportional med antallet af partnere tilsvarende protein. Linjebredde afspejler antallet af fælles partnere mellem to lokkemad. Fordoblet grønne linjer betegner kendte direkte fysiske protein-protein interaktioner. Prey-proteiner interagerer med tre eller flere lokkemad vises som blå ovaler:. FYN, TP53, ADCY2 og POMC

Den største netværk komponent mellem integrin ITGB5, protein kinase PTK2B, semaphorin receptorer (PLXNA2) og phospholipase D2 (PLD2) er defineret ved deres samspil med FYN protein. Sidstnævnte er et velkendt proteinkinase fra Src-familien og er involveret i serien af ​​cellulære funktioner, såsom T-celle-immunitet, axon vejledning og er også betragtes som en potentiel protoonkogen [42]. Vides kun lidt om dens funktion i melanom, og der er tegn på, at Fyn ikke kan være en medicin mål i fremskreden modermærkekræft. Især når den blev inhiberet af saracatinib lægemiddel sammen med andre Src kinaser, blev ingen fordele observeret i fremskreden melanom [43]. Men baseret på vores data, mere opmærksomhed bør rettes til at studere på Fyn rolle i melanom adskilt fra andre Src kinaser, såsom Src selv, ja, osv

Uventet, blandt hypomutated proteiner, nogle partnere af TP53 tumor suppressor blev fundet. De omfatter bl.a. fysisk interagerende proteiner, caspase-10 (CASP10) og TRAIL-R1 dødsreceptor (TNFRSF10A). I modsætning til disse resultater, er komponenter af TRAIL apoptose pathway anses for at have antitumorvirkning, når aktiv [44]. Denne modsigelse afventer yderligere afkodning.

Konklusioner

kræft genom koncept udviklet i det seneste årti har bogstaveligt revolutionerede vores forståelse af kræft molekylærbiologi [45]. Resultater af kræft genomprojekter er særligt lovende for evidensbaserede og personlig medicin, afslører driver gener, som giver tumor udvikling og progression [5]. Samtidig kan ikke alle driver proteiner fungerer som mål for lægemiddelterapier. Mange kræftformer er primært forårsaget af tumorsuppressorer som irreversibelt inaktiveres af genmutationer. I disse tilfælde lægemiddelterapi repræsenterer en stor udfordring på grund af vanskeligheder i komplementering af den mistede funktion [46]. Derfor søgen efter nye lægemiddelkandidater er den primære opgave for post-cancer-genom studier.

Positiv selektion regulerer, på niveau med tilsvarende gener, aminosyresekvenser for førerens kræft proteiner under klon konkurrence ledsager tumorigenese. Nødvendigheden af ​​onkogener og tumor suppressorer skal muteret i de fleste kræftformer inspirerer forskere til at gennemføre pointsystemer for at vælge hypermutated driver gener [5]. I modsætning til disse nyttige indsats, i stedet vi fokuseret på proteiner, hvis tilsvarende gener er hypomutated i tumor, dvs. erfaring negativ selektion under kræft evolution. Vi mener, at disse proteiner kan give yderligere lægemiddelkandidater især i de tilfælde, hvor kræft drivere repræsenterer undertrykkere funktionelt ødelagt af mutationer.

Med vores tilgang aggregere evolutional dN /dS parameter som et mål for negativ udvælgelse, genekspression og funktionelt indvirkning aminosyreændringer, har vi forudsagde 91 proteinkodende gener at være essentielle i melanom og fundet flere væsentlige berigelser. For eksempel indeholdt en liste øgede antal celleoverflade og celleperiferi proteiner. Det er vores opfattelse, kunne det være et tegn på immunsystemet drevet negative udvalg af kræft neo-antigener [22]. Desuden repræsenterer nogle eksempler på hypomutated proteiner kendt kræftrelaterede proteiner, såsom cytokinreceptorer CCR5 og CXCR1 [33].

Det skal understreges, at resultaterne af vores forskning stærkt afhængige af den tilgængelige stikprøve. Jo mere mutation data akkumuleres for protein, jo mere trygt vi kan betegne, om det er vigtigt eller ej. Essential gener er karakteriseret ved lav frekvens af stor effekt mutationer [47], som også kan reducere styrken i vores tilgang. Dermed for analysen har vi valgt hud melanom exome datasæt [48], fordi denne kræft er karakteriseret ved det højeste niveau af punktmutationer. Vi forstår, at for tiden tilgængelige mængde data kan være utilstrækkelig til at identificere alle de essentielle proteiner til denne form for kræft.

Selvom vores data er foreløbige, er dette arbejde hovedsagelig til formål at illustrere en generel idé om at definere væsentlige kræft- specifik proteomanalyse. Resultater kan blive mere pålidelig, når det større antal individuelle cancer genomer vil blive akkumuleret. Men selv i sin nuværende form vores liste over forventede væsentlige melanom proteiner giver en baggrund for målrettet at eksperimentere med tumorceller overlevelse, ved at blokere protein kandidater

in vitro

in vivo

.

Metoder

Kræft mutation data blev hentet fra Synapse hjemmeside [49], tiltrædelse nummer syn1729383. Disse data blev oprindeligt opnået via The Cancer Genome Atlas [50] og blev oparbejdet at bortfiltrere falske positiver og germline varianter, kan detaljer findes i [51]. Hud kutant melanom datasæt (SKCM) havde det højeste antal varianter i forhold til andre datasæt, i alt 181175 varianter. Data om germlinie polymorfier blev downloadet fra webstedet 1000 genomer (1 kg) [9] og kommenteret hjælp ANNOVAR software [52]. Finalebordet indeholdt 425069 varianter beliggende inden de kodende regioner. Gener med mindre end 11 varianter enten i SKCM eller i 1kg data blev fjernet fra efterfølgende analyse.

For hver humant protein-kodende gen var forholdet mellem satserne for ikke-synonyme og synonyme substitutioner (dn /DS) beregnet som i [14] ved hjælp SKCM data om somatiske mutationer. Gener med dn /dS værdi større end 0,25 (dvs. oplever enten neutral eller positiv selektion) blev fjernet.

Gene udtryk data blev opnået via TCGA hjemmeside og indeholdt oplysninger omkring 20531 gener udtrykt i 374 melanom prøver. Genekspressionsprofilerne der havde absolutte ekspressionsniveauer i den laveste 20% af datasættet blev fjernet.

Funktionel virkning af ikke-synonyme enkelt nucleotid-varianter i både SKCM og 1KG data blev vurderet under anvendelse dbNSFP ressource [53]. Denne database samler resultaterne fra ti forudsigelse algoritmer (herunder SIFT, Polyphen2 og MutationAssessor) i to ensemble scoringer, MetaSVM og MetaLR. Større værdi af score indikerer, at varianten er mere tilbøjelige til at være skadelig. Vi overvejede variant for at have stor indvirkning på protein at fungere, hvis enten MetaSVM eller MetaLR værdien var større end 70-percentil af tilsvarende score. Somatisk mutation blev også anset for at have høj funktionel virkning, hvis det tilhørte en af ​​følgende klasser: indsættelse /sletning, stop loss, stop gevinst, eller splejsningsstedmutationen. For hvert gen, vi beregnede brøkdel af mutationer med høj funktionel effekt

f

1KG og

f

SKCM som

f

=

# (høj funk

.

mutationer) /# (total mutationer)

Funktionel geneset berigelse analyse via hypergeometric test blev udført ved hjælp WebGestalt software [15]. Som reference sæt vi leverede liste over 16172 gener med gennemsnitlig SKCM udtryk større end 20-percentil. Korrektion for multiple test blev udført ved hjælp Benjamini Hochberg metode.

En liste over interaktioner for udvalgte proteiner hentet fra STRING database v. 9.1 [41] ved hjælp af Python script. STRING samler forskellige foreninger mellem proteiner, såsom strukturelle forudsigelser, textmining, pathway analyse og eksperimentelle resultater fra andre ressourcer web, at danne sin aggregativ score. High-tillid interaktioner med scoren større end 0,9 blev anvendt til analyse. Netværk visualisering og analyse blev udført via Cytoscape [54].

Støtte Information

S1 Table. . Liste over protein-kodende gener med aminosyresekvenser under negativ selektion i huden melanom genomer ( “væsentlige” kræft proteiner)

Kolonne beskrivelse: Gene, EntrezGene: gen identifikatorer efter HGNC og NCBI Gene. Beskrivelse: gen funktionsbeskrivelse. skcm.dnds: dN /dS-forhold beregnet under anvendelse SKCM data om somatiske mutationer. quantile.expression: percentil af genekspression (TCGA SKCM data). norm.neutral: Antallet af synonyme SNVs (1KG data). norm.high: Antallet af mutationer med høj effekt funktionel effekt (1KG data). skcm.neutral: Antallet af synonyme SNVs (TCGA SKCM data). skcm.high:. antal mutationer med høj effekt funktionel effekt (TCGA SKCM data)

doi: 10,1371 /journal.pone.0142819.s001

(TSV)

S2 Table. Berigelse af de væsentlige kræft protein delmængde af Gene ontologi, Kegg og PharmGKB drug target kategorier

P-værdier blev justeret med Benjamini-Hochberg korrektion for multiple sammenligninger

doi:.. 10,1371 /journal.pone.0142819.s002

(TSV)

tak

Vi takker Ksenia Kuznetsova for korrektion af vores engelsk.

Be the first to comment

Leave a Reply