PLoS ONE: Klassificering af Ti Typer af større kræftformer Baseret på modfase Protein Array profiler

Abstrakt

Gathering store datasæt af kræft genomer kræver flere effektive og selvstændige procedurer til at klassificere kræfttyper og at opdage et par væsentlige gener for at skelne mellem forskellige kræftformer. Fordi proteinekspression er mere stabilt end genekspression, valgte vi omvendt fase-protein array (RPPA) data, en kraftfuld og robust antistof-baserede high-throughput tilgang til målrettede proteomics, at udføre vores forskning. I denne undersøgelse, foreslog vi en beregningsmæssige ramme for at klassificere patientprøver i ti store typer kræft baseret på RPPA data ved hjælp af SMO (Sequential minimal optimering) metode. En omhyggelig procedure funktion udvælgelse var ansat til at vælge 23 vigtige proteiner fra de i alt 187 proteiner ved mrmr (minimum Redundans Maximum Relevans Feature Selection) og IFS (inkremental Feature Selection) på træningssættet. Ved at bruge de 23 proteiner, vi med succes klassificeret de ti kræftformer med en MCC (Matthews Correlation Coefficient) af 0,904 om træningssættet, evalueret af 10-fold cross-validering og en MCC af 0,936 på en uafhængig test sæt. Yderligere analyse af disse 23-proteiner blev udført. De fleste af disse proteiner kan præsentere kendetegnende for cancer; Chk2, for eksempel spiller en vigtig rolle i proliferationen af ​​cancerceller. Vores analyse af disse 23-proteiner giver tiltro til betydningen af ​​disse gener som indikatorer for klassificering cancer. Vi tror også vores metoder og resultater kan kaste lys over de opdagelser af specifikke biomarkører for forskellige typer af kræft

Henvisning:. Zhang PW, Chen L, Huang T, Zhang N, Kong XY, Cai YD (2015) Klassificering Ti typer af større kræftformer Baseret på omvendt fase Protein Array Profiler. PLoS ONE 10 (3): e0123147. doi: 10,1371 /journal.pone.0123147

Academic Redaktør: Lukasz Kurgan, University of Alberta, CANADA

Modtaget: Oktober 20, 2014 Accepteret: 24. februar, 2015; Udgivet: 30 Marts 2015

Copyright: © 2015 Zhang et al. Dette er en åben adgang artiklen distribueres under betingelserne i Creative Commons Attribution License, som tillader ubegrænset brug, distribution og reproduktion i ethvert medie, forudsat den oprindelige forfatter og kilde krediteres

Data Tilgængelighed: Alle relevante data er inden for papir og dens støtte Information filer

Finansiering:. Dette arbejde blev støttet af tilskud fra National Basic Research Program Kina (2011CB510102, 2011CB510101), og National Natural Science Foundation of China (31.371.335, 81.171.342, 81.201.148 , 61401302), Innovation Program for Shanghai Municipal Education Kommissionen (12ZZ087), tildeling af “The First-class Discipline af universiteter i Shanghai”, Tianjin Research Program for Application Foundation og Advanced Technology (14JCQNJC09500), National Research Foundation for ph.d. Program for videregående uddannelse i Kina (20130032120070, 20120032120073) og den uafhængige Innovation Foundation of Tianjin University (60302064, 60.302.069). De finansieringskilder havde ingen rolle i studie design, indsamling og analyse af data, beslutning om at offentliggøre, eller forberedelse af manuskriptet

Konkurrerende interesser:.. Forfatterne har erklæret, at der ikke findes konkurrerende interesser

Introduktion

Identifikation cancerspecifikke gener involveret i tumorigenese og kræft progression er en af ​​de vigtigste måder at forstå de patofysiologiske mekanismer af kræft og til at finde terapeutiske lægemiddelmål. Der er gjort mange forsøg på at identificere cancer biomarkører ved hjælp genekspressionsprofiler [1]. Men robustheden af ​​microarray-afledte biomarkører er meget dårlig [2]; dette skyldes til dels robustheden let kan påvirkes i genekspressionsniveauer af små miljøændringer. Uden evalueringen af ​​protein ekspressionsniveauer, ville der ikke være nogen måde at illustrere årsager til tumor proliferation og differentiering. Derfor vil en bedre forståelse af de translationelle stater i disse genomer bringe os et skridt tættere på at finde potentielle drug targets og illustrere off-target effekter i cancer medicin.

Omvendt fase protein array (RPPA) er en stærk og robust antistof-baserede high-throughput tilgang til målrettede proteomanalyse, der giver os mulighed for kvantitativt at vurdere target protein-ekspression i store prøvesæt [3]. I denne proces, er eksempler analytter immobiliseret i den faste fase, og analytspecifikke antistoffer anvendes i opløsningsfasen. Gennem brug af sekundær tagging og signal forstærkning for at detektere bundne antistoffer, kan proteiner måles. Sammenlignet med konventionel protein kvantificere metoder, såsom western blotting eller ELISA, fordelene ved RPPA omfatter: storstilet kvantificering af proteinet, høj følsomhed og mindre krav prøvevolumen [4]. Mens massespektrometri, der normalt bruges til at kvantificere antallet af phosphoryleringssites eller phosphopeptider, kræver yderligere protein fordøjelse, peptid fraktionering og phosphopeptid berigelse efter protein udvinding, kan RPPA direkte kvantificere den udpakkede protein [5]. Anvendelsen af ​​RPPA er blevet grundigt valideret for begge cellelinier og patientprøver [6], og det illustrerer mekanistiske indsigt bag sygdomme.

I øjeblikket er cancertyper klassificeret af anatomiske positioner, hvor de findes, såsom lunge kræft, brystkræft, mv Hvorvidt disse navne kunne præsentere deres proteomisk funktion er ikke fastlagt indtil nu. Selv om der har været nogle metoder til at finde biomarkør signaturer for specifikke typer cancer, er der stadig lidt forskning, der udføres som anser forskellige typer af kræft som helhed med henblik på at identificere deres tilsvarende eller distinkte proteom ekspressionsmønstre og klassifikationsselskaber funktioner.

I denne undersøgelse, foreslog vi en beregningsmæssige arbejdsgang at kunne bruge 23 proteiner til at klassificere patientprøver i ti hovedtyper kræft. Først, vi delte tilfældigt de 3467 prøver fra ti typer af kræft i et træningssæt med 2775 prøver og en uafhængig test sæt med 692 prøver. Andelene af hver kræft typen var ens i sættet uddannelse og uafhængige test sæt. Så med træningssættet, alle funktioner til karakteristiske grupper rangeret af mrmr (minimum Redundans Maximum Relevans Feature Selection) kriterier. Med 10-fold krydsvalidering på træningssættet, at SMO (Sequential minimal optimering) og IFS (inkremental Feature Selection) [7] metoder blev anvendt til at vælge en optimal funktion sæt. I alt 23 proteiner blev valgt fra træningssættet. Deres MCC (Matthews Correlation Coefficient) til uddannelse sæt var 0,904 evalueret af 10 gange krydsvalidering, og deres MCC på det uafhængige test sæt var 0,936. Vores metoder kunne give klinikere med viden om centrale distinkte biokemiske funktioner i cancertyper og kunne kaste nyt lys over opdagelser af specifikke biomarkører for forskellige typer af kræft.

Materialer og metoder

datasæt

De RPPA data blev hentet fra TCPA (The Cancer Proteome Atlas) database [8] (https://app1.bioinformatics.mdanderson.org/tcpa/_design/basic/download.html under Pan-Cancer 11 RBN ), som indeholdt proteomisk udtryk for 3467 kræftpatienter i 11 cancertyper (tabel 1). Fordi COAD (Colon adenocarcinom) og LÆS (endetarm adenocarcinom) deler lignende patologier og analyseret sammen i TCGA (The Cancer Genome Atlas) tyktarm og endetarmskræft undersøgelse [9], vi kombineret de COAD og LÆS prøver sammen som ‘Colon adenocarcinom og endetarmen adenocarcinom ‘prøver. Derfor blev ti kræftformer analyseret i følgende trin.

Fordi vi ikke har en anden kohorte til at gøre multi-center validering, vi delt tilfældigt de 3467 prøver til et uddannelse sæt med 2775 prøver og en uafhængig test sæt med 692 prøver. Forholdet mellem uddannelse prøver i løbet af prøveemner var ca. 4: 1 og vi holdt andelen af ​​hver kræftform nogenlunde det samme i sættet uddannelse og uafhængige test sæt. Beskrivelsen af ​​de ti cancertyper og deres stikprøvestørrelser i er givet i tabel 1. uddannelse og test datasæt findes i S1 File.

Hver prøve indeholdt 187 proteiner, hvis udtryk blev målt med omvendt fase protein array (RPPA). RPPA er et protein array, der muliggør måling af protein-ekspressionsniveauer i et stort antal prøver samtidigt på en kvantitativ måde, når høj kvalitet antistoffer er tilgængelige [4]. De 187 protein-ekspressionsniveauer blev betragtet som 187 funktioner, der skal anvendes til klassifikationer cancertypen i denne undersøgelse.

Feature udvælgelse

Ekspressionsniveauerne for 187 proteiner kan ikke alle ligeligt til klassificeringen . Den maksimale relevans minimum redundans (mrmr) metode [10-13] blev ansat til at rangere betydningen af ​​de 187 funktioner i træningssættet. De 187 funktioner kan bestilles ved hjælp af denne metode i henhold til hver funktion relevans til målet og i henhold til redundans blandt de funktioner selv.

Lad Ω betegner hele sættet af 187 funktioner, mens Ω

s

betegner den allerede valgte funktion sæt, som omfatter m funktioner og Ω

t

betegner den til-være-valgte funktion sæt, som omfatter n funktioner. Relevansen

D

af funktionen

f

i Ω

t

med kræft klasser

c

kan beregnes ved:

(1)

Og redundans

R

af funktionen

f

i Ω

t

med de allerede udvalgte funktioner i Ω

s

kan beregnes ved: Hotel (2)

for at få funktionen

f

j

i Ω

t

med maksimal relevans med kræft klasser

c

minimum redundans med de allerede udvalgte funktioner Ω

s

, ligning (1) og ligning (2) kombineres som mrmr funktion: Hotel (3)

funktionen evalueringen vil fortsætte 187 runder. Efter disse evalueringer, en rangeret liste over funktioner

S

af mrmr metode kan der opnås: Hotel (4)

Funktionen indeks h viser vigtigheden af ​​funktionen. En funktion med en mindre indeks h viste, at det havde en bedre afvejning mellem den maksimale relevans og den mindste redundans, og det kan bidrage mere i klassificeringen.

Baseret på den rangeret funktionen listen i mrmr tabellen vedtog vi Incremental Feature Selection (IFS) metoden [14, 15] for at bestemme den optimale feature sæt, eller en, der opnår den bedste klassificering ydeevne. For at udføre denne metode blev funktioner i mrmr tabellen tilføjet en efter en fra højere til lavere rang.

Når en anden funktion var blevet tilføjet, en ny funktion sæt blev genereret. Og vi får 187 indslag apparater, og i’te feature sæt er: Hotel (5)

Baseret på hver af de 187 indslag apparater, blev klassificører bygget og testet på den uddannelse, sæt med validering 10-fold cross . Med Matthews Correlation Coefficient (MCC) af 10-fold krydsvalidering beregnet på træningssæt, får vi en IFS tabel med antallet af funktioner, og ydeevnen af ​​dem.

S

optimale er den optimale feature sæt, der opnår det højeste MCC på træningssæt. Til sidst, modellen blev bygget med funktioner fra

S

optimal på træningssæt og hævet på testsættet.

Prediction metoder

Vi tilfældigt inddelt hele datasæt i et træningssæt og en uafhængig test sæt. Træningssættet blev yderligere opdelt i 10 lige store partitioner. Den 10-fold krydsvalidering på træningssættet blev anvendt til at vælge de funktioner og opbygge forudsigelsesmodel. Det konstruerede forudsigelse model blev testet på det uafhængige test sæt. Rammerne for model konstruktion og evaluering blev vist i figur 1.

Først vi tilfældigt opdelt hele datasæt i et træningssæt og en uafhængig test sæt. Derefter blev træningssættet yderligere opdelt i 10 lige store partitioner at udføre 10-fold krydsvalidering. Baseret på træningssættet blev trækkene udvalgt og forudsigelsen Modellen blev bygget. Til sidst blev den beregnede forudsigelse model testet på det uafhængige test sæt

Vi forsøgte følgende fire machine learning algoritmer:. SMO (Sekventiel minimal optimering), IB1 (Nærmeste nabo Algoritme), Dagging, RandomForest (Random Forest), og valgt den optimale én til at konstruere klassificeringen. Den korte beskrivelse af disse algoritmer var som nedenfor.

SMO metoden er en af ​​de populære algoritmer til træning support vektormaskine (SVM) [16]. Det bryder optimeringsproblemet af en SVM i en serie af de mindst mulige delproblemer, som derefter løses analytisk [16]. For at tackle multi-klasse problemer, parvis kobling [17], anvendes til at opbygge den multi-klassen klassifikator.

IB1 er en nærmeste nabo klassifikator, hvori den normaliserede euklidiske afstand anvendes til at måle afstanden mellem to prøver . For en forespørgsel testprøve, er klassen af ​​trænings prøve med minimumsafstand tildelt denne prøve som den forudsagte resultat. For yderligere oplysninger henvises til Aha og Kibler undersøgelse [18].

Dagging er en meta klassifikatør der kombinerer flere modeller stammer fra et enkelt læring algoritme, der anvender adskilte prøver fra træningen datasæt og integrerer resultaterne af disse modeller ved flertalsafgørelser [19]. Antag at der er en uddannelse datasæt indeholdende

n

prøver.

k

delmængder konstrueres ved tilfældigt at tage prøver i uden erstatning sådanne, at hver af dem indeholder

n

‘prøver, hvor

kn

‘ ≤

n

. En udvalgt grundlæggende læring algoritme er uddannet på disse

k

delmængder, hvorved der induceres

k

klassifikationsmodeller

M

1,

M

2, …,

M

k

. For en forespørgsel prøve,

M

i

(1≤

i

k

) giver en forudsige resultatet og det endelige forudsagt resultat af Dagging er klassen med flest stemmer.

Random Forest algoritme blev først foreslået af Loe Breiman [20]. Det er et ensemble indikator bestående af formere beslutning træer. Antag der er

n

prøver i uddannelsen sæt og hver prøve var repræsenteret af

M

funktioner. Hvert træ konstrueres ved tilfældigt at udvælge

N

, med udskiftning, fra træningssættet. Ved hvert knudepunkt, tilfældigt vælge

m

funktioner og vælge den optimerede split til at vokse træet. Efter konstruere formere beslutningstræer, det forudsagte resultat af en given prøve er den klasse, der modtager flest stemmer fra disse træer.

Matthews Korrelationskoefficient (MCC)

MCC [21], en afbalanceret måle selv om klasserne er af meget forskellig størrelse, er ofte bruges til at evaluere resultaterne af forudsigelse metoder på et problem to-klasse klassificering. For at beregne MCC, må man regne fire værdier: sande positive (TP), falsk positive (FP), sande negative (TN) og falsk negative (FN) [22, 23]. Derefter kan MCC beregnes ved Hotel (6)

Men mange problemer involverer mere end to klasser, siger

N

klasser kodet af 1,2, …,

N

(

N

2). I dette tilfælde kan vi beregne MCC for klasse

jeg

til dels måle effektiviteten af ​​forudsigelse metoder ved at tælle TP, FP, TN og FN som følgende måder:

TP

i

: antallet af prøver, således at klasse

jeg

er deres forudsagte klasse og sande klasse

FP

i

: antallet af prøver således at klasse

jeg

er deres forudsagte klasse og klasse

jeg

er ikke deres sande klasse;

TN

i

: antallet af prøver således at klasse

jeg

hverken deres forudsete klassen eller deres sande klasse;

FN

i

: antallet af prøver, således at klasse

jeg

ikke deres forudsete klasse og klasse

jeg

er deres sande klasse.

Derfor MCC for klasse

jeg

, betegnet MCC

jeg

, kan beregnes ved Hotel (7)

Men disse værdier kan ikke helt måle effektiviteten af ​​forudsigelse metoder, den generelle MCC i multiklassefonde tilfælde stadig er nødvendig. Heldigvis Gorodkin [24] har rapporteret MCC i multiklassefonde sag, som blev brugt til at evaluere resultaterne af de i afsnittet “Prediction metoder” forudsigelse metoder. Samtidig vil MCC for hver klasse også gives som referencer. Her gav vi den korte beskrivelse af den samlede MCC i multiklassefonde tilfælde som nedenfor.

Antag at der er en klassifikation problem på

n

prøver, siger

s

1,

s

2, …,

s

n

, og

N

klasser kodet af 1,2, … ,

N

. Definer en matrix

Y

med

n

rækker og

N

kolonner, hvor

Y

ij

= 1, hvis

jeg

th prøve tilhører klassen

j

Y

ij

= 0 ellers. For en klassificering model, kan dens forudsagte resultater på problemet være repræsenteret af to matricer

X

og

C

, hvor

X

har

n

rækker og

N

kolonner, (8) og

C

har

N

rækker og

N

kolonner,

C

ij

er antallet af prøver i klassen

jeg

der er blevet forudsagt til at være klasse

j

.

for Matricer

X

og

Y

, deres kovarians funktion kan beregnes ved (9) hvor

X

k

og

Y

k

er

k

th kolonne af matricer

X

og

Y

henholdsvis og er middelværdien af ​​tal i

X

k

og

Y

k

hhv. Derefter kan MCC i multiklassefonde tilfælde beregnes af følgende formulering [25]:

(10)

Ligesom MCC i to klasser tilfælde, MCC i multiklassefonde tilfælde i området mellem -1 og 1, hvor 1 angiver den perfekte klassificering, -1 den ekstreme misklassifikation.

resultater og diskussion

de mrmr og IFS resultater

Ved at bruge den maksimale relevans minimum redundans (mrmr) metoden, 187 funktioner blev rangeret efter vigtighed i træningssættet. Resultatet af mrmr tabellen kan findes i S2 Fil.

Under IFS fremgangsmåde blev hvert protein funktion tilføjet en efter en. Klassificeringen MCC som blev opnået ved fire beregningsmetoder, på træningssættet evalueret ved 10 ganges validering indlægget er præsenteret i S3 Fil. Vi afbildet klassificeringen MCC’er som figur 2 fra dataene i S3-fil. Det kan observeres, at de højeste MCC’er for SMO, IB1, Dagging og RandomForest var 0,985, 0,937, 0,969 og 0,925, hvilket indikerer SMO kan anvendes til at konstruere en optimal klassifikator. Ved omhyggeligt at kontrollere de forudsagte resultater af SMO, kan det ses, at ved hjælp af de øverste 23 proteiner, MCC nåede 0,904, som var den første rækkevidde ovenfor 0.900. Med flere proteiner, har MCC ikke stige ret meget. Derfor, i dette studie, vi overvejet de 23 proteiner som den optimale feature sæt, og disse 23 proteiner blev betragtet som de vigtigste proteiner i at klassificere disse ti typer af kræft. Vi evaluerede deres forudsigelse præstationer på uafhængige test sæt og MCC var 0,936. MCC for hver kræft type kan findes i S3-fil.

Plot at vise MCC’er af de forskellige klassificører konstrueret med forskelligt antal af protein funktioner udvalgt fra mrmr bordet under IFS processen på træningssæt. Da de første 23-proteinerne blev udvalgt, MCC nåede 0,904, som var den første rækkevidde ovenfor 0.900 og med mere protein funktioner, har MCC ikke stige meget. Vi overvejede de 23 proteiner som de væsentligste proteiner til klassificeringen.

De udvalgte top 23 proteiner til at skelne cancertyper

Den valgte top 23 proteiner er opsummeret i tabel 2. Disse proteiner kan spille vigtige roller i at klassificere de ti forskellige kræftformer. De fleste af disse proteiner er blevet rapporteret at være forbundet med visse tumorer. For eksempel har Claudin-7 blevet rapporteret at være overudtrykt i brysttumorer [26] og nedreguleret i hoved og hals-carcinomer [27]. Tigar er opreguleret i colon tumorer [28]. Gene forstærkning af ESR1 forekommer hyppigt med brystkræft [29]. PREX1 er højt udtrykt i prostatacancer [30]. Således er vores resultater yderligere bekræftet af disse tidligere resultater. Nedenfor vil vi diskutere den biologiske betydning af de 23 proteiner i detaljer baseret på gen-funktion, celle veje og biologiske funktioner, som kan kaste lys over forskellene i forskellige kræftformer i protein udtryk niveauer. Vi primært diskutere disse gener i afsnit ifølge Robert A. Weinburg s [31]. For nogle gener, som ikke gælder for kræft er kendetegnende, forsøger vi at sætte disse gener med lignende funktioner sammen til diskussion (se figur 3).

De 23 udvalgte proteiner tilskrives syv afsnit primært baseret på kendetegnende for kræft . For dem, der ikke er forbundet med kræftrelaterede veje, vi sætter gener med tilsvarende funktioner sammen for at diskutere.

Forebyggelse celledød er afgørende for udvikling af kræft, fordi kræftceller ofte resistente over for apoptotisk signalering forårsaget af DNA-beskadigelse og andre faktorer. I vores resultater, fandt vi et gen, der er relateret til apoptotisk maskiner og kunne anvendes til at skelne mellem forskellige kræftformer. Her diskuterer vi NDRG1, samt tidligere resultater, der viser dens forhold til kræft. NDRG1 (N-myc nedstrøms reguleret gen 1) er et phosphoryleret protein [32], der kan aktiveres af tumorsuppressorgen p53 og nødvendig for induktionen af ​​p53-medieret apoptose i coloncancercellelinie [33]. Fordi NDRG1 protein har en afgørende rolle i inhibering primær tumorvækst, er velkendt som en metastase suppressor i en række cancere, herunder tyktarms-, prostata- og brystcancer [34].

replikativ udødelighed er en vigtig kendetegnende for cancer, som er almindeligt anerkendt som dereguleret celleproliferation. Vores resultater på flere vigtige cellecyklus-relaterede gener i udvalgte proteiner illustrerer ikke kun betydning for udvikling af kræft, men er også første gang brugt som indikatorer for klassificering kræft. Disse cellecyklus-relaterede gener behandles nedenfor: cyclin B1 har en rolle i reguleringen af ​​cellecyklus: før indtastning mitose, celler flip mellem G2 og mitose, indtil der er tilstrækkelig ophobning af cyklin B at støtte CDK1 aktivitet [35]. Fejl-udtrykt cyclin B1 i kernen er blevet fundet i en meget stor andel af celler af visse neoplasmer, og cyclin B1 er blevet betragtet som en potent prognostisk faktor i human brystcarcinoma og pladecellecarcinom [36]. Cyclin E1, som kodes af CCNE1, er et af medlemmerne af cyclin familien, som kontrollerer cellecyklus processer ved dramatisk hyppighed overflod. For nylig, en genom-dækkende sammenslutning undersøgelse viste, at rs8102137 i CCNE1 genet er associeret med blærecancer [37]. Meta-analyse viser også, at der er over-ekspression af dette protein med brystcancer [38]. Chk2 (checkpoint kinase 2), som en serin /threoninproteinkinase, kunne svare på DNA beskadigelse for at opretholde genomisk integritet [39]. Det er blevet vist, at Chk2 spiller en vigtig rolle i proliferationen af ​​cancerceller [40], tiltrækker meget opmærksomhed på at kunne udgøre et anticancerlægemiddel design target [41].

Det er klart, at invasion er kendetegnende for kræft, selv om de underliggende mekanismer er stadig en gåde. Indtil nu, gevinsten og tab af celle-celle vedhæftede proteiner er de vigtigste årsager af invasion, især tabet af E-cadherin [31]. I vores resultater, er E-cadherin og nogle polaritet-relaterede proteiner fundet at kunne anvendes til at skelne mellem forskellige kræfttyper. Disse proteiner behandles nedenfor: E-Cadherin, som typen-1 klassisk cadherin, medierer celle-interaktioner. Tumorprogression er ofte forbundet med tabet af E-cadherin-funktion, hvilket fører til en mere motile og invasiv fænotype [42]. PREX1 (phosphatidylinositol-3,4,5-triphosphat-afhængig Rac udveksling faktor) er højt udtrykt i prostatacancer, hvilket indikerer et forhold mellem celleinvasion og dets ekspression [30]. I melanomer blev PREX1 overekspression forbundet til aktivering af ERK-MAPK signalering og kræves til effektiv melanoblast metastase samt for migration [43]. Claudin-7, en fælles transmembrant protein, spiller en afgørende rolle i dannelsen og vedligeholdelsen af ​​permeabiliteten i polariserede epithelceller [44]. Den afvigende Claudin-7 udtryk profil er blevet fundet i forskellige tumorer, såsom højt induceret Claudin-7-ekspression i både primær og metastatisk brystkræft, [26] men det er nedreguleret i hoved og hals karcinomer [27]. Disse tidligere studier understøttes yderligere vores resultater, at Claudin-7 kan anvendes som biomarkør for differentieringen og klassificering af forskellige tumorer. Rab-25, som et medlem af familien af ​​Rab GTPaser, Rab-25 er en grundlæggende aktiv Rab GTPase, der spiller en afgørende rolle i apikale genvindings- og transcytose omsætningsveje i polariserede epithelceller. Fordi tab af cellepolaritet er en væsentlig kendetegnende for kræft, Rab-25 relateret handel har en vigtig indflydelse på epitelcelle polaritet program i kræft progression [45].

anomale kræftcelle energi metabolisme blev først observeret af Otto Warbugy i 1930 og er blevet accepteret som et adelsmærke for kræft. Unormal fedtsyrer syntese som en form for energi stofskiftet findes i mange cancerceller [46]. Her er flere vigtige fedtsyre og glycolytiske metabolisme gener fundet i de udvalgte 23-proteiner: FASN er et nøgleenzym, der er påkrævet for de novo syntese af fedtsyre. Det har vist sig, at FASN ekspression og aktivitet unormalt er forhøjede i mange typer af humane cancere, der kan bidrage til cellulær resistens over for lægemiddelresistente og stråleinduceret apoptose [46]. ACC1 er et hastighedsbegrænsende enzym i de novo fedtsyrer syntese. Det synes at være den begrænsende enzym i prolifererende cancerceller. ACC1 har vist sig at være opreguleret i prolifererende cancercellelinier, såsom prostata-, bryst- og leveren. Faktisk er det blevet vist, at knock-down af ACC1 af siRNA fremmer apoptose i prostatakræft og brysttumorceller, men ikke i kontrol noncancerous celler, hvilket understreger kræftcellernes højere afhængighed af dette enzym end normalt væv [47]. AMPK (AMP-aktiveret protein kinase, kodet af genet PRKAA1 /2) spiller en afgørende rolle i sensing tilgængelig energi og koordinere eksterne vækstsignaler med cellulær metabolisme [48]. Et fald af AMPK signalering, hovedsagelig forårsaget af tab af funktion gen STK11, kunne føre til øget aktivering af mTOR og et skift mod glycolytisk metabolisme, som findes i en række forskellige cancere, herunder NSCLC [49] og livmoderhalskræft [50] .

Unormal udtryk for hormonreceptorer ofte vist i sex-relaterede kræftformer, såsom brystkræft og prostatakræft. Tre hormonreceptorer er også rapporteret i de udvalgte proteiner: progestinreceptoren (PR), som et nukleart steroid receptor, har en høj specificitet for binding progesteron [51]. Det er blevet vist i litteraturen, at PR hæmmer overgangen fra G1 til S i cellecyklus og fremme apoptose i endometriecancer-celler [52]. I GOG119 fase II forsøg, kunne en østrogen surrogat navngivne tamoxifen forbedre progestin aktivitet for at fremkalde PR og helbrede endometrie patienter [53]. Østrogenreceptor (ER, aktiveret af hormonet østrogen) er en af ​​de vigtigste terapeutiske mål i brystcancer, eftersom korrelationen mellem ER-ekspression og cellulært respons på østrogen [54]. Det er blevet rapporteret, at genamplifikation af ESR1 ofte forekomme med brystcancer [29]. Androgen receptor (AR, NR3C4) menes at alene mægle alle de biologiske virkninger af endogen, fungerer primært i reguleringen mandlige udvikling. På grund af den stærke forbindelse mellem ARs og prostatacancer, androgen antagonister eller androgen deprivation terapi er blevet anvendt til at hindre cancercelleproliferation af patienter med androgen-afhængig prostatacancer i klinisk behandling [55].

overraskende blandt disse 23 udvalgte proteiner, der bruges til at skelne mellem forskellige kræftformer, α-tubulin og GAPDH er ofte anvendt som kontroller i Western blot-analyse. I den følgende del vil vi diskutere kendte resultater om α-tubulin og GAPDH, der egner tiltro til gyldigheden af ​​vores resultater for deres betydning at skelne kræft. For eksempel, både a- og p- tubulin proteiner er ansvarlig for at samle mikrotubuli (MTS, cytoskeletale polymere strukturer), og visse posttranslationelle modifikationer. Den acetylering af α-tubulin (Lys-40) [56] kunne ændre dynamiske opførsel MTS, hvilket kan føre til ændringer i biologiske funktioner, som MT’er udfører under celledeling, migration og intracellulær handel. Idet de dynamiske parametre i betragtning, MT’er tilvejebringe et attraktivt mål for kemoterapi mod hurtigt voksende tumorceller såsom i lymfom og leukæmi, metastatiske cancere, og langsomtvoksende tumorer i bryst, ovarie og lunge [57, 58]. I det seneste årti, blev GAPDH (glyceraldehyd-3-fosfat dehydrogenase) betragtes som en husholdning gen og var som en kontrol for lige belastning under den eksperimentelle proces. Det er imidlertid blevet vist, at GAPDH-ekspression varierer forskellige typer af væv. Endvidere GAPDH-ekspression varierer på grund af oxygenspænding [59], og ekspressionsniveauerne af GAPDH varierer i fallopian rør cancere og ovariecancere [60]. På grundlag af GAPDH forkærlighed for AU-rige elementer, er det blevet vist, at GAPDH kan binde til CSF-1 3’UTR at stabilisere mRNA [60]. For at opsummere, der kombinerer alle de beviser, tubulin proteiner og GAPDH kan bringe et nyt perspektiv på kræft studier, og det foreslås, at de ikke anvendes som kontrol i western blot analyse af forskellige former for kræft.

Andet valgt proteiner indbefatter phosphataser, transskriptionelle aktivatorer, linker-proteiner og transferrinreceptorer: GATA3 er en transkriptionel aktivator med høj ekspressionsniveauer [61] og den tredje hyppigst muterede gen i brystcancer [62]. Således har GATA3 vist sig at være en nyttig immunohistokemisk markør til at forudsige tumor tilbagefald tidligt i udviklingen af ​​brystcancer. PEA15, som et multifunktionelt linker protein hovedsageligt udtrykkes i cellerne i nervesystemet, såsom astrocytter [63], kontrollerer en række cellulære processer, såsom celleoverlevelse, proliferation, migration og adhæsion [64]. PEA15 funktioner forskellige kræftformer, indgå glioblastom, astrocytom, og malkeorganer, samt hudkræft. PEA15 kan have både anti- (i ovariecancer [65]) og pro- (glioblastom [66]) tumorigene funktioner, afhængigt af dens interaktioner. TFRC er en transferrin receptor. Det er en stor jern importør i de fleste mammale celler. Det er blevet vist, at TFRC proteiner øges i bryst-, malign pancreascancer, og andre kræftformer [67, 68]. PKCa kodes af PRKCA genet og er en serin- og threonin- specifikke kinase. Dette gen udtrykkes kraftigt i flere cancertyper, og den høje aktivering af PKCa er blevet identificeret til at fremme tilblivelsen af ​​brystcancer [69].

Be the first to comment

Leave a Reply