PLoS ONE: Integrativ Proteomics og Tissue Microarray profilering Angiv associering mellem overudtrykt Serum Proteiner og ikke-småcellet Cancer

Abstrakt

Lungekræft er den hyppigste årsag til kræftdødsfald i hele verden. Klinisk kan behandling af ikke-småcellet lungekræft (NSCLC) forbedres ved tidlig påvisning og risiko screening blandt befolkningen. For at imødekomme dette behov, her beskriver vi anvendelsen af ​​omfattende fraktionering peptid niveau kombineret med label gratis kvantitative proteomics for opdagelsen af ​​potentielle serum biomarkører for lungekræft, og brugen af ​​Tissue microarray analyse (TMA) og Multiple (MRM) assays reaktion overvågning for følgende op valideringer i kontrollen fase. Ved hjælp af disse state-of-art, i øjeblikket tilgængelige kliniske proteom tilgange, i opdagelsen fase vi trygt identificeret 647 serumproteiner, og 101 proteiner viste en statistisk signifikant sammenhæng med NSCLC i vores 18 opdagelse prøver. Denne serum proteomisk datasæt tilladt os at skelne den differentierede mønstre og unormale biologiske processer i lungekræft blod. Af disse proteiner, Alpha-1B-glycoprotein (A1BG) og leucin-rige alpha-2-glycoprotein (LRG1) blev to plasma glycoproteiner med hidtil ukendt funktion valgt som eksempler, for hvilke TMA og MRM verifikation blev udført i en stor stikprøve bestående omkring 100 patienter. Vi viste, at A1BG og LRG1 blev overudtrykt i både blodniveauet og tumorsnit, som kan omhandlede separate lungekræftpatienter fra raske tilfælde

Henvisning:. Liu Y, Luo X, Hu H, Wang R, Sun Y, Zeng R, et al. (2012) Integrativ Proteomics og Tissue Microarray profilering Angiv associering mellem overudtrykt Serum Proteiner og ikke-småcellet lungekræft. PLoS ONE 7 (12): e51748. doi: 10,1371 /journal.pone.0051748

Redaktør: Giuseppe Viglietto, University Magna Graecia, Italien

Modtaget: Juni 25, 2012; Accepteret: 5. november 2012; Udgivet: December 19, 2012 |

Copyright: © 2012 Liu et al. Dette er en åben adgang artiklen distribueres under betingelserne i Creative Commons Attribution License, som tillader ubegrænset brug, distribution og reproduktion i ethvert medie, forudsat den oprindelige forfatter og kilde krediteres

Finansiering:. Dette projekt blev støttet af tilskud fra Ministeriet for Videnskab og Teknologi (2010CB912100, 2011CB910200), National Natural Science Foundation of China (91.029.301, 30.821.065, 81.101.760, 81.172.218, 81.101.761), Videnskab og Teknologi Kommissionen for Shanghai kommune (09JC1416302), Chinese Academy of Science Projekt (KSCX2-YW-R-106, KSCX1-YW-02), Fudan University (09FQ78) og Fudan University Cancer Hospital (YJ200804, YJ200701). De finansieringskilder havde ingen rolle i studie design, indsamling og analyse af data, beslutning om at offentliggøre, eller forberedelse af manuskriptet

Konkurrerende interesser:.. Forfatterne har erklæret, at der ikke findes konkurrerende interesser

Introduktion

Lungekræft er den hyppigste cancer i verden, både med hensyn til forekomst og dødelighed. Ikke-småcellet lungekræft (NSCLC) tegner sig for 80-85% af lungekræft med en samlet 5-års overlevelse mindre end 14% [1]. Konkret 5-års overlevelse er knap 3% til 7% for trin IIIB, og er mindre end 1% for stadie IV sygdom [2]. Men patienter diagnosticeret på et tidligt tidspunkt og har kirurgi erfaring en 86% samlet 5-års overlevelse [3]. Derfor er der behov ny diagnostik til at detektere tidligt stadium lungekræft, fordi det kan hærdes med kirurgi. Flere potentielle protein-signaturer, såsom carcinoembryonisk antigen, CYFRA21-1, plasmakallikrein B1 og neuron-specifik enolase er blevet opdaget og klinisk anvendt som biomarkør kandidater til lungekræft. Men ingen af ​​dem viste nok følsomhed, specificitet eller reproducerbarhed [4]. Derfor er et presserende behov for biomarkører for tidlig diagnosticering af lungekræft.

Molekylære biomarkører for tidlig påvisning af lungekræft kan antage mange former. Histologiske biomarkører er altafgørende, fordi de kan være direkte forbundet med de patologiske forandringer, risikoen for sammentrækning, tilstedeværelsen eller den fase af sygdommen. De menes at have potentiale til at skelne mellem de forskellige molekylære sygdomsmekanismer af NSCLC. På den anden side, serum biomarkører for lungekræft er endnu mere tiltalende, fordi blodet er let tilgængelig og menes at erhverve proteiner udskilt, skur, eller på anden måde frigøres fra væv, hvorigennem blodet cirkulerer. Selv nogle moderate rigelige plasmaproteiner kan være indikatorer for særligt organ status og er blevet rapporteret til at svinge som reaktion på visse typer sygdomme [5].

I øjeblikket er de sygdomsfremkaldende drevet proteomics baseret på massespektrometri er blevet indført til opdagelsen af ​​både histologiske og serologiske biomarkører. Trods betydningen af ​​serum biomarkører, har en af ​​de store tekniske udfordringer været, at blod proteom er yderst kompleks, der spænder over et koncentrationsområde på mindst ti størrelsesordener. Det forventes, at effektive udtynding metoder og flerdimensionelle fraktionering systemer kan være nyttigt at adskille lav hyppighed proteiner og udvide af detektionsgrænsen [6]. Heri, brugte vi en omfattende fraktionering på peptid-niveau for at profilere albumin udtømte serum proteom ved en unik integreret multidimensional væskekromatografi (IMDL) system udviklet i vores [7] lab. En anden teknik hurdle er, hvordan man hurtigt og effektivt sammenligne protein niveauer på tværs væv eller plasmaprøver. Normalt disse prøver er ikke kompatible med in vivo stabil isotop strategi MS-baserede kvantificering mærkning. Sekventielt er in vitro-strategier mærkning såsom iTRAQ [8] og acrylamid isotoper [9] fremstår som alternativer. Ikke desto mindre er disse teknikker har begrænsninger forbundet med omkostninger, som regel mindre proteomet dækning på grund af mærkning selektivitet, anvendelighed og forskelle i mærkning effektivitet. I denne undersøgelse, vi derfor udnyttet en enkel og robust label-fri kvantificering (LFQ) strategi ved spektral optælling i opdagelsen fase. Desuden har det presserende behov for reproducerbar MS-analyse førte til udviklingen af ​​overvågning multipel reaktion (MRM) -teknik. Denne teknik kan anvendes til at måle protein-koncentrationer i kliniske plasmaprøver når de integreres med syntetiserede peptid standarder og absolut kvantificering analyse (AQUA). Bedre selektivitet, følsomhed og dynamikområde kan opnås ved MRM, som er afgørende for klinisk validering [10].

Formålet med denne undersøgelse er for det første at bruge shotgun proteomics til direkte skelne forskellen serum proteommønstrene forbundet med NSCLC sygdomme, for at forstå de regulerede serumproteiner med hensyn til deres biologiske relevans såsom molekylære aktiviteter, og at etablere en database over serum indikatorer for NSCLC. Dels at validere vores opdagelse indsats, valgte vi to nye biomarkør kandidater -A1BG og LRG1-, ved hjælp af traditionelle verifikation tilgange, såsom konventionel western blotting og /eller væv microarray (TMA), samt MRM målinger i større prøve kohorter.

Metoder

Etik og Indsamling af serumprøver

Blodprøver fra nydiagnosticerede patienter blev opnået, før en behandling på Institut for thorax kirurgisk på Shanghai Cancer Hospital. Inklusionskriterierne af motiver bestod af bekræftet diagnose af NSCLC, ingen fjernmetastaser eller andre kirurgiske kontraindikationer. De skriftlige informerede samtykke blev leveret af alle de involverede i denne undersøgelse individer. Anonyme prøver fra patienter blev udvalgt tilfældigt. Denne undersøgelse er godkendt af den institutionelle gennemgang bestyrelse Fudan University Shanghai Cancer Center.

Serumprøver blev indsamlet og behandlet ved hjælp af den samme standardiserede protokol. Kort fortalt blev blodprøver efterladt til at koagulere ved stuetemperatur i 30 min, centrifugeret ved 3.000 g i 20 minutter (4 ° C), og supernatanterne blev opsamlet, gjort til alikvoter og opbevaret i -80 ° C indtil analyse. Tidsintervallet mellem forarbejdning og frysning var ikke mere end 2 timer for hver prøve. Ingen af ​​prøverne blev optøet mere end to gange, før analysen.

Delipidering og albumin udtynding i serumprøver

delipidering og albumin udtynding i opdagelsen fase blev ændret i overensstemmelse med tidligere rapporterede protokoller [11] , [12]. Kort fortalt, for hver prøve blev 50 pi rå serum fortyndet med 250 pi buffer (100 mM NaCl, 10 mM HEPES, pH 7,4) og centrifugeret ved 10.000 g i 30 min gennem et 0,22 um filter (Millipore) for at fjerne lipider. Dernæst blev 260 pi delipiderede serum udfældet med 180 pi præ-kølet ethanol (Sigma), inkuberet i en time ved 4 ° C under forsigtig blanding og centrifugeret ved 16.000 g i 45 min. De albumin-fjernet pellets blev opsamlet, lyofiliseret og resuspenderet i 100 pi lysepuffer indeholdende 8 M urinstof, 4% CHAPS, 40 mM Tris-base, 65 mM DTT og protease inhibitor cocktail (Roche, Ltd.).

i-opløsning protein fordøjelse

proteinblandinger blev inkuberet med 10 mM dithiothreitol (DTT) ved 37 ° C i 2,5 timer, og carbamidomethylated med 20 mM iodacetamid (IAA) i 45 minutter ved stuetemperatur i mørke. De alkylerede proteinopløsninger blev udfældet ved fem volumener præ-kold acetone /ethanol (01:01, v /v) med 0,1% eddikesyre ved -20 ° C i 12 timer [13]. Protein- pellets blev resuspenderet i 50 mM ammoniumchlorid-puffer (pH 8,3) og inkuberet med trypsin (25:1, Promega) i 20 timer ved 37 ° C. Spaltede peptider blev lyofiliseret og opbevaret ved -80 ° C i massespektrometrianalyse.

Online todimensional MS /MS-analyse af integrerede multidimensional væskekromatografi

Den omfattende fraktionering for serum-peptider blev udført på vores Integrated multidimensional væskekromatografi (IMDL) systemet som tidligere beskrevet [7]. Dybest set blev en tofaset integreret søjle anvendes til at opnå on-line todimensional HPLC-adskillelse. Denne integrerede kolonne omfattede en stærk kation-søjle (SCX, 320-um id, 50-mm længde, kolonne Technology Inc., CA) og et omvendt fase (RP) kromatografisøjle (150-um id, 100-mm længde, Column Technology Inc.). Peptidblandingen blev først injiceret med Surveyor autosampler (ThermoFinnigan, San Jose, CA) og derefter fraktioneret ved 11 pH trin (pH 2,5, 3,0, 3,5, 4,0, 4,5, 5,0, 5,5, 6,0, 7,0, 8,0, 8,5) under anvendelse af en serie af pH-buffere (konfigureret af 5 mM citronsyre justeret ved NH

4OH). Forskellige pH buffere blev anvendt i det integrerede søjle ved anvendelse af en fuld løkke injektion af 100 pi 3 pi /min før online-RP-HPLC-gradient. RP-HPLC anvendte opløsningsmidler var 0,1% myresyre (v /v) vandig (A) og 0,1% myresyre (vol /vol) acetonitril (B), med gradienten af ​​2 til 40% mobil fase B i 115 minutter ved 2 pl /min efter split. Et massespektrometer var et lineært ion trap LTQ (Thermo). En spænding på 3,0 kV blev påført på ESI nålen, og det normaliserede kollisionsenergi var 35,0. Antallet af ioner, der er lagret i ionfælde blev reguleret af den automatiske forstærkningsstyring. De spektre blev opnået i data-afhængige tilstand, med mulighed at 10 mest intense ioner af hver MS-spektret for MS /MS-analyse. Den dynamiske udelukkelse funktion blev fastsat som følger; gentag tæller 3, gentag varighed 0,5 min, og varigheden udelukkelse 1,5 min.

Protein identifikation

BioWorks ™ 3,2 software pakke blev anvendt til at generere peak lister over alle erhvervede MS /MS spektre ( standardparametre), som blev derefter automatisk søgt mod human International protein Index protein sekvens database (version 3.22, som indeholder 57,867 proteiner), ved hjælp af SEQUEST version 2.7 (University of Washington, licens til Thermo Finnigan) søgning program. For at estimere hastigheden af ​​forkerte identifikationer (falske positiver), blev alle de filtrerede spektre udsat for database søger mod en sammensat database, der indeholder humane proteinsekvenser i både fremad (korrekt) og omvendt (forkert) orientering [14]. I alle databasesøgninger, blev trypsin udpeget som proteasen, og kun én savnet spaltning var tilladt. Maksimal masse tolerance blev sat som 3 Da for precursor-ion og 1,0 Da for fragment-ioner. Carbamidomethylation (57,0125 Da) blev søgt som en fast modifikation på cystein, og oxidation (15,99492 Da) blev sat som en variabel modifikation på methionin. En hjemmelavet software Buildsummary blev brugt til at slette de overflødige data som tidligere defineret [15].

Proteiner blev identificeret med strenge kriterier. Konkret har vi ansat den konservative naive target-lokkedue strategi, som estimerer proteinidentifikation falsk opdagelse sats (FDR) analogt med peptid-spektrum match (PSM) FDR, dvs ved at tilnærme det forventede antal falsk positiv identifikation protein med antallet af lokkefugle protein identifikation [16]. Tærskler for Xcorr Ifølge foreløbige PSM FDR lavere end 1%, og den ultimative Protein FDR mindre end 5% blev anvendt. Alle accepterede SEQUEST resultat skal have en ΔCn score på mindst 0,1 uanset opladningstilstand [17].

Label gratis kvantificering af spektral optælling og statistik

En simpel etiket gratis kvantificering tilgang med spektral optælling blev brugt til at profilere serum proteom mellem NSCLC og kontrollere situationer [18]. Peptid-sekvens kampe tildelt hver protein gruppe blev summeret sammen og taget som grundlaget for relativ kvantificering [13], [17]. Sager i hvert kohorte blev behandlet som NSCLC-relaterede biologiske gentagelser. Vi beregnede den relative berigelse faktor, R

e, defineret som R

e = (n

f /n) /(N

f /N) for at prioritere overudtrykte og under-udtrykte proteiner [19 ]. I denne ligning, n

f er antallet af peptid-hits af et protein i en prøve, n er det samlede antal af peptid hits i denne prøve, N

f er samlede rammer antal af dette protein i alle prøver og N er det totale antal af peptid hits for alle proteinerne i alle prøver. På grundlag af R

e gennemførte vi ANOVA og Student t-test, under anvendelse af en permutation test på 200.000 gange i Pomelo II [20]. Receiver Operating Karakteristisk (ROC) blev udført af PROC pakke i R [21]. I ROC-analyse af en biomarkør panel, vi brugte logistisk regressionsmodel for at vurdere resultatet af panelet, som indarbejdet kandidaterne vi vil medtage i panelet (dvs. ved hjælp af blok indtastning af variable) sammen med sandsynligheder. Denne modellering blev udført i SPSS (v13.0). De forudsagte sandsynligheder for forekomst af begivenheden (såsom kræft eller normal) blev inkorporeret som prædiktorer i ROC plot; og areal under ROC-kurven (AUC) blev beregnet til at estimere effekten af ​​panelet [22]. Hierarkisk klyngedannelse analyse (HCA) og Principal komponent analyse (PCA) blev udført ved R software (https://www.r-project.org/) under anvendelse fraktil normaliserede værdier af logaritmisk transformerede spektrale tællinger, der er, ved transformation af log

2 (spektrale tællinger +1) for hvert serum protein i hver prøve.

Tissue microarray analyse (TMA)

immunhistokemisk (IHC) farvning blev udført under anvendelse væv microarrays indkøbt fra Shanghai overgå Biotech Co .. i korte, formalinfikserede, paraffinindstøbte snit fra 90 NSCLC patienter, der består af 44 lunge adenocarcinom (AD), 38 pladecellekræft (SCC), og 8 tilfælde af andre undertyper, blev afparaffiniseret og rehydreret. Endogen peroxidase blev standset med 3% H

2O

2 (v /v). Efter antigen-genvinding og blokering blev snit inkuberet med kanin polyklonalt anti-A1BG (1:100, LifeSpan Biosiences), kanin polyklonalt anti-USP1 (01:25, Abgent), muse monoklonalt anti-Mucin5B (01:25, Millipore) og muse monoklonalt anti-LRG1 (Dilution 1:200, Abonva) ved 4 ° C natten over. Efter en skylning med PBST løsning, blev sektionerne inkuberet sekventielt med biotinyleret sekundært antistof og ABC reagens (Vectastain), efterfulgt af behandling med DAB løsning (Shanghai Sangon Biological Engineering Technology Service Co). Endelig blev snit modfarvet med Hematoxylin QS (Vectastain). Blandt de 90 tilfælde var der kun én skive tabt under behandlingen, hvilket resulterer i 89 NSCLC sektioner gældende med deres parrede ikke-tumor kontroller.

IHC slides blev revideret af to patologer (XL, og HC), blindet for alle clinicopathologic data. Resultater blev midlet ved deres uafhængige evalueringer, og scoret ved at skønne (P) af celler viser karakteristiske farvning (fra målbart niveau eller 0%, til homogen farvning eller 100%) og ved at estimere intensiteten (I) af farvning (0, ingen visuel farvning, 1, svag farvning, 2, moderat farvning, eller 3, stærk farvning). Procentdelen blev bestemt ved den andel af alle de positive celler, uden intuitive domme celletyper. De procentvise værdier blev derefter kollapsede i en P score fra 0 til 9, svarende til de varierer fra 0-5%, 5-15%, 15-25%, 25-35% til 85-100% endelig. Som vi foreslog i et tidligere studie [13], blev den relative proteinekspression i histologisk niveau scoret ved at gange P score ved intensiteten værdi, jeg, dvs. den såkaldte hurtig score (Q) (Q = P × I; minimum = 0 og maksimum = 27).

Western blotting

Vi udførte western blot analyse i 12 tilfældigt udvalgte trillinger af normal, AD og SCC sera. Proteinprøver blev opløst på en 12% polyacrylamidgel og overført til PVDF-membran (Pall Inc.). Kanin polyklonale anti-A1BG (LifeSpan Biosiences) blev fortyndet som producentens anvisninger og anvendt til at probe blottet. Immunodection blev realiseret anvendelse af ECL plus reagenser (Amersham Biosciences) og blev udsat for røntgenfilm (Kodak). Efter afsluttende WB billeder erhvervet, et billede software med navnet Multi Gauge (v3.0, FUJI FILM CO. LTD) blev anvendt til at udtrække protein udtryk data fra IOD værdi.

LC-MRM måling

Fire isotopiske peptider tildelt A1BG og LRG1 (to pr hvert protein) blev syntetiseret ved anvendelse af standard Fmoc kemi indarbejdet med ren, tung [

13C

6] Leucin (Sigma-Aldrich). Umærkede [

12C] former af hvert peptid blev også syntetiseret (GL Biochem, Kina). Alle syntetiske peptider blev renset til . 95% renhed med mængden rapporteret fra leverandør

Peptider fordøjet fra 0,1 uL rå serum (for 70 NSCLC prøve og 30 aldersmatchede kontroller, se tabel S1) blev genopløst i 0,1% myresyre, tilsat intern standard peptider, og separeret ved omvendt fase mikro højtydende væskekromatografi på en 1200 HPLC-system kombineret med en 6410 QQQ massespektrometer (Agilent Technologies). Separation blev udført ved mobil fase strømningshastighed på 1,5 pl /min med puffer A (0,1% myresyre) og puffer B (90% acetonitril i 0,1% myresyre), på en C18 fælde søjle (300 um × 5 mm, Agilent Technologies ) efterfulgt af en analytisk C18-kolonne (150 um x 100 mm, Column Technology Inc., CA). Den binære gradient bestod af 3-17% B i 2,5 min, 17-23% B i 25 min, 23-40% B i 5 min, 40-100% B i 5 min og ved 100% B i 2,5 min. Data blev erhvervet med en kapillær spænding på 4000 V, tørregas på 300 ° C ved 3,0 L /min, og forstøver gas af 18 psi. Fragmentor spænding og kollisionsenergi (CE) blev optimeret med infusion af hvert peptid. I MRM forsøg vendte cyklustider ikke overstige 1,2 sek og mindst 20 datapunkter blev opsamlet pr top.

Absolute kvantificering af A1BG og LRG1 serumniveauer Salg

MRM dataanalyse blev udført ved anvendelse Masshunter kvalitativ software (Agilent). [

12C] /[

13C] toparealer blev registreret ved manuel inspektion af streng co-eluering adfærd, idet alle de [

13C] overgange som reference. For A1BG og LRG1 blev kontrol af deres mængderne i forskellige kohorter opnås ved alle overgange par, men kun de bedste overgange, som nærede bedste linearitet respons blev brugt til absolut kvantificering. Assayet linearitet blev karakteriseret ved fortynding af et tryptisk fordøjelse af ét serum prøve, som blev inkorporeret med lys peptider til at generere en række endogene analytkoncentrationer spanning 3

7 og 3

8-fold koncentrationsområde (fremgangsmåde modificeret fra Michael et al., [23]) for LRG1 og A1BG reference- peptider hhv. Mængden af ​​[

12C] peptid blev målt ved koncentrationen punkt, hvor området forhold mellem [

12C] /[

13C] var tættest på en (1,029 for A1BG og 0,922 for LRG1). Arealforhold blev anvendt til at beregne endogene koncentrationer af målproteiner i sera, ved formel monteret lineariteten kurven. Inter-assay variationskoefficient (CV) blev bedømt ved fem adskilte forarbejdning og MRM replikerer af en blandet prøve, og detektionsgrænse (LOD) blev defineret som de koncentrationer, hvor S /N af analysanden lig med 3 [24 ]. Grænsen for kvantificering (LOQ) blev empirisk bestemt som den laveste analytkoncentration som kan holde det acceptable linearitet (Pearson korrelation, R 0,99) og kan måles med. 20% CV [23]

Resultater

En høj kvalitet database over NSCLC associeret serumproteiner

Pre-terapi sera fra 13 NSCLC patienter (8 annoncer og 5 SCCS) og 5 raske kontroller blev behandlet for IMDL-MS /MS-analyse ( Figur 1). At optrævle kompleksiteten af ​​serum proteom, vi lindres en tidligere udfældning metode til at fjerne humant serumalbumin og anvendes todimensional HPLC fraktionering. Udtømningen proces var hurtig og billig, og var helt reproducerbar og effektiv, som vist i figur S1. En ny serie af buffere af elleve forskellige pH-værdier blev anvendt i IMDL i betragtning af kompleksiteten af ​​humant serum proteom (figur 1, midterste panel). Sammenlignet med en traditionel endimensional RP-LC separation blev proteomet dækning forbedret, i betragtning af at mere end tre gange så mange proteiner blev identificeret ved IMDL under samme PSM FDR kriterier (data ikke vist).

Venstre panel , serumprøver indsamling og nedbrydning at fjerne humant serumalbumin (HSA); Midterste panel, IMDL fraktionering som adskiller serum peptider ved deres pI (2.5~8.5) og hydrofobicitet, med et eksempel på HPLC-MS /MS-chromatografi viste for hver pH trinvis eluering; Højre panel, antallet af NSCLC-patienter og antallet af aldersmatchede raske kontroller i verifikationsfase ved western blotting, TMA og MRM måling. SCX, stærk kationbytter, RP omvendt fase-kromatografi. AD: Adenocarcinom; SCC: Pladecellekræft; NSCLC:. Ikke-småcellet lungekræft

Med hensyn til den voksende bekymring over den tillid spørgsmålet om blodproteiner identificeret [25], brugte vi de strenge kriterier, naive target-lokkedue FDR på protein niveau for at kvalificere serum proteom [16]. Kollektivt, blev 629,804 peptid hits fra 4.456 unikke peptider, tildele til 647 proteiner identificeret fra serum (protein FDR 4,6%) og indarbejdet i label fri kvantificering. Vi derefter observeret XCorr fordeling af peptid identifikation i serum proteom. Som figur S2 angivet, alle spektrene havde en XCorr højere end 2,25, og var domineret af identifikation af meget højere score for både ladning 2+ og opkræve 3 + ioner. For yderligere at fastslå effektiviteten af ​​target-lokkedue strategi og dens afledte FDR, en anden udbredte proteinidentifikation workflow, Trans-proteomiske Pipeline (TPP) [26], blev også anvendt på alle de rå spektre kommer fra en sund serum prøve. Alle PSM’er med PeptideProphet ≥0.75 blev lagret, og tildelt til proteiner. Endvidere 89,7% proteiner i vores identifikation resultat havde en ProteinProphet ≥0.9, og ca. 65,1% proteiner havde en ProteinProphet lig 1. Hvis derimod vi beholdt afledningsindretningen tag i TPP, serumproteiner med ProteinProphet ≥0.9 havde en FDR højere end 10,7 %. Disse foreslog temmelig høj tillid til vores serum proteomanalyse.

Profilering og biomarkør screening i NSCLC serum proteom

Vi næste estimeret dynamikområdet af etiketten gratis profilering. En signifikant korrelation mellem protein spektrale tæller og deres kendte tilsvarende koncentrationer [27], [28] blev opnået (tabel S2). Således er vores proteomisk fremgangsmåde gjorde muligheder for identifikation og relativ kvantificering af serumproteiner tværs seks størrelsesordener (så lavt som flere nanogram per milliliter).

At etablere en NSCLC associeret serum proteom, vi startede med at udføre Hierarkisk klyngedannelse analyse (HCA) og Principal komponent analyse (PCA) på den samlede proteom at imødegå, at hvis betydelige serum proteiner blev reguleret på grund af NSCLC forekomst. HCA og PCA blev begge udført på den spektrale tælle information af alle 647 serumproteiner (se metode). HCA underforstået, at NSCLC og normale forsøgspersoner blev inkorporeret i to store klynger (figur 2A). Tilsvarende i PCA-analyse, NSCLC sera kunne adskilles fra 5 normale kontroller af kun en hovedbestanddel, og variationen i kræft gruppe var meget mere end i den normale gruppe (figur 2B). Fordi MS-analyse af kontrol- sager blev indsat tilfældigt ind i sekventering løber af 13 NSCLC sera, skal de præ-analytiske faktorer være usikker og mindre væsentlig end kræft fænotype. Selvom de relative positioner af hver NSCLC omstændigheder i HCA og PCA ikke var de samme, observerede vi moderat divergens mellem AD og SCC patienter. At svare, hvis adskillelsen mellem kohorter kommer fra kun en eller to væsentligt ændret rigelige proteiner, vi også ansat PCA for alle protein-identiteter (se røde pile i figur 2B). Denne “bi-plot” foreslog, at betydelige proteiner, snarere end et lille antal proteiner, bidrog til adskillelsen.

(A) Hierarkisk klyngedannelse analyse og (B) Principal komponent analyse af alle de 647 proteiner kvantificeret tværs de 18 serumprøver. Slutter af røde pile i (B) repræsenterer PCA resultater for hvert protein.

Siden den identificerede serum protein kan holde muligheder for at afgrænse eller forudsige NSCLC, permuteret ANOVA og studerende T-test mellem kohorter var ansat. I alt 101 proteiner blev filtreret som betydeligt differentieret proteiner (p 0,01, se detaljer i tabel S3) og deres relative berigelse mønster som Heatmap blev vist i figur 3A. Blandt 101 proteiner filtreret, blev mere end 25% tidligere angivet som NSCLC biomarkør kandidater. Denne betydelige konsekvens stærkt valideret vores eksperimenterende tilgang i opdagelsen fase. Notatet blev de fleste af de tidligere undersøgelser baseret på 2D-gel og rapporteres meget mindre differentierede proteiner end vores resultat [29], [30], [31]. Også vores 101 protein indstillet med succes dækket en væsentlig andel af kandidaterne rapporteret fra en tidligere møjsommelige arbejde [32], der kombinerede omfattende multi-dimensional væskekromatografi og todimensional forskel gelelektroforese for hver kromatografi-fraktion. Disse beviser viste, at vores online IMDL fraktionering var ikke kun praktisk, men også relativt følsom i screening potentielle blod biomarkører. Udover de rapporterede NSCLC kandidat markører, fandt vi betydelige bemærkelsesværdige proteiner tæt relateret til andre kræftformer, såsom alfa-1B-glycoprotein [33], Complement C1q underkomponent subunit A [34], fibrinogen alfa /gamma-kæde [35], [36] , fibulin-1 [37], trombocytfaktor 4 og dens variant [38]. Alligevel var der flere proteiner, som nærede meget god statistik, men manglede tidligere beviser til at knytte dem til kræft status, såsom Protein AMBP (alternativt navn, alpha-1-mikroglobulin), multivesikulære krop subunit 12B og V-typen proton ATPase 116 kDa underenhed. Interessante proteiner, der er direkte forbundet med en kræft tilstand (enten NSCLC eller anden cancer i human) ved litteratur minedrift var opført i tabel 1.

(A) Hierarkisk klyngedannelse Heatmap af 101 væsentligt ændrede proteiner. Expression værdier er vist som en farveskala med højere værdier repræsenteret ved gule og nederste repræsenteret ved blå. (B) Gene ontologi biologiske processer betydeligt beriget med 101 protein sæt. Gene symboler i blå eller røde cirkler (kunne blive henvist i tabel S3) angiver de tilsvarende proteiner i ned- eller op-reguleret i NSCLC sera.

biologiske processer beriget med differential serum proteomanalyse af NSCLC

Vi næste forsøgt at karakterisere de 101 proteiner i forbindelse med deres biologiske funktioner. Ved at sammenligne GO biologisk proces kommenteret af BINGO, fandt vi flere processer var signifikant beriget (justere p 0,05 efter BH korrektion, figur 3B). Specifikt processer af akut-fase-responser (p = 5.26E-10) og cellulær kation homeostase (p = 1.31E-6) i kredsløbssystemet tendens til at være opreguleret i kræft sera. Processer relateret til komplementaktivering (p = 1.28E-7), celledød (p = 1.15E-2) og apoptose (p = 1.27E-3) blev også signifikant reguleret. Desuden fandt vi en række protein-aktiviteter, der ikke tidligere kendt at opholde sig i lungekræft, såsom proteaseinhibitor og G-protein-koblet receptor bindingsaktivitet, hvis relevant proteiner var hovedsagelig nedreguleret (p = 1.56E-11 og 3.24E -6). Kollektivt, disse observationer implicerer NSCLC ikke kun i den akutte fase svar og immunitet, men også i specifikke signal transduktioner og dødsprocesser.

TMA og scoring til validere den histologiske udtryk A1BG, USP1 og mucin 5B i NSCLC væv

for at vise, at nogle, hvis ikke alle, af proteinerne af interesse er faktisk forbundet med NSCLC risiko, i kontrollen fase vi udnyttet forskellige validering tilgange. Fordi høj konkordans tidligere blev observeret mellem TMA måling og RT-PCR [39] eller proteom profilering [40], vi spurgte, om TMA kunne muliggøre en hurtig, grundig og semi-kvantitativ vurdering af de histologiske biomarkører. I dette afsnit, foruden alfa-1B-glycoprotein (A1BG) og leucin-rige alpha-2-glycoprotein (LRG1), som er af mid-range overflod i serum, valgte vi en lav rigelige serumprotein ubiquitin carboxylterminale hydrolase 1 ( USP1), der blev påvist i NSCLC sera. Hertil kommer, fordi cellelinie lysat kunne være biologisk mere tæt på vævsprøve, valgte vi på kandidat mucin-5B som detekteret i NSCLC celleniveau ifølge et datasæt i vores tidligere undersøgelse [17]. Vores TMA mod disse fire proteiner forudsat en homogen og synkron profilering af den 90 parrede NSCLC sektioner. Alle testede proteiner demonstreret højere ekspressionsniveau i NSCLC tumorsnit (figur 4A). Til nøje adgang differensniveauværdien mellem NSCLC og deres tilgrænsende ikke-tumorsnit, IHC farvningsintensitet (I, 0-3) og den procentvise (P 0-9) af positive farvede celler blev fordelt (figur 4B og fig S3) . De fleste tumor sektioner blev karakteriseret med højere intensitet (I≥2) og mere positive celler (P 60%).

Be the first to comment

Leave a Reply