PLoS ONE: en systematisk gennemgang og meta-analyse af diagnostiske og prognostiske Serum biomarkører for kolorektal Cancer

Abstrakt

Baggrund

Vores systematisk gennemgang opsummerer beviserne vedrørende nøjagtigheden af ​​serum diagnostisk og prognostisk test for kolorektal cancer (CRC).

Metoder

databaser MEDLINE og EMBASE blev søgt iterativt at identificere den relevante litteratur for serum markører af CRC udgivet fra 1950 til august 2012. artiklerne der leveres tilstrækkelige oplysninger til at opfylde kravene i den meta-analyse af diagnostiske og prognostiske markører blev medtaget. En 2-by-2 tabel over hver diagnostisk markør og dens hazard ratio (HR) og konfidensintervallet (CI) for hver prognostisk markør blev direkte eller indirekte ekstraheret fra den medfølgende papirer, og den poolede følsomhed og specificitet diagnostisk markør og den poolede HR og CI i den prognostiske markør blev efterfølgende beregnet ved hjælp af de udtrukne data.

Resultater

i alt 104 papirer i forbindelse med de diagnostiske markører og 49 papirer relateret til de prognostiske serum markører af CRC blev indsamlet, og kun 19 af 92 diagnostiske markører blev undersøgt i mere end to studier, mens 21 ud af 44 prognostiske markører blev inkluderet i to eller flere undersøgelser. Alle de puljede følsomheder i de diagnostiske markører med = 3 gentagelser var mindre end 50%, og meta-analyser af prognostiske markører med mere end 3 blev udført, VEGF med højeste (2,245, CI: 1,347-3,744) og MMP-7 med laveste (1,099, CI: 1,018 -1,187)) puljede HRs præsenteres.

konklusioner

kvaliteten af ​​undersøgelser vedrørende den diagnostiske og prognostiske nøjagtighed af testene var dårlig, og resultaterne var meget heterogene. De fattige egenskaber indikerer, at disse tests er af ringe værdi for klinisk praksis

Henvisning:. Liu Z, Zhang Y, Niu Y, Li K, Liu X, Chen H, et al. (2014) en systematisk gennemgang og meta-analyse af diagnostiske og prognostiske Serum biomarkører for kolorektal cancer. PLoS ONE 9 (8): e103910. doi: 10,1371 /journal.pone.0103910

Redaktør: Valli De Re, Centro di riferimento Oncologico, IRCCS National Cancer Institute, Italien

Modtaget: 10. oktober 2013; Accepteret: 8 Juli 2014; Udgivet: 8 August, 2014

Copyright: © 2014 Liu et al. Dette er en åben adgang artiklen distribueres under betingelserne i Creative Commons Attribution License, som tillader ubegrænset brug, distribution og reproduktion i ethvert medie, forudsat den oprindelige forfatter og kilde krediteres

Finansiering:. Finansiering af dette arbejde blev leveret af China Postdoc Science Foundation (201150M1569 og 2012T50893 til ZL) og Luoyang ansøgning teknologi, forskning og udviklingsprojekter (1401088A-5). De finansieringskilder havde ingen rolle i studie design, indsamling og analyse af data, beslutning om at offentliggøre, eller forberedelse af manuskriptet

Konkurrerende interesser:.. Forfatterne har erklæret, at der ikke findes konkurrerende interesser

Introduktion

kolorektal cancer (CRC) er en af ​​de mest almindelige ondartede sygdomme i udviklede lande [1]. Forekomsten af ​​CRC i Kina var lavere end i Vesten, men er steget i de senere år [2], og er blevet en væsentlig kræft byrde i Kina. CRC dødelighed i Kina er 7,35 /100.000 mennesker, ifølge en retrospektiv undersøgelse af dødsfald forårsaget af maligne tumorer i Kina 2004-2005 [3]. Hvert år i Storbritannien og USA, er der cirka 32.000 og 160.000 nye tilfælde diagnosticeres henholdsvis og omkring 500.000 nye tilfælde diagnosticeret på verdensplan [4]. Trods fremskridt i dosering og planlægning af kemoterapi i både adjuvans og avancerede indstillinger, tidlig påvisning af CRC er altid overvurderes [5].

FOBT (fækal okkult blod test) og koloskopi er de traditionelle metoder til CRC screening. Selvom FOBT er non-invasive og billig, den lavere følsomhed af resultaterne gør det uacceptabelt for forfremmelse og popularisering [6]. Selvom koloskopi plus biopsi er guldstandarden af ​​kolorektal cancer screening og diagnosticering på grund af den invasive natur og tarm ubehag af koloskopi, mere end halvdelen af ​​patienterne vil ikke have det [7]. Sammenlignet med disse screeningsmetoder, test af serum biomarkører er mere bekvemme og mindre invasiv og kan være mere acceptabel som del af en rutinemæssig fysisk undersøgelse [8], men de fleste serum CRC markører stadig ikke for de fleste patienter [9]. Selv om en række af serum markører af resultat i CRC er blevet rapporteret [10], der ikke har været nogen klar enighed om, deres rolle, med mange undersøgelser rapporterer modstridende resultater [11] – [13].

En vigtig overvejelse er, at en systematisk gennemgang kan fremhæve de underliggende problemer på tværs af de enkelte undersøgelser og hjælpe med at identificere behovet for fremtidig forskning [14]. I den nuværende papir, er begge disse aspekter behandles, og vi håber, at vores resultater vil forbedre undersøgelser af CRC markører i fremtiden.

Materialer og metoder

Søg strategi

den systematiske søgning rettet artikler med oplysninger om markører i serum til at inkludere eller udelukke forekomsten af ​​CRC offentliggjort fra januar 1950 til august 2012. for at opfylde vores udvælgelseskriterier, undersøgelserne skulle have været offentliggjort som en fuld papir på engelsk. Artikler blev identificeret ved en elektronisk Medline og PubMed søgning ved hjælp af følgende nøgleord: Kolorektal ‘,’ Colon “,” rektal ‘,’ kræft ‘,’ serum “og” markør “(se bilag 1 i Materialer S1 for nøgleordene og tilsvarende “tilknyttede ordene”, se bilag 2 for nærmere oplysninger om søgestrategi). I den aktuelle undersøgelse blev dubletter fra Medline og EMBASE slettes automatisk og manuelt med Reference Manager Version 11 (Thomson Reuters, New York, NY, USA).

Inklusionskriterier og eksklusionskriterier

Til diagnostisk markør (r), meta-analyse sætter fokus på sensitivitet og specificitet af en markør, og de mest basale krav er en 2 × 2 tabel over resultatet af markør indeks test til at beregne de to værdier. En kort oversigt over kriterierne for en diagnostisk markør er følgende:.

Den oprindelige artikel er på engelsk og om diagnostisk serum markør (er) på kun primær kolorektal cancer (CRC, colon eller rektal cancer)

Der er nok information til direkte eller indirekte at konstruere en 2 × 2 tabel (ler) af resultatet af markøren (r) indeks test.

den gyldne standard (referencestandard) til diagnosticering af CRC , colon eller rektal cancer er baseret på kliniske histopatologi.

Kun patienter (CRC, colon eller rektal cancer) versus kontrol (sund befolkning) er undersøgt.

Ekstra oplysninger såsom undersøgelse design og cut-off-værdier (se tabel S3 af vores manuskript) er ikke meget vigtigt for kvantitativ syntese af effekt størrelser af en diagnostisk markør. Vi sammenfattet studiedesign til undersøgelser med følgende designs: case-kontrol, retrospektiv case-kontrol, prospektivt kohorte, nested case-kontrol, prospektivt nested case-kontrol, kohorte, prospektive kohortestudier og kohorte af konsekutive patienter (se tabel S3 for detaljer) .

for prognostisk markør (r), undersøgelsen skal give tid-til-hændelse data og meta-analyse fokuserer på hazard ratio (HR) og dens konfidensinterval (CI)

en original papir baseret på en primær CRC, colon eller rektal cancer i engelsk skulle give et kvantitativt resultat eller give tabelform individuelle patientdata (IPD) [15] for at vurdere evnen af ​​en eller flere prognostiske serum markører.

undersøgelsen skal give tilstrækkelige data til (re) konstruere en 2 × 2 tabel til at estimere markørens prognostiske nøjagtighed eller log af hazard ratio (HR) og dens præcision (variansen eller standardafvigelse (SE)) eller HR og dens konfidensinterval (CI).

Ud over de ovennævnte 2 punkter, resten af ​​elementerne er de samme som punkt 3 og 4 til diagnostiske markører.

fra papirer klassificeret som ‘relevant, “oplysninger blev ekstraheret på tumormarkør anvendte det kliniske anvendelsesområde, aldersgruppen af ​​patienter, stadium af sygdommen, om resultatet var samlet overlevelse (OS) eller sygdomsfri overlevelse (DFS), og den cut-off niveau af markøren (se tabel S5 af vores manuskript for detaljer).

To trin var nødvendige for at medtage eller udelukke kandidatlandene artikler. Det første parti af korrekturlæsere, der blev trænet på forhånd, vurderet de titler og abstracts, og derefter, den anden uafhængige parti korrekturlæsere, der er uddannet på forhånd, vurderet de fulde artikler for at sikre, at ingen relevante artikler blev udelukket. Inklusion eller eksklusion, samt dataudtræk for papir, blev gennemført af mindst to uafhængige korrekturlæsere, og hvis de udtrukne data ikke var de samme, blev konflikter løses ved at nå til enighed. 1) Hvis der er mere end én markør blev anvendt i en given undersøgelse blev de relevante data for hver støtteberettiget markør individuelt udvindes. 2) Hvis en markør havde flere funktioner (dvs. er en markør for en sygdom, der anvendes til screening, diagnose, prognose og /eller overvågning) blev de datasæt svarende til de multiple funktioner ekstraheret separat. 3) Hvis der var flere markører og sygdomme behandles i en undersøgelse blev kun de relevante data fra markør (er), der svarer til hver sygdom af interesse for forfatteren (e) udvindes.

Dataudtræk

fra papirer klassificeret som “relevante” oplysninger blev ekstraheret om undersøgelsens karakteristika, de deltagende egenskaber, typen af ​​henvisningen test, der anvendes til at bekræfte tilstedeværelsen eller fraværet af kolorektal cancer, tumor markør anvendte det kliniske anvendelsesområde, den aldersgruppe af patienter, den fase af sygdommen, om resultatet var samlet overlevelse (OS) eller sygdomsfri overlevelse (DFS), og cut-off niveauer samt hvordan disse niveauer blev bestemt. Nogle af undersøgelserne havde flere forskellige afskæringsværdier niveauer, og vi tog kun den tættest på afskæringen svarer til 95% specificitet (undgå falske positiver så meget som muligt) [16] 1) til diagnose-relaterede papirer, den dataudtræk og kvalitetsvurdering metodiske af hver omfattede undersøgelsen blev generelt udført samtidig. Whiting et al. (2003) foreslået en række kriterier for kvalitetsvurdering af diagnostisk nøjagtighed Studies (QUADAS), der gælder godt til diagnostisk markør undersøgelser [17]. Yderligere oplysninger, der skal udvindes omfattede antallet af patienter og kontroller og antallet af sande positive (TP) /falsk positive (FP) /sande negativer (TN) /falsk negative (FN), som er obligatoriske. Hertil kommer, at sensitivitet og specificitet, konfidensintervaller de 95% (CIS), den samlede nøjagtighed, den positive prædiktive værdi (PPV = TP /(TP + FP)), den negative prædiktive værdi (NPV = TN /(TN + FN )), den positive sandsynlighed forholdet (LR +), den negative sandsynlighed ratio (LR), og den diagnostiske odds ratio (DOR) af tumormarkører var valgfri udtrukne oplysninger. Hvis en undersøgelse manglede de obligatoriske oplysninger, vi beregnet TP /FP /TN /FN og fyldt de tomme felter i tabellen. 2) til prognose-relaterede papirer, Altman et al. (2012) foreslåede rapportering anbefalinger til tumor markør prognostiske undersøgelser (NB) [18], der gælder godt til prognostiske markør studier. De data udtræk og konverteringer for prognostiske markører var langt mere kompleks end for diagnostiske markører fordi prognostiske markører giver tid-til-hændelse data. Meta-analyser af denne type markør kræver ofte en af ​​to typer data, dvs, log af hazard ratio (HR) og dens præcision (variansen eller standardafvigelse (SE)) eller HR og dens konfidensinterval (CI ). For større prognostisk markør undersøgelser, kan de to typer data ikke udledes. Paramar og kolleger [19] præsenterede en række enkle metoder til at udtrække de relevante data fra publikationer med det formål at udføre en meta-analyse af overlevelse-type data. Metoderne fokuserer på metoder til at udtrække disse data fra publikationer og er illustreret i denne publikation med virkelige eksempler. Riley og medarbejdere (2003) [20] sammenfattet 11 metoder (bilag 3), der er tilgængelige for direkte eller indirekte estimering af disse data og den omtrentlige normale loge (HR) fordeling til store prøver. Desuden Tierney et al. [21], forudsat trin-for-trin vejledning til hvordan man beregner en HR og de tilhørende statistik for de enkelte forsøg, ifølge oplysningerne i forsøget rapporten. I vores undersøgelse blev en R-pakke udviklet på grundlag af de metoder Paramar og kolleger [19] og blev anvendt til indirekte eller direkte beregne HR og dens CI.

Statistisk analyse og data syntese

den systematiske gennemgang fulgt de retningslinjer, der er offentliggjort af NHS Center for anmeldelser og Formidling og havde en samlet målsætning om at opretholde bredde, syntese beviserne kvalitativt og derefter, kun hvor det er relevant, ved hjælp af kvantitative metoder [22], [23].

diagnostiske serum markører

Meta-analyse af diagnostiske test nøjagtighed rummer mange udfordringer. Selv i det enkleste tilfælde, hvor data er opsummeret af en 2 × 2 tabel fra hver undersøgelse, en statistisk stringent analyse kræver hierarkiske (flere niveauer) modeller, der respekterer binomial datastruktur. I den aktuelle undersøgelse blev skovens plots følsomhed og specificitet skøn og deres 95% CIs konstrueret af hver undersøgelse med MetaDiSc software (version 1.4) [24], med heterogenitet af nøjagtighed skøn vurderes med I

2 statistik [25]. De sammenfattende skøn over sensitivitet og specificitet blev beregnet ved hjælp af den pakke Metandi for STATA 11 statistisk software (STATA Corp, College Station, TX) [26] (Metandi kræver enten Stata 10 eller derover). Vi vedtog også en kommando, metandiplot, at forenkle plotning af grafiske oversigter over den model, nemlig resuméet modtageren opererer karakteristik (SROC) kurve og forudsigelse regionen og også at plotte resumé punkt og sin tillid region.

Det er blevet fremført, at diagnostiske nøjagtighed test kan være særligt modtagelige for offentliggørelse partiskhed [27]. Simulation undersøgelser har imidlertid vist, at effekten af ​​publikationsbias på meta-analytiske estimater af Diagnostiske Odds Ratio (DOR) er ikke sandsynligt, at være store, og sin vurdering i anmeldelser af test nøjagtighed er kompleks [28]. En alternativ fremgangsmåde bruger tragt afbildninger af (naturlige logaritme (ln) DOR) vs () og tests for asymmetri hjælp relaterede regression eller rang korrelation test [28]. Det skal bemærkes, at effekten af ​​alle statistiske tests for tragt plot asymmetri falder med stigende heterogenitet DOR.

Prognostiske serum markører

hazard ratio (HR) blev anvendt til at måle effekten af ekspressionen af ​​individuelle biomarkører på prognose. Fra papirer klassificeret som “relevante”, blev oplysninger udvindes på tumormarkør anvendte det kliniske anvendelsesområde, den aldersgruppe af patienterne, den fase af sygdommen, om resultatet var samlet overlevelse (OS) eller sygdomsfri overlevelse ( DFS), og den afskårne niveau af markøren. OS, DFS, eller uklare blev registreret til at klassificere resultatet af en markør, hvor det er muligt, og adskilt efter, om de var blevet analyseret af univariate eller multivariate analyse. Sygdomsspecifikke overlevelse (DSS) blev medtaget under OS og fjern sygdomsfri overlevelse (DDFS) og metastase overlevelse (MFS), blev medtaget under DFS. For både OS og DFS, blev følgende registreret (hvor muligt): om markøren til analyse havde en signifikant sammenhæng med overlevelse, hazard ratio (HR), de 95% konfidensintervaller (CI), p-værdi for faktoren, hvorvidt p-værdien var nøjagtige, og om overlevelse var blevet analyseret ved univariate og /eller multivariat analyse. Hvis der var blevet udført multivariat analyse blev andre faktorer der indgår i modellen registreres også. Fordi estimatet mål for HR varieret, vi konverterede de forskellige statistikker i HR, 95% CI, og dens varians, som var mere præcise og forenet. Efter opnåelse af de grundlæggende statistikker, en sekventiel proces, der bygger på den relevante kommando i STATA version 10 (Stata Corporation, College Station, TX, USA) blev gennemført for at tælle den poolede HR værdi. Processen fulgte forskning af RD Riley [20].

Puljede skøn over HRs blev opnået ved hjælp af både fast effekt og random-effekt meta-analyser ved hjælp af inverse-varians vægtning metode. Statistisk heterogenitet mellem studier blev vurderet ved brug af blandt-studiet varians (s2) og statistik I

2 [25]. Vi har udført heterogenitet X2-test, og hvis antagelsen om homogenitet af individuelle HRs havde afvises, vi brugte en tilfældig-effekt model i stedet for en fast effekt model. Konventionelt en observeret HR 1 indebar en dårligere prognose for gruppen med positiv markør udtryk. Vi udførte en meta-analyse af prognostisk test nøjagtighed ved hjælp af metan kommandoen i STATA. Publikationsbias refererer til fænomenet studier med uinteressante eller ugunstige resultater er mindre tilbøjelige til at blive offentliggjort, end dem med mere gunstige resultater [29]. Hvis en publikationsbias eksisterer, så den publicerede litteratur er en forudindtaget prøve af alle undersøgelser på et emne, og eventuelle meta-analyse baseret på det vil være tilsvarende forudindtaget. Funnel plots er almindeligt anvendt til at undersøge offentliggørelse og relaterede skævheder i meta-analyser [30]. Den metabias funktion i STATA udfører Begg og Mazumdar [31] justerede rank korrelation test til offentliggørelse skævhed samt Egger et al. [32] regression asymmetri test til offentliggørelse bias. Som optioner, det giver en tragt graf over data eller regression asymmetri plot. Den Begg justeret rang korrelation test er mere populær i fælles ansøgninger om publikationsbias analyse, og det bruges til at estimere publikationsbias i vores undersøgelse. Metoden “trimme og fylde” [33] blev gennemført for at undersøge mulige karakter af undersøgelser “savnet” i revisionen og at forsøge at estimere den “sande” relativ skøn risiko regnskab til offentliggørelse bias. Kommandoen metatrim i STATA bruges til at implementere Duval og Tweedie parametrisk “trimme og fylde” metode.

Resultater

Søgning resultater

I alt 2243 artikler blev indhentet fra de to databaser, hvoraf 153 artikler rapportering på 114 CRC serum diagnostiske og /eller prognostiske markører (tabel S1) blev betragtet som relevant i henhold til de to første anmeldere. I alt 105 papers (bilag 4) var relateret til diagnose, mens 49 (bilag 5) var prognose papirer. Endvidere 23 af de relevante papirer indbefatter både diagnose og prognose. I disse undersøgelser blev der opnået i alt 257 individuelle tumormarkører. Papers indikerer relaterede studier i det specifikke område blev undersøgt yderligere at søge mere relevante resultater. Processen med at hente og reservere papirer og resultaterne er vist i figur 1.

tumormarkører Identificerede Samlet og inden for hvert kliniske område

Vurdering af studiet kvalitet og undersøgt diagnostiske serum markører.

kvaliteten af ​​diagnose papirer blev vurderet ved hjælp af QUADAS systemet [11]. Den metodiske kvalitet af studierne med fokus på formålet med denne anmeldelse var generelt dårlig og er vist i figur 2, med specifikke detaljer i tabel S2 (henvisninger til disse undersøgelser er indledes med en »D« og er anført i tillæg 4 i materialer S1). Af undersøgelserne blev 12 papirer designet ved hjælp et prospektivt kohortestudie. Resten af ​​undersøgelser anvendte case-kontrol-metoder. Derfor verifikation skævhed uundgåeligt dukkede op i disse undersøgelser. Verifikation skævhed er et resultat af at identificere forsøgsgrupper af guldstandarden henvisning test af en sygdom eller tilstand, såsom cancer, mens kontrolgruppen formodes at være fri for denne tilstand, men dette er ikke verificeret af guldstandarden henvisning test, som pustes følsomhed og reducerer specificitet [34] – [36]. Desuden har de fleste undersøgelser ikke en fyldestgørende beskrivelse af proceduren patient-valg af, karakteristika undersøgelsens deltagere, reference standard, og det anvendte cut-off værdi af markøren. Tiden mellem indekset test (markør) og henvisningen test samt tilgængeligheden af ​​andre kliniske data (som er almindeligt stødt på i praksis), blev også dårligt rapporteret.

Tabel S3 giver en komplet oversigt af udførelsen af ​​alle markører på tværs af de inkluderede studier. I alt blev 92 serum markører identificeret, og kun et par markører ofte rapporteret. Af disse markører, er 73 markører kun rapporteret én gang. Den hyppigst evalueret serummarkør var CEA (42 gentagelser) efterfulgt af CA19-9 (24), CRP (9), CA-50 (7), CA72-4 (7), og VEGF (7) (tabel 1). Nogle anmeldelser må ikke medføre brugbare summariske skøn over sensitivitet og specificitet, for eksempel på grund af betydelig variation i de enkelte estimater undersøgelse, eller fordi antallet af de relevante undersøgelser, der svarer til en markør, er mindre end tre. er blevet foreslået adskillige metoder til meta-analyse af diagnostiske nøjagtighed data, hvoraf to er statistisk streng: den hierarkiske oversigt modtageren opererer karakteristik (HSROC) model [37], og den bivariate model [38]. I nuværende systematisk review, resuméer af den diagnostiske nøjagtighed af disse markører, henholdsvis vurderet af den hierarkiske oversigt modtageren opererer karakteristik (HSROC) kurve [39] (undersøgelse nummer tre) og skoven plot af meta-analyse (undersøgelse nummer 2), er vist i tabel 1. CEA er den hyppigst undersøgte biomarkør baseret på den ekstraherede biomarkør information. I alt er der 42 papirer præsenterer de diagnostiske resultater for CEA. CEA undersøgelser omfattede 8861 personer, hvoraf 5361 var patienter, og de resterende 3500 personer var kontrol. Cut-off-værdien lå i området fra 2,40 ng /ml til 10,0 ng /ml. Følsomheden og specificiteten varierede meget fra 25,55% til 97,22% og 54,40% til 100,00%, hhv.

Figur 3 A præsenterer hierarkiske summariske skøn over sensitivitet og specificitet for CEA efter back-transformation til ROC akser . Desuden viser den 95% tillid ellipse omkring middelværdierne af følsomhed og specificitet for CEA og en 95% forudsigelse ellipse for de enkelte værdier af sensitivitet og specificitet. Den ellipse omkring resuméet eller betyde skøn over sensitivitet og specificitet markerer region, der indeholder sandsynlige kombinationer, som middelværdien af ​​sensitivitet og specificitet er lille. De 95% forudsigelse ellipse er bredere og indikerer mere usikkerhed om, hvor de sandsynlige værdier af sensitivitet og specificitet kan opstå for de enkelte studier. Figur 3 B og C hver for præsentere skov afbildninger af specificitet og følsomhed af diagnostisk markør CEA for tarmkræft med individuelle undersøgelse estimater af følsomheder og særlige karakteristika og de 95% initiativerne som en random-effects model. De enkle summariske skøn over følsomheden og specificiteten af ​​CEA for tarmkræft var 46,1% (95% CI: 44,8-47,4%) og 89,2% (95% CI: 88,2-90,2%), hhv. Den HSROC model producerede de samme summariske skøn over sensitivitet og specificitet med næsten nøjagtigt lige CIS (48,5% (95% CI: 44.8-52.3-46.7%) og 91,1% (95% CI: 88 til 93,0%), henholdsvis), der tager hensyn heterogenitet ud over chancen mellem undersøgelser (random-effects model). For de resterende serum markører for CRC, de puljede følsomheder og særlige med deres CIs er henholdsvis opført i 6

th og 7

th kolonner i tabel 1, men de HSROC plots og skov plots præsenteres i appendiks 6 i Materialer S1 på grund af artiklen længde grænser. Publikationsbias analyser blev gennemført for de prognostiske markører med mere end tre gentagelser i undersøgelser. Resultaterne er vist i det 12.-15 søjle i tabel 1, og de særlige kendetegn ved disse beslutningstagere er anført i tabel S3. De tilsvarende skov plots og tragt plots vises Bilag 7 i Materials S1. Resultaterne viser, at publikationsbias eksisterer for næsten alle diagnostiske markører.

A er ROC plot af de hierarkiske summariske skøn over sensitivitet og specificitet for CEA med 95% sikkerhedsgrænser og forudsigelse ellipser. B og C er skov plots af sensitivitet og specificitet af diagnostisk markør CEA for tarmkræft plottet med en HSROC model. Størrelsen af ​​kvadraterne i B og C er proportional med undersøgelsen størrelse og vægt for hver undersøgelse. Den rhombus repræsenterer de poolede skøn, som er 0,461 (CI: 0,448 til 0,474) og 0,892 (CI: 0,882-0,902) til specificitet og sensitivitet henholdsvis

Vurdering af studiet kvalitet og undersøgt prognostisk serum. markører.

De snesevis af alle prognostiske undersøgelser af BEMÆRKNING [18] er vist i tabel S4. De snesevis af disse undersøgelser varierede mellem 16 og 19. Tabel S5 giver en komplet oversigt over udførelsen af ​​alle prognostiske markører for CRC, på tværs af de inkluderede studier. I alt blev 41 serum prognostiske markører identificeret, og kun nogle få markører ofte blev rapporteret. Af disse markører blev 22 markører kun rapporteret én gang, 13 markører blev rapporteret to gange, og kun 10 markører blev rapporteret mere end tre gange. Den hyppigst evalueret serum prognostisk markør var CEA (34 gentagelser) efterfulgt af CA19-9 (10), VEGF (9), MASP-2 (6), CRP (5), TIMP-1 (4), YKL-40 ( 3), MMP-7 (3), PAI-1 (3), og suPAR (3). De prognostiske markører med mere end tre gentagelser blev valgt til meta-analyse og publikationsbias analyse ved hjælp af STATA (10 udgave) software, og resuméet er givet for hver markør i tabel 2.

Den mest hyppigst rapporterede prognostisk markør for CRC er CEA. CEA undersøgelser omfattede 5792 patienter, hvoraf 3856 patienter havde positive resultater for CEA markør, mens 1936 patienter var negative. De afskæringsværdier varierede fra 2,7 ng /ml til 10,0 ng /ml. Den mediane patientens alder på tværs af alle forsøg var mellem 47.74 og 73 år, med aldersgruppen 31-90 år. Alle patienter havde histologisk eller cytologisk bekræftet CRC, colon eller rektal cancer, som den primære diagnose. Der er 28 artikler relateret til CEA og prognosen resultatet af patienterne, hvoraf 6 artikler studeret både den samlede overlevelse (OS) og sygdomsfri overlevelse (DFS). Der er 9 artikler, der ikke angiver, om de studerede OS eller DFS; vi defineret disse som “uklar” (tabel 2). Et resumé af de enkelte forsøg og overordnede poolede resultater fra den primære analyse af den samlede overlevelse er vist i figur 4. Ifølge resultaterne (OS, DFS og uklare) blev CEA klassificeret i tre undergrupper, og de tre undergruppe datasæt var separat indsendes til meta-analyse og publikationsbias analyse. Som et resultat, de samlede timer med 95% CIs af OS, DFS, og uklare undergrupper var 1,624 (1,290-2,043), 1,453 (1,267-1,666), og 2,208 (1,479-3,297), henholdsvis, og den samlede HR (CI ) fra de tre kombinerede undergrupper var 1,513 (1,391 til 1,645) (figur 4 A). Efter analyse af publikationsbias ved metoden “trimme og fylde”, blev OS, DFS, og uklare undergrupper tilføjet med tre, syv, og en “manglende” undersøgelser (figur 4 B C og D og tabel 2), henholdsvis. De justerede HRs med 95% initiativerne for de tre undergrupper var 1,346 (1,083-1,671), 1,166 (1,018-1,336) og 2,073 (1,410-3,047), hhv. I modsætning hertil alle justerede HRs var relativt mindre end de ujusterede h (tabel 2, panel CEA). Ligeledes blev de samme metoder til meta-analyse og publikationsbias analyse gennemført for de resterende prognostiske markører med mere end tre gentagelser i undersøgelser om CRC. Resultaterne er vist i tabel 2, og egenskaberne af disse producenter er listet Tabel S5. De tilsvarende Skov plots og tragt plots vises Bilag 8 i Materials S1.

A er skoven plot og B, C og D er den “fyldte” tragt plots af OS, DFS, og den uklare gruppe, henholdsvis. Metaanalysen viste en signifikant effekt til fordel for en høj lydstyrke. De poolede og fyldte Resultaterne er præsenteret i tabel 2.

Diskussion

Vurdering af det systematiske review

I vores undersøgelse, vi udført en systematisk gennemgang og meta- analyse for alle de offentliggjorte CRC serum biomarkører. Gennem undersøgelsen, vi søgte 114 serum biomarkører (til diagnose 92, for prognose 41), hvoraf 20 biomarkører både kan fungere som diagnose og prognose markører. De fleste af de markører er blevet offentliggjort kun én gang, og de hyppigst rapporterede top tre markører for diagnose er CEA (42 studier), CA19-9 (25 studier), og CA242 (10 studier), og for prognosen, de er CEA ( 34 undersøgelser), CA19-9 (10 undersøgelser), og VEGF (9 undersøgelser). Til diagnosen markører, der blev undersøgt mere end to gange, vi brugte HSROC model og meta-analyse tilgang til sensitivitet og specificitet korrelationsanalyse. Resultaterne antydede, at næsten alle de puljede følsomheder af diagnosen markører var mindre end 50% og fulgt af betydelig heterogenitet. eksisterer Offentliggørelse bias for større diagnostisk serum CRC markører med en alternativ tilgang med tragt afbildninger af (naturlige logaritme (ln) DOR) vs () [28]. Ligeledes blev metaanalyser og publikationsbias analyse gennemføres for de prognostiske markører med mere end tre gentagelser i undersøgelser. Rækken af ​​alle de puljede HRs er fra 1 til 2, som angiver, at der ikke vil være nogen overlevelse, der opstår mellem de positive og negative patienter. Ifølge vores analyse kan vi forklare, hvorfor disse rapporterede diagnostiske og prognostiske markører for CRC er ikke egnede til kliniske anvendelser. Fordi de fleste af de puljede følsomheder af diagnosen markører var mindre end 50%, og heterogenitet var betydelig, og de sammenblandede timer af prognosen markører var større end 1 og mindre end 2.

Den ideelle undersøgelse prøve til en test nøjagtighed undersøgelse er en fortløbende eller tilfældigt udvalgt serie af patienter, hvor målet betingelse er mistænkt, eller til screening undersøgelser, målgruppen. Der er to grundlæggende typer af test nøjagtighed studier: kohortestudier og case-control studier. Både diagnostiske og prognostiske undersøgelser indgår i den nuværende systematiske review overvejende hører til case-kontrol design type, som kan skævhed [40]. Diagnostiske eller prognostiske tests udføre forskelligt i forskellige populationer [41], [42], Det er vigtigt klart at definere populationen af ​​interesse. I vores systematiske gennemgang, er undersøgelsespopulationen begrænset til primær CRC.

Analyse af mulige årsager til offentliggørelse og heterogenitet observeret

En potentiel kilde til bias (dvs. publikationsbias) er, om alle relevante undersøgelser er blevet identificeret, og et lille antal del-offentliggjorte undersøgelser kan have været udeladt. Fra tabel 1 og tabel 2, både diagnostiske og prognostiske undersøgelser har publikationsbias.

Be the first to comment

Leave a Reply