PLoS ONE: Prediction Model for mavekræft Forekomst i koreansk Befolkning

Abstrakt

Baggrund

Forudsigelse højrisikogrupper for mavekræft og motivere disse grupper til at modtage regelmæssige checkups er nødvendig for tidlig påvisning af mavekræft. Formålet med denne undersøgelse er var at udvikle en forudsigelse model for mavekræft incidens baseret på et stort populationsbaseret kohorte i Korea.

Metode

Baseret på National Health Insurance Corporation data, vi analyseret 10 store risikofaktorer for mavekræft. Den Cox proportionel risiko model blev brugt til at udvikle kønsspecifikke forudsigelse modeller for gastrisk udvikling af kræft, og udførelsen af ​​den udviklede model i form af diskrimination og kalibrering blev også valideret ved hjælp af en uafhængig kohorte. Diskrimination evne blev vurderet ved hjælp af Harrell s C-statistik, og kalibreringen blev evalueret ved hjælp af en kalibreringskurve og hældning.

Resultater

Under en median på 11,4 års opfølgning, 19.465 (1,4% ) og 5.579 (0,7%) nyudviklede mavekræft sager blev observeret blandt 1,372,424 mænd og 804,077 kvinder hhv. De forudsigelsesmodeller omfattede alder, BMI, familie historie, måltid regelmæssighed, præference salt, alkoholforbrug, rygning og fysisk aktivitet for mænd, og alder, BMI, familie historie, præference salt, alkoholforbrug og rygning for kvinder. Denne forudsigelse model viste god nøjagtighed og forudsigelighed i både udviklingslandene og validering kohorter (C-statistik: 0,764 for mænd, 0,706 for kvinder).

Konklusioner

I denne undersøgelse en forudsigelse model for gastrisk kræfttilfælde blev udviklet, der viste en god præstation

Henvisning:. Eom BW, Joo J, Kim S, Shin a, Yang HR, Park J, et al. (2015) Prediction Model for mavekræft Forekomst i koreansk Befolkning. PLoS ONE 10 (7): e0132613. doi: 10,1371 /journal.pone.0132613

Redaktør: Masaru Katoh, National Cancer Center, JAPAN

Modtaget: Januar 29, 2015; Accepteret: 12 juni 2015; Udgivet: 17 Jul 2015

Copyright: © 2015 Eom et al. Dette er en åben adgang artiklen distribueres under betingelserne i Creative Commons Attribution License, som tillader ubegrænset brug, distribution og reproduktion i ethvert medie, forudsat den oprindelige forfatter og kilde krediteres

Data Tilgængelighed: Vores data er tilgængelige efter anmodning, fordi vi brugte data fra National Health Insurance Corporation. Denne database består af medicinske data, herunder personlige og finansielle oplysninger. Vores data er tilgængelige efter godkendelse institutionelle udvalg. Kontakt venligst anmode om data Byung-Ho Nam ([email protected])

Finansiering:. Dette arbejde blev støttet af en bevilling fra National Cancer Center Korea (nr NCC-1.110.310).

konkurrerende interesser: forfatterne har erklæret, at der ikke findes konkurrerende interesser

Introduktion

mavekræft er den fjerde mest almindelige kræftform i verden, og cirka 1 million nye tilfælde. diagnosticeres årligt på verdensplan [1]. Selvom forekomsten er faldet betydeligt i de fleste dele af verden, forbliver mavekræft den mest almindelige kræftform, og den tredje mest almindelige årsag til kræftdødsfald i Korea [2,3].

Prognosen for patienter med gastrisk kræft er meget forskellige alt efter patologisk stadium. Det 5-års overlevelsesraten for patienter med stadie IA mavekræft er 95,1-98,9% i Korea; Men denne figur afviser at 26,1-32,2% hos patienter med stadium IIIC [4-6]. For de patienter, der gennemgår palliativ kemoterapi for trin IV, forventes en samlet overlevelse på ca. 1 år på verdensplan [7,8]. Denne store forskel i overlevelse baseret på den fase tyder på, at tidlig påvisning før tumorprogression er vigtigt for en god prognose. For tidlig påvisning, regelmæssig screening er afgørende, og regelmæssig screening blev rapporteret at være forbundet med en lavere dødelighed af mavekræft i tidligere populationsbaserede kohortestudier [9-11].

I Korea, den nationale mavekræft screeningsprogram har kørt siden 1999 som en del af National Cancer screening program [12]. Målgruppen af ​​National Cancer Screening Program var mindre end 50% af National Health Insurance modtagere i 2005 og blev udvidet til udelukkende af Sygesikringen modtagere i 2010. Derfor, for at alle modtagere ældre end 40 blev rådgivet gennemgå en gastroskopi eller øvre gastrointestinale serie undersøgelser hvert 2. år.

screeningen sats var 34,4% i 2004 og steg til 64,6% i 2011. ikke desto mindre er en betydelig andel af egnede patienter stadig ikke undergår mavekræft screening. Offentlig ligegyldighed til masse-screening og manglende viden om risikofaktorer for at udvikle mavekræft kan være relateret til den lave screening sats. Derfor kan identificere risikogrupper høje og anmeldelsen af ​​sådanne populationer har en signifikant effekt på forbedring af overlevelsen.

En risiko forudsigelse model er en enkel og effektiv metode, der anvendes til evaluering individualiseret risiko ved at kvantificere kræftrisiko . Imidlertid har nogle undersøgelser etablerede risikofaktorer forudsigelse modeller for mavekræft forekomst ved hjælp af epidemiologiske risikofaktorer [13]. I denne undersøgelse har vi foretaget en systematisk undersøgelse af de potentielle risikofaktorer for mavekræft hjælp af en stor populationsbaseret kohorte i Korea, med det formål at udvikle en risiko forudsigelse model for mavekræft forekomst.

Materialer og Metoder

studiepopulation

undersøgelsen kohorte bestod af koreanske statsansatte, lærere, virksomhedens medarbejdere og deres pårørende, som gennemgik en toårig lægeundersøgelse fra National Health Insurance Corporation (NHIC) mellem år 1996 og 1997. Efter at udelukke de modtagere, der var under 30 eller over 80, og som havde en tidligere cancer historie, eller som er blevet diagnosticeret som med mavekræft mellem år 1996 og 1997, vi identificeret 2,291,132 personer (1,436,958 mænd og 854,174 kvinder) med data på baseline karakteristika. Ti risikofaktorer blev anset for modellering, herunder alder, body mass index (BMI), familie historie af enhver form for kræft, måltid regelmæssighed, salt præference, hyppigheden af ​​kød forbrug, præference kosten, alkoholforbrug, rygning og fysisk aktivitet. Men NHIC data har en stor del af manglende data, fordi de fleste livsstil information blev opnået ved selvrapportering spørgeskemaer,. Efter de modtagere, der havde manglende data på et af de risikofaktorer blev udelukket, kun 823,741 (57,3%) mænd og 369,554 (43,3%) kvinder forblev.

Andelen af ​​udstødte modtagere på grund af manglende data var betydeligt høj; derfor, suppleret vi data ved hjælp af imputering metoden. Vi var i stand til at gøre dette, fordi det NHIC undersøgelse blev givet hvert andet år, og vi var i stand til at hente nogle oplysninger fra NHIC eksamen data udført i de andre år end 1996 og 1997. Når en deltager fik flere undersøgelser, det nærmeste tidspunkt blev anvendt til at imputere de manglende værdier. Endelig 1,372,424 (95,5%) mænd og 804,077 (94,1%) kvinder var tilgængelige for model udvikling efter imputering. Forskellen i forudsigelsesmodeller udviklet på baggrund af de fuldstændige data og imputerede data med de nærmeste observationer var mindre (S1 File); Derfor blev den model udvikling og validering baseret på den imputerede, større datasæt.

For at evaluere resultaterne af den udviklede model, en uafhængig befolkning, der gennemgik National Health Insurance Corporation medicinsk vurdering mellem år 1998 og 1999 blev anvendt som en validering kohorte. Blandt alle støtteberettigede modtagere, vi udelukkede modtagere, der indgik i udviklingsmodellen i tillæg til modtagere, der mødte samme udelukkelseskriterier. Lignende manglende data imputering blev anvendt, og endelig i alt 484,335 mænd (4,3% mangler) og 466,013 kvinder (3,5% mangler) blev inkluderet i valideringen kohorte.

Denne undersøgelse blev godkendt af Institutional Review Board of National Cancer center, Korea (IRB nr. NCCNCS 09-305).

Dataindsamling og risikofaktor vurdering

Under sundhed undersøgelse vægt, højde og blodtryk hver deltagers var målt som en del af rutinemæssig fysisk undersøgelse. Derudover deltagerne udfyldt et spørgeskema om familie historie af enhver form for kræft, tidligere sygdom historie, kostvaner, alkoholforbrug, rygning og fysisk aktivitet. Hvert spørgsmål havde enkle valg, fordi det var self-registreres og de kategorier af kost vaner og fysisk aktivitet var subjektive dem som ‘Almindelig’, ‘Intermediate’ og ‘Uregelmæssig’ for måltid regelmæssighed, og “Ikke salt ‘,’ Intermediate ‘ , og “Salty” for salt præference. Baseret på disse enkle spørgeskemaer, blev analyseret risikofaktorer for gastrisk udvikling af kræft.

Kræft konstatering og identifikation af døden

Data for mavekræft forekomst blev opnået fra den koreanske Central Cancerregisteret database til december 31, 2007. Baseret på international klassificering af sygdom, 10. udgave, C16 blev anvendt til forekomsten af ​​mavekræft. Dødsfald og dødsårsager blev identificeret fra død registreringer af det nationale statistiske kontor, der er en landsdækkende registrering af dødsfald, og National Health Insurance Corporation.

Statistisk analyse

en Cox proportionel risiko regressionsmodel blev anvendt til at estimere de relative risici (og tilsvarende 95% konfidensintervaller (CIS)) af mavekræft forekomst for hver af de potentielle risikofaktorer. Den proportionalitet i farer blev undersøgt via log-log overlevelse plots. Vi bemærkede, at de demografiske karakteristika og miljømæssige eksponeringer var forskellige mellem mænd og kvinder, og begge rå og alder (ved baseline) justeres analyser blev udført separat for mænd og kvinder.

De potentielle risikofaktorer overvejes i analysen var BMI ( 18,5, 18,5 til 22,9, 23,0 til 24,9, og ≥25), familie historie af enhver form for kræft (ja eller nej), måltid regelmæssighed (regelmæssig, mellemliggende, uregelmæssig), salt præference (ikke salt, mellemliggende, salt), hyppigheden af ​​kød forbrug (≤1, 2-3, og ≥4 gange om ugen), præference kosten (grøntsager foretrækkes, blandet, og kød foretrækkes), alkoholforbrug (none, dvs 0 g, lys, dvs. 1-14,9 g; moderat, dvs 1.5.0-24.9 g, og tung, dvs. ≥25 g ethanol pr dag), rygning (aldrig, tidligere, nuværende 10, nuværende 10-19, og nuværende ≥ 20 cigaretter om dagen), og fysisk aktivitet (ingen, let, moderat, og tunge). For kvinder, på grund af det lille antal af tilfælde, blev der flere kategorier af de alkoholforbrug og rygning variabler kombineres. For alkoholforbrug, blev dem med mere end 15 g ethanol kombineret, og kun to kategorier blev anvendt til rygning (aldrig, ryger). Yderligere beskrivelser af begrundelsen for de kategoriseringer af disse variable kan findes andre steder [14,15].

En baglæns variabel valgmetode med en type I fejl kriterium på 0,1 baseret på likelihood kvotientkriteriet blev betragtet i multivariable model. Sandsynligheden for at udvikle mavekræft inden t år (t = 8) for en person med kovarianteffekter værdier x = (x

1, …, x

K) for K risikofaktorer kan estimeres ved hjælp af følgende ligning:

Her S

0 (t) er den gennemsnitlige overlevelse sandsynlighed på tidspunkt t for en person, hvis kovariat værdier er alle 0, og β

er er de estimerede koefficienter fra Cox proportional hazard model . Når β

jeg og S

0 (t) opnås, kan estimeres sandsynligheden for at udvikle mavekræft for ethvert sæt af kovarianteffekter værdier.

De udviklede modeller blev valideret i en uafhængig kohorte befolkning ved at evaluere effektiviteten af ​​de modeller med hensyn til deres evne diskrimination ved hjælp C-statistik, og kalibreringen evne blev vurderet ved hjælp af en kalibreringskurve og kalibrering hældning [16-21].

Harrell s C-statistik for overlevelse data blev behandlet i denne undersøgelse [18-20]. Denne værdi repræsenterer sandsynligheden for, at den forudsagte sandsynlighed for at udvikle gastrisk cancer er højere for dem, der faktisk udvikler mavekræft i 8 år end for dem, der ikke udvikler mavekræft. Kalibrering er relateret til nøjagtigheden af ​​forudsigelsen. For at generere en kalibrering plot, blev data først opdelt i 10 usammenhængende undergrupper efter de forudsagte sandsynligheder for at udvikle mavekræft baseret på den udviklede model. Den forventede (den gennemsnitlige forudsagte sandsynligheder) og observeret (selve arrangementet sats målt ved Kaplan-Meier estimat) værdier blev derefter plottet. Derudover, for at opnå den kalibreringshældning, blev den prognostiske indeks (PI) fra Cox regression, som er en vægtet linearkombination af de udvalgte til forudsigelse model variabler, opnået for enkeltpersoner i sættet datavalidering, og regressionskoefficienten på PI blev opnået. Et PI tæt på 1 angiver god kalibrering, og en risiko-kvotientkriteriet der tester, om denne hældning er 1 udføres derefter [22]

Alle analyser blev udført ved anvendelse af SAS (version 9.1.3;. SAS Institute , Cary, NC) og STATA (version 13) software.

Etik erklæring

Denne undersøgelse blev udført med godkendelse af de institutionelle anmeldelse bestyrelser National Cancer, center, Korea (nr NCCNCS 09-305). Deltagernes informeret samtykke blev fraviges af de institutionelle anmeldelse boards, fordi denne undersøgelse involveret rutinemæssigt indsamlede medicinske data, der blev anonymt forvaltet i alle faser, herunder stadier af data rengøring og statistiske analyser.

Resultater

kræftforekomst og baseline karakteristika

Det samlede antal personår års opfølgning var 14.815.612 for mænd og 8.471.357 for kvinder til en median på 11,3 års opfølgning. De gennemsnitlige (SD) aldre af mænd og kvinder var 45,1 (10,5) og 48,7 år (11,0), hhv. Under opfølgning, blev 19,465 (1,4%) og 5.579 (0,7%) tilfælde af mavekræft observeret blandt 1,372,424 mænd og 804,077 kvinder henholdsvis, hvilket resulterer i forekomst af 131,38 /100.000 og 65,89 /100.000 personår for hvert køn. I valideringen kohorte, blev observeret i alt 6,628 og 2.920 gastriske kræfttilfælde ud af 484,335 mænd og 466,013 kvinder henholdsvis. De incidensrater i valideringen kohorten var 164,54 /100.000 for mænd og 75,84 /100.000 for kvinder; disse var højere end dem, der observeres i modellen udvikle kohorte.

Risikofaktorer

For at evaluere de væsentligste risikofaktorer for mavekræft forekomst, en multivariabel analyse blev udført på grundlag af kriterier de variable udvælgelseskriterier. Tabel 1 og 2 viser forekomsten af ​​mavekræft og det anslåede hazard ratio for hver af de potentielle risikofaktorer for mænd og kvinder henholdsvis. For mænd, de betydelige risikofaktorer for mavekræft forekomst var alder, lav vægt, har et familiemedlem, som tidligere havde haft nogen form for kræft, uregelmæssige måltider, præferencer salt, alkoholforbrug og rygning. Blandt disse risikofaktorer, blev en klar tendens til øget risiko observeret for alkoholforbrug og rygning (lineær trend test

P

0,0001 for begge variabler). Storforbrug (ethanol ≥ 25 g /dag) havde en mere end 20,4% øget risiko, og storrygere (1 pakke øjeblikket) havde en mere end 43,1% øget risiko for mavekræft forekomst. Derudover dem, der havde et familiemedlem med enhver form for kræft havde en 30,2% øget risiko, og uregelmæssig måltid forbrug og en præference for salt mad også tillægges en øget risiko. Omvendt er en BMI ≥23 kg /m

2 og moderat til høj fysisk aktivitet var beskyttende faktorer.

For kvinder, de betydelige risikofaktorer var alder, BMI, have en familie medlem, der havde nogen form for kræft, og tidligere rygning. Salt præference og alkoholforbrug havde var marginalt signifikant ( 0,1; disse variabler blev derfor medtaget i modellen)., Og måltid regelmæssighed og fysisk aktivitet havde ingen effekt på mavens kræfttilfælde hos kvinder

Prediction model

på baggrund af de multivariable analyseresultater, vi udviklede kønsspecifikke forudsigelsesmodeller som følger. (A for mænd, B for kvinder).

A. Risk forudsigelse model for mænd

Trin 1:. Form en prognostisk indeks (PI) ved hjælp af β-koefficienten skøn

Trin 2: Beregn sandsynligheden

P

= 1 S (t

Be the first to comment

Leave a Reply