PLoS ONE: Risiko Prediction Model for kolorektal cancer: National Health Insurance Corporation Study, Korea

Abstrakt

Formål

Forekomst og dødelighed af kolorektal cancer er blevet hastigt stigende i Korea under sidste par årtier. Udvikling af risiko forudsigelse modeller for kolorektal cancer i koreanske mænd og kvinder er et presserende behov for at forbedre forebyggelse og tidlig opsporing.

Metoder

Køn specifikke femårige risiko forudsigelse modeller blev udviklet til den samlede kolorektal cancer, proksimal coloncancer, distal colon cancer, coloncancer og rektal cancer. Modellen er udviklet ved hjælp af data fra en befolkning på 846,559 mænd og 479,449 kvinder, der deltog i helbredsundersøgelser af National Health Insurance Corporation. Eksaminander var 30-80 år og fri for kræft i de grundlæggende år af 1996 og 1997. En uafhængig befolkning på 547,874 mænd og 415,875 kvinder, der deltog i 1998 og 1999 undersøgelser blev brugt til at validere modellen. Model validering blev udført ved at evaluere sine resultater i form af diskrimination og kalibrering evne ved hjælp af C-statistik og Hosmer-Lemeshow-type chi-square statistik.

Resultater

Age, body mass index, serum kolesterol, familie historie af kræft, og alkoholforbrug blev inkluderet i alle modeller til mænd, hvorimod alder, højde, og kød indtag frekvens blev inkluderet i alle modeller til kvinder. Modeller viste moderat god diskrimination evne med

C

-Statistik mellem 0,69 og 0,78. De C-statistikken var generelt højere i modellerne for mænd, mens kalibrering evner var generelt bedre i modellerne for kvinder.

Konklusioner

Tyktarmskræft risiko forudsigelse modeller blev udviklet fra storstilet , populationsbaserede data. Disse modeller kan anvendes til at identificere højrisikogrupper og udvikle forebyggende interventionsstrategier for kolorektal cancer

Henvisning:. Shin A, Joo J, Yang H-R, Bak J, Park Y, Kim J, et al. (2014) Risk Prediction Model for kolorektal cancer: National Health Insurance Corporation Study, Korea. PLoS ONE 9 (2): e88079. doi: 10,1371 /journal.pone.0088079

Redaktør: Dong Zhang, Nanjing Medical University, Kina

Modtaget: Juli 14, 2013; Accepteret: 5 januar 2014; Udgivet: 12 februar 2014

Copyright: © 2014 Shin et al. Dette er en åben adgang artiklen distribueres under betingelserne i Creative Commons Attribution License, som tillader ubegrænset brug, distribution og reproduktion i ethvert medie, forudsat den oprindelige forfatter og kilde krediteres

Finansiering:. Forfatterne har ingen støtte eller finansiering til at rapportere

konkurrerende interesser:. forfatterne har erklæret, at der ikke findes konkurrerende interesser

Introduktion

Tyktarmskræft er en af ​​de hurtigst voksende kræft. i den koreanske befolkning, med en årlig procentvise ændringer på 6,2% hos mænd og 6,8% hos kvinder mellem 1999 og 2009 [1]. Selvom dødeligheden fra kolorektal cancer begyndte at falde i de yngre generationer og kvinder [2], er kolorektal cancer stadig rangeret den fjerde mest almindelige årsag til kræft død [3].

Flere risiko forudsigelse modeller for kolorektal cancer har blevet udviklet og valideret i forskellige populationer [4] – [11]. De store roller risiko forudsigelse modeller er: 1) at identificere personer i høj risiko for at udvikle sygdommen, der kan så tilbydes individuelt tilpasset klinisk ledelse, målrettet screening og metoder til at reducere sygdomsbyrden og 2) at identificere nye risikofaktorer for sygdommen gennem forskning [11].

Nyere litteratur tyder på, at fordelingen af ​​molekylære undertyper af kolorektal cancer afvige med underordnede websteder [12], [13]. I vores tidligere undersøgelse, vi rapporterede, at risikofaktorer profiler afveg efter køn, og af de anatomiske placeringer af kolorektal cancer [14]. Derfor var fokus for denne undersøgelse for at udvikle tyktarmskræft risiko forudsigelse modeller for den samlede kolorektal cancer, proksimal tyktarmskræft, distal tyktarmskræft, og endetarmskræft for den koreanske befolkning; udnytte et stort sæt af helbredsundersøgelse data.

Metoder

studiepopulation

Denne undersøgelse blev godkendt af Institutional Review Board of National Cancer Center, Korea (IRB no. NCCNCS 09-305). Behovet for deltagernes samtykke blev givet afkald af den etiske komité, fordi denne undersøgelse involveret rutinemæssigt indsamlet medicinske data, der blev anonymt forvaltes i alle faser, herunder data rengøring og statistiske analyser.

To uafhængige sæt af befolkningen blev indarbejdet i denne studere. Det første datasæt blev brugt til model udvikling, som bestod af mænd og kvinder, der deltog i en lægeundersøgelser, som National Health Insurance Corporation (NHIC) mellem 1996 og 1997. Nærmere oplysninger om undersøgelsen design er blevet beskrevet andetsteds [14]. Deltagerne blev bedt om at udfylde selvadministrerede spørgeskemaer om alkoholforbrug, rygning vaner, regelmæssig motion, familie historie af kræft, kostpræferencer, og hyppigheden af ​​kødforbruget. Yderligere oplysninger om kvindelige reproduktive faktorer (dvs. alder ved menarche, alder ved første fødsel, overgangsalderen status og alder ved overgangsalderen) blev også indsamlet. Højde og vægt blev målt direkte, og body mass index (BMI) blev beregnet som vægt i kg divideret med højden i meter i anden potens.

andet datasæt blev brugt til model validering, som bestod af de deltog i en lægeundersøgelse i 1998 og 1999. de, der indgik i sidste ende var mellem 30 og 80 år, uden forudgående historie af kræft, og med nogen manglende oplysninger om nogen af ​​de store risikofaktorer variabler (dvs., højde, vægt , fastende serum glukose, total serum kolesterol, familie historie af kræft, cigaretrygning status (nuværende /tidl /ikke-rygere), og alkohol frekvens forbrug). Antallet af forsøgspersoner inkluderet var 1,326,058 (846.559 mænd og 479,499 kvinder) for udvikling sæt, og 963.749 (547,874 mænd og 415,875 kvinder) til validering sæt.

Cancer Konstatering

Forekomsten af ​​kræft blev konstateret fra den koreanske Central Cancerregisteret (KCCR) database, og død oplysninger fra den koreanske nationale statistiske kontor frem til december 2007. underordnede websteder for kolorektal cancer blev kategoriseret af International Classification of Disease 10. udgave (ICD-10) kode som følger : proksimal kolon (C180-C185), distal colon (C186-C187), og endetarm (C19-C20). Kræft med en overlappende læsion af tyktarmen (C188), og dem var ikke andet er angivet (C189) blev udelukket fra sub-site analyse.

Statistisk analyse

Fem modeller blev udviklet til den samlede kolorektal cancer, tyktarmskræft, højre tyktarmskræft, venstre tyktarmskræft, og endetarmskræft, separat for mænd og kvinder. Cox proportional-hazard regressionsmodeller blev brugt til at udvikle forudsigelse ligninger i udviklingen sæt. Kolorektal cancer hændelser blev talt som en begivenhed på datoen for indlæggelse registreres i Cancer Registrering af data. Forsøgspersonerne blev censureret på dødsdagen konstateret fra dødsattest databasen, eller på slutdatoen efter otte års opfølgning.

Rå og aldersjusterede analyser blev udført for hver risikofaktor. Alder og den kvadratiske hensyn til alder blev centraliseret ved at trække den gennemsnitlige alder af undersøgelsens deltagere. Risikofaktorerne i betragtning til modellerne var alder, alder-squared, højde, BMI, familie historie for kræft, fastende glukose, serum kolesterol, rygning vane, alkoholforbrug, og frekvens kødforbruget. Alle de risikofaktorer undtagen alder blev inkluderet som kategoriske variable i modellen. BMI blev kategoriseret efter WHO kriterier for den asiatiske befolkning ( 25,0

vs

≥25.0.). Højde var opdelt i kvartiler og den første kvartil blev brugt som reference. Variabel valg (frem, tilbage og trinvis) metoder med kriterierne for type I fejl 0,15 blev anset i den multivariate model til at bygge risikoen forudsigelse model udvælgelse og udelukkelse.

baseline overlevelse estimat for de gennemsnitlige værdier af risikoen faktorer for tiden t (t = 5 år) blev estimeret ved følgende ligning:. hvor

Her er regressionskoefficienten skøn, er de risikofaktorer for den enkelte og er middelværdierne for hver risikofaktor undersøgelsespopulationen. S (t) er baseline overlevelse estimat på tidspunktet t (t = 5 år), når alle de risikofaktorer er på deres middelværdier.

Diskrimination blev kvantificeret ved at beregne C-statistik for overlevelse model [15 ]. C-statistik er en konkordans foranstaltning analog med Receiver Operating Characteristic (ROC) Curve område for den logistiske model [16]. Værdien angiver sandsynligheden for, at en model producerer højere risiko for dem, der udvikler brystkræft inden for fem år opfølgning sammenlignet med dem, der ikke udvikle tyktarmskræft [16].

En Hosmer-Lemeshow (HL ) typen statistik blev anvendt til kalibrering [15]. Den statistik blev beregnet ved først at dividere data i 10 grupper (deciler) ved stigende orden forudsagte sandsynligheder produceret af modellen. Så, i hvert decil, er den gennemsnitlige forudsagte sandsynligheder blev sammenlignet med den faktiske begivenhed sats anslået af Kaplan-Meier tilgang. Værdier over 20 kan betragtes som en betydelig mangel på kalibrering [17].

Desuden forventede (E) og de observerede (O) antal kræfttilfælde blev sammenlignet for den samlede kolorektal cancer, og hver underordnede websteder. Alle statistiske analyser blev udført ved hjælp af SAS-version 9.1 (SAS Institute, Cary, NC).

Resultater

Under opfølgningsperioden blev 6.492 mænd og 2.655 kvinder udviklede kolorektal cancer i udvikling sæt. Blandt mændene var der 1.143 proksimale kolon kræft, 1.725 distale colon kræft, og 3.146 rektal kræftformer. Blandt kvinderne var der 604 proximale coloncancere, 606 distale coloncancere og 1.252 rektale cancere. Sager med overlappende læsioner i tyktarmen eller hvis kræft var ikke andetsteds specificeret læsioner blev udelukket (478 mænd og 193 kvinder).

I validering, 3.555 mænd og 1.969 kvinder blev diagnosticeret med tyktarmskræft. Blandt mændene var 605 proximale coloncancere, 909 distale coloncancere og 1.764 rektale cancere. Blandt kvinderne var der 433 proksimale kolon kræft, 448 distale colon kræft, og 958 rektal kræftformer.

Risikofaktorerne er medtaget i modellerne

Risikofaktorerne indgår i risiko forudsigelse modeller var anført i tabel 1 (mænd) og tabel 2 (kvinder). Alder, højde, familie historie for kræft, og mængden af ​​alkohol indtaget blev inkluderet i alle modeller for mænd. Body mass index blev inkluderet i alle modeller med undtagelse af en for højre tyktarmskræft.

Hos kvinder, alder og højde blev inkluderet i alle modeller. Fastende glukose og familie historie af kræft blev inkluderet i alle modeller undtagen at for endetarmskræft, og frekvens kødforbruget blev inkluderet i alle modeller undtagen at for den rigtige kolon. BMI blev inkluderet i modellen for kun rigtige kolon, og hyppigheden af ​​alkoholforbruget blev inkluderet i modellen for endetarmskræft kun.

Model ydeevne

Diskrimination.

Den diskriminerende evne af modellen blev målt under anvendelse af C-statistik i både udvikling og validering sæt (tabel 3). De C-statistik for modeller for mænd varierede 0.762~0.786 og disse statistikker til modeller for kvinder var 0.678~0.763. Modeller for colorectum (0,762 for udvikling sæt og 0,779 til validering sæt), venstre colon (0,786 for udvikling sæt og 0,779 til validering sæt), samt endetarmen (0,753 for udvikling sæt og 0,779 til validering sæt) viste de højeste C-statistik hos mænd, mens modeller for højre colon viste de højeste værdier i kvinder (0,745 for udvikling sæt og 0,763 til validering sæt).

Kalibrering.

Figur 1-A, 2- A, 3-A, 4-A, og 5-A viser kalibrering grunde til den samlede kolorektal cancer model samt E /O-forhold mellem validering sæt til mandlige kolorektal, højre colon, venstre colon, rektal, og tyktarmskræft, henholdsvis og figures 1-B, 2-B, 3-B, 4-B, og 5-B viser dem efter kvinde, henholdsvis. Tabel 3 præsenterede Hosmer-Lemeshow-type chi-square værdier. I almindelighed er de hændelser forudsagt af modellerne var meget tæt på de faktiske hændelser i mandlige modeller. Kun modeller for venstre coloncancer hos mænd viste ikke signifikant forudsigelse magt. Hos kvinder, men ingen af ​​modellerne viste signifikant forudsigelse evne.

Vejviser

Diskussion

Nyt epidemiologiske og kliniske oplysninger tyder på, at kolon kræft og endetarmskræft er særskilte sygdomme [12], [13], [18]. Desuden proximale og distale koloner er forskellige i embryologic oprindelser, morfologisk udseende af slimhinden, fysiologiske funktion, og galdesyre sammensætning [19], [20]. Blandt flere kolorektal cancer risiko forudsigelse modeller udviklet og valideret [11], kun én undersøgelse giver separate modeller for proksimal og distal colon og rektum [6]. En undersøgelse, der er fastsat særskilte modeller for tyktarmskræft og endetarmskræft [7]. Tidligere offentliggjorde vi en artikel om risikofaktoren profiler til forskellige kolorektal cancer underordnede [14]. De forudsigelse modeller blev udviklet ved hjælp af samme datasæt for modellen udvikling med en længere opfølgningsperiode. Desuden blev en uafhængig befolkning bruges til model validering.

Modellerne viste moderat god evne diskrimination. Modellen for den samlede kolorektal cancer viste den bedste kalibrering evne. Blandt de modeller for kvinder, at for rette tyktarmskræft viste den højeste evne diskrimination og at for venstre tyktarmskræft viste de laveste C-statistik. Desværre ingen af ​​modellerne viste nogen meningsfuld kalibrering evne. Alligevel viste vores modeller C-statistik, der var sammenlignelig med, eller endog højere end andre kolorektal cancer risiko forudsigelse modeller [11]. De C-statistik for tre tidligere modeller 0.67-0.71 for Harvard Cancer Risk Index, 0,61 for den amerikanske undersøgelse, og 0,62-0,66 for japansk undersøgelse, henholdsvis, mens dem, for vores modeller var 0,68-0,78 [11]. Faktisk gjorde model for venstre tyktarmskræft hos kvinder ikke nå C-statistik over 0,7. To undersøgelser, kalibrering statistikker forholdet mellem observerede vs. forventede kolorektal cancer begivenheder (O /E) [7], [8]. De O /E ratio varierede afhænger risikofaktor profil [7], [8]. I en japansk model for mænd, det Hosmer-Lemeshow chi-square p-værdi var 0,08 [7].

Incidensraten for tarmkræft hos kvinder er to tredjedele, at mænd for den koreanske befolkning [21] . Relativt lave kræft incidensrater for kvinder sammenlignet med mænd, kan begrænse den statistiske effekt af modeller for kvinder. Mangel på detaljerede oplysninger om kvindelige-specifikke risikofaktorer såsom reproduktive og hormonelle faktorer kan være en anden årsag til den begrænsede magt kalibrering [22].

De nuværende risiko prognosemodeller til formål at vurdere sandsynligheden for sporadisk kolorektal cancer risiko. Arvelige kolorektal cancer syndromer såsom HNPCC og familiær adenomatøs polypose er kendt for at udgøre op til 2% af de samlede kolorektal kræft [23], [24]. Blanding arvelige kræfttilfælde i vores undersøgelse kohorte kan have udvandet de relative risici på grund af miljømæssige faktorer.

De styrker den aktuelle undersøgelse omfatter en stor stikprøve og fuldstændigheden af ​​kræft opfølgning af samkøring af data til registrering af kræft og dødsattester. Begrænsninger omfatter begrænsede oplysninger om kosten risiko eller beskyttende faktorer såsom calcium og fiber indtag [25], eller ikke-kosten faktorer såsom non-steroide anti-inflammatoriske lægemidler [26]. Forrige koloskopi, som kan reducere forekomsten af ​​kræft blev ikke anset i modellen.

Som konklusion, risiko prognosemodeller for tarmkræft udviklet ved at udnytte store forsikringsselskaber-baserede datasæt fra den koreanske befolkning, viser en rimelig evne diskrimination. Disse modeller til at definere grupper med høj risiko for tarmkræft og vejlede dem til at ændre risikoadfærd samt at gennemgå kræftscreening.

Be the first to comment

Leave a Reply