PLoS ONE: En heuristisk løsning af Identificerbarhed Problem Age-Periode-Kohorte Analyse af Cancer Forekomst: Lung Cancer Example

Abstrakt

Baggrund

The Age-Periode-Kohorte (APC ) analyse er at estimere de følgende virkninger på sygdomsforekomst: (i) alder af emnet på tidspunktet for sygdommens diagnose; (Ii) det tidsrum, når sygdommen indtraf; og (iii) fødselsdato af emnet. Disse effekter kan hjælpe med at evaluere de biologiske begivenheder, der førte til sygdommen, estimering indflydelse distinkte risikofaktorer på sygdomsforekomst, og i udviklingen af ​​nye strategier for forebyggelse og behandling af sygdomme.

Metode /vigtigste resultater

Vi udviklede en ny tilgang til at estimere APC virkninger på sygdomsforekomst satser inden for rammerne af den Log-Linear Age-Periode-Kohorte (LLAPC) model. Eftersom APC effekter er lineært afhængige af hinanden og kan ikke entydigt anslås, at løse dette problem kræver identificerbarhed indstilling fire redundante parametre inden for et sæt ukendte parametre. Ved at sætte tre parametre (en af ​​det tidsrum og fødsel-kohorte effekter og den tilsvarende alder effekt) til nul, reducerede vi dette problem på problemet med at bestemme en overflødig parameter og anvendt som sådan, effekten af ​​tids- periode støder op til det forankrede tidsperiode. Ved at variere denne identifikation parameter, kan der opnås en familie af skøn over APC effekter. Ved hjælp af en heuristisk antagelse, at forskellene mellem de tilstødende fødsel-kohorte effekter er små, har vi udviklet en numerisk metode til bestemmelse af den optimale værdi af identifikation parameter, hvorved et unikt sæt af alle APC effekter er fast besluttet på, og identificerbarhed problemet er løst.

konklusioner /betydning

Vi har testet denne tilgang, mens estimering APC virkninger på lungekræft forekomst i hvide mænd og kvinder ved hjælp seeren data, der er indsamlet i løbet af 1975-2004. Vi viste, at LLAPC modeller med de tilsvarende unikke sæt af APC effekter anslået af den foreslåede fremgangsmåde passer meget godt med de observationsdata

Henvisning:. Mdzinarishvili T, Sherman S (2012) En heuristisk løsning af Identificerbarhed problem af Age-Periode-Kohorte Analyse af Cancer Forekomst: lungekræft Eksempel. PLoS ONE 7 (4): e34362. doi: 10,1371 /journal.pone.0034362

Redaktør: Giuseppe Biondi-Zoccai, Sapienza-universitetet i Rom, Italien

Modtaget: 18 oktober, 2011; Accepteret: 27 februar 2012; Udgivet: April 4, 2012 |

Copyright: © 2012 Mdzinarishvili, Sherman. Dette er en åben adgang artiklen distribueres under betingelserne i Creative Commons Attribution License, som tillader ubegrænset brug, distribution og reproduktion i ethvert medie, forudsat den oprindelige forfatter og kilde krediteres

Finansiering:. Forfatterne har ingen støtte eller finansiering til at rapportere

konkurrerende interesser:. forfatterne har erklæret, at der ikke findes konkurrerende interesser

Introduktion

for mere end 50 år, betydningen af ​​præcise. der tegner sig for de Age-Periode-Kohorte (APC) virkninger er blevet godt anerkendt af epidemiologer og matematikere i sygdomsforekomst og dødelighed undersøgelser. I sådanne undersøgelser, er forekomsten defineret som et forhold mellem antallet af hændelser divideret med den samlede mandår erfaring. Det antages, at tælleren i dette forhold har en Poisson fordeling og standardfejlene () af forekomsten beregnes som forholdet mellem den kvadrerede roden af ​​antal hændelser divideret med det samlede personår [1]. Ofte er det også forudsat, at logaritmen incidensraten kan modelleres som en lineær funktion af specificerede regressorer: APC effekter. Sådanne modeller over frekvensen tilhører de såkaldte generaliseret lineær model [2]. Især i Log-Linear Age-Periode-Kohorte (LLAPC) model, den observerede variabel er logaritmen incidensraten, som er tilnærmet ved summen af ​​APC effekter [2]. Problemet er at finde ud af, hvordan at estimere disse effekter fra de observerede incidensrater.

APC analyse

I dette arbejde, ved hjælp af de langsigtede observationsdata, vi bestemme APC effekter i rammen af LLAPC model [2]. Ved definition [1], den rå incidensrate for den givne alder, tid-periode (TP) og fødselskohorten (BC) intervaller, er et forhold mellem antallet af kræft forekomster, divideret med det samlede antal årsværk i fare ,: (1), hvor intervallerne alder er indekseret som; de perioder af kræft hændelser som; de fødselskohorter kræft hændelser som; og, og er numre på aldersintervaller, perioder og fødselskohorter, tilsvarende.

Lad os antage, at de tidsmæssige intervaller, indekseret af, og, har samme størrelse (f.eks fem år lange intervaller, der sædvanligvis anvendes i APC undersøgelser). I dette tilfælde, disse indekser og og tal er relateret på følgende måde [2] 🙁 2) og. Det skal bemærkes, at ifølge (2), er indekset entydigt defineret af indekser, og. Derfor vil der i (1), kan indeksere udelades, uden at glemme, at incidens satser er også afhængige af BC effekter

LLAPC model er normalt præsenteres med følgende system af betingede ligninger:. (3), og (4) hvor er en logaritme af den observerede incidens rate, betegner alderen effekt, – TP effekt, – BC effekt, og den konstante sigt, er skæringspunktet [2]. I denne model, vægte for de observerede data, er valgt til at være omvendt proportional med deres prøveudtagning forskelle, 🙁 5), hvor (6) Formel (6) opnås under forudsætning af, at antallet af kræft forekomster i hver gruppe er uafhængige stokastiske variable er karakteriseret ved en Poisson-fordeling. Det antages også, at variansen på incidensrater, er udelukkende på grund af variationer i det lille antal kræft forekomster, i forhold til de samlede personår i fare, [3]. Fra (5) og (6) følger det, at: (7) APC problem er at afgøre, fra ordningen med betingede ligninger (3) med vægte (7) følgende: (i) skøn over alder effekter,; (Ii) overslag over de TP effekter ,; (Iii) overslag over BC effekter,; og (iv) skæringen,. Yderligere begrænsninger på parametrene skal foretages for at opnå en løsning. En fremgangsmåde er at sætte tre effekter (en af ​​TP effekter,, en af ​​BC effekter, og den tilsvarende Age effekt, hvor) til nul og derefter at bruge disse indstillinger som referenceniveauerne. En anden fremgangsmåde er at sætte de summer af disse virkninger til nul [2]. I det foreliggende arbejde, bruger vi den første tilgang

Fra de førnævnte indstillinger og fra (1-7), følger det, at:.

præsenterer den modellerede incidensrate for at få kræft, når de forankrede parametre er:, og

præsenterer den modellerede aldersspecifikke incidens rate for at få kræft i en given alder interval, når TP og BC effekter er fraværende

præsenterer modelleret.. TP-incidens rate for at få kræft for et givet TP interval, når Alder og BC effekter er fraværende.

præsenterer den modellerede BC-incidens rate for at få kræft i en BC interval, når Age og TP effekter er fraværende.

præsenterer den modellerede incidensrate for at få en bestemt type kræft i en given alder interval, en TP interval, og en BC interval, når alle disse effekter er til stede.

I 2), 3) og 4), The Age effekter ,, TP effekter ,, og BC effekter, kan præsenteres som logaritmer i ulykkesfrekvensen nøgletal:,, og, tilsvarende. Således ,, og parametre er dimensionsløs og deres variationer (i forhold til den tilsvarende successive Age, TP og BC intervaller) angiver de tidsmæssige tendenser disse effekter.

Identificerbarhed problem

Systemet (3) kan ikke løses direkte ved hjælp af fremgangsmåder af multiple lineære regressioner skyldes, at udformningen matrix af systemet (3), i LLAPC er rang mangelfuld. (Dette faktum kan direkte kontrolleres i praksis, for eksempel ved anvendelse MATLAB funktion,

rang

). Dette skyldes, at APC virkninger er lineært forbundet med hinanden. Derfor er disse virkninger kan ikke entydigt og samtidigt estimerede (flere estimatorer for disse parametre giver lignende løsninger). Matematisk dette problem falder i en kategori af de

identificerbarhed

problemer, til gengæld er en særlig underklasse af en mere generel klasse af

dårligt stillet

eller

forkert-stillet

matematiske problemer. Løsning af identificerbarhed problem, i særdeleshed, og de dårligt stillede problemer generelt kræver brug af ekstra antagelser og /eller

a priori

viden om deres løsninger [4].

Approaches der er blevet anvendt i APC analyse for at løse identificerbarhed problemet er gennemgået i flere papirer (se f.eks, [2], [5], [6] og referencer deri). I disse tilgange, er enten tre effekter (en af ​​de TP effekter, en af ​​de BP effekter, og den tilsvarende Age effekt) sat til nul, og brugt som referenceniveauer eller summen af ​​disse effekter er sidestilles med nul. Men disse indstillinger er stadig utilstrækkelig til at løse identificerbarhed problemet [2], og krævede brug af yderligere begrænsninger på et sæt parameterestimaterne, der skal fastlægges. Selv om en række yderligere begrænsninger og nytten af ​​agtværdige funktioner (som er invariant for en bestemt sæt af modelparametre) allerede er blevet foreslået, at identificerbarhed problemet stadig stort set uløst [2], [5], [6].

i dette arbejde, vi udvidet den velkendte fremgangsmåde anvendes i APC-analyse til løsning identificerbarhed problem [2], [3], [7], [8], hvor fire redundante parametre inden et sæt af ukendte parametre, der skal bestemmes, er sidestilles med nul. I vores tilgang, vi fast (sæt til nul) kun tre redundante parametre og brugte dem som referenceniveauer. I modsætning til de “traditionelle” tilgange, hvor alle fire parametre lig med nul vi bestemt en optimal værdi af den fjerde parameter ved hjælp af en ekstra heuristisk antagelse (se nedenfor). Vi anvendte en virkning af tidsperioden støder op til det forankrede tidsrum som sådan parameter. Vi har vist, at ved at variere denne parameter fra -∞ til ∞, kan der opnås alle mulige løsninger af APC problem. Til vores bedste viden, er en sådan generel løsning af APC problemet (en komplet familie af estimater af APC effekter), som kun afhænger af én “identificerbarhed” parameter givet for første gang i det nuværende arbejde.

en heuristisk antagelse

for at få en optimal værdi af identifikation parameter, brugte vi en heuristisk antagelse, at virkningerne af de tilstødende årgange er tæt på. Denne antagelse er begrundet i, at de flerårige tilstødende fødselstal kohorter overlapper hinanden i tidsintervaller. Under anvendelse af denne antagelse, vi udviklet en numerisk metode til bestemmelse af den optimale værdi af identifikation parameter. Med den optimale værdi af denne parameter, kan et unikt sæt af APC virkninger bestemmes og dermed identificerbarhed problem overvindes. Fremgangsmåden til opnåelse af den optimale værdi af identificerbarhed parameter foreslået i dette arbejde gør det muligt at opnå en særskilt opløsning (er) af APC identificerbarhed problem afhængigt af en

priori

antagelse (s).

Proof-of-concept

Vi testede den foreslåede numerisk metode, mens estimere APC virkninger på lungekræft (LC) incidensrater i hvide mænd og kvinder, ved hjælp af data indsamlet i SEER 9 database under 1975-2004.

Materialer og metoder

data forberedelse

for at teste den foreslåede fremgangsmåde, vi brugte Seer-databaser, der omfatter antallet af forekomster af forskellige former for kræft og oplysninger om befolkningen i fare fås fra US Census Bureau. I vores undersøgelse, data om LC forekomst i hvide mænd og kvinder opsamlet i SEER 9 under 1975-2004 [9] blev udnyttet. Vi brugte data fra de ni registre snarere end data fra de aktuelt tilgængelige 17 registre, fordi den langsgående karakter af vores undersøgelse krævede udnyttelse af data går tilbage tre årtier, hvor der kun var ni registre.

Fra SEER 9 vi udvindes den første primære, mikroskopisk bekræftede LC sager stratificeret efter køn og race. Antallet af LC forekomster i hvide mænd og kvinder og de tilsvarende personår i fare udvundet fra SEER 9 var grupperet i seks femårige tværsnitsundersøgelser TP grupper: 1975-1979, …, 2000-04; 18 femårige aldersgrupper: 17 grupper, der spænder fra 0 til 84 år, og den 18. gruppe herunder alle tilfælde for aldre 85 +; og 17 BC grupper svarende til de fødselsår grupper af 1890-1894, …, 1970-1974. I vores undersøgelse, vi brugte kun 12 femårige Aldersgrupper fra 30-34 år op til 85+, fordi de observerede antal af LC kræft forekomster i yngre aldersgrupper var ubetydelige. De grupperede data, tabuleret af alder og tid-periode indekser, er vist i tabel 1, 2, 3, 4. Vejviser

Statistiske metoder og software, der anvendes

for data præsenteret i tabel 1, 2, 3, 4, den LLAPC modellen blev anvendt, og de tilsvarende design matricer af systemerne for betingede ligninger for hvide mænd og kvinder blev opnået. Disse design matricer blev kontrolleret for rang mangler ved hjælp af MATLAB-funktionen,

rang

. For at løse disse systemer af betingede ligninger, vi anvendte en ny tilgang (se nedenfor) ved hjælp af den vægtede mindste kvadraters metode og udnyttes MATLAB funktion,

tilbagegang

. For at bestemme optimale værdier af identifikationsparametrene, brugte vi et program udviklet internt,

inpar

, og skrevet i Matlab, Version 7.10.0 (R2010a). Gyldighed af de anvendte LLAPC modeller til vurdering af APC effekter i LC forekomster i hvide mænd og kvinder blev kontrolleret af tre diagnostiske plots [10]: (i) den normale sandsynlighed plot af de standardiserede residualer, (ii) residualerne

vs

den modellerede værdier plot; og (iii) den observerede

vs.

den modellerede værdier plot.

En opløsning af identificerbarhed problemet

Lad os løse en af ​​TP effekter, en af ​​de BC effekter, og den tilsvarende Age effekt, hvor (se (2)). Ved at flytte disse virkninger til venstre side af systemet (3), er antallet af ubekendte i et nyt system faldt med tre. . I praksis er disse effekter som referenceniveauer og er normalt sat til nul

I et sådant tilfælde, er løsningen af ​​APC problemet reduceret til at bestemme en parameter – identifikation parameter. Lad os bruge effekten, (eller) af TP, der støder op til den forankrede TP, som identifikation parameter udpeget. Når den nøjagtige værdi af er

a priori

kendt, at systemet (3) kan desuden korrigeres for denne effekt ved at flytte denne parameter til den venstre side af (3). Så den venstre side af det korrigerede system vil være: (8) Bemærk, når den nøjagtige værdi af er

a priori

kendt, den korrigerede systemet (3) har de samme vægte (7) som systemet (3) og udformningen matrix af denne vejede systemet har ikke en rang mangel (dette kan kontrolleres direkte ved hjælp af MATLAB funktion,

rang

). For at vurdere de ubekendte i den korrigerede systemet (3), kan der anvendes en almindelig vægtet mindste kvadraters metode. Overslag over skæringspunktet ,, numrene på Age effekter,, numrene på de overslag over TP effekter,, og numrene på de skøn over BC effekter,, og deres konfidensintervaller () kan fås. Her og nedenfor betegner asterisk skøn eller fastsatte værdier af de ukendte parametre. Det skal bemærkes, at i almindelighed disse estimater afhænger givne værdier af de fire redundante parametre:.,, Og

Ved at variere parameteren identifikation,, i intervallet dens forventede variation, en familie af estimater af APC virkninger kan opnås. Faktisk lad os antage værdierne af den forventede variation af identifikationsparameter ligger inden for et interval, hvor. I dette interval, lad os vælge følgende netto punkter: (9) hvor er et naturligt tal større end fx,

dvs.

.. De deraf følgende værdier for disse net punkter kan bruges som de variable værdier af identifikation parameter: (10) For hver værdi, kan man opnå estimater af APC effekter (,,, og) og deres s, som blev beskrevet tidligere

således kan der opnås den tilsvarende familie af estimater af APC effekter. Teoretisk ved at variere fra det, kan man få alle mulige skøn over APC effekter (,, og) og deres s.

Den optimale værdi af identifikation parameter ,, kan bestemmes i intervallet dets forventede variation brug af en ekstra antagelse. Som sådan kan den heuristiske antagelse, at forskelle mellem virkningerne af de hosliggende birth-kohorter er små anvendes. Denne antagelse er baseret på det faktum, at de flerårige tilstødende fødselstal kohorter overlapper hinanden i tidsintervaller, og identifikation af en kohorte knyttet til et bestemt område for perioden og alder er en eller anden måde tvetydig [11] – [13].

Brug denne heuristisk antagelse kan man numerisk bestemme den optimale værdi af identifikation parameter ved at minimere (i forhold til) det vejede gennemsnit af de kvadrerede forskelle mellem skøn over de tilstødende BC effekter,. Denne minimering problem kan formuleres som følger: (11), hvor vægtene, er reciprokke af varianserne af forskellene mellem skøn over de tilstødende BC effekter,. Dette problem kan løses numerisk ved at få netto værdier (10), og beregning for hver den tilsvarende vægtede gennemsnit (11). Således fra disse netto værdier, den optimale værdi ,, der minimerer denne vægtet gennemsnit, kan der opnås.

Vurdering model tilstrækkelighed

For at kontrollere godhed tilpasningen af ​​de modellerede værdier er opnået ved en multipel lineær regressionsanalyse af de fundne værdier, statistikken samt statistikken og dens værdi, anvendes sædvanligvis. Men at beregne disse statistikker, design matrix af systemet af de betingede ligninger, præsentere modellen under overvejelse, har, til at omfatte en kolonne med “1”. Ellers kan de opnåede numeriske værdier af disse statistikker være forkert og endda fejlagtig [14], [15]. I vores tilfælde har designet matrix af systemet af de vægtede betingede ligninger af det korrigerede systemet (3) med vægte (7) ikke omfatter kolonnen med “1”. Derfor, for at vurdere gyldigheden af ​​de resultater, som den foreslåede fremgangsmåde, vi udnyttet de følgende diagnostiske plots [10]: (i) den normale sandsynlighed plot af de standardiserede residualer; (Ii) residualerne

vs

den modellerede værdier plot.; og (iii) den observerede

vs.

den modellerede værdier plot. Plot (i) gør det muligt at vurdere sandsynligheden af ​​den antagelse, at standardiserede residualer, (de observerede vægtede værdier, mindre de modellerede vægtede værdier,, divideret med deres anslåede), har en normal fordeling. Hvis antagelsen om normalfordelte residualer er korrekt, skal plottet være tilstrækkelig lige. Plot (ii) kontrollerer egnetheden af ​​modellen. Når modellen er hensigtsmæssigt, bør residualerne være tilfældigt fordelt omkring 0, så alle, men en meget få (ca. 95% af det samlede antal rester) skal ligge mellem værdierne -2 og 2. Plot (iii) skal udvise punkter ligger tæt på linje med en hældning på 1 går gennem punktet (0, 0). Dette plot giver en visuel vurdering af effektiviteten af ​​modellen i at gøre forudsigelser.

Resultater

I dette afsnit præsenterer vi resultaterne af afprøvningen af ​​denne tilgang, mens estimering APC effekter på lungekræft (LC) incidensrater i hvide mænd og kvinder, ved hjælp af SEER 9 data, der er indsamlet over en 30-års periode.

Afprøvning af tilgangen

SEER 9 data indsamlet i 1975 -2004 til LC i hvide mænd og kvinder blev anvendt til afprøvning af den foreslåede fremgangsmåde. I denne test blev fremstillingen af ​​SEER-baserede data udført som beskrevet i materialer og fremgangsmåder. Den opnåede antal kræft forekomster og de samlede personår i risiko for de givne aldersintervaller og perioder er vist i tabel 1, 2, 3, 4.

Data præsenteret i tabel 1, 2, 3, 4 blev anvendt til at opnå de rå incidensrater og deres varianser. Tabelopstillingen af ​​logaritmerne disse incidensrater er vist i tabel 5. I denne tabel er data LC forekomst sats portioned i seks perioder (1975-79, …, 2000-04 de modellerede aldersspecifikke incidens satser, ),; 17 BC grupper (1890-94, …, 1970-74),; og 12 Aldersgrupper (30-34, …, 80-84,85 +),. Her er de tværsnitsarealerne incidens vist i kolonnerne. Rækkerne af denne tabel viser incidensrater for 12 Aldersgrupper. De incidensrater for 17 f.Kr. grupper (langsgående data) er præsenteret langs øverste venstre til nederste højre diagonaler. Logaritmen af ​​incidensraten af ​​det forankrede celle () er angivet ved et symbol “+”. Problemet er at estimere: 12 Alder virkninger (); seks TP effekter (); 17 BC virkninger (); og skæringspunktet (). I alt har 36 ukendte parametre, der skal bestemmes ud fra 72 observerede værdier af (;).

Brug Tabel 5 og formler (3) og (7), design matricer til LLAPC model af LC i hvide mænd og kvinder blev bygget og deres rang mangler blev kontrolleret (se materialer og metoder). De opnåede rang mangler i disse design matricer var lig med 4. Derfor havde fastsættes at bestemme APC virkninger for LC i hvide mænd og kvinder ved hjælp af de tilsvarende systemer i de betingede ligninger (3) med vægte fire parametre (7) . Dette blev gjort i to trin: (i) ved at vælge en af ​​Age effekter, en af ​​TP effekter, og en af ​​BC virkninger som ankre og indstille dem til 0; og (ii) ved at bestemme den optimale værdi af identifikation parameter -. effekt af TP, der støder op til det forankrede TP

For at udføre det første skridt, vi valgte celle med indekser 9 og 6 (dvs. og) som det forankrede celle i tabel 5. det betyder, at Age interval, 70-74, og TP for 2000-04 () blev valgt som ankrene. Siden indekserne, og er lineært forbundet med hinanden ved formel (3), den forankrede BC-indekset var. Dette indeks svarer til BC gruppen af ​​1925-1929. For at udføre det andet trin, vi valgte TP effekt, der støder op til den forankrede TP, dvs.. Derefter flyttede vi denne identifikation parameter samt de forankrede parametre til venstre side af systemet (3). For den forankrede celle, (,,), satte vi de tilsvarende APC effekter til nul og brugt disse effekter som referenceniveauerne.

For de opnåede betingede ligningssystemer (8) med vægte (7), vi byggede de tilsvarende design matricer og kontrolleret rang mangler i disse matricer ved hjælp af Matlab funktionen,

rang

. Vi fandt, at disse matricer ikke har en rang mangel og deres fulde rækker blev lig med 32. Vi anvendte den førnævnte numeriske proceduren for at opnå fra nettet værdier (11), når og.

For at bestemme den optimale værdi af identifikation parameter, brugte vi vores program,

inpar

, og opnåede værdier af ~0.14 og ~0.03, for mænd og kvinder, tilsvarende. Disse optimale værdier af identifikation parameter blev brugt til at estimere APC effekter (,,, og), samt de lavere () og øvre () grænserne for deres konfidensintervaller 95% for LC i hvide mænd og kvinder. For mænd, de opnåede estimater af skæringspunktet ,, og dens 95% med de lavere () og øvre () grænser er: = -7,34, = -7,36, og = -7,31. For kvinder, de analoge skøn: = -7,71, = -7,76, og = -7,67. Estimaterne ,, og, og deres 95% med den nedre () og øvre () grænser er vist i tabel 6, 7 og 8, tilsvarende. I disse tabeller er værdierne af de forankrede virkninger angives med fed. I tabel 5, er værdierne af identifikationsparametrene præsenteres i fed kursiv. Vejviser

Figur 1 udviser resultaterne af APC-analyse af LC forekomst i hvide mænd og kvinder, forankret til 2000-04 TP og til 1930-1934 f.Kr.. De forankrede virkninger præsenteres af åbne cirkler. Parametrene identifikation præsenteres af stjerner. De fejl søjler viser konfidensintervaller 95%.

Paneler A og B præsentere udviklingen i de TP effekter for hvide mænd og kvinder, tilsvarende. Data er præsenteret i seks perioder (1975-1979, 1980-1994, …, 2000-04 år) indekseret som. Paneler C og D præsentere de opnåede tendenser i BC effekter for hvide mænd og kvinder, tilsvarende. Data er præsenteret i 17 f.Kr. grupper (1890-1894, 1895-1899, …, 1970-74 år) indekseret som. Paneler E og F præsentere de opnåede tendenser i Age effekter

vs.

Alder intervaller (30-34, 35-39, …, 80-84, 85 + år), indekseret som for hvide mænd og kvinder , tilsvarende. De forankrede virkninger præsenteres af åbne cirkler. Parametrene identifikation præsenteres af stjerner. De fejl søjler viser konfidensintervaller 95%.

Paneler 1A og 1B nuværende tendenser i TP effekter på LC forekomst i hvide mænd og kvinder, tilsvarende. For mænd, disse faktorer faldt fra 1975 til 2004, mens det for kvinder, disse faktorer steg fra 1975 til 1990, og derefter forblev næsten konstant.

Paneler 1C og 1D præsentere de opnåede tendenser i BC effekter på LC forekomst i hvide mænd og kvinder, tilsvarende. For både mænd og kvinder, disse tendenser stigning fra BC af 1890-1894 indtil BC af 1925-1929, derefter falde indtil BC af 1950-1954 og derefter forbliver næsten uændret.

Paneler 1E og 1F nuværende de opnåede tendenser i Age effekter på LC forekomst i hvide mænd og kvinder, tilsvarende. Disse tendenser stigning fra Alder 30 indtil Alder 70-75, og derefter, falde med alderen.

Figur 2 viser APC virkninger på LC incidensrater i hvide mænd og kvinder, forankret til Age interval på 70- 74, TP af 2000-04, og BC af 1930-1934. Satserne for den forankret Age, TP og BC præsenteres af åbne cirkler. De fejl søjler viser konfidensintervaller 95%.

Paneler A og B præsentere TP-specifikke incidensrater i hvide mænd og kvinder, tilsvarende. Data er præsenteret i seks perioder (1975-1979, 1980-1994, …, 2000-04) indekseret som. Paneler C og D præsentere de opnåede BC-specifikke incidensrater i hvide mænd og kvinder, tilsvarende. Data er præsenteret i 17 kohorte grupper (1890-1894, 1895-1899, …, 1970-74) indekseret som. Paneler E og F præsentere de opnåede aldersspecifikke incidens satser

vs.

Aldersintervaller (30-34, 35-39, …, 80-84, 85+), indekseret som, i hvide mænd og kvinder, tilsvarende. De tværsnitsundersøgelser aldersspecifikke incidens satser, observeret i 2000-04 perioden er vist med stiplede linjer. De forankrede virkninger præsenteres af åbne cirkler. De fejl søjler viser konfidensintervaller 95%.

Paneler A og B i dette tal præsentere udviklingen i de modellerede TP-specifikke incidensrater

vs

. TP interval indekser ,, af LC i mænd og kvinder, tilsvarende. Estimaterne af de modellerede TP-specifikke incidensrater, og deres varianser blev opnået ved formler: (12) (13) Til mænd, TP-specifikke forekomst af LC faldt fra 1975 til 2004, mens den for kvinder disse steget fra 1975 til 1990 og derefter forblev næsten konstant.

Paneler C og D i figur 2 til stede tendenserne i de modellerede BC-specifikke incidensrater

vs

. BC interval indekser ,, for mænd og kvinder, tilsvarende. Estimaterne af de modellerede BC-specifikke incidensrater, og deres varianser blev opnået ved formler: (14) (15) For både mænd og kvinder, BC-specifikke forekomst af LC stigning fra kohorte af 1890-1894, indtil kohorte af 1925-1929, falde, indtil den kohorte 1950-1954 og derefter forbliver næsten uændret.

Paneler E og F i figur 2 nuværende tværsnitsarealerne aldersspecifikke incidens satser, observeret i 2000-04 tidsperiode (stiplede linjer), og skønnene over de modellerede aldersspecifikke incidens satser forankret til 2000-04 periode, og til 1930-1934 fødselsårgang (optrukne linjer) af LC i hvide mænd og kvinder, tilsvarende. Estimaterne af de modellerede aldersspecifikke incidens satser, og deres varianser blev opnået ved formler: (16) (17) De modellerede aldersspecifikke incidens satser på den forankrede aldre vist med åbne cirkler. De fejl søjler viser 95% konfidensintervaller. Som det kan ses, de modellerede aldersspecifikke incidens satser LC hos mænd og kvinder har de “omvendte badekar” figurer, som stiger med alderen, når maksimum (i en alder interval på 75-79) og derefter falder med alderen. Det er vigtigt at bemærke, at værdierne af de modellerede aldersspecifikke incidens satser og de tilsvarende værdier af de observerede tværsnitsundersøgelser aldersspecifikke incidens satser er væsentligt anderledes. Dette skyldes, at estimater af de modellerede aldersspecifikke incidens satser er “renset op” fra TP og BC effekter, mens de observerede tværsnitsarealet aldersspecifikke incidens satser er væsentligt påvirket af disse effekter.

figur 3 udstiller resultaterne af vurderingen af ​​gyldigheden af ​​at bruge LLAPC model til bestemmelse af APC effekter i LC forekomster i hvide mænd og kvinder. Paneler 3A og 3B udviser sandsynlighedsfordelingen plot af de standardiserede residualer,. De lodrette akser præsentere de opnåede kvintiler af de standardiserede residualer og vandrette akser viser de tilsvarende kvintiler af standardnormalfordelingen. For både mænd og kvinder, plottene er tilstrækkeligt lige, bortset fra flere punkter, som har meget små eller store kvintiler.

Paneler A og B udviser sandsynlighedsfordelingen plot af de standardiserede residualer, for hvide mænd og kvinder , tilsvarende. De lodrette akser præsentere de opnåede kvintiler af de standardiserede residualer og vandrette akser viser de tilsvarende kvintiler af standardnormalfordelingen. De lodrette akser i panelerne C (for hvide mænd) og D (for hvide kvinder) udviser de standardiserede residualer, og de vandrette akser udviser de modellerede vægtede værdier ,. Paneler E (for hvide mænd) og F (for hvide kvinder) udviser de observerede vægtede værdier,, på de lodrette akser

vs

. de modellerede vægtede værdier, på de vandrette akser.

De lodrette akser af paneler 3C og 3D udviser de standardiserede residualer, og de vandrette akser udviser de modellerede vægtede værdier ,. Som det fremgår af panel 3C for mænd, alle undtagen to værdier af de standardiserede residualer,, falde i den [-2,2] interval, mens det for kvinder, alle disse værdier er fordelt inden for intervallet. Dette indikerer, at modellerne for flere regressioner vi er egnede til at præsentere de tilsvarende observationsdata.

Paneler 3E og 3F udviser de observerede vægtede værdier, på de lodrette akser

vs

.

Be the first to comment

Leave a Reply