PLoS ONE: Et Information-Teoretisk analyse af Genetik, køn og alder i Cancer Patients

Abstrakt

kønscellelinie genetik, køn og hormonelle-signalveje er alle godt beskrevet modifikatorer af kræftrisiko og progression. Selv om en forbedret forståelse af, hvordan kimcellelinje genetiske varianter interagere med andre kræft risikofaktorer kan muliggøre bedre forebyggelse og behandling af kræft hos mennesker, måle og kvantificere disse interaktioner er udfordrende. I andre forskningsområder, har Information Theory blevet brugt til kvantitativt at beskrive lignende multivariate interaktioner. Vi implementeret en hidtil ukendt information-teoretisk analyse til at måle den samlede virkning af en højfrekvent kimcellelinje genetisk variant af p53 tumor suppressor pathway (MDM2 SNP309 T /G) og køn på kliniske cancer fænotyper. Denne analyse kvantitativt beskriver synergistiske samspil mellem køn, den MDM2 SNP309 locus og alder debut af tumorigenese i p53 mutation luftfartsselskaber. Disse resultater giver en molekylær og genetisk basis for den observerede kønsdimorfisme af kræftrisiko i p53 mutation luftfartsselskaber og en model foreslås der antyder en ny strategi forebyggelse af kræft for p53 mutation luftfartsselskaber

Henvisning:. Atwal GS, Rabadan R , Lozano G, Stærk LC, Ruijs MWG, Schmidt MK, et al. (2008) Et Information-Teoretisk analyse af Genetik, køn og alder i kræftpatienter. PLoS ONE 3 (4): e1951. doi: 10,1371 /journal.pone.0001951

Redaktør: Juha Klefstrom, University of Helsinki, Finland

Modtaget: Oktober 3, 2007; Accepteret: 26 februar 2008; Udgivet: April 9, 2008

Copyright: © 2008 Bond et al. Dette er en åben adgang artiklen distribueres under betingelserne i Creative Commons Attribution License, som tillader ubegrænset brug, distribution og reproduktion i ethvert medie, forudsat den oprindelige forfatter og kilde krediteres

Finansiering:. Støtte af dette arbejde kommer fra Breast Cancer Research Foundation, The Simons Fond, Leon Levy Foundation og den franske National Cancer Institute. Yderligere støtte til dette arbejde kommer fra en Cancer Center Support Grant, CA16672, og en NIH Grant til Louise Stærk, P01 CA034936

Konkurrerende interesser:.. Forfatterne har erklæret, at der ikke findes konkurrerende interesser

Introduktion

p53 stress respons pathway fungerer som en kritisk tumor suppressor pathway dokumenteret ved den observation, at p53-genet er et af de mest almindeligt muterede gener i humane tumorer [1]. Endvidere både mus og mennesker, der huser en kimlinjekonfiguration inaktiverende mutation i kun én allel af p53-genet udvikle tumorer tidligt i livet og ved meget høje frekvenser [2] – [5]. Mennesker huser en kim-line inaktivere p53 mutation udgør 50% af medlemmerne af Li-Fraumeni kræft disposition syndrom. Alder debut af tumordannelse i humane p53 mutationsbærere har vist sig at være modificeret i fire uafhængige undersøgelser ved en høj frekvens enkelt-nukleotid polymorfisme i promotoren af ​​Mdm2 onkogen (MDM2 SNP309, T /G) [6] – [9 ]. G-allel af SNP309 forøger DNA-bindende affinitet af den transskriptionelle aktivator Sp1, hvilket resulterer i højere niveauer af MDM2-mRNA og protein i humane celler og væv [6], [10] – [12]. Højere niveauer af MDM2 føre til dæmpningen af ​​p53 pathway, i konkordans med rollen som MDM2 som en vigtig negativ regulator af p53 [13]. I p53 mutation luftfartsselskaber, blev det vist i tre uafhængige rapporter om, at personer med G-allel af SNP309 er diagnosticeret med kræft i gennemsnit syv til femten år tidligere end de p53 mutation luftfartsselskaber homozygote for T-allelen (tabel 1) [6] – [8]. Det blev foreslået, at de høje niveauer af MDM2 følge af G-allelen af ​​SNP309 sammen med mutant p53-allelen, producere en alvorligt svækket p53 tumor suppressor pathway og resultere i en højere mutation sats, fattigere DNA reparation processer, og reduceret apoptose, fører til hurtigere og hyppigere tumordannelse [14].

for nylig studier med sporadiske kræftformer (162 ashkenazi jødiske lymfom patienter, 969 finske og 164 italienske kolorektal kræftpatienter, 105 tyske sarkom patienter, 341 norske ikke-småcellet lungekræft patienter og 658 ashkenazi jødiske brystkræftpatienter) har vist, at virkningerne af den G-allel af MDM2 SNP309 locus på tumorigenese kan ændres af to yderligere variabler; nemlig køn og primært kvindelige-specifikke hormon, østrogen [15] – [19]. Specifikt blev G-allelen af ​​MDM2 SNP309 vist at accelerere tumorigenese og øge risikoen for kræft hos kvinder og ikke i mænd for colorectal cancer, diffust storcellet B-celle lymfom, lungecancer og for højt østrogen receptor positiv ( 50% af tumor celler), men ikke for østrogen receptor negativ, invasivt duktalt karcinom i brystet [16], [18], [19]. Dette blev vist at resultere i berigelse af individer med G-allelen hos præmenopausale kvinder med disse kræftformer, når der sammenlignes med enten postmenopausale kvinder eller mænd med de samme cancerformer. For nylig, Hu et al. fremlagt beviser for en mulig molekylær mekanisme for, hvordan G-allel af SNP309 kunne accelerere tumordannelse i denne kønsspecifikke og østrogen afhængig måde, ved at demonstrere, at den primært kvindelige-specifikke hormon, østrogen, fortrinsvis stimuleret transskription af MDM2 genet med G-allel af SNP309 [20].

Interessant nok har to uafhængige undersøgelser også defineret køn at være en modificerende faktor kræftrisiko i p53 mutation luftfartsselskaber [21], [22]. Konkret blev kvindelige p53 mutation luftfartsselskaber vist sig at være i større risiko for at udvikle kræft end deres mandlige modstykker. For eksempel ved 20, 30, 40 og 50 år, viste de kvindelige bærere respektive kumulative risici af 18%, 49%, 77% og 93% for at udvikle en første cancer, mens de mandlige bærere viste risici for 10% , 21%, 33% og 68% [22]. Den øgede risiko i kvindelige bærere kunne ikke forklares ved den høje forekomst af kønsspecifikke kræftformer, som forskellene tilbage efter udelukkelse af tilfælde af brystkræft, æggestokkene, og prostatakræft. Selvom den mulige inddragelse af østrogen i stigende kræftrisiko i kvindelige bærere blev drøftet, denne hypotese forbliver uprøvet.

Det er spændende at hypotesen, at den SNP309 locus kunne bidrage til den øgede risiko kræft observeret i kvindelige bærere selvom den foretrukne østrogenafhængig stimulering af MDM2 transkription fra G-allelen af ​​SNP309. Hvis det er sandt, kunne østrogen manipulation indarbejdes i forebyggelsesstrategier for p53-mutation luftfartsselskaber med G-allel af MDM2 SNP309. Sådanne patienter har begrænset forebyggelsesstrategier kræft. I denne rapport, er den hypotese, at den primært kvindelige specifikke hormon, østrogen, kan påvirke tumorigenese i p53-mutation luftfartsselskaber testet selv udforske mulige interaktioner mellem MDM2 SNP309 locus og køn på aldersbetinget tumorincidens.

Der har været stigende interesse for udvikling af statistiske redskaber til at afdække sådanne interaktioner, som mellem genotype og køn, og deres virkning på komplekse fænotyper, såsom aldersbetinget tumorincidens. Nylige metoder, både parametriske og ikke-parametriske, omfatter neurale netværk [23], rekursive partitionering metoder [24], kombinatoriske partitionering metoder [25], multifaktor-dimensionalitet reduktion [26] og multi-locus regression [27], [28] . Disse metoder er skræddersyet til at løse specifikke spørgsmål om karakteren af ​​multi-locus interaktioner og påberåbe forskellige antagelser om den underliggende model genererer af disse data. Her beskæftiger vi en ny information-teoretisk ramme til at behandle specifikke spørgsmål om, hvorvidt køn og MDM2 SNP309 locus interagerer synergistisk eller redundant i forhold til alder tumorincidensen i p53 mutation luftfartsselskaber. De optimale egenskaber af informations-teoretisk vilkår i vurderingen variabilitet og sammenhæng mellem flere variabler kender til machine learning og statistik samfund, men måske ikke kendt i områderne epidemiologi og medicinsk statistik. En yderligere fordel i forbindelse med denne foreliggende undersøgelse er, at principperne for oplysning teorien tillade os at studere komplekse fænotyper udtrykt som reelle tal (dvs. alder for indtræden af ​​cancer i modsætning til den binære tilfælde /kontrol scenario) definere optimale partitionering, eller binning, af de kontinuerlige fænotype data.

Metoder

p53 Mutation Carriers (MD Anderson Cancer center)

88 personer, der er medlemmer af Li-Fraumeni syndrom (LFS) familier (34 i alt) med kendte germlinie mutationer i en allel af p53 var tidligere genotype for MDM2 SNP309 [6]. 66 af disse er blevet diagnosticeret med mindst en cancer. Af de LFS familier indgår i denne undersøgelse, 12 blev konstateret gennem systematiske undersøgelser af sekventiel barndom bløddelssarkom (7 familier) og osteosarkom (5 familier) patienter. De resterende familier bestod af patienter, der er nævnt M. D. Anderson til forskning eller kliniske studier med en personlig eller familiær disposition for kræft i den type findes i LFS. Den største familie bidrager 14 prøver til denne undersøgelse; 16 familier bidrager et enkelt individ.

p53 Mutation Carriers (fransk LFS Network)

Sixty-én påvirkede eller upåvirkede kim-line p53 mutation luftfartsselskaber, fra 41 ubeslægtede LFS familier blev tidligere genotype for MDM2 SNP309 [7]. Kliniske kendetegn for de familier og beskrivelse af mutationerne var tilgængelige efter anmodning. Fyrre-én berørte kim-line p53 mutation luftfartsselskaber blev indarbejdet i denne undersøgelse. Den største familie bidrager med 3 berørte personer til denne undersøgelse; 27 familier bidrager en enkelt berørte enkelte.

p53 Mutation Carriers (hollandsk /finsk undersøgelse)

Et hundrede og otte patienter fra 87 LFS eller LFS-lignende familier blev tidligere screenet for p53 mutationer og genotype for MDM2 SNP309 [8]. Ninety-syv blev screenet på Family Cancer Klinik Nederlandene Cancer Institute og 11 ved Helsinki University Central Hospital. Tredive-seks berørte personer fra 19 familier gennemført kendte germlinie mutationer i p53-genet og blev indarbejdet i denne undersøgelse.

Information-Teoretisk analyse

Givet en variabel, siger

X

, som kan eksistere i en af ​​

K

X

stater og dens sæt af tilknyttede sandsynligheder {

p (X = x

1), p (X = x

2) … P (X = x

K)

}, så Shannons entropi giver en generel ikke-parametrisk mål for variabilitet, eller informationer indhold af

X

. Dette mål for informationsindhold er den eneste mængde, der opfylder bestemte rimelige kriterier som

H [X]

burde være en voksende funktion af

K

X

hvis alle sandsynligheder er ens . Den fælles entropi for to variabler målt sammen, siger

X

og

Y

, kan også være passende defineret, hvor

s Hotel (

x

i

,

y

j

) er sandsynligheden for de to begivenheder

X = x

jeg

og

Y = y

j

co -occurring. Det kan vises, at følgende ulighed for den fælles entropi altid skal anvende,

H

[

X

,

Y

] ≤

H

[

X

] +

H

[

Y

], med lighed hvis og kun hvis

X

og

Y

er uafhængige variable

s Hotel (

x

jeg

,

y

j

) =

s Hotel (

x

i

)

s Hotel (

y

j

), dvs. den fælles entropi vil altid være mindre end summen af ​​de enkelte entropier hvis der er nogen afhængighed eller sammenhæng mellem de to variabler. Foranstaltningen af ​​statistisk afhængighed mellem to variabler,

X

og

Y

, derefter simpelthen fanget af reduktionen i den samlede entropi, når de to variabler måles sammen, dvs. Shannons gensidig information. Bemærk, at dette ikke påberåbe sig nogen af ​​de lineære (Gauss) forudsætninger kræves af andre foranstaltninger såsom Pearsons korrelation. Denne definition kan også tilsvarende skrives som

jeg

[

X

;

Y

] =

H

[

X

] –

H

[

X

Y

] =

H

[

Y

] –

H

[ ,,,0],

Y

X

], hvor den betingede entropi

H

[

X

Y

] er defineret som, hvilket gør det klart, at

jeg. [X, Y]

kan tolkes som en reduktion af variabiliteten af ​​

X

grund viden om

Y

og omvendt

data analyse ved hjælp af diskrete versioner af informations-teoretisk udtryk, som defineret i det foregående afsnit, kræver skabe skraldespande der Diskretisere kontinuerte værdier. For eksempel er den reelle tal, der repræsenterer alder ved diagnose af cancer har at binned ind i en af ​​flere grupper, hovedsagelig en opgave i datakomprimering. Vi kan trække på information teori og bemærk, at mindst partiske opdeling af enhver datasæt er givet ved princippet om maksimal entropi, dvs. partitionering i lige befolkede siloer eller fraktiler. I dette tilfælde alle oplysninger-teoretisk udtryk beregnet ud fra den sammenflettede data har den vigtige og ønskelig egenskab, at det er invariant at inverteres koordinere transformationer, f.eks multiplicere alle aldre med en konstant faktor bør ikke påvirke gensidig information med SNP variabel. Et almindeligt problem med kvantisere reelle tal i siloer er at afgøre, hvor mange spande til at bruge, og til dette formål vi igen appellere til information teori. En fornuftig kriterium kan udledes den iagttagelse, at hvis vi prøver at måle den gensidige information mellem to endeligt-samplet uafhængige fordelinger derefter beskæftiger for mange siloer vil over-passer til dataene, hvilket giver anledning til en ikke-nul værdi gensidig information, selv når ekstrapoleres til uendelig prøve grænse på [29]. På den anden side, komprimere dataene til for få placeringer over-udglatter dataene, og potentielt mister vigtig struktur i disse data. Således burde der være en optimal afvejning mellem over-fitting og information kompression. Vi bestemt, at det optimale antal placeringer i vores datasæt var tre, og at etablere dette blev de gensidige information værdier først beregnet med tilfældigt blandes data, for at ødelægge enhver sammenhæng, og det blev observeret, at når antallet af placeringer blev øget fra tre til fire og højere, de ekstrapolerede gensidig information værdier ikke længere var nul inden fejllinjer. Ved således at begrænse antallet af bins vi implicit inkorporere en prøve-størrelse afhængig straf for over-montering af dataene. Yderligere eksplicitte oplysninger om dette og andre mulige metoder til estimering gensidig information er givet i [29], [30]

Synergistisk oplysninger

Disse oplysninger-teoretiske begreber kan udvides til naturligt sonde spørgsmål statistiske afhængigheder blandt mere end to variable. Især kan niveauet af synergi og redundans blandt tre variable kvantificeres i en principiel måde og er for nylig blevet formuleret i forbindelse med analyse korrelationer mellem neuroner [29], [30]. Hvis vi bruger definitionen af ​​synergi mellem to variabler

X, Y

med hensyn til en tredje variabel

Z

, hvor meget ekstra information

X

og

Y

tilsammen giver om

Z

end af

X

og

Y

separat, så er vi straks føre til den naturlige formulering af synergistisk information som

S ( X, Y; Z) = I (X, Y, Z) -I (X; Z) -I (Y Z)

hvor. Den synergistiske oplysninger viser således, hvor meget af variationen af ​​

Z

reduceres ved at kende både

X

og

Y

sammen end at kende dem separat, og dermed strengt kvantificerer ikke- uafhængige effekter af både

X

og

Y

Z

. Denne matematiske formulering af synergi kan generaliseres naturligt til mere end tre variabler.

Statistisk analyse

Det kan ikke være klart, hvordan præcist at fortolke information-teoretisk værdier bestemt fra empiriske fordelinger, især da statistisk udsving vokser med aftagende stikprøvestørrelse. På grund af konkaviteten af ​​Shannon entropi, inducerer finite prøveudtagning en negativ forspænding i den empiriske entropi og en positiv bias i den empiriske gensidig information [29]. Disse problemer nødvendiggør generation af p-værdier til de beregnede oplysninger-teoretisk værdier mod en specificeret nulhypotese. I tilfælde af gensidig information, nulhypotesen var, at ingen statistisk afhængighed eksisterede mellem en enkelt variabel (enten SNP eller køn) og alder diagnose, dvs det fælles sandsynlighed er simpelthen et produkt af de randnr,

s (variabel , alder) = p (variabel) p (alder)

. I tilfælde af synergistisk information, nulhypotesen var, at ingen korrelation eksisterede mellem to variable og alder ved diagnose og samtidig bevare sammenhængen mellem de to variable, dvs.

s (SNP, køn, alder) = p (SNP, køn) p (alder)

,

s (SNP, alder) = p (SNP) p (alder)

og

s (køn, alder) = p (køn) p (alder)

. P-værdierne blev bestemt ved en Monte Carlo permutation test. Et mindste antal 10

6 permutationer skulle generere et konfidensinterval område på mindre end 0,005 ved p-værdi 0,05.

En to-sidet Mann-Whitney-test blev anvendt til at bestemme den statistiske signifikans af forskellen i median alder af tumordiagnose mellem grupperne med og uden G-allelen af ​​SNP309. Strengt taget Mann-Whitney-test er en ikke-parametrisk vurdering af, om to sæt data er hentet fra den samme fordeling, men hvis de to sæt data har nogenlunde samme form, så er det rimeligt at fortolke resultaterne af testen som en erklæring om, hvorvidt medianen i de to grupper er statistisk ikke anderledes. En permutation test blev anvendt til at bestemme betydningen af ​​forskellen i den gennemsnitlige alder af tumordiagnose mellem de to grupper [6]. Både en Kolmogorov-Smirnov test og en Cramer-Smirnov-Von Mises testen blev anvendt til at bestemme betydningen af ​​forskellen i fordelingerne af alder ved diagnose mellem grupperne med og uden G-allelen af ​​SNP309. Ved at anvende alle disse tests for betydning, mange af de antagelser, der ligger i et test er elimineret.

Resultater

For at teste effekten af ​​og samspillet mellem, køn og allelerne på MDM2 SNP309 locus gen ved tumorigenese i p53 mutationsbærere, alle 144 p53 mutationsbærere, som var genotypebestemt ved MDM2 SNP309 locus tidligere [6] – [8], blev undersøgt (tabel 1). Kollektivt, når de 144 individer blev separeret i de forskellige genotyper af SNP309 locus, individer, der bar G-allelen i enten heterozygote eller homozygote tilstand (n = 81), viste en meget signifikant 11-år tidligere gennemsnitsalderen for første tumor debut i forhold til enkeltpersoner T /T (n = 63) i genotype (T /T individer, gennemsnit er 33 år versus 22 år i G /G og T /G enkeltpersoner, p = 0,0006, Mann Whitney Test). En væsentlig tidligere gennemsnitlige alder for første tumor debut blandt G-allel bærere blev også set i både kvinder og mænd. Mænd, der bar G-allelen i enten heterozygote eller homozygote tilstand (n = 35), viste en signifikant 12-år tidligere gennemsnitlige alder for første tumor debut i forhold til mænd T /T (n = 23) i genotype (p = 0,0436 , Mann Whitney Test). Kvinder, der gennemførte G-allelen i enten heterozygote eller homozygote tilstand (n = 46), viste en signifikant 10-årig tidligere gennemsnitlige alder for første tumor debut forhold til kvinder T /T (n = 40) i genotype (p = 0,0223 , Mann Whitney Test).

for at direkte sammenligne alder afhængige forekomst af kræft mellem mænd og kvinder, personer, der er udviklet primært kønsspecifikke kræftformer (bryst- og prostatakræft) blev udelukket fra denne analyse efterlader STS , osteosarkomer og leukæmier som de store tumortyper analyseret i begge køn (figur 1A og B). Af de resterende 101 individer, 57 individer var mænd og 44 var kvinder (tabel 1). Den gensidige information deles mellem køn, blev G og T alleler af MDM2 SNP309 og alder første tumor diagnose beregnet, og resultaterne er vist i figur 1C. Som forventet fra tidligere offentliggjorte analyser af disse populationer [6] – [8], at MDM2 SNP309 locus påvirker alder af tumor diagnose på en signifikant måde som påvist af en betydelig grad af gensidig information (0,10 bits, p = 0,007, permutation Prøve). I modsætning til hvad der var forventet fra de tidligere vurderinger af den samlede kræftrisiko i p53 mutation luftfartsselskaber [21], [22], køn alene viste ikke en signifikant grad af gensidig information med en alder af første tumor diagnose (0,002 bits, p = 0,9, Permutation Test). Faktisk, når de 101 individer blev separeret i de forskellige genotyper af SNP309 locus, individer, der bar G-allelen i enten heterozygote eller homozygote tilstand, viste en meget signifikant 12-år tidligere gennemsnitsalder, og 17-års gennemsnitsalder på første tumor debut i forhold til enkeltpersoner T /T i genotype (T /T individer, gennemsnit er 30 år, der spænder fra 1 til 71 år, versus 18 år i G /G og T /G individer, der spænder fra 1 til 59 år, figur 1 D og tabel 2). Statistisk signifikans af denne 12-år tidligere gennemsnitsalder, og 17-år tidligere median alder af tumor indtræden blev målt under anvendelse af en permutation test og en Mann-Whitney-test (se materialer og metoder, p = 0,0008 og p = 0,0015, tabel 2) . Endvidere betydningen af ​​forskellen i fordelingerne af alderen på tumordiagnose mellem G-allel bærere og enkeltpersoner T /T i genotype, som det ses i figur 1 D, blev målt under anvendelse af to fremgangsmåder: den Kolmogorv-Smirnov-test og Cramer- Smirnov-Von Mises Test. Begge test støttede betydningen af ​​disse forskelle ved afgivelse p-værdier 0,0091 og 0,0046 (tabel 2). I modsætning hertil, når de 101 personer blev separeret baseret på køn alene, ingen signifikante forskelle i den gennemsnitlige alder for tumor debut blev set. Konkret blev kvindelige p53-mutation luftfartsselskaber diagnosticeret i gennemsnit på 23 år (fra 1 til 71 år) sammenlignet med de mandlige bærere, der blev diagnosticeret i gennemsnit på 24 år (fra 1 til 59 år , figur 1E og tabel 2).

for at kunne sammenligne alder afhængige forekomst af kræft mellem mænd og kvinder, personer, der er udviklet primært kønsspecifikke kræftformer blev udelukket fra denne analyse efterlader STS, osteosarkomer og leukemmias som de store tumortyper analyseret som afbildet i lagkagediagrammerne for både mænd (A) og kvinder (B). (C) Søjlediagrammet viser de stumper af gensidig information mellem MDM2 SNP309 locus og en alder af tumor debut, køn og alder af tumor debut og endelig mellem alle tre variabler. De tilhørende p-værdier er afbildet nedenfor. (D) Den kumulative incidens af tumor diagnose for både enkeltpersoner T /T i genotypen (sorte firkanter) og T /G eller G /G (SNP309) i genotype (grå diamanter) er plottet som funktion af alder. En offentlig en diamant betegner mindst en person. (E) Den kumulative incidens af tumor diagnose for både mænd (sorte firkanter) og kvinder (grå diamanter) er afbildet som funktion af alder.

Som nævnt ovenfor er en fordel ved en informations-teoretisk analyse af interaktioner er, at der kan påvises og kvantificeres ikke-additive interaktioner. Interessant denne analyse viste, at MDM2 SNP309 locus og køn tilsammen interagere at påvirke en alder af tumordiagnose i en ikke-additiv, synergistisk måde, hvilket fremgår af de målte 0,06 bits signifikant synergistisk information (p = 0,05, Permutation Test) . Dette antyder, at veldefinerede modificerende af MDM2 SNP309 locus på en alder af første tumor debut i p53-mutation luftfartsselskaber (tabel 1) kan være signifikant forskellig mellem kønnene. For at teste dette blev samspillet mellem allelerne af MDM2 SNP309 med en alder af tumor diagnose målt for begge køn ved at beregne deres respektive gensidige informationer. Interessant, ved denne foranstaltning, at MDM2 SNP309 locus interagerer kun signifikant med en alder af tumor diagnose i kvindelige bærere og ikke i mandlige bærere. Konkret i kvindelige bærere, den MDM2 SNP309 locus og en alder af tumor diagnose aksjer en betydelig 0,2 bits for gensidig information (p = 0,014, figur 2A). Men i mandlige bærere, de 0,114 bits for gensidig information målte ikke når signifikans med en p-værdi på 0,06.

(A) Søjlediagrammet viser de stumper af gensidig information mellem MDM2 SNP309 locus og alder af tumor indtræden hos kvinder og hos mænd. De tilhørende p-værdier er afbildet nedenfor. Den MDM2 SNP309 locus og en alder af tumor diagnose aksjer betydelig gensidig orientering hos kvinder og ikke hos mænd. Statistisk signifikans er repræsenteret ved den sorte mærkning af søjlediagram og p-værdierne er afbildet nedenfor. Den kumulative incidens af alle ikke-kønsspecifikke tumortyper for både de personer T /T i genotypen (sorte firkanter) og T /G eller G /G i genotype (grå diamanter) er plottet som funktion af alder for kvinder (B) og hanner (C). En offentlig en diamant betegner mindst en person.

Når adskilles i de forskellige genotyper af SNP309 locus, de 23 kvinder, der bar G-allelen i enten heterozygote eller homozygote tilstand, udviser en signifikant 16-år tidligere gennemsnitsalder, og 23-års median alder af tumor debut i forhold til de 21 kvinder T /T i genotype (T /T hunner, 31 år, der spænder fra 2 til 71 år, versus 15 år i G /G og T /G hunner, der spænder fra 1 til 54, p = 0,007 og p = 0,0037, figur 2B og tabel 2). Deres respektive fordelinger af alderen på tumordiagnose også signifikant forskellige, som målt ved Kolmogorov-Smirnov test og Cramer-Smirnov-Von Mises Test (p = 0,0275 og 0,0077, tabel 2). Som forudsagt af information-teoretisk analyse af forskellene mellem den mandlige G-allel bærere og hannerne T /T i genotype er meget svagere. Når adskilt i de forskellige genotyper af SNP309 locus, mænd, der gennemførte G-allelen i enten heterozygote eller homozygote tilstand, viste en signifikant 10-årig tidligere gennemsnitlige alder for tumor debut i forhold til mænd T /T i genotype (T /T mænd, 30 år, der spænder fra 1 til 55 år, versus 20 år i G /G og T /G-hunner, der spænder fra 1 til 54 år, p = 0,0285, Figur 2C og tabel 2). Men den målte betydning af forskellene i medianerne og fordelinger i hanner var bare boarder-line signifikant med p-værdier på 0,0672, 0,0478 og 0,0469 (Tabel 2). Således p-værdier beregnet på flere forskellige måder var 5-10 gange svagere for virkningen af ​​G-allelen på alder debut af de første tumorer hos mænd end kvinder.

Diskussion

i denne rapport blev de statistiske afhængigheder af MDM2 SNP309 locus og køn på en alder af første tumor debut i p53 mutation luftfartsselskaber bestemmes ved hjælp af en ny kvantitativ information-teoretisk tilgang. De tre patientpopulationer, der oprindeligt blev anvendt til at definere MDM2 SNP309 som en modifikator af tumorigenese i p53 mutationsbærere blev analyseret (tabel 1). Analysen viste en betydelig grad af gensidig information mellem MDM2 SNP309 locus og en alder af første tumor debut, men ikke mellem køn og alder tumor debut (figur 1). Oplysningerne-teoretisk tilgang tilladt for sondering af statistiske afhængigheder mellem alle tre variabler (allelerne af MDM2 SNP309, køn og alder af første tumor debut). Interessant nok MDM2 SNP309 locus og køn tilsammen har vist sig at interagere og påvirke en alder af ikke-kønsspecifikke tumordiagnose i en ikke-additiv, synergistisk måde (Synergistisk Information = 0.06 bits, p = 0,05). Hos kvinder, det MDM2 SNP309 locus og en alder af tumor diagnose aksjer betydelig gensidig information henviser til, at mænd, den gensidige information målte ikke helt nå signifikans (figur 2). Med andre ord, analysen af ​​de tre variabler i dette studie viste, at køn rent faktisk spiller en rolle i aldersbetinget forekomst, men kun når der også gives om allel form af MDM2 SNP309 locus. Dette skyldes sandsynligvis den observation, at kun den G-allelen hos MDM2 SNP309 stimuleres til at producere mere MDM2-mRNA og protein i nærvær af østrogen [20]. Standard statistiske tests måler betydningen af ​​forskellene i både de gennemsnitlige og median alderen første tumor debut og i fordelingen af ​​alderen tumor diagnose mellem G-allel luftfartsselskaber og enkeltpersoner T /T i genotype validerede disse observationer (Tabel 2).

Som nævnt ovenfor, kan informationen-teoretisk tilgang sonde spørgsmål om statistiske afhængigheder blandt mere end to variable, og kan kvantificere niveauet af synergi og redundans. Storstilet genetiske og epidemiologiske undersøgelser i stigende grad har erkendt, at variable interagerer på en ikke-additiv måde med hensyn til risikoen for sygdom, dvs. variablerne ikke handler uafhængigt af hinanden. Fremhævning disse afhængigheder er kritisk i at forstå, hvordan risiko for sygdom kan ændres subtilt ved en skjult variabel og kan forklare, hvorfor forskellige epidemiologiske studier kan rapportere forskellige konklusioner baseret på visning af en enkelt variabel [17]. Desuden identifikation og kvantificering af synergistiske interaktioner også kan skinne en lys på nye biologiske mekanismer, såsom krydstale mellem to signalveje. Men da endnu, der ikke har været streng definition og dermed ingen kvantificering af sådanne synergistiske interaktioner. Information teori og de metoder, der er beskrevet her, danner en naturlig ramme for at løse disse problemer af statistiske afhængigheder blandt variabler samtidig påberåbe ingen parametriske antagelser.

Som konklusion informationen-teoretisk analyse af de statistiske afhængigheder af MDM2 SNP309 locus og køn på en alder af tumor debut i p53 mutation luftfartsselskaber tyder på, at G-allel af SNP309 fungerer primært i kvindelige p53 mutation luftfartsselskaber til at accelerere tumordannelse, hvilket giver en potentiel genetisk basis for observeret kønsdimorfisme i kræftrisiko [21], [22 ]. har vist disse observationer i forbindelse med observationer, både før pubertære og post-pubertære kvinder har højere niveauer af østrogen [33], [34], og at østrogen til fortrinsvis stimulere transskription af

MDM2

fra G-allelen [20], giver en rimelig hypotese; G-allel af MDM2 SNP309 locus kunne bidrage til den øgede risiko kræft observeret i kvindelige p53 mutation luftfartsselskaber gennem den foretrukne østrogen-afhængige stimulering af transskription af MDM2 genet.

Be the first to comment

Leave a Reply