PLoS ONE: Flere analytiske tilgange Reveal Tydelige Gene-Miljø Interaktioner i rygere og ikke rygere i Lung Cancer

Abstrakt

Kompleks sygdom som kræft resultater fra interaktioner mellem flere genetiske og miljømæssige faktorer. Studere disse faktorer ualmindeligt kan ikke forklare den underliggende patogenetiske mekanisme af sygdommen. Multi-analytisk tilgang, herunder logistisk regression (LR), klassificering og regression træ (CART) og flere faktorer dimensionalitet reduktion (MDR), blev anvendt i 188 lungekræfttilfælde og 290 kontroller at udforske høje ordens interaktioner mellem miljøfremmede metaboliske gener og miljømæssige risikofaktorer . Rygning blev identificeret som den dominerende risikofaktor ved alle tre analytiske tilgange. Individuelt,

CYP1A1 * 2A

polymorfi var signifikant forbundet med øget risiko lungekræft (OR = 1,69; 95% CI = 1,11-2,59, p = 0,01), mens

EPHX1

Tyr113His og

SULT1A1

Arg213His Tildelt reduceret risiko (OR = 0,40; 95% CI = 0,25-0,65, p 0,001 og OR = 0,51; 95% CI = 0,33-0,78, p = 0,002 henholdsvis). I rygere,

EPHX1

Tyr113His og

SULT1A1

Arg213His polymorfier reducerede risikoen for lungekræft, mens

CYP1A1 * 2A, CYP1A1 * 2C

GSTP1

Ile105Val bibringes øget risiko på kun ikke-rygere. Mens udforske ikke-lineære interaktioner gennem CART analyse, rygere bærer kombinationen af ​​

EPHX1

113TC (Tyr /His),

SULT1A1

213GG (Arg /Arg) eller AA (Hans /His) og

GSTM1

null genotyper viste den højeste risiko for lungekræft (OR = 3,73; 95% CI = 1,33-10,55, p = 0,006), hvorimod kombinerede effekt af

CYP1A1 * 2A

6235CC eller TC ,

SULT1A1

213GG (Arg /Arg) og betel quid tygge viste maksimale risiko i ikke-rygere (OR = 2,93; 95% CI = 1,15-7,51, p = 0,01). MDR-analyse identificerede to særskilte prædiktor modeller for risikoen for lungekræft hos rygere (tobak tygge,

EPHX1

Tyr113His, og

SULT1A1

Arg213His) og ikke-rygere (

CYP1A1 * 2A

,

GSTP1

Ile105Val og

SULT1A1

Arg213His) med test balance nøjagtighed (TBA) af 0,6436 og 0,6677 hhv. Interaktion entropi fortolkninger af MDR Resultaterne viste ikke-additive interaktioner af tobak tygge med

SULT1A1

Arg213His og

EPHX1

Tyr113His i rygere og

SULT1A1

Arg213His med

GSTP1

Ile105Val og

CYP1A1 * 2C

i ikke-rygere. Disse resultater identificeret distinkte gen-gen og gen miljø interaktioner i rygere og ikke-rygere, hvilket bekræfter betydningen af ​​multifaktorielle interaktion i vurderingen af ​​risikoen for lungekræft

Henvisning:. Ihsan R, Chauhan PS, Mishra AK, Yadav DS, Kaushal M, Sharma JD, et al. (2011) Flere analytiske tilgange Reveal Tydelige Gene-Miljø Interaktioner i rygere og ikke rygere i lungekræft. PLoS ONE 6 (12): e29431. doi: 10,1371 /journal.pone.0029431

Redaktør: Courtney G. Montgomery, Oklahoma Medical Research Foundation, USA

Modtaget: Juli 4, 2011; Accepteret: November 28, 2011; Udgivet: December 19, 2011

Copyright: © 2011 Ihsan et al. Dette er en åben adgang artiklen distribueres under betingelserne i Creative Commons Attribution License, som tillader ubegrænset brug, distribution og reproduktion i ethvert medie, forudsat den oprindelige forfatter og kilde krediteres

Finansiering:. Denne undersøgelse blev støttet af tilskud fra indiske Råd for Medicinsk Forskning (ICMR), New Delhi, Indien (49/4 /RMRC /NE /2005-NCD-II /III). Rakhshan Ihsan er en modtager af en Senior Research Fellowship of University Grants Kommissionen (UGC), New Delhi, Indien (Ref. Nr 10-2 (5) /2005 (ii) -E.U.II). Pradeep Singh Chauhan er en modtager af en Senior Research Fellowship of Rådets videnskabelig og industriel forskning (CSIR), New Delhi, Indien (Ref. Nr 09/630 (0014) /2006-EMR-1). De finansieringskilder havde ingen rolle i studie design, indsamling og analyse af data, beslutning om at offentliggøre, eller forberedelse af manuskriptet

Konkurrerende interesser:.. Forfatterne har erklæret, at der ikke findes konkurrerende interesser

Introduktion

Lungekræft er den mest almindeligt diagnosticeret kræft og den førende årsag til kræft død globalt [1]. I Indien udgør 6,2% af alle kræfttilfælde med cirka 58.000 hændelse tilfælde rapporteret i 2008 og er den hyppigste kræftform hos mænd [2]. North østlige (NE) del af Indien viser en støt stigning i kræft forekomster og lungekræft er blandt de ti førende sites, med den højeste alder-justeret incidensrate (AAR) i Mizoram tilstand (24,5 hos mænd og 26,3 hos kvinder). Aizwal distriktet alene viser en AAR af 36,0 hos mænd og 38,7 hos kvinder, der er næsten tre til ti gange højere end Delhi [3]. Forekomsten af ​​lungekræft er også høj blandt mænd i Silchar og Imphal distrikter. Høje incidensrater tyder rolle både genetiske og miljømæssige faktorer såsom rygning, rygning og kosten kræftfremkaldende forbrug.

Personer der har modificeret evne til at metabolisere kræftfremkaldende stoffer såsom polycykliske aromatiske hydrocarboner (PAH), som er allestedsnærværende miljømæssige , kosten og tobak kræftfremkaldende stoffer har en øget risiko for at udvikle kræft. Således genetiske varianter i miljøfremmede metaboliske gener kan påvirke deres clearance fra cirkulation og bestemme respons på sådanne kræftfremkaldende stoffer. Fase I miljøfremmede enzymer som cytochrom P-450S (

CYP

s), alkohol dehydrogenase (

ALDH

) og epoxid hydroxylase (

EPHX

) aktiverer normalt procarcinogens gennem oxidation og dehydrogenering derved konvertere dem til reaktive metabolitter. Fase II metaboliske enzymer såsom glutathion S-transferaser (

GST

), sulfotransferase (

SULT

) og N-acetyltransferase (

NAT

) generelt resultere i inaktivering eller afgiftning af disse reaktive metabolitter. Ligevægt mellem udtryk og aktivitetsniveauer af disse miljøfremmede-enzymer i både fase I og II bestemme den relative afgiftning af kræftfremkaldende stoffer. Men disse veje også kendt for at aktivere giftige og kræftfremkaldende kemikalier til elektrofile former, der reagerer irreversibelt med makromolekyler, såsom proteiner og nukleinsyrer, der fører til carcinogenese.

single nucleotide (SNP’er) i miljøfremmede metaboliske gener er blevet undersøgt udstrakt grad med risiko for lungekræft. Et flertal af disse molekylære epidemiologiske undersøgelser kun behandle de vigtigste virkninger af disse SNP’er og deres observerede styrke foreninger kan anfægtes af penetrans af den genetiske variant. Desuden kan en enkelt locus ikke højde for genetisk modtagelighed i en kompleks sygdom, såsom cancer, som involverer flere genetiske variationer og gen-miljø interaktioner. Aktuelle beviser tyder på, at høje ordens interaktioner i multigenic tilgang tillader mere præcis afgrænsning af risikogrupper [4], [5].

I den foreliggende undersøgelse, to data mining metoder, CART og MDR blev anvendt sammen med LR til opdage høj orden gen-gen og gen-miljø interaktioner. Både CART og MDR antager model frie og ikke-parametriske metoder til estimering ikke-lineære interaktioner med lave falske positiver selv på relativt små stikprøvestørrelser. Model validering gennem permutation test og falske positive rapport sandsynligheder blev også gjort for at overvinde unøjagtige skøn. Interaktion entropi grafer blev konstrueret til at fortolke kombinationseffekter identificeret af MDR. For yderligere at analysere mulige virkninger af

EPHX1

CYP1A1

SNPs, vi anslået deres haplotypefrekvenser og risiko bibringes mod lungekræft.

Materialer og metoder

undersøgelse fag

Denne undersøgelse bestod af 188 histopatologisk diagnosticeret lungekræft sager registreret hos Dr. Bhubaneswar Borooah Cancer Institute, Gauhati, Civil Hospital, Aizawl, og Sir Thutob Namgyal Memorial Hospital, Gangtok, de samarbejdende centre i nord øst Indien. Incident sager i perioden fra december 2006 til 2009 og er villige til at deltage i undersøgelsen blev inkluderet. 290 frivillige, alder (± 5 år) og køn matchede individer blev udvalgt fra de uafhængige ledsagere, der ledsagede kræftpatienter. Dette gav en let tilgængelig og samarbejdsvillig kilde til kontrol fra samme socioøkonomiske baggrund som de sager, reducere forstyrrende fordomme. Som vores samarbejdende centre var offentlige hospitaler et stort flertal af emner tilhørte sænke til midten socioøkonomisk baggrund. Demografiske data og karakteristika såsom alder, køn, rygevaner, brug af tobak, betelnødder quid og alkohol, blev opnået fra individer i en standard spørgeskema bruges til alle centre, i et personligt interview af en uddannet data samler. Et flertal af sager og kontroller var kultiveret med fuld folkeskole og nogle op til college niveau. Den erhvervsmæssige historie undersøgelsens deltagere viste, at de fleste af dem var landarbejdere eller engageret i smålige job og arten af ​​disse jobs ikke udsat dem for eventuelle erhvervsbetingede risici. Enhver historie tidligere eller nuværende sygdom var forespurgte, eller hvis undergår nogen medicin på tidspunktet for indskrivning. Patienter med kun lunge som deres primære sted for kræft blev inkluderet. Enhver genstand med historie af familiær malignitet eller pulmonal infektionssygdom blev udelukket fra både sag og kontrol. Afsluttende udvalgte kontroller blev inkluderet på grundlag af ikke tidligere nogen indlysende sygdom og dem, der ikke tager nogen medicin på tidspunktet for ansættelsen. Alle emner forudsat skriftligt informeret samtykke til deltagelse i denne forskning, som blev gjort under en protokol godkendt af institutionelle etiske komité for Regional Medical Research Centre, North East Region (Indiske Råd for Medicinsk Forskning). Rygere, tyggere og drikkende blev klassificeret i to kategorier nogensinde og aldrig. For rygning, blev en person, der aldrig havde røget eller røget mindre end 100 cigaretter i deres levetid, og ikke ryge på tidspunktet for rapporteringen betragtes aldrig ryger eller ikke-rygere. Nogensinde rygere eller rygere kategori, nuværende rygere, og dem, der havde forladt inden 1 års rapportering [6]. 5 ml blod blev opsamlet i EDTA-hætteglas og opbevaret under -70 ° C, indtil den forarbejdes.

Genotypning

Genomisk DNA blev isoleret ved anvendelse af Qiagen Blood DNA Isolation Kit (Qiagen GmbH, Tyskland) og opbevaret ved -30 ° C indtil yderligere analyse. Informationer om SNP’er udvalgt til undersøgelsen er opsummeret i tabel S1. Sletningen varianter i

GSTM1

GSTT1

blev bestemt ved multiplex polymerasekædereaktion protokol og SNPs i

CYP1A1

,

EPHX1, GSTP1, SULT1A1

var bestemt ved polymerasekædereaktion-restriktionsfragmentlængde-polymorfisme-analyser som beskrevet tidligere [7] – [12]. 10% af de tilfældigt udvalgte sager og kontroller blev genotype to gange for hver SNP, men ingen uoverensstemmelser blev observeret.

Statistisk analyse

Sager blev individuelt matchet med kontrol på grund af alder (± 5 år), køn og etnicitet, i et forhold på ca. 1:1.5. Forskel i fordelingen af ​​demografiske karakteristika og genotypefrekvenser mellem cases og kontroller blev evalueret ved hjælp af Chi Square (χ

2) og Fishers eksakte test, hvor det er hensigtsmæssigt. Hardy-Weinberg ligevægt (HWE) blev vurderet ved hjælp af χ

2-test. Skøn over risikoen for kræft, bibringes af genotyper og andre kovariater som tobaksrygning, tobak tygge, betelnødder quid tygge og alkoholforbrug blev bestemt ved at udlede odds ratio (OR) og dens tilsvarende 95% konfidensinterval (95% CIS) hjælp multivariable betinget logistisk regression. For alle prøver en tosidet p 0,05 blev betragtet som statistisk signifikant. Dataene blev udført på intercooler Stata 8.0 statistisk programpakke (Stata Co, College Station, TX).

haplotypeanalyse

haplotyperne blev bygget fra unphased diploide genotype data ved hjælp af Forventning maksimering-baserede algoritme. Individuelle haplotyper og deres estimerede population frekvenser blev udledt og estimater af koblingsuligevægt (D ‘) mellem SNPs blev beregnet ved hjælp af Haploview software ver.4.1.

Identifikation af High Order Interaktioner

Høj ordens interaktioner bestemmes ved hjælp af CART, MDR og interaktion entropi grafer.

CART.

en binær rekursiv partitionering metode blev anvendt til at producere et beslutningstræ, der identificeret specifikke kombinationer af medvirkende faktorer forbundet med risiko for lungekræft ved hjælp af kommercielt tilgængelig CART software (version 6.6, Salford Systems) [13]. Tree opdeling blev gjort indtil terminal noder nåede en forud fastsat mindstestørrelse på 10 forsøgspersoner. Optimal træ blev valgt ved hjælp af en standard fejl (1-SE) reglen og 10 gange cross validering. Undergrupper af personer med differentierede risikomønstre blev identificeret i forskellig rækkefølge af knudepunkter, hvilket indikerer tilstedeværelsen af ​​genet-gen og gen-miljø interaktioner. Fischers Exact test blev anvendt til at beregne relative risiko i hver terminal node i træet.

MDR.

MDR software er udviklet af Ritchie et. al. i 2001 [4] og revideret af Moore et al [14]. Genotype og miljømæssige faktorer blev samlet i høj og lav risiko gruppe, effektivt at reducere multifactor forudsigelse fra n dimension til en dimension ved hjælp MDR-software (version 2.0 beta) (https://www.epistasis.org). Vi anvendte Tuned ReliefF (græstørv) filter algoritme til at fjerne støjende SNP’er og undgå overfitting af data. Bedste modeller for hvert locus blev selekteret ved at gentage analysen for op til 10 frø og anvende 10 folder krydsvalidering hver gang. Statistisk signifikans af de bedste modeller udvælges til hvert locus blev bestemt ved anvendelse 1000 gange permutation test. p-værdier dermed opnås for TBA og krydsvalidering konsistens (CVC), blev betragtet som statistisk signifikant på 0,05 niveau.

False Positive Report Sandsynlighed (FPRP)

Rapporter om gen-miljø interaktionsstudier er ofte udfordret af falske positive fund, især når resultaterne genereret af flere sammenligninger. For at estimere FPRP og vurdere robustheden af ​​resultaterne fra MDR analyse, vi brugte Bayesian tilgang beskrevet af Wacholder et. al. [15]. Metoden kræver forudgående sandsynligheder at den genetiske variant og sygdom forening er reel. Som tidligere sandsynlighed kan være en subjektiv foranstaltning og kan være påvirket af flere faktorer, som regel en bred vifte er indberettet af undersøgelser. I betragtning af fattige epidemiologiske data fra studiet befolkning og inkonsekvent sammenslutning af de SNPs med risiko lungekræft vi sat en forholdsvis bredere vifte af forudgående sandsynligheder (10

-6 til 10

-1) med en anslået statistisk styrke til at påvise en OR på 1,5 og 2,0 og α lig med den observerede p-værdi. Den FPRP cutoff punkt blev stringent holdt til 0,2.

Interaktion entropi grafer

Interaktion grafer blev bygget til at visualisere og fortolke de opnåede resultater fra MDR hjælp Orange machine learning softwarepakke [16]. Interaktion grafer bruger entropi estimater som beskrevet af Jakulin et al. [17] til at bestemme gevinsten i oplysninger om en klasse variabel (fx case-kontrol-status) fra at fusionere to variabler sammen over denne, som variablerne selvstændigt. Dette mål for entropien er nyttig til opbygning interaktion grafer, der letter fortolkningen af ​​forholdet mellem variablerne. Interaktion grafer består af et knudepunkt for hver variabel med parvise forbindelser mellem dem. Procentdelen af ​​entropi fjernes (dvs. information gevinst) ved hver variabel visualiseres for hvert knudepunkt. Andelen af ​​entropi fjernet for hver parvis kartesiske produkt af variabler blev visualiseret for hver forbindelse. Således kan de uafhængige vigtigste virkninger af hver SNP sammenlignes med interaktionen virkning. Positiv entropi (plottet i grøn) indikerer ikke-lineær interaktion mens negativ entropi (plottet i rødt) angiver redundans. Entropi værdien sættes til nul indikerer uafhængighed eller en blanding af synergi og redundans.

Resultater

Karakteristik af forsøgspersonerne

Fordelingen af ​​køn og etnicitet var ens for sager og kontroller . Hyppigheden fordeling af hanner og hunner var 77,1% og 22,9% i tilfælde og 76,2% og 23,85 i kontrol hhv. Gennemsnitsalderen af ​​sager og kontroller var 60,41 ± 10,58 (interval 30-82 år) og 57,19 ± 10,75 (interval 32-85 år) hhv. Fordelingen af ​​alle SNPs i kontrol var i overensstemmelse med HWE (p 0,05), dog alleler af

EPHX1

Tyr113His og

SULT1A1

Arg213His polymorfier i tilfælde ikke følger HWE (p 0,001 og p = 0,004 henholdsvis).

Foreningen af ​​genetiske og miljømæssige faktorer med risiko lungekræft af LR analyse

distribution og vigtigste virkninger af genetiske og miljømæssige faktorer er sammenfattet i tabel 1. risiko vaner sådanne som rygning, tobak tygge og betelnødder quid tygge var fremherskende blandt sager. Men kun rygning og betel quid tygge var signifikant forbundet med øget risiko for lungekræft (OR = 3,06; 95% CI = 1,94-4,83; p 0,001 og OR = 1,86; 95% CI = 1,21-2,84; p = 0,004 henholdsvis) . Genotype distribution af

CYP1A1 * 2A

,

EPHX1

Tyr113His,

SULT1A1

Arg213His og

GSTT1

null polymorfi var signifikant forskellige i sager fra kontroller (p = 0,014, p 0,001, p = 0,01 og p = 0,04 henholdsvis). Vigtigste virkninger af genotyper i lungekræft modtagelighed blev evalueret ved hjælp af betinget multivariable logistisk regression. Heterozygot genotype i

CYP1A1 * 2A

var forbundet med øget risiko (OR = 1.69,95% CI = 1,11-2,59; p = 0,01), mens heterozygote genotyper i

EPHX1

Tyr113His og

SULT1A1

Arg213His bibringes reduceret risiko mod lungekræft (OR = 0,40; 95% CI = 0,25-0,65, p 0,001 og OR = 0,51; p = 0.33x-0,78, p = 0,002 henholdsvis).

CYP1A1 * 2A

EPHX1

His139Arg polymorfier blev forbundet med øget risiko for lungekræft i dominant genetisk model, mens

EPHX1

Tyr113His og

SULT1A1

Arg213His bibragt nedsat risiko i recessive genetiske model (tabel S2).

haplotypeanalyse

tabel 2 opsummerer foreningerne mellem hyppighedsfordeling af de haplotyper i

CYP1A1

EPHX1

gener og risikoen for lungekræft. De odds ratio blev beregnet ved hjælp af den mest almindelige haplotype som referencegruppe. I

CYP1A1

, “TA” haplotype var den hyppigste blandt både cases og kontroller og viste signifikant sammenhæng. Kun

CYP1A1

-CG haplotype bibringes øget risiko for lungekræft (OR = 1,49; 95% CI = 1,00-2,21, p = 0,04). I

EPHX1

, den “TA” haplotype var den mest almindelige med frekvenser på 44,79% og 45,04% i tilfælde, og kontroller hhv. Ingen haplotype viste sig at være signifikant associeret med risiko lungekræft.

Risiko SNPs stratificeret af rygning

Da rygning er en veletableret risikofaktor for lungekræft og var den stærkeste uafhængig risikofaktor i LR, vi yderligere stratificeret dataene ved at ryge status. Distribution og risiko forbundet med genetiske faktorer efter lagdeling er vist i tabel 3. Heterozygot og homozygot variant genotyper af

CYP1A1 * 2A

polymorfi bibringes betydelig risiko hos ikke-rygere (OR = 2,88; 95% CI = 1,22-6,81 , p = 0,016 og OR = 4,35; 95% CI = 1,47-12,84, p = 0,008). Også,

CYP1A1 * 2C

variant genotype og

GSTP1

Ile105Val heterozygot genotype var signifikant forbundet med øget risiko hos ikke-rygere (OR = 11,81; 95% CI = 1,24 til 111,98, p = 0,03 og OR = 2,40; 95% CI = 1,15-5,03, p = 0,01). Heterozygote genotyper i

EPHX1

Tyr113His og

SULT1A1

Arg213His var forbundet med 66% og 55% reduceret risiko i rygere (OR = 0,34; 95% CI = 0,18 til 0,63, p = 0,001 og OR = 0,45; 95% CI = 0,25-0,80, p = 0,007 henholdsvis). Men heterozygot genotype i

EPHX1

His139Arg tillægges betydelig risiko i rygere (OR = 1,92; 95% CI = 1,07-3,45, p = 0,02).

CART analyse

Figur 1 viser den valgte CART model bygget på alle undersøgte genetiske varianter og miljømæssige risikofaktorer. Den endelige træ indeholdt otte terminale knuder. Den første opdeling af roden node var på rygevaner, hvilket indikerer, at rygning er den stærkeste risikofaktor for lungekræft. Blandt rygere, viste de efterfølgende splits interaktioner mellem

EPHX1

Tyr113His,

SULT1A1

Arg213His og

GSTM1

. I ikke-rygere første split var på

CYP1A1 * 2A

status, hvilket var på konkordans med LR analyse, hvor

CYP1A1 * 2A

viste stærk association kun at risikere hos ikke-rygere. Yderligere interaktioner blev forudsagt af

SULT1A1

Arg213His polymorfi og betel quid status. Terminal node 7, der består af mindst procentdel af tilfælde i ikke-rygere, blev taget som reference til at beregne eller for andre terminaler noder. Blandt rygerne blev observeret maksimale risiko for terminal node1 bestående af

EPHX1

113TT (Tyr /Tyr) eller -113CC (Hans /Hans) genotyper (OR = 4,38; 95% CI = 2,12-9,15) og for terminal node 2 med en kombination af

EPHX1

113TC (Tyr /His),

SULT1A1

213GG (Arg /Arg) eller AA (Hans /His) og

GSTM1

null genotyper (OR = 3,73; 95% CI = 1,33-10,55, p = 0,006). I ikke-rygere blev set høj risiko for terminal node 5 bestående af

CYP1A1 * 2A

6235CC eller TC,

SULT1A1

213GG (Arg /Arg) og betelnødder quid tygge (OR = 2,93; 95 % CI = 1,15-7,51, p = 0,01). Parallelt med ovenstående, CART analyse på separate datasæt af rygere og ikke-rygere blev også udført. Men vi ikke finde nogen høj orden interaktion i disse analyser (data ikke vist).

Terminal knudepunkter er tyk omkranset.

* W: Wild typen genotype; V: Variant genotype, TN: Terminal Node,

#p værdi 0,05

MDR Analyse

MDR-analyse blev anvendt til yderligere at udforske gen-gen og gen-miljø interaktioner. Bedste prognosemodeller op til 4 ordrer for interaktion, sammen med deres CVC og TBA er opsummeret i tabel 4. Analysen blev kørt separat for samlede datasæt og datasæt stratificeret på rygning status. For total datasæt, rygning var den bedste locus model med højeste CVC (10/10) og test nøjagtighed 0,6114, som var statistisk signifikant (p 0,001) bestemt ved 1000 gange permutation test. For en 2-locus interaktion, kombination af rygning og

EPHX1

Tyr113His var mest markant med CVC af 10/10 og TBA af 0,6407 (p 0,001). De 3 locus model bestod af rygning,

EPHX1

Tyr113His og

EPHX1

His139Arg med TBA af 0,6497 (p 0,001) og CVC af 10/10. Den 4 loci interaktion model af rygning,

EPHX1

Tyr113His,

EPHX1

His139Arg og

SULT1A1

Arg213His, blev den bedste model identificeret, med maksimal CVC (10/10) og TBA (0,6503, s 0,001). Denne model havde en chi-square værdi på 66,31 (p 0,0001) og en OR på 4,93 (95% CI = 3,32-7,33). I rygere bedste interaktion model var den tre loci model, som består af tobak tygge,

EPHX1

Tyr113His og

SULT1A1

Arg213His have maksimal CVC (10/10) og TBA (0,6436, s 0,001) blandt alle modeller identificerede. Modellen bibringes 3,5 gange forøget risiko for lungekræft (95% CI = 2,69-7,69). I ikke-rygere den bedste model var tre loci model bestående af

CYP1A1 * 2A

,

GSTP1

Ile105Val og

SULT1A1

Arg213His med CVC af 10/10 og TBA af 0,6677 (p 0,005). og en OR på 7,32 (95% CI = 3,24-16,53)

Falsk positiv rapport sandsynlighed (FPRP)

tabel 5 viser FPRPs for 3 bedste modeller opnået fra MDR-analyse. Det 4-loci prædiktor model på total datasæt og 3-loci model i rygere viste fremragende pålidelighed, selv når antager meget lave forudgående sandsynligheder (fra 10

-3 til 10

-6) til påvisning af yderste periferi på 1,5 og 2,0 . Men den bedste model er valgt i ikke ryger kategori viste sand forening kun på høj sandsynlighed for 10

-1 til påvisning OR = 1,5 og indtil 10

-2 til detektering OR = 2,0.

interaktion entropi grafer

Efter at have identificeret de højrisiko-kombinationer ved hjælp MDR tilgang, blev interaktion entropi algoritme anvendes til at fortolke forholdet mellem variablerne. Grafer blev bygget på MDR resultater fra analyse på total datasæt (figur S1) og datasæt stratificeret af rygning (figur 2). I rygere,

EPHX1

Tyr113His havde en stor uafhængig effekt (4,64%) og en ikke-additiv interaktion med tobak tygge (entropi 1,79%). Betydelig entropi var forbundet med

SULT1A1

Arg213His (1,88%) og dens interaktion med tobak tygge yderligere fjernet 1,49% af entropi fra case-kontrol-gruppe. Men vi ikke afsløre eventuelle ikke-lineær vekselvirkning mellem de to SNPs i modellen. Vi fandt små procentdele af entropien i case-kontrol-status forklares ved alkoholforbrug (0,56%) og tobak tygge (0,70%) uafhængigt af hinanden, men en stor procentdel af entropi forklares ved samspillet mellem disse to miljøfaktorer (2,47%). I ikke-rygere,

CYP1A1 * 2A

viste stærkest vigtigste effekt med entropi fjernelse på 4,7%.

GSTP1

Ile105Val havde for en stærk uafhængig effekt (entropi fjernelse = 3,28%) og dens interaktion med

SULT1A1

Arg213His yderligere fjernet 3,02% af entropi. blev observeret en stærk synergistisk vekselvirkning mellem

SULT1A1

Arg213His og

CYP1A1 * 2C

som kombinationen fjernet yderligere 2,61% af den samlede entropi.

Samspillet Modellen beskriver den procentvise af entropien (information gevinst) fjernes ved hver variabel (vigtigste effekt: repræsenteret ved knuder) og ved hver parvis kombination af attributter (interaktion effekt: repræsenteret ved tilslutninger). Attributter udvælges på grundlag af MDR resultater opnået i tilfælde af (A) Rygere og (B) ikke rygere. Etiketter: EX3:

EPHX1

Tyr113His, Alc: alkohol forbrug, Tbc: tobak tygge, Sult:

SULT1A1

Arg213His, 2A:

CYP1A1 * 2A,

2C:

CYP1A1 * 2C

, P1:

GSTP1

Ile105Val

diskussion

Den foreliggende undersøgelse bruges flere analysemetoder til først vurdere foreninger og derefter udforske muligt. interaktioner af miljøfremmede metaboliske gener med miljømæssige faktorer i risiko for lungekræft. De anvendte metoder data mining har mulighed for at søge og identificere interaktioner uanset betydningen af ​​de vigtigste virkninger. Den væsentligste fund af denne undersøgelse er de konsekvent identificerede gen-gen og gen miljø interaktioner med alle de tre statistiske metoder.

Rygning er den primære ætiologiske faktor i lungekræft. Det samme blev afspejlet i nærværende undersøgelse som rygning viste stærk forening i LR, bedste én faktor model i MDR og dannede første splittelse i CART. Interaktion af

EPHX1

Tyr113His og

SULT1A1

Arg213His konsekvent identificeret i rygere. Begge

EPHX1

Tyr113His og

SULT1A1

Arg213His Tildelt reduceret risiko i ryger delmængde i LR. De to polymorfier sammen med

EPHX1

His139Arg dannede bedste forudsigelse model i MDR-analyse hos rygere og også dannede efterfølgende splits inden rygere i CART. EPHX1 enzym kataboliserer epoxider fra PAH i dihydrodiols, som indebærer generering af mere reaktive kræftfremkaldende metabolitter. Substitution af en variant Hans allel ved kodon 113 (

EPHX1

Tyr113His) aftager aktiviteten af ​​dette enzym [18] mindsker derved risikoen for kræft. Undersøgelser af lungekræft tyder beskyttende virkning for

Hans

113 (langsom type) sammenlignet med

Tyr

113 (hurtig type), der bibringer forøget lunge caner risiko [19] – [21]. Varianten allelen er også blevet foreslået at reducere risikoen for ovariecancer [22]. Vi har tidligere rapporteret tilsvarende resultater fra samme population i kræft i spiserøret viser

Hans

113 allel at være forbundet med en betydeligt reduceret risiko i rygere [23]. Afspejler det samme, i CART analyse Terminal node 1 af bibringer mere end 4 gange høj risiko for rygere muligvis på grund stor andel af den vilde

Tyr

113 homozygot genotype. Sulfonering reaktion af

SULT1A1

er en afgiftning reaktion, men det indebærer også bioaktivering af visse procarcinogens, herunder heterocycliske aminer og PAH’er at danne kræftfremkaldende-DNA addukt [24], [25]. In vitro model studier antyder, at substitution af histidin i position 213 i aminosyresekvensen er forbundet med nedsat substrat affinitet og et lavere niveau af protein [26], der kan beskytte mod kemisk carcinogenese af PAH’er i lungecancer [27]. Resultater på sammenslutning af

SULT1A1

Arg213His og risiko for kræft er inkonsekvent, fra nul association med risiko for colorectal cancer [28] og prostatakræft [29] for at øge i risikoen for brystkræft i forbindelse med

Hans

213 allel [30]. En anden undersøgelse af kolorektal cancer viste en signifikant reduceret risiko for personer, der bærer

Hans

213 allel [31]. En metaanalyse af Kotnis et al [32] viste en signifikant beskyttende virkning af polymorfi i syv studier af uro-genital kræftformer.

Blandt ikke-rygere

CYP1A1 * 2A

GSTP1

Ile105Val var de vigtigste polymorfier identificeret for udvikling lungekræft. Varianten allel af både polymorfier tillagt væsentlig risiko i ikke ryger undergruppe i LR-analyse. Ligeledes MDR 3 loci model af

CYP1A1 * 2A

,

GSTP1

Ile105Val og

SULT1A1Arg213His

polymorfier var den bedste prædiktor for risikoen hos ikke-rygere.

CYP1A1

6235T C MspI (

CYP1A1 * 2A

) polymorfi, er forbundet med højere enzymaktivitet mod benzopyren [33], [34]. Undersøgelser på sammenhæng mellem

CYP1A1

polymorfier og lungekræft har ført til tvetydige resultater [35], [36]. Svarende til vores resultater, en undersøgelse foretaget af Taioli et. al. [37] rapporterede sammenslutning af

CYP1A1 * 2A

variant allel med lungekræft, men efter lagdeling ved at ryge foreningen forblev begrænset til ikke-ryger lejlighed. Endvidere i en samlet analyse af 11 undersøgelser af

CYP1A1 * 2C

polymorfi i lungekræft, Le Marchand et al [38] fandt det at være forbundet med risiko hos ikke-rygere, en konstatering, der bestyrker vores resultater. En anden undersøgelse af Jose et al [39] om lungekræft fundet sammenslutning af nogen

CYP1A1

polymorfi med rygere. Lignende resultater blev rapporteret i kolorektal cancer, hvor heterozygote og variant genotyper af både CYP1A1 * 2A og CYP1A1 * 2C tillagt risiko i kombinationer med NAT2 kun blandt ikke-rygere [40]. al.

Be the first to comment

Leave a Reply