PLoS ONE: Genetisk variation og Antioxidant Respons genekspression i de bronchiale Airway epitel Rygere at Risk for lungekræft

Abstrakt

Tidligere microarray studier af rygere med høj risiko for lungekræft har vist, at heterogenitet i bronkial luftveje epitelcelle genekspression respons på rygning kan tjene som en tidlig diagnostisk biomarkør for lungekræft. Som et første skridt i at anvende funktionel genomisk analyse befolkningsundersøgelser, har vi undersøgt sammenhængen mellem genekspression variation og genetisk variation i en central molekylær vejen (Nrf2-medieret antioxidant respons) i forbindelse med rygning eksponering og lungekræft. Vi vurderede global genekspression i histologisk normale luftvejsepitelceller celler opnået ved bronchoskopi fra rygere, der udviklede lungekræft (SC, n = 20), rygere uden lungecancer (SNC, n = 24), og aldrig rygere (NS, n = 8) . Funktionel berigelse analyse viste, at Nrf2-medierede, antioxidant responselement (ARE) -regulated gener, var signifikant lavere i SC, når der sammenlignes med ekspressionsniveauer i SNC. Vigtigere, fandt vi, at ekspressionen af ​​MAFG (en bindingspartner af Nrf2) blev korreleret med ekspressionen af ​​gener, hvilket tyder MAFG niveauer kan begrænse målgen induktion. Bioinformatically vi identificerede enkeltstoffer nukleotid polymorfier (SNP) i formodede ER gener og for at teste virkningen af ​​genetisk variation, vi genotypede disse formodede regulatoriske SNPs og andre tag SNPs i udvalgte Nrf2 pathway gener. Sekventering MAFG locus, vi identificeret 30 nye SNP’er og to blev forbundet med enten genekspression eller lungekræft status blandt rygere. Dette arbejde viser en analyse tilgang, der integrerer bioinformatik vej og transkriptionsfaktor bindingssted analyse med genotype, genekspression og sygdomsstatus at identificere SNPs, som kan være forbundet med individuelle forskelle i genekspression og /eller kræft status i rygere. Disse polymorfier i sidste ende kan bidrage til risikoen lungekræft via deres effekt på luftvejene genekspression respons på tobak røg eksponering

Henvisning:. Wang X, Chorley BN, Pittman GS, Kleeberger SR, Brothers J II, Liu G et al. (2010) Genetisk variation og Antioxidant Respons genekspression i de bronchiale Airway epitel Rygere at Risk for lungekræft. PLoS ONE 5 (8): e11934. doi: 10,1371 /journal.pone.0011934

Redaktør: Oliver Eickelberg, Helmholtz Zentrum München /Ludwig-Maximilians-Universitetet i München, Tyskland

Modtaget: Februar 23, 2010; Accepteret: 6 maj 2010; Udgivet: 3. august, 2010

Dette er en åben adgang artiklen distribueres under betingelserne i Creative Commons Public Domain erklæring hvori det hedder, at når det først er i det offentlige rum, dette arbejde kan frit gengives, distribueres, overføres, ændres, bygget på, eller på anden måde bruges af alle til ethvert lovligt formål

Finansiering:. de finansieringskilder havde ingen rolle i studie design, indsamling og analyse af data, beslutning om at offentliggøre, eller forberedelse af manuskriptet. Dette arbejde blev finansieret af Intramural Research Program for National Institute of Environmental Health Sciences, National Institutes of Health (Z01 ES100475) og tilskud til Avrum Spira fra National Institute of Health (U01ES016035, R01CA124640).

Konkurrerende interesser: forfatterne har erklæret, at der ikke findes konkurrerende interesser

Introduktion

Omkring 1,3 milliarder mennesker ryger cigaretter på verdensplan, der bidrager til næsten 5 millioner forebygges dødsfald om året [1].. Rygning er en væsentlig risikofaktor for lungekræft, den hyppigste årsag til kræft-relaterede dødsfald i USA, og kronisk obstruktiv lungesygdom, den fjerde mest almindelige dødsårsag samlet [2]. Selv med de høje henføres risici som følge af cigaretrøg eksponering, kun 10-15% af alle rygere udvikler lungekræft [3], kan tyder genetiske variabilitet spille en rolle i modtagelighed for lungekræft. Manglende kendskab til det genetiske grundlag for lungekræft forhindrer nøjagtig forudsigelse af rygere med den højeste risiko. Imidlertid hurtige fremskridt inden for high-throughput genomforskning teknikker, især genekspression profilering og enkelt-nukleotid polymorfisme (SNP) genotyping, lovende til karakterisering risiko. Forstå, hvordan genetisk variation påvirker rygning-induceret genekspression i lungerne og luftvejene kan afsløre modtagelighed faktorer.

Tidligere undersøgelser har vist, at cigaretrøg eksponering skaber en “inden for skade” i luftvejs epitelceller (revideret i [4 ]). Spira

et al

[5] har målt hel-genom genekspressionsprofiler i epitel celle børstninger indsamlet på bronkoskopi fra hovedstammebronkie af raske rygere og aldrig rygere ,. Rygning-induceret genekspression blev observeret for gener involveret i regulering af oxidant stress, miljøfremmede stofskifte, og onkogenese, mens gener involveret i inflammation og tumor undertrykkelse veje ned blev reguleret. For nylig, ved hjælp af en lignende fremgangsmåde blev en 80-gen biomarkør udviklet til at hjælpe med at diagnosticere personer med lungekræft blandt en gruppe af rygere, der har en bronkoskopi grundet mistanke om lungekræft [6], [7]. Profiler af histologisk normale store luftvejs epitelceller opnået ved bronkoskopi blev effektivt brugt som en tidlig diagnostisk lungekræft biomarkør, med en nøjagtighed på 83%. Disse observationer afslører luftvejs-gen-ekspression forskelle mellem individer som reaktion på rygning, men ikke pege på de molekylære mekanismer, der bidrager til heterogenitet i dette gen-udtryk respons.

Menneskelig genetiske variation i responsen på miljømæssig eksponering er generelt accepteret som en vigtig determinant i modtagelighed for cancer [8]. Imidlertid er en udfordrende problem i associationsstudier tolkning hvis statistisk bevis for genotype-fænotype /sygdom korrelation er biologisk plausibelt. Ofte forholdet mellem specifikke single nucleotide (SNP’er) og genekspression eller aktivitet har været vanskeligt at studere

in vivo

. Undersøgelse SNP’er i transkriptionsfaktor veje og specifikt i transkriptionsfaktorbindingssites, i forhold til genekspression er en tilgang, der kan give funktionel information [9]. For nylig,

cis

virkende regulatoriske SNPs er blevet opdaget ved hjælp af en regional forening tilgang [10], [11]. For bedre at forstå disse funktionelle forhold, der bidrager til

in vivo

forskelle i genekspression og muligvis til lungekræft følsomhed, har vi anvendt en tredelt tilgang til at teste associationer mellem: (1) genekspression og lungekræft status , (2) SNP genotypen og genekspression, og (3) SNP genotypen og lungekræft status.

Brug den fremgangsmåde beskrevet af Spira

et al

[7], vi vurderet global genekspression i cytologisk normale luftveje epitelceller opnået ved bronkoskopi fra rygere med mistanke om lungekræft og fra en kontrolgruppe af aldrig rygere. Vi identificerede, at antioxidanten respons pathway reguleret af transskription faktor Nrf2 (nuklear faktor erythroid-afledt 2-like to eller NFE2L2) afveg blandt disse faggrupper. Vi fandt, at ekspressionen af ​​MAFG (en bindingspartner af Nrf2) blev korreleret med ekspressionen af ​​Nrf2 syntesevejsgener. Vi bruges bioinformatik strategier til identifikation putative regulatoriske SNPs i Nrf2 bindingssteder [9], [12], [13] og for at vælge tag SNPs for Nrf2-medierede gener. Desuden har vi sekventeret den MAFG locus i vores forsøgspersoner. Gen-ekspression, blev genotype og lungekræft status integreret og sammenlignet, og vi identificerede SNPs, der var forbundet med individuelle forskelle i genekspression og /eller kræft status.

Resultater

Cigaretrygning, lungekræft og de bronchiale luftvejene transkriptomet

med det formål at identificere potentielle funktionelle SNP’er og /eller haplotyper i antioxidant respons veje forbundet med rygning-induceret lungekræft, brugte vi en tredelt tilgang til at analysere sammenhængen mellem: 1) genekspression og lungekræft status; 2) genekspression og genotype af SNP’er udvalgt af flere bioinformatik strategier, og 3) SNP genotyper og lungekræft status. Den overordnede arbejdsgang i vores tilgang er skitseret i figur 1.

(A) Vi vurderede microarray genekspression profiler af histologisk normale luftvejs epitelceller opnået ved bronkoskopi fra rygere med mistanke om lungekræft og fra en kontrolgruppe af aldrig rygere. (B) Vi identificerede, at antioxidanten respons pathway reguleret af transskription faktor Nrf2 afveg blandt disse faggrupper. Vi fandt, at ekspressionen af ​​MAFG (en bindingspartner af Nrf2) blev korreleret med ekspressionen af ​​Nrf2 syntesevejsgener. (C) Bioinformatik strategier blev anvendt til at identificere formodede regulatoriske SNPs i Nrf2 bindingssteder og for at vælge tagging SNPs for Nrf2-medierede gener. (D) Den MAFG locus blev sekventeret i vores forsøgspersoner. Vi identificerede SNP’er der var knyttet til individuelle forskelle i: (E) genekspression og /eller (F) cancer status ved at integrere genekspression, genotype og lungekræft status

opnåedes Bronkial luftvejs-epitelceller. af fleksibel bronkoskopi fra 8 raske aldrig-rygere (NS) og fra rygere indskrevet i en diagnostisk undersøgelse for klinisk mistanke om lungekræft, herunder 20 rygere med lungekræft (SC), og 24 rygere uden lungekræft (SNC) (tabel 1). Disse emner var en delmængde to større genekspression projekter [5], [7], for hvem vi kunne opnå tilstrækkelig genomisk DNA til genotypebestemmelse. Expression data for 31 fag fra disse projekter [5], [7] og data for yderligere 21 nyansatte patienter blev anvendt. Brug Affymetrix HG-U133A microarrays, fandt vi 11285 probe-sæt til udtryk på målelige niveauer (afsløring p-værdi = 0,05 i mindst 20% af personer i en af ​​SC, SNC, eller NS), hvilket svarede til 8159 protein- kodning RefSeq gener baseret på Affymetrix annotation (HG-U133A.na28.annot.csv marts 2009).

for at undersøge den differentierede svar på effekten af ​​cigaretrygning på bronchiale luftvejene transkriptomet, brugte vi profiler fra aldrig-rygere som baseline og sammenlignet de gennemsnitlige log2-udtryk værdier af SC eller SNC med den af ​​NS af t-test, efterfulgt af korrektion multipel testning (Benjamini-Hochberg falsk opdagelse sats, FDR [14]). Sammenlignet med aldrig-rygere, fandt vi differential udtryk (FDR 0,1) til 846 probe-sæt (774 gener) i rygere uden kræft og 919 probe-sæt (834 gener) i rygere med kræft. Vi næste klassificeret ryger-afhængige gener i overudtrykt (fold forandring 1,2) og under-udtrykt (fold forandring 0,8) gener. I rygere uden kræft, var der 210 probe-sæt over-udtrykte og 628 probe-sæt under-udtryk; hos rygere med kræft, der var 263 probe-sæt over-udtrykte og 644 probe-sæt under-udtrykt, sammenlignet med aldrig-rygere. Listen over probe-sæt, gennemsnitlig log

2-udtryk værdier, og statistiske værdier indgår i Støtte Information S1.

Funktionel berigelse analyse af rygning påvirkede genekspression signaturer

Til identificere sæt af relaterede gener med fælles biologiske funktion, vi analyserede udtryk profiler ved hjælp Gene Set Enrichment Analysis (GSEA) [15], Opfindsomhed pathway analyse (IPA), og Gene ontologi berigelse analyse (GOEA). GSEA testet om nogen

a priori

definerede kanoniske veje blev beriget blandt differentielt udtrykte gener i grupperne. Vi var især interesseret i forskelle mellem kræft og ingen kræft grupper. Vi fandt, at to gensæt blev beriget i SNC versus NS, på 0,1 niveau FDR. Det første gen sæt var de “antioxidant responselement gener” (kurateret og offentliggjort tidligere [9]), med en normaliseret berigelse score (NES) på 2,04 og en FDR q-værdi på 0,021; det andet gen sæt var “actin Y pathway” (NES = 1,87, q-værdi = 0,077). To gensæt blev beriget i NS, herunder “Histidin metabolisme” (NES = 1,93, q-værdi = 0,082) og “RAR /RXR-vejen” (NES = 1,84, q-værdi = 0,093). Ingen gen sæt blev beriget ved FDR 0,1 eller 0,25 niveau i SC forhold til NS. Vi har også observeret nogen beriget gen sat i sammenligning SNC versus SC på FDR 0,1 niveau, men vi fandt 4 gen sæt beriget på FDR 0,25 niveau, den mest betydningsfulde gen sæt var “antioxidant respons element gener” (NES = 1,86, q- værdi = 0,120). Disse resultater tydede på, at sættet af “antioxidant responselement gener” var signifikant beriget i SNC, men ikke i SC.

Vi også brugt IPA til at teste for berigede kanoniske veje ved hjælp af lister over over-udtrykt eller under-udtrykt probe bruges til at vælge og bestemme den relative vægt af identificerede veje i de forskellige fænotype grupper. For de 210 overudtrykte probe-sæt mellem SNC og NS, seks veje var signifikant (figur 2A), herunder “Nrf2-medieret oxidativ stress respons”, “hypoxi signalering i kardiovaskulære system”, “TR /RXR aktivering”, “aryl kulbrinte receptor signalering “,” integrin signalering “, og” eicosanoid signalering “. GSEA og IPA repræsenterer to forskellige funktionelle berigelse metoder, der er baseret på uafhængige viden databaser og forskellige statistiske test. Både identificeret Nrf2 vej som den mest beriget vej, viser sammenhæng mellem disse metoder. Vigtigst hjælp IPA, for over-udtrykte gener observerede vi en meget udtalt forskel i signifikansniveau “Nrf2-medieret oxidativ stress pathway” mellem SNC og SC (figur 2A). Desuden Gene ontologi analyse støttede også den rolle, oxidativ stress gener blandt over-udtrykte gener i SNC. Der var 15 GO vilkår beriget fra over-udtrykte gener på FDR 0.1 niveau i SNC og alle af dem blev molekylære funktion vilkår for antioxidant respons gener (Støtte Information S1); dog blev der ikke GO vilkår beriget blandt over-udtrykte gener i SC. Således tre bioinformatiske analyser understøtter en rolle for Nrf2 pathwaygener i gruppen uden kræft, men ikke i lungekræft gruppen.

(A) Ingenuity Pathway Analyse afslørede forskellige virkninger af cigaretrygning hos rygere uden cancer (SNC) og rygere med cancer (SC) i forhold til ikke-rygere (NS). Seks kanoniske veje var signifikant beriget i de 210 over-udtrykte probe-sæt, når man sammenligner SNC med NS (blå søjler). Tre veje blev væsentligt beriget med 263 over-udtrykte probe-sæt, når man sammenligner SC versus NS (røde søjler). Vi observerede en meget udtalt forskel i signifikansniveau “Nrf2-medieret oxidativ stress pathway” mellem SNC og SC. (B) mRNA niveauer i interagerende, regulatoriske komponenter af Nrf2 pathway vises som boxplots. Et boxplot viser et datasæt gennem fem-nummer resuméer: den mindste observation, lavere kvartil, median, øvre kvartil, og største observation. I forhold til NS, master regulator Nrf2 viste ingen forskel mellem SNC og SC. , Bindingspartneren MAFG var imidlertid betydeligt lavere i SC, og konkurrenten NRF1 var signifikant højere i SC. NRF3, KEAP1, og BACH1 mRNA viste ingen væsentlige ændringer. (C) Vi observerede, at 22 gener med kendte Nrf2 bindingssteder viste signifikante forskelle blandt grupperne på FDR 0.1 niveau. Konsekvent, ekspressionen af ​​disse gener i SNC var højere end den, NS; og de fleste af disse gener har lavere ekspression i SC end den, SNC. Dette mønster var ligner MAFG udtryk mønster.

Korrelation af MAFG med ekspressionen af ​​antioxidant respons gener

Funktionelle berigelse metoder stærkt impliceret betydningen af ​​Nrf2 vejen (defineret ved gener indeholder antioxidant responselementer (Ares) i opstrøms regioner). Som et resultat, vi undersøgte denne gruppe af gener nærmere. Under oxidative eller elektrofil stress, er Nrf2 frigjort fra dets interaktion med KEAP1 og translokerer til kernen, hvor det heterodimeriserer med små MAF proteiner, såsom MAFG, og derefter binder er sekvenser opstrøms af Nrf2 målgener [16]. NRF1, NRF3, og BACH1 kan konkurrere med Nrf2 at binde med MAFG på ER sites, der kan føre til nedsat ARE-medieret genekspression [17], [18], [19]. Figur 2B viser mRNA-niveauer af de interagerende regulatorisk protein komponenter af Nrf2-vejen. Sammenlignet med NS, fandt vi ingen signifikant forskel i master regulator Nrf2 mellem enten SNC eller SC. Vi fandt imidlertid signifikant forskel i konkurrenten NRF1 og bindingspartneren MAFG der er i overensstemmelse med en rolle i reguleringen af ​​de nedstrøms målgener (figur 2B). NRF1 var signifikant højere (fold ændring = 1,23, p = 0,0115 for SC versus SNC, og fold forandring = 1,54, p = 0,0084 for SC vers NS, af t-test). Ændringen i NRF1 udtryk i denne proces understøtter rolle NRF1 foreslået af Wang

et al

[20] og Ohtsuji

et al

[16], som viste, at NRF1 binding til ARE’er

in vivo

undertrykt ARE-afhængig genekspression og moduleret reaktion på oxidativ stress. Det vil sige, NRF1 blev observeret at være anti-korreleret med ekspression af Nrf2 syntesevejsgener. MAFG var lavere i SC forhold til NS eller SNC (fold ændring = 0,55, p = 0,0022 for SC versus SNC, og fold forandring = 0,60, p = 0,0076 for SC versus NS, af t-test). Ingen signifikante ændringer blev fundet i NRF3, KEAP1, og BACH1 mRNA (figur 2B). Som forventet baseret på IPA og GSEA resultater, fandt vi, at 22 ER-regulerede gener var forskellige mellem grupperne, og korreleret med MAFG niveauer (lavere i SC, men højere i SNC, Figur 2C). Nrf2 målgener vist i figur 2C (AKR1C1, AKR1C2, ALDH3A1, CBR1, FTH1, FTL, GCLM, GCLC, GPX2, NQO1, PIR, PRDX1, PSMA3, SAT1, SLC7A11, SOD1, SQSTM1, TALDO1, TKT, TXN, TXNRD1, og UGT1A6) blev induceret blandt SNC men forblev konsekvent lavere i SC patienter. Denne roman observation tyder på, at reducerede niveauer af MAFG og højere niveauer af NRF1 (negativ regulator) kan være at undertrykke transskription af disse er-regulerede gener blandt rygere, der går på at udvikle lungekræft.

Vi re-undersøgt en større, tidligere offentliggjorte datasæt [7] og også fundet signifikant lavere MAFG niveauer hos rygere med lungekræft (n = 90) sammenlignet med hos rygere uden kræft (n = 97) (Støtte Information S1). Yderligere bevis for en regulerende rolle for MAFG i luftvejs epitelceller er ved at opstå. I en beslægtet projekt, er blevet observeret cigaretrøg-induceret luftvejs udtryk for MAFG at blive reguleret af microRNA miR-218 [21]. Vi udforskede virkningen af ​​MAFG ekspressionsniveauet på downstream Nrf2-pathway gener. Figur 3A viser MAFG siRNA knockdown i A549-cellelinjen. Figur 3B viser, at MAFG lyddæmpning fører til svækket udtryk for GCLC, NQO1, SLC7A11, TXNRD1 (alle er gener). Vi hypotesen, at reducerede MAFG niveauer og den efterfølgende reduktion i beskyttende oxidativt stress respons kan repræsentere et genekspression adelsmærke i bronchiale epitelceller af rygere, der udvikler lungekræft. Men det mønster af genekspression over tid (varighed rygning) kan være vigtigt og nylige rygning blandt de nuværende rygere kunne påvirke nogle af de mønstre, som vi observerer i de bronchiale epitelceller.

Efter transient transfektion med MAFG siRNA i A549 luftvejs-cellelinien, blev genekspression målt ved hjælp af real-time qPCR. Transfektion med scrambled kontrol siRNA produceret en generel stigning i Nrf2 pathway gener (sorte søjler) i forhold til ikke-transfekterede celler (sat til 100%). (A) MAFG genekspression var signifikant reduceret (55%) sammenlignet med ikke-specifik siRNA kontrol. (B) GCLC, NQO1, SLC7A11, og TXNRD1 genekspression var signifikant reduceret med MAFG tavshed i forhold til ikke-specifikke siRNA kontroller. * (P ≤ 0,05, t-test). Alle data præsenteres som middel ± SEM (n = 3).

SNP udvælgelse, genotypning og MAFG sekvensering

For at undersøge, om den genetiske variation var at bidrage til luftvejs genekspression forskelle, vi anvendte en bioinformatik strategi til at identificere SNPs i potentielle Nrf2 bindingssteder [9], [13] og også identificere tagging SNPs i adskillige gener involveret i Nrf2-medierede anti-oxidant respons pathway. Genet og SNP liste er inkluderet i de understøttende Information S1. Efter genotypning, omkring 77% (348 SNP’er) af den identificerede SNPs bestået kriterierne kvalitetskontrol indledende (genotype rate = 90%, MAF tærskel = 0,01 og Hardy-Weinberg ligevægt p-værdi tærskel = 0,001, GenTrain score 0,25), men kun vi undersøgt 312 SNPs med allelfrekvenserne ≥0.05 i 52 fag.

Expression analyse foreslog, at MAFG niveauer potentielt kunne være hastighedsbegrænsende i ekspressionen af ​​antioxidant respons gener. For bedre at vurdere, om sekvens variabilitet i MAFG genet påvirkede genekspression, vi sekventeret en 16,5 kb genomisk region (CHR17: 77,467,438-77,483,879) i vores forsøgspersoner. Denne region var fra 5000-nt opstrøms for transkriptionsstartsitet til 2000-nt nedstrøms for MAFG transskription ende site, der dækker introner, exoner og utranslaterede regioner. Vi opdagede 33 SNPs i denne region, herunder en kodende SNP, 16 SNPs i 3’UTR og 3 SNPs i introns, og 13 SNP’er i upstream. Placering, allel frekvens og koblingsuligevægt (LD) er inkluderet i Støtte Information S1. Sammenligning disse oplysninger med NCBI dbSNP bygge 130 (maj 2009), fandt vi, at kun tre af disse SNPs tidligere er blevet rapporteret.

Association analyse af SNP genotypen og genekspression

Vi udførte lineær regression mellem normaliseret log

2-transformerede genekspression værdier og genotyper af SNPs, der var nær hvert gen (SNP holdning i 10-kb af et gens opstrøms, kodning, og nedstrøms regioner). Statistisk signifikans blev vurderet ved anvendelse af 10.000 permutationer af ekspression værdier i forhold til genotyperne som tidligere beskrevet af Stranger

et al

[22] med en korrigeret

s Drømmeholdet værdi tærskel på 0,05. I 44 rygere, blandt 338 påviselige probe-sæt (213 gener) nærliggende vores udvalgte 312 SNPs, fandt vi signifikant sammenhæng mellem 26 SNPs og 29 probe-sæt (25 gener, der er anført i tabel 2). Blandt disse er 21 formodede ER SNPs og seks kendte er gener, herunder AKR1C1, AKR1C2, AKR1C3, EPHX1, FTL, og HMOX1. Vi fandt en klynge af SNPs associeret med ekspression af 3 tilstødende Nrf2-regulerede gener, AKR1C1, AKR1C2 og AKR1C3 (figur 4). Vi genotypet 25 tag SNPs i denne genomiske region. SNP rs12414884 ligger -3792 nt opstrøms for AKR1C2 og var forbundet med ekspressionen af ​​alle 3-gener. To SNP’er, rs17134158 og rs10904392, som er 1768-nt og 4715 nt væk fra rs12414884 henholdsvis var forbundet med ekspressionen af ​​AKR1C1 og AKR1C2. Yderligere koblingsuligevægt analyser indikerer disse 3 SNPs var i kobling (r

2 0,8). Vi testede også sammenhængen mellem nyligt identificerede SNP’er i MAFG og MAFG genekspression. Promotor SNP på CHR17: 77.482.956 (-4077, A /C, mindre allel freq = 0,09) var forbundet med MAFG udtryk (p_corrected = 0,0038)

Vi genotype 25 SNPs i den genomiske region, der indeholder AKR1C1, AKR1C2. og AKR1C3. I hvert plot af udtryk vers genetype, cirkler var log2 udtryk, og linjer var lineær regression tendens linjer. Genotyperne af SNP rs1241488 forbundet med ekspressionsniveauerne af alle 3-gener. Genotyperne af SNP rs1090439 forbundet med ekspressionsniveauerne af AKR1C1 og AKR1C2. Bemærk: Den SNP rs17134158 kun havde 2 genotyper AG og GG i rygere, men havde AA genotype i NS og dens samlede mindre allel frekvens 0,05. Bindingsuligevægt analyser indikerer disse 3 SNPs var i koblings (r

2 0,88).

Selvom vores fokus var sammenhængen mellem genotype og udtryk i alle rygere i undersøgelsen, vi også undersøgt forskel i sammenhænge mellem SC og SNC-grupper. Denne form for eksplorativ analyse kan afsløre SNP effekter, der kan være relateret til differential modtagelighed hos rygere. En association blev fundet mellem udtryk og en formodet ER SNP rs3753660 på -199-nt af epoxidhydrolase en (EPHX1) genet (figur 5A). Foreningen var stærkest blandt SNC og virkningen af ​​SNP synes at være helt forskellige mellem de to grupper (figur 5A og tabel 2). Menneskelig EPHX1 har to formodede ARE’er (herunder polymorfe ER), men EPHX1 udtryk fulgte ikke det mønster, som vises af mange andre ER gener i figur 2C. C allel af rs3753660 var forudsagt til at have lavere Nrf2 binding og vi observerede det var forbundet med lavere ekspression i SNC. Dette tyder på en mulig interaktion mellem den genetiske variant, udtryk og gruppen fænotype. DUSP1 havde også en formodet ER SNP rs17658295 forbundet med dets ekspression (figur 5B). Den mindre allel var signifikant forbundet med højere udtryk og signifikansniveauet var mere udtalt i kræft gruppen.

I hvert plot, er SC, SNC og NS farvet med rød, blå og sort, hhv. (A) Foreningen af ​​en formodet ER SNP rs3753660 i promotoren for EPHX1 gen viser tydelige tendenser i SC og SNC; (B) DUSP1 formodede ARE SNP rs17658295 forbundet med dets udtryk. Den mindre allel var signifikant forbundet med højere udtryk og signifikansniveauet var mere udtalt i kræft gruppe; C) GCLC intron SNP rs670548 mindre allel forbundet med lavere udtryk blandt alle fag; (D) GCLC 3 ‘nedstrøms SNP rs2397146 mindre allel forbundet med højere udtryk blandt alle fag.

Et par SNPs var forbundet med udtryk for kendte er gener blandt alle 52 emner, men ikke inden for alle rygere. For eksempel to SNP’er (rs670548 og rs2397146) i glutamat-cystein ligase katalytiske subunit (GCLC) gen, som ikke var i LD (r

2 = 0,28), blev uafhængigt associeret med ekspression (figur 5C). Interessant nok blev den mindre allel af rs670548 (i intron) i forbindelse med lav ekspression, mens den mindre allel af rs2397146 i 5’opstrøms region blev forbundet med høj ekspression (figur 5D), hvilket antyder muligheden for to forskellige allele fænotyper. Variation i GCLC har tidligere været forbundet med lavt niveau af lungefunktionen i to uafhængige populationer [23].

SNPs, som kan bidrage til kræft status via genekspression

At identificere SNPs, som kan påvirke lunge cancer via genekspression vi først brugt logistisk regression for at teste forholdet mellem kræft eller ikke-cancer status og log2-transformerede genekspressionsniveauer. Dette identificeret 34 probe-sæt (31 gener) i antioxidant svar sti, der var forbundet med kræft status rygere på en korrigeret p-værdi = 0,05. Især blev MAFG sonde-sæt 204970_s_at forbundet med “uden kræft” status (p = 0,0014) (Figur 6A). Som skitseret i figur 6, vi ræsonnerede, at en SNP, der påvirkede genekspression kan variere i hyppighed mellem grupper. Mens den statistiske strøm til en sådan sammenligning er lav, vi observerer en sådan virkning for MAFG 3’UTR SNP tidligere nævnt (CHR17: 77.469.864; p = 0,058) (Figur 6B-C). Som vist i figur 6 blev GG genotype forbundet med status “uden cancer” af rygere (p = 0,0199), og også marginalt med den højere ekspressionsniveau af MAFG. Hvis disse forskelle i frekvens kunne dokumenteres i større grupper af patienter, kunne de angive beskyttelses- eller risikofaktorer alleler og kan være nyttig til at forudsige risiko

MAFG 3’UTR SNP på CHR17:. 77.469.864 kan potentielt bidrage til fænotype ( lungekræft status) via genekspression, baseret på: (A) ekspression af MAFG var højere hos rygere uden kræft end hos rygere med kræft; (B) Genotype GG viser en tendens mod højere ekspressionsniveauer af MAFG (#, sort linje); skråninger af genotype ved ekspression plots varierer mellem grupper (* røde stiplede linje vs blå stiplede linje); (C) Genotype GG, der er forbundet med højere udtryk, var mere almindelig hos rygere uden kræft; (D) hypotese. Personer med genotype GG display højere MAFG ekspression i bronkiale epitelceller; MAFG udtryk højere hos rygere uden kræft tyder det beskyttende mod lungekræft; GG genotype er mindre hyppig blandt kræft gruppe, i overensstemmelse med en beskyttende virkning.

Diskussion

Der er en vigtig arvelig komponent til lungekræft [24], og forstå, hvordan genetisk variation ændrer rygning induceret genekspression kunne give genetiske biomarkører til diagnosticering og afslører genetiske modtagelighed alleler. Talrige undersøgelser af menneskets luftveje [5], [7], [25], [26] mus lunge [27] eller

in vitro

cellekultur [28] har rapporteret om genekspression signaturer relateret til rygning. Spira

et al

identificerede genekspression profiler i cytologisk normale store-luftvej epitelceller, der kan tjene som en diagnostisk biomarkør for lungekræft [7]. Den nuværende arbejde identificerer molekylære og genetiske funktioner i Nrf2-regulerede vej, der er centrale for denne luftvejene genekspression respons. Brug vej analyseværktøjer, vi identificeret forskelle i Nrf2-medieret transskription profiler fra bronchiale luftvejs epitelceller opnået fra ikke-rygere, cigaret rygere med mistanke om lungekræft, og dem med en efterfølgende diagnose af lungekræft. Vi afslørede også en potentiel rolle for MAFG (a Nrf2-bindingspartner) i modulering rygning-induceret genekspression.

Nrf2 aktiveres af oxidativ stress og translokerer til kernen, hvor det heterodimeriserer med små MAF proteiner for at danne en transaktivering kompleks, der binder til specifikke DNA-regioner betegnet antioxidant responselementer (ARE) [29] og opregulerer antioxidant og fase II-afgiftning enzymer. Vi undersøgte udtryk for Nrf2 og dets interagerende partnere (fx MAFG, NRF1, NRF3, og BACH1) og gjort en roman observation, at MAFG udtryk var stærkt korreleret med udtryk af downstream Nrf2 målgener. På nuværende tidspunkt er der 42 Nrf2 målgener opdaget i forskellige humane væv, og vi fandt 22 af dem korreleret med MAFG genekspressionsniveau i humane luftvejs-epitelceller. Desuden NRF1, en negativ og konkurrencedygtig regulatorisk faktor, blev anti-korreleret med nedstrøms antioxidant genekspression. Den mulighed, at MAFG udtryk kan begrænse downstream antioxidant genekspression blev undersøgt yderligere. Silencing MAFG med siRNA i A549-celler svækkede ekspressionen af ​​kendte er gener (figur 3B), og dette var i overensstemmelse med publicerede eksperimenter i MafG knockout-mus [29]. Et lignende mønster for MAFG udtryk i forhold til andre antioxidant gener blev fundet, når vi foretaget en retrospektiv analyse af udtryk data fra en beslægtet, tidligere publiceret, større målestok undersøgelse [7].

Be the first to comment

Leave a Reply