PLoS ONE: Den 12p13.33 /RAD52 Locus og genetisk disposition for planocellulært Kræft i Upper Aerodigestive Tract

Abstrakt

Genetiske varianter beliggende inden for 12p13.33 /

RAD52

locus har været forbundet med lunge planocellulært karcinom (LUSC). Her inden 5.947 UADT kræft og 7,789 kontroller fra 9 forskellige undersøgelser, fandt vi rs10849605, en fælles intron variant i

RAD52

, der også er forbundet med øvre aerodigestive tarmkanalen (UADT) pladecellekarcinom tilfælde (OR = 1,09 , 95% CI: 1.04-1.15, p = 6×10

-4). Vi har desuden identificeret rs10849605 som

RAD52 cis

-eQTL inUADT (p = 1×10

-3) og LUSC (p = 9×10

-4) tumorer, med UADT /LUSC risiko allel korreleret med øget

RAD52

ekspressionsniveauerne. Den 12p13.33 locus, der omfatter rs10849605 /

RAD52

, blev identificeret som en væsentlig somatisk omdrejningspunkt kopi nummer forstærkning i UADT (n = 374, q-værdi = 0,075) og LUSC (n = 464, q-værdi = 0,007) tumorer og korreleret med højere

RAD52

tumor ekspressionsniveauerne (p = 6×10

-48 og p = 3×10

-29 i UADT og LUSC henholdsvis). I kombination, implicerer disse resultater forøget

RAD52

udtryk i både genetisk modtagelighed og tumorigenese af UADT og LUSC tumorer

Citation:. Delahaye-Sourdeix M, Oliver J, Timofeeva MN, Gaborieau V, Johansson M, Chabrier A, et al. (2015) Den 12p13.33 /

RAD52

Locus og genetisk disposition for planocellulært Kræft i Øvre Aerodigestive Tract. PLoS ONE 10 (3): e0117639. doi: 10,1371 /journal.pone.0117639

Academic Redaktør: Amanda Ewart Toland, Ohio State University Medical Center, UNITED STATES

Modtaget: 16. juli 2014 Accepteret: December 29, 2014; Udgivet: 20 Marts 2015

Copyright: © 2015 Delahaye-Sourdeix et al. Dette er en åben adgang artiklen distribueres under betingelserne i Creative Commons Attribution License, som tillader ubegrænset brug, distribution og reproduktion i ethvert medie, forudsat den oprindelige forfatter og kilde krediteres

Data Tilgængelighed: Alle relevante data er inden for papir og dens Støtte Information filer

Finansiering:. Finansiering af studier koordinering, genotypning af replikation undersøgelser og statistisk analyse blev leveret af det amerikanske National Institutes of Health (R01 CA092039 05 /05S1) og National Institute af Dental og kraniofaciale Research (1R03DE020116). De finansieringskilder havde ingen rolle i studie design, indsamling og analyse af data, beslutning om at offentliggøre, eller forberedelse af manuskriptet

Konkurrerende interesser:.. Forfatterne har erklæret, at der ikke findes konkurrerende interesser

Introduktion

Øvre aerodigestive tarmkanalen (UADT) kræftformer, bestående af mundhulen, svælget og spiserøret, er den fjerde mest almindelige årsag til kræft død på verdensplan [1]. Mens forbruget af tobak og alkohol er de vigtigste UADT kræftformer risikofaktorer [2], er genetisk modtagelighed blevet hypotese at spille en rolle i patogenesen af ​​denne sygdom [3,4].

Udsættelse for tobak og alkohol fører til celleskader og DNA forandringer, der i mangel af passende reparation, kan forårsage cellecyklus deregulering og kræft udvikling [5,6]. Homolog rekombination (HR) er en vigtig måde, hvorpå celler reparere DNA-læsioner [7,8].

RAD52

gen er involveret i homolog rekombination DNA-reparation proces [9] af medierende RAD51, en central HR-gen, der danner en spiralformet glødetråd nukleoprotein involveret i søgningen efter homologi og streng parring [10].

genom forbindelsesundersøgelser (GWAS) har impliceret den rs10849605 genetisk variant ved 12p13.33, locus, der omfatter

RAD52

i det humane genom, til at være forbundet med en beskeden, men statistisk signifikant, forøget risiko for lungekræft [11,12]. Det ser mest relevante for lunge pladecellekræft (LUSC) og småcellet lungekræft, men med lidt dokumentation inden for lunge adenokarcinomer (LUAD) [11,12]. Selvom de molekylære mekanismer, der bidrager til indvielse og progression er stadig dårligt forstået, planocellulært karcinom (SCC) af forskellige anatomiske steder deler mange fænotypiske og molekylære karakteristika med hinanden [13]. Formålet med denne undersøgelse var at undersøge

RAD52

i forbindelse med genetisk disposition for SCC af UADT, at undersøge, hvordan denne forening kan være medieret, og undersøge de somatiske mutation begivenheder på

RAD52

12p13.33 locus.

Materialer og Metoder

undersøgelse emner

i alt 9 case-kontrol studier af UADT kræft deltog i vores nuværende studie i alt 5.947 UADT kræfttilfælde og 7,789 kontroller. Undersøgelse designs og befolkningsmæssige karakteristika er blevet beskrevet i flere detaljer tidligere [3,14,15] og er kort beskrevet i tabel 1. I de fleste undersøgelser, kontrolpersonerne var frekvens matchet til sager om alder, køn og andre faktorer (f.eks , undersøgelse stedet og hospital). Skriftligt informeret samtykke blev opnået fra alle forsøgspersonerne, og de undersøgelser, blev godkendt af de institutionelle anmeldelse bestyrelser på hver studiecenter. Analyse var begrænset til planocellulært karcinom.

Genotypning

rs10849605 blev genotype hjælp Illumina perle arrays eller TaqMan genotypebestemmelse (C__1244798_10, Applied Biosystems, Carlsbad, CA) ved IARC som beskrevet andetsteds [3]. Udførelsen af ​​Taqman assays blev valideret af re-genotype prøver med kendt genotype (f.eks HapMap). Den genotype fordeling var i overensstemmelse med det forventede ved Hardy-Weinberg ligevægt i de enkelte lande /studie. Alle efterfølgende genotypning opnåede en intern undersøgelse to eksemplarer konkordans på . 99%

The Cancer Genome Atlas data

Vi adgang til hoved og hals pladecellecarcinom (HNSC), Lung planocellulært carcinom (LUSC) og lungeadenokarcinom (LUAD) komponenter af TCGA data (TCGA Projekt nummer # 3230 og # 2731). Disse data er tilgængelige ved hjælp af dbGAP via TGCA (https://tcga-data.nci.nih.gov/tcga/). Data blev hentet enten fra https://cghub.ucsc.edu/for exome sekventering eller direkte fra https://tcga-data.nci.nih.gov/tcga/for dataene RNA sekventering, methylering og genotype.

Exome sekventering.

Vi adgang TCGA exome sekventering “niveau 1” (uforarbejdede) data for 363 HNSC og 459 LUSC TCGA enkeltpersoner og afsluttet bioinformatik analyse af deres sekvens data ved hjælp af Picard, GATK, MuTect og somatisk Indel detektor (Metode A i S1 File). Efterfølgende brugte vi i hus bioinformatik rørledninger (Methods A i S1 fil) til at bestemme den højeste kvalitet variant opkald. Somatiske punktmutationer var exoniske funktionelle varianter defineret som enten afkortning, påvirker splejsning eller missense varianter forudsagt som skadelig ved SIFT /POLYPHEN2 [16,17].

Kopier nummer Variation.

Prøverne blev hybridiseret hjælp Genome Wide Menneskelig SNP Array 6.0 platform på Genome Analyse platform af de overordnede Institut. Vi hentede niveau 3 TCGA data for 374 HNSC, 464 LUSC og 476 LUAD individer indeholder normaliseret log

2 forhold mellem fluorescensintensiteterne mellem målstikprøven og en reference prøve. Vi kun inkluderet i vores analyse individer, for hvem både tumor og tilsvarende normale opkald var til rådighed. For et segment, betragtede vi log

2 (ratio) -0,5 Til at være en indikation af et tab, og en log

2 (ratio) 0,5 for at indikere en gevinst. Segmenter med log

2 (ratio) på mellem -0,5 og 0,5 blev ikke bevaret som somatisk kopi nummer ændringer. Annotation blev færdig med at tilføje generne, der er indeholdt i hver af de resterende segmenter ved hjælp Ensembl databaser [18].

RNA-sekventering.

RNA-sekventering (RNA-seq) TCGA data hentet “niveau 3 “data for 263 HNSC, 223 LUSC og 125 LUAD individer. Normalisering af disse data er nærmere beskrevet i metoder Statistiknomenklaturen.

Methylering.

TCGA methylering data blev analyseret på Illumina Infinium HumanMethylation 450K BeadChip assay. Vi adgang TCGA methylering “niveau 2” data for 263 HNSC, 223 LUSC og 125 LUAD individer. Vi anslået den methylerede for hver CpG sted ved at beregne M-værdi (log

2 (forholdet mellem methylerede og umethylerede sonder)) ved hjælp af TCGA niveau 2-data [19]. Methylering niveau 2 data allerede baggrund-korrigeret.

rs10849605 TCGA genotyper.

rs10849605 er placeret inde i 5′-området af

RAD52

og var ikke omfattet af exome sekventering. Derfor afledt vi genotyperne for 263 HNSC, 223 LUSC og 125 LUAD individer ved hjælp af Affymetrix 6.0 SNP-array TCGA data.

Statistiske metoder

Association analyse.

Sammenhængen mellem den varianter og UADT kræftrisiko blev estimeret ved odds ratio (periferi) og 95% konfidensintervaller (CIS) pr allel under log-additive model og genotype stammer fra multivariat ubetinget logistisk regression, med sex og studere specifikke oprindelsesland indgår i model som kovariater (S1 tabel). Heterogenitet yderste periferi blev vurderet ved hjælp af Cochran Q test. Statistiske analyser blev udført ved hjælp af SAS-version 9.3 (SAS Institute, Cary, NC, USA).

For at kontrollere for potentielle etniske heterogenitet mellem cases og kontroller, vi udførte en principal komponenter analyse ved hjælp af EIGENSTRAT pakke af EIGENSOFT 5.0 software [20] ved hjælp af 12,898 markører i lav koblingsuligevægt [21]. Vi brugte de resulterende 12 statistisk signifikante eigen vektorer (som defineret i Tracy-Widom statistik) i følsomhedsanalysen (tabel A i S1 File).

eQTL analyser.

Sammenhængen mellem rs10849605 kimcellelinje genotype og

RAD52

tumor udtryk niveauer (eQTL) blev testet på 263 HNSC, 223 LUSC og 125 LUAD ved hjælp af en lineær model. Det er gentagne gange blevet observeret, at tumorer erhverve somatiske ændringer, der også kan påvirke genekspression, især kopiantals ændringer og DNA methylering [22-24]. Derfor testede vi eQTL effekt rs10849605 på

RAD52

tumor udtryk ved hjælp af både korrigerede og ikke-korrigerede lineære modeller som beskrevet i tabel B i S1 Filer. Disse statistiske analyser blev udført ved hjælp af R statistisk software (R Foundation for Statistisk Computing, https://www.R-project.org).

For at styre for virkningen af ​​befolkningens heterogenitet, udledte vi befolkning struktur af 263 HNSC, 223 LUSC og 125 LUAD TCGA tilfælde med struktur software [25] ved hjælp Hapmap release # 23 som reference befolkning [26] og begrænsede eQTL analyser til 215 HNSC, 192 LUSC og 113 LUAD sager forventes at være af europæisk herkomst (CEU 0,8). På disse, vi yderligere gennemført en principal komponenter analyse ligner den GWAS én. De resulterende betydelige eigen vektorer (som defineret af Tracy-Widom statistik) blev anvendt i eQTL følsomhedsanalyse (tabel C i S1 File).

Kopier nummer analyse-transportcenter.

Vi brugte en offentligt tilgængelige metode, kaldet Genomisk Identifikation af væsentlige mål i Cancer (transportcenter) [27,28], version 2.0 for at finde de væsentligt forstærkede eller slettede regioner bruger TCGA kopi nummer data. Den transportcenter algoritmen beregner p-værdier for hver markør ved at sammenligne scoren på hvert locus til en score baggrund fordeling genereret ved tilfældig permutation af markørplaceringer i hver prøve. Så rette p-værdier for flere hypotesetest ved hjælp af Benjamini-Hochberg falsk opdagelse sats (FDR) metode. Derfor transportcenter scores repræsenterer signifikansniveauer og udtrykkes som Q-værdier (væsentlige under 0,25).

RNA-sekventering normalisering.

niveau 3-RNA-sekventering tumor data, som vi tilgås fra TCGA var allerede normaliseret til kilobase per million læser (RPKM) standard, som korrigerer for arterne længde og læse dybde [29], men ikke for mangfoldighed af RNA befolkning. For at kontrollere for dette vi anvendte TMM (Trimmet Mean af M-værdier) normalisering [30] til de RPKM data. Dette muligvis indebærer et tab af statistisk effektivitet i forhold til at anvende TMM til rådata, da præcision vægtning i TMM vil ikke længere fungere. Det bør dog ikke tilføje nogen bias og tab af effektivitet vil være små, hvis de læste massefylde er tæt på ensartet. Vi brugte implementeringer i Edger pakke af BioConductor [31] og voom funktion BioConductor limma pakke [32]. De normale udtryk data bliver kun tilgængelig for et par tilfælde, var det ikke muligt at udføre en differentieret udtryk analyse.

Resultater

Kimcellelinje genetisk variation rs10849605 og modtagelighed for UADT kræft

Vi genotype rs10849605 i 5.947 UADT kræfttilfælde og 7,789 kontrol personer fra 9 studier. Hyppigheden af ​​den mindre allel af rs10849605 varierede noget efter land, med risiko allel (C) er mere udbredt i Europa og Latinamerika sammenlignet med Asien (51% og 49% mod 40%).

Som observeret i pladecellecarcinom i lungen, blev C-allel forbundet med en beskeden stigning i UADT kræftrisiko (fig. 1, p = 6×10

-4), med odds ratio (OR) for at have en yderligere risiko allel være 1,09 (95% CI: 1,04-1,15). Foreningen optrådte relativt konsistent på tværs af geografisk område (fig. 1), og syntes ikke følsom over for kryptisk befolkning struktur i 1.791 sager og 2.531 kontroller hvor genom bred data var til rådighed til at udlede den genetiske herkomst (tabel A i S1 File). Foreningen var også konsistente inden UADT kræft underordnede og forbrug af tobak. Det var dog mere fremtrædende i dem, drukket alkohol i forhold til ikke-drikkende (p_het 0,03) (fig. 1). Der var lidt, der tyder på denne variant ændrede forbrugsmønstre af tobak og alkohol (p = 0,53 og p = 0,40, henholdsvis pack /år og ethanol /dag taget som en kontinuerlig variabel).

Squares repræsenterer yderste periferi, størrelse af pladsen repræsenterer den inverse af variansen af ​​log yderste periferi, vandrette linjer repræsenterer 95% kreditinstitutter. Det faste lodrette linje angiver OR = 1 og den stiplede lodrette linje overordnede eller under log-additive model. p_het er p-værdien for heterogenitet mellem de forskellige undergrupper. I2 er% af observerede variation på tværs af undergrupper (negativ I2 blev sat til 0).

Integreret

i-silico

fine kortlægning af 12p13.33 locus

Vi næste påtog

i-silico

analyse af rs10849605 variant og

RAD52

/12p13.33 locus i kræftformer hoved og hals og lunge genomisk karakteriseret ved Cancer Genome Atlas (TCGA) .

Expression kvantitativ egenskab locus (eQTL) af rs10849605 i HNSC og LUSC

rs10849605 ligger i nærheden af ​​formodede promotor 5 ‘for

RAD52

gen, derfor har vi en hypotese, at dette, eller en korreleret proxy variant, kan have indflydelse på

RAD52

genekspression. Vi udførte et udtryk kvantitativ egenskab locus (eQTL) analyse mellem rs10849605 og

RAD52

ekspressionsniveauerne i HNSC (n = 263), ved hjælp af data, hvor både RNAseq af tumorerne og genotypning var blevet udført af TCGA inden for samme individer. rs10849605 var signifikant associeret med

RAD52

genekspression niveauer i HNSC (fig. 2, n = 263, p = 9×10

-4), tyder på, at rs10849605 er en

cis

-eQTL locus for

RAD52

. C allel af rs10849605, der er forbundet med risiko for HNSC blev korreleret med øget

RAD52

ekspressionsniveauerne (fig. 2). Foreningen var ikke følsom enten justering for somatiske begivenheder (kopi nummer eller methylering status, som kan påvirke eQTL analyse i tumorer [22]), HNSC undertype (larynx /hypopharynx, mundhulen, oropharynx) eller befolkningens struktur (tabel B og C i S1 fil). En tilsvarende virkning iagttoges i LUSC (fig. 2, n = 223, p = 8×10

-4), men ingen klar eQTL association blev observeret i lunge adenocarcinom (LUAD, fig. 2, n = 125, p = 0,75) . Mens statistisk signifikant, at eQTL for rs10849605 udgjorde kun en lille del af variansen (ca. 4%) i

RAD52

udtryk i HNSC og LUSC tumorer, en observation i tråd med den relativt beskedne genetiske risiko observeret med dette variant.

Boxplots viser effekten af ​​genotypen for SNP

RAD52

rs10849605 på

RAD52

tumor ekspressionsniveauer i HNSC, LUSC og LUAD. Risikoen allel (C) øger

RAD52

udtryk niveauer (p = 9×10

-4 og 8×10

-4 henholdsvis) i begge skællede kræftformer, men ikke i lunge adenocarcinom (p = 0,75). I modsætning hertil var der ingen evidens for sammenhæng mellem rs10849605 og ekspressionsniveauer af andre gener i 12p13.33 regionen (tabel D S1 File).

somatiske forandringer på RAD52 /12p13.33 i hovedet og Neck pladecellecarcinom (HNSC) og LUSC

Inden somatiske mutationer tilbagekaldt fra parrede normal-tumor exome sekventering prøver af 305 HNSC og 243 LUSC,

RAD52

blev sjældent muterede somatisk (punktmutationer og indsættelser sletninger), med kun 2 HNSC (0,60% af tumorer) og et LUSC (0,40% af tumorer) patienter huser en somatisk missense variant, og ingen somatiske insertion eller deletion observeret.

derimod vi analyseret TCGA somatisk kopi nummer variation (CNV) data på 374 HNSC, 464 LUSC og 476 LUAD tumorer og fandt, at 12p13.33 locus var en hyppig region kopi nummer gevinst i HNSC (7,2% af tilfældene) og LUSC (11,2% af tilfældene ). Kopi nummer gevinst på 12p13.33 blev observeret i en lavere andel af LUAD tumorer (3,9% af tilfældene) (fig. 3). Der var en signifikant forskel i de somatiske kopiantal gain frekvenser mellem SCC og LUAD (p = 3×10

-5). Derudover brugte vi GISTIC2 statistiske program for at bestemme den relative betydning af den 12p13.33 gevinst i forhold til baggrunden på kopi nummer ændringer i hele genomet [27,28] ved hjælp af TCGA somatisk kopi nummer data. Den 12p13.33 region blev identificeret ved GISTIC2 som en betydelig omdrejningspunkt forstærkning i HNSC og LUSC (q-værdi = 0,075 og 0,007 henholdsvis), men ikke i LUAD (figur A i S1 File).

Individer blev bestilt af uovervåget gruppering baseret på

RAD52

ekspressionsniveauerne. Heatmap repræsenterer de skalerede RPKM normaliserede værdier med højere ekspressionsniveauer repræsenteret i røde og lavere ekspressionsniveauer i blåt. De personer, der bærer en kopi nummer gevinst (log

2 (ratio) 0,5) af

RAD52

er markeret med grønt (lys gul ellers).

RAD52

gain luftfartsselskaber synes at have den samme høje udtryk mønster og klynge sammen. Især i LUAD en af ​​de 3 gain luftfartsselskaber har den højeste

RAD52

udtryk niveau.

Tilstedeværelse af somatiske kopi nummer gevinst blev også korreleret med højere

RAD52

udtryk niveauer i både HNSC og LUSC tumorer (p = 6×10

-48 og 3×10

-29 henholdsvis) (fig. 3), med kopi nummer på dette locus tegner sig for en stor del af variansen i

RAD52

tumor udtryk niveauer (57% i HNSC og 45% i LUSC). Som forventet blev genekspressionsniveauer korreleret med kopi nummer til andre gener ved 12p13.33 (11 ud af 26). Men rs10849605 syntes at påvirke kun

RAD52

udtryk niveauer (tabel D i S1 fil).

Diskussion

Vores undersøgelse har identificeret rs10849605 at være forbundet med UADT cancer (p = 6×10

-4). Mens den beskedne karakter af denne forening begrænset vores evne til at opdage inter-substrater heterogenitet, foreningen var relativt ensartet på tværs af de forskellige ætiologiske indstillingerne for Europa, Japan, Latinamerika og sub-kontinentale Asien (hvor tobak tygge er en vigtig UADT kræftrisiko faktor ). Vi bemærker, at forskellige LD mønstre eller kryptiske befolkning struktur, hvor vi var ude af stand til at kontrollere for, kunne påvirke disse resultater. Alligevel vores resultater stemmer overens med den observation, at rs10849605 (eller varianter korreleret med det) er også blevet associeret med lungecancer og især lung pladecellecarcinomer. Som fundet i lungekræft [12], blev allel C i modtagelighed variant rs10849605 forbundet med en beskeden øget risiko for UADT.

rs10849605 er placeret på kromosom 12p13.33, et sted, der indeholder den

RAD52

gen.

RAD52

cellulære rolle er DNA dobbelt streng brud reparation via homolog rekombination, interagere med flere DNA-reparation relaterede gener i denne funktion og derfor en plausibel kandidat gen til at forklare denne sammenhæng [33]. Ikke desto mindre kan vi ikke udelukke muligheden for en alternativ modtagelighed gen til

RAD52

grund koblingsuligevægt. Vi brugte derfor et

i-silico

integrativ analyse ved hjælp TCGA udtryk, genotype og somatiske ombygning data til fine kortlægge denne modtagelighed locus. 12p13.33 var en region af signifikant somatisk kopital gevinst i HNSC og LUSC, hvilket antyder, at somatisk amplifikation af 12p13.33 er en vigtig molekylær begivenhed i en undergruppe af tumorer. Imidlertid 3MBp amplificerede region indeholdt multiple gener foruden

RAD52

. Vigtigere, rs10849605 var en eQTL i HNSC og LUSC for

RAD52

kun, hvilket tyder på

RAD52

som den mest sandsynlige kandidat driver gen for både den genetiske modtagelighed og tumorigenese på dette locus. Som en eQTL, den rs10849605 UADT og LUSC risiko forbundet allel (allel C) blev korreleret med øget

RAD52

ekspressionsniveauerne. At højere

RAD52

ekspression forekommer involveret i både genetisk følsomhed og somatiske begivenheder i UADT og LUSC kan indikere, at RAD52 aktivitet muliggør tumorceller at have tilstrækkelig genom integritet for at undgå apoptose, et træk, der kan være særligt vigtigt i genotoksisk miljø skabt af tobaksrøg og alkoholforbrug. Især blev både eQTL og somatiske gevinster observeret i HNSC og LUSC, men ikke LUAD, i overensstemmelse med lungekræft genetisk modtagelighed [11,12], styrke betydningen af ​​dette locus i SCC.

En vigtig rolle af

RAD52

er at give celler med et niveau af redundans i DNA-reparation [34].

RAD52

er derfor særlig vigtigt i celler, der mangler i BRCA1-PALB2-BRCA2 vej, der giver en alternativ mekanisme til DNA-reparation [35,36]. Målrettet hæmning af

RAD52

i

BRCA2

mangelfulde celler resulterer i genomisk ustabilitet og cellevækst hæmning, der fører til forslaget om

RAD52

som en potentiel terapeutisk target ved hjælp af syntetiske letalitet tilgange [37]. Vores resultater forbinder

RAD52

højere genekspression til UADT og LUSC, sammen med vores seneste observation, at en sjælden beskærer

BRCA2

genetiske variant, rs11571833 (K3326X) er forbundet med en 2,5 gange risiko for pladecellekræft celle carcinomer i lunge og UADT [38,39], tyder på, at sådanne målrettede terapi tilgange kan være værd at undersøge i UADT og LUSC tumorer.

Støtte Information

S1 fil. Metoder A.

figur A, Amplification toppe identificeres på tværs af genomet ved GISTIC2 i HNSC, LUSC og LUAD. De transportcenter-scores vises på toppen og q-værdier på bunden. Betydningen linje tegnes på q-værdi = 0,25 og de væsentligt forstærkede locus er kommenteret på højre side af hvert plot. Den 12p13.33 forstærkede region er indrammet og angivet med en pil. Tabel A, Befolkning lagdeling følsomhedsanalyse. Model 1 er den oprindelige forening analyse logistisk regression, justeret for køn og studere specifikke oprindelsesland. Model 2 justerer yderligere til befolkningen lagdeling herunder de 12 betydende eigen vektorer (som defineret af Tracy-Widom statistik) som kovariater i logistisk regression. Tabel B, eQTL analyser anvendes korrigerede og ikke-korrigerede lineære modeller til at måle effekten af ​​den rs10849605 genotypen på

RAD52

tumor ekspressionsniveauerne. Modellen måler effekten af ​​den beskyttende allel T for rs10849605. Antal personer taget i betragtning i modellen, beta skøn og p-værdi er givet for de tre forskellige typer kræft og ved hjælp af følgende lineære modeller: 1) Ikke-korrigeret, hvordan genotypen påvirker den genekspression. 2) For HNSC kræft, er subtype (mundhulen, strubehoved /hypopharynx eller oropharynx) anvendt som covariat. 3)

RAD52

somatisk kopi nummer anvendes som kovariat. 4) Da vi er interesseret her i indflydelse somatiske determinanter på en stigning på udtryk og fordi methylering er omvendt korreleret med udtryk (hypermethyleret sites tendens til at falde udtryk, når hypomethylated sites inducerer stigning i udtryk), valgte vi otte af de 24 CpG sites for at blive hypomethylated (som defineret af en negativ M-værdi på tværs alle personer i alle vores 3 forskellige kræft sites). Ud af disse otte blev kun cg15612927 signifikant associeret med udtryk for

RAD52

i alle 3 kræftformer (p-værdi 0,05). Derfor tumor methylering niveauer af cg15612927 blev anvendt som covariat. 5) Den oprindelige model er justeret for alle tre somatiske forandringer (undertype til HNSC, somatiske kopi nummer og methylering niveauer). Tabel C, eQTL følsomhedsanalyse. Den lineære model måler effekten af ​​rs10849605 genotype på RAD52 tumor ekspressionsniveauer. Den første linje præsenterer resultater på alle TCGA sager vi adgang. Den anden linje begrænser analysen på TCGA tilfælde forventes at være af europæisk oprindelse. Den sidste linje viser resultaterne af den samme lineære model, men korrigeret for statistisk signifikante eigen vektorer, som defineret af Tracy-Widom (5 for HNSC og LUSC, 8 for LUAD). Tabel D, 12p13.33 kopi nummer versus udtryk og eQTL analyse i HNSC og LUSC. Association analyse mellem kopi nummer og ekspressionsniveauerne for hver given gen i 12p13.33 region (venstre side af bordet, “NA ‘hvis ingen CNV eller udtryk data). For de betydelige foreninger kun udførte vi en eQTL analyse for at kontrollere, hvor rs10849605 genotype påvirker hver given genekspression niveauer (højre side af bordet). Væsentlige resultater er markeret med grønt (Bonferroni korrektion for multiple test)

doi:. 10,1371 /journal.pone.0117639.s001

(DOCX)

S1 Table. Undersøgelse epidemiologiske eksponeringer og genetiske data

doi:. 10,1371 /journal.pone.0117639.s002

(XLSX)

Tak

Forfatterne takker alle deltagere, der deltog i denne forskning og der finansierer og støtte og teknisk personale, som gjorde denne undersøgelse muligt. Vi har også anerkende og takke The Cancer Genome Atlas initiativ, hvis data bidrog stærkt til denne undersøgelse.

Be the first to comment

Leave a Reply