PLoS ONE: GWAS Opfylder Microarray: Er resultaterne af genom-dækkende Association Studier og Gene-Expression Profiling Konsekvent? Prostata Cancer som Example

Abstrakt

Baggrund

Genom-dækkende forening undersøgelser (GWASs) og globale profilering af genekspression (microarrays) er to store teknologiske gennembrud, der tillader hypotese-fri identifikation af kandidatgener forbundet med tumorigenese. Det er ikke klart, om der er en sammenhæng mellem de kandidatgener identificeret af GWAS (GWAS gener), og dem, identificeret ved profilering af genekspression (microarray-gener).

Metode /vigtigste resultater

Vi brugte cancer genetiske markører modtagelighed database for at hente en enkelt nukleotid polymorfier fra kandidatgener for prostatakræft. Derudover gennemførte vi en stor meta-analyse af genekspression data i normal prostata og prostata tumorvæv. Vi identificerede 13,905 gener, der blev afhørt af både GWASs og microarrays. På grundlag af P-værdier fra GWASs, valgte vi 1.649 mest markant associerede gener for funktionel annotation af Database til anmærkning, Visualisering og integreret Discovery. Vi har udført også funktionel anmærkning analyse ved hjælp samme antal af de øverste gener identificeret i meta-analyse af genekspression data. Vi fandt, at gener involveret i celleadhæsion blev overrepræsenteret blandt både GWAS og microarray gener.

Konklusioner /Betydning

Vi konkluderer, at resultaterne af disse analyser tyder på, at kombinere GWAS og microarray data ville være en mere effektiv tilgang end at analysere de enkelte datasæt og kan hjælpe til at forfine identifikation af kandidatgener og funktioner i forbindelse med tumor udvikling

Henvisning:. Gørløv IP, Gallick GE, Gorlova OY, Amos C, Logothetis CJ (2009) GWAS Meets Microarray: er resultaterne af genom-dækkende Association Studier og Gene-Expression Profiling Konsekvent? Prostata kræft som et eksempel. PLoS ONE 4 (8): e6511. doi: 10,1371 /journal.pone.0006511

Redaktør: Eshel Ben-Jacob, Tel Aviv University, Israel

Modtaget: Maj 11, 2009; Accepteret: 29 Juni 2009; Udgivet: 4 August, 2009

Copyright: © 2009 Gørløv et al. Dette er en åben adgang artiklen distribueres under betingelserne i Creative Commons Attribution License, som tillader ubegrænset brug, distribution og reproduktion i ethvert medie, forudsat den oprindelige forfatter og kilde krediteres

Finansiering:. Denne undersøgelse blev støttet af David Koch center for Anvendt forskning i Urogenitale Cancer. Delvis støtte til denne undersøgelse er leveret af amerikanske National Institute of Health giver R01CA121197-01A2 til CA og AR055258 underentreprise til OG. De finansieringskilder havde ingen rolle i studie design, indsamling og analyse af data, beslutning om at offentliggøre, eller forberedelse af manuskriptet

Konkurrerende interesser:.. Forfatterne har erklæret, at der ikke findes konkurrerende interesser

Introduktion

Microarray teknologi tillader samtidig vurdering af ekspressionen af ​​praktisk taget alle gener i genomet. Denne fremgangsmåde har været meget anvendt til at identificere kandidatgener associeret med cancer udvikling og progression [1] – [3]. Genom-dækkende forening undersøgelser (GWASs) har for nylig vist sig som et effektivt værktøj til at identificere genetiske polymorfier associeret med kræftrisiko [4], [5]. I en GWAS, er hundredtusindvis af enkelt nukleotid polymorfier (SNP) genotypebestemmes i en lang række tilfælde og kontroller. En forskel i allele eller genotypefrekvenser mellem cases og kontroller tyder en sammenhæng mellem kræftrisiko og SNP og en sammenkædet gen eller regulatorisk region.

Hvorvidt disse to tilgange sammenlignelige resultater er ikke blevet undersøgt. Senest Chen et al. [6] identificeret de gener, der har tendens til at blive udtrykt forskelligt på tværs af forskellige erfaringsmæssige betingelser og stater bruger gen-udtryk data fra Gene Expression Omnibus (GEO). De fandt, at differentielt udtrykte gener er mere tilbøjelige til at blive detekteret som sygdomstilstande varianter i forbindelsesundersøgelser.

I denne undersøgelse foretog vi en mere direkte tilgang til at forbinde GWAS og microarray data. Vi udførte funktionelle anmærkninger af top gener identificeret i prostatakræft GWASs og det samme antal af de øverste kandidatgener identificeret i en meta-analyse af gen-ekspression data for normal prostata og prostata tumor. Resultaterne af vores analyser viser, at disse to tilgange give lignende resultater på det funktionelle plan.

Materialer og metoder

Flere prostatakræft GWASs blev for nylig gennemført, og en række kandidatgener blev identificeret ( tabel 1) [7] – [10]. Selvom kun få SNPs med genomet hele signifikansniveau, 10

-7, blev identificeret i disse undersøgelser, en række SNPs var signifikant på de enkelte tests, men ikke er væsentlige efter korrektion for multiple test. Sådanne SNPs sandsynligvis indikerer berigelse med årsagssammenhænge SNPs, der ikke når frem til hele genomet signifikansniveau på grund af deres lille effekt størrelse eller lav allel frekvens [11].

De GWAS data til denne analyse blev hentet fra databasen Cancer genetiske markører følsomhed (CGEMS), https://cgems.cancer.gov/about/executive_summary.asp. Vi brugte Oncomine database https://www.oncomine.org/main/index.jsp at gennemføre en meta-analyse af antallet af undersøgelser, der sammenligner genekspression i normal prostata væv med den af ​​lokaliseret prostata tumorvæv [12]. Den komplette liste over de undersøgelser, der anvendes i meta-analysen kan findes i de supplerende materialer (tabel S1). Vi brugte en udvidelse af Stouffer metode [13] for den meta-analyse. Denne tilgang er baseret på at estimere standard normal afvigelse,

Z

, og svarer til den tilgang, for nylig foreslået af Ochsner et al. [14]. Metaanalysen identificeret en række gener udtrykkes forskelligt mellem normal prostata og prostata tumor.

Resultater

Som en indledende validering af vores hypotese, at GWASs og microarrays tendens til at identificere de samme gener, vi anvendes en meta-analyse af de Oncomine genekspression data til at vurdere ekspressionen af ​​de GWAS-identificerede gener (tabel 1). Vi fandt, at alle, men tre (

HNF1B, EHBP1

, og

LMTK2

) af generne blev differentielt udtrykt mellem den normale og tumorform prostata. Derfor 10 af 13 (77%) af de GWAS gener udtrykkes forskelligt i overgangen fra normal prostata til prostatakræft, som er højere end man kan forvente at opdage blandt tilfældigt udvalgte 13 gener -1.1 (χ

2 = 20,9, df = 1, P. 0,0001)

prostatakræft GWAS data fra CGEMS fase 1A og fase 1B, blev anvendt i analysen. Vi begrænset vores analyse til de gen-associerede SNPs at gøre GWAS og microarray resultater sammenlignelige. Vi fulgte CGEMS udpegning af de gen-associerede SNPs. En alt 63,831 gen-associerede SNPs tilhører 16,550 unikke gener blev identificeret. For hvert gen blev en SNP med den mindste P-værdi anvendes til at karakterisere en forening. Hvis en given SNP var forbundet med flere gener, blev alle disse foreninger indgår i vores analyse. Fordi der i mange tilfælde aliaser snarere end de officielle gen navne blev brugt i GWAS, vi er knyttet forskellige gen-id’er til de officielle gen navne og EntrezIDs ved hjælp af den nyeste version af NCBI gen-databasen (adgang 17 januar 2009). Sammenfald af de unikke GWAS og microarray gener viste, at 13,905 gener blev vurderet i både GWAS og microarray-analyser. Listen af ​​generne med tilsvarende GWAS og microarray P-værdier er vist i tabel S1.

For at vurdere, om GWAS og microarray-analyser tendens til at identificere lignende sæt af gener, vurderer vi en sammenhæng mellem -log (P) værdier baseret på GWAS data og -log (P) værdier baseret på en analyse af genekspression. Vi fandt en lille, men signifikant (på grund af den store stikprøvestørrelse) positiv korrelation mellem GWAS og microarray -log (P) s (figur 1)

Black linje viser den lineære regression kurve, røde linje -. Glidende gennemsnit beregnet ved hjælp af et glidende vindue af 100 point. Spearman rang-orden korrelationskoefficient:. R = 0,043, N = 13905, P = 0,0000001

Database til anmærkning, Visualisering og integreret Discovery (DAVID) [15] blev anvendt til den funktionelle annotation af GWAS og microarray gener. Vi valgte gener med GWAS P værdier ≤0.01. blev identificeret i alt 1.649 gener. Vi anvendte nøjagtig det samme antal af de øverste generne identificeret i meta-analyse af gen-ekspression data. For at kontrollere for eventuelle skævheder i gen valg, vi brugte en liste over 13,905 gener som baggrund. Funktionelle annotation diagrammer blev brugt til at hente en udvidet anmærkning dækning, der omfattede mere end 40 annotation kategorier [15]. En funktionel diagram for de øverste GWAS gener kan findes i tabel S2. Mange celleadhæsion-relaterede kategorier er blandt de bedste annotation kategorier. Gruppering af vilkårene for funktionelle anmærkninger opsummeret alle typer af den funktionsbeskrivelse, der anvendes af DAVID, identificere celleadhæsion som den øverste klynge, efterfulgt af plasmamembranen og fibronektin.

Funktionel annotation af toppen differentielt udtrykte gener identificeret cytoskelet, omdrejningspunkt vedhæftning, ekstracellulære matrix, og celleadhæsion som top annotation vilkår (tabel S3). Gruppering af vilkårene for funktionel anmærkning demonstrerede cytoskelet, aktincytoskelettet, ekstracellulære matrix, og celleadhæsion blandt de identificerede klynger. Figur 2 viser resultaterne af den gruppering af funktionelle termer af David baseret på en analyse af den øverste GWAS og differentielt udtrykte gener (se også tabel S4). I begge lister, er de fleste af de øverste funktionelle klynger afledt GWAS og microarray data direkte eller indirekte tilknytning til celleadhæsion.

Funktionelle klynger relateret til celleadhæsion er vist med blåt. Detaljerede oplysninger om sammensætningen af ​​klynger kan findes i tabel S4.

Vi næste søgte et overlap mellem toppen 1649 GWAS og de øverste 1.649 differentielt udtrykte gener. Vi identificerede 248 optræder i begge lister gener (se supplerende materialer til listen over generne). Dette tal er højere end det kunne forventes ved en tilfældighed. Hvis vi tilfældigt prøve 1.649 gener fra blandt de 13,905 gener, ville det forventede antal af de gener der findes i to uafhængige prøver være (1.649 /13.905) 2 * 1.649 = 23,2. Den funktionelle annotation af disse 248 gener identificeret cytoskelet, fokal vedhæftning, og actin binding som top funktionelle kategorier. Funktionel gruppering af de identificerede gener celle migration, celle motilitet, cytoskelet, og celleadhæsion som top klynger.

Diskussion

GWAS og microarray-analyser både tillader uvildig identificere kandidatgener og stier, der er forbundet med cancerudvikling. Disse to fremgangsmåder har hver deres fordele og ulemper. Ved at kombinere data fra flere ekspressionsundersøgelser, analyser af genekspressioner har statistisk styrke til at påvise selv små forskelle i genekspression mellem normalt væv og tumorvæv. På den anden side, fordi gener i det humane genom er involveret i mange forskellige interaktioner, kan modulering af ekspressionen af ​​et enkelt gen forårsage en “bølgeeffekt” på flere downstream mål, hvilket gør det vanskeligt at adskille kausal og inducerede ændringer i genekspression. Det er usandsynligt, at være et problem i GWASs. GWASs, er imidlertid ofte statistisk underdimensioneret til at opdage SNPs med lille effekt størrelse.

Når vi sammenlignet kandidatgener for prostatakræft identificeret ved GWAS med dem identificeret ved microarray, vi bemærkede en signifikant positiv sammenhæng mellem GWAS og microarray -log (P) s. Korrelationen var lille, med Pearson rang korrelationskoefficient bliver kun 0,04, men forventes positiv korrelation mellem to rækker til at være drevet af et relativt lille antal kausale gener. Ikke alle kausale gener vil blive opdaget af GWAS. Selv om genet er mekanistisk forbundet med prostata tumorigenese, kan det påvises ved GWAS kun hvis det bærer genetiske varianter, som modulerer dens funktion. På den anden side, er generne identificeret ved microarray analyse forventes at være en blanding af kausale gener og de gener, der udtrykkes differentielt på grund af den bølgeeffekt af kausale gener. Dette antyder, at kun en brøkdel af generne væsentlige i begge analyser er kausale gener.

Vi fandt, at den øverste GWAS og differentielt udtrykt kandidater blev beriget i celleadhæsionsprocesser gener. Hvis vi betragter alle kendte celleadhæsionsmolekyler gener i genomet, kun 74 gener eller 10% af dem var blandt de øverste differentielt udtrykte gener. Hvis cellen vedhæftning vej er forbundet med prostata tumorigenese, kan man forvente, at andre celle vedhæftning gener-de, der ikke gør det til toppen 1.649 gener-også vil have en tendens til at blive væsentligt positivt associeret. Vi fandt, at den gennemsnitlige GWAS-afledte P-værdi for celle vedhæftning gener, der har undladt at nå toppen 1649 var lavere end den gennemsnitlige værdi for GWAS gener (t-test = 2,9, df = 13.902, P = 0,001). Et lignende resultat blev opnået for P-værdier afledt af analysen af ​​genekspression: det absolutte Z-score var højere blandt celle vedhæftning gener (undtagen blandt de 1649 gener), end det var gennemsnitlige Z-score (t-test = 1,81, df = 17811, P = 0,07 på den tosidede test og P = 0,03 på den ensidede test). Dette antyder, at celleadhæsion funktion som helhed er forbundet med prostata tumorigenese.

Både GWAS og microarray gener danner funktionelle klynger i forbindelse med forskellige aspekter af celleadhæsion, herunder celleadhæsion selv, celle junction, ekstracellulære matrix-glycoproteiner, fibronectin , aktincytoskelettet, og cellemotilitet. Flere andre klynger viser også en mekanistisk forbindelse med celleadhæsion. F.eks cadherin optagelse fra celleoverfladen ved endocytose regulerer niveauet af de frie cadheriner på celleoverfladen og derfor celleadhæsion [16]. Også zinkfingerproteiner med LIM-domænet er vigtige for fokal adhæsion og celleadhæsion til fibronectin [17], [18]. Modulering af celleadhæsions-funktionen synes ikke at være begrænset til nogen specifik adhæsion type, men omfatter cadheriner, integriner og selectiner samt adhæsionsmolekyler forbundet med tight junctions.

Resultaterne af en række undersøgelser foreslog inddragelse af celleadhæsions-system i udvikling af prostatacancer. Cadheriner spiller en rolle i reguleringen af ​​tumorcelleproliferation gennem cycliner og cyclinafhængige kinaser [19]. Integriner er involveret i forskellige aspekter af prostata tumorigenese, herunder celleproliferation, cellemotilitet, og apoptose [20] – [22]. Modulation af celleadhæsion kan spille en vigtig rolle i epitel-til-mesenkymale overgang, der menes at være et vigtigt skridt i malign transformation [23] – [25]. Også resultaterne af en række undersøgelser suggestd en inddragelse af celleadhæsion i angiogenese [26] – [28]

GWAS-identificerede gener anses for at være kræft modtagelighed gener, der hovedsageligt er forbundet med tumor initiering.. Vi vurderer dog, at gener identificeret af GWAS vil sandsynligvis også omfatte gener er vigtige for tumor progression. Faktisk påvisning af tumor er sædvanligvis symptomatisk: tumoren skal nå en vis størrelse, der skal detekteres. Dette antyder, at gener involveret i tumorudvikling vil være blandt GWAS-detekterede kandidatgener. Derfor kan GWAS og genekspression analyse målrette væsentlige det samme sæt af gener, der giver det teoretiske grundlag for den fælles analyse af GWAS og microarray data.

Sammenfattende vores analyse fundet et betydeligt overlap mellem prostatakræft gener identificeret af GWAS og dem identificeret ved global profilering af genekspression. Vi identificerede celleadhæsion som en biologisk funktion i forbindelse med prostata tumorigenese. Resultaterne af denne undersøgelse tyder også på, at kombinere GWAS og microarray data kan være en mere effektiv tilgang end at bruge blot en analyse af de enkelte datasæt, og kan bidrage til at forfine identifikation af kandidatgener og /eller funktioner, der er involveret i tumor udvikling.

Støtte oplysninger

tabel S1.

doi: 10,1371 /journal.pone.0006511.s001

(0,83 MB PDF)

tabel S2.

doi: 10,1371 /journal.pone.0006511.s002

(0,07 MB XLS)

tabel S3.

doi: 10,1371 /journal.pone.0006511.s003

(0,33 MB XLS)

Tabel S4.

doi: 10,1371 /journal.pone.0006511.s004

(0,33 MB XLS)

Be the first to comment

Leave a Reply