PLoS ONE: CMS: En web-baseret system til visualisering og analyse af genom-Wide Methylering data for Human Cancers

Abstrakt

Baggrund

DNA methylering af promoter CpG øer er forbundet med gen undertrykkelse, og dets unikke genom-dækkende profiler har været knyttet til tumorprogression. Kombineret med high-throughput sekventering teknologier, kan det nu effektivt afgøre genom-dækkende methylering profiler i cancerceller. Også, eksperimentelle og beregningsmæssige teknologier gør det muligt at finde den funktionelle sammenhæng mellem kræft-specifikke methylering mønstre og deres klinisk-patologiske parametre.

Metode /vigtigste resultater

Kræft methylome system (CMS) er et web -baseret database program designet til visualisering, sammenligning og statistisk analyse af human cancer-specifik DNA-methylering. Methylering intensiteter blev opnået fra MBDCap-sekventering, præ-behandles og lagres i databasen. 191 patientprøver (169 tumor og 22 normale prøve) og 41 brystcancer-cellelinier er deponeret i databasen, der omfatter ca. 6,6 mia entydigt kortlagt sekvens læser. Det giver omfattende og genom-dækkende epigenetiske portrætter af menneskelig brystcancer og endometriecancer til dato. To synspunkter er foreslået for brugerne til bedre at forstå methylering struktur på det genomiske niveau eller systemisk methylering ændring på genniveau. Desuden er en række anmærkning spor til dækning genomisk information. CMS omfatter vigtige analytiske funktioner for fortolkning af methylering data, såsom påvisning af forskelligt methylerede regioner, statistisk beregning af globale methylering intensiteter, flere gen-sæt biologisk signifikante kategorier, interaktivitet med UCSC via custom-track data. Vi har også nuværende eksempler på opdagelser udnytte rammerne.

Konklusioner /Betydning

CMS giver visualisering og analytiske funktioner for kræft methylome datasæt. En omfattende samling af datasæt, en række indlejrede analytiske funktioner og omfattende applikationer med biologiske og translationel signifikans gør dette system kraftfulde og unikke i kræft methylering forskning. CMS er frit tilgængelig på: https://cbbiweb.uthscsa.edu/KMethylomes/

Henvisning:. Gu F, Doderer MS, Huang Y-W, Roa JC, Goodfellow PJ, Kizer EL, et al. (2013) CMS: En web-baseret system til visualisering og analyse af genom-Wide Methylering data for Human kræftformer. PLoS ONE 8 (4): e60980. doi: 10,1371 /journal.pone.0060980

Redaktør: Eric Y. Chuang, National Taiwan University, Taiwan

Modtaget: 31 juli 2012; Accepteret: 5 mar 2013; Udgivet: 22 april, 2013 |

Copyright: © 2013 Gu et al. Dette er en åben adgang artiklen distribueres under betingelserne i Creative Commons Attribution License, som tillader ubegrænset brug, distribution og reproduktion i ethvert medie, forudsat den oprindelige forfatter og kilde krediteres

Finansiering:. Dette arbejde blev støttet af R01 CA069065, U54 CA113001 (Integrativ Cancer Biology Program), P30 CA054174 (Cancer center Support Grant), NCATS 8UL1TR000149 (CTSA) af det amerikanske National Institutes of Health, Texas CPRIT RP101195-C04, og ved generøse gaver fra Kræftens Terapi og Research center Foundation. De finansieringskilder havde ingen rolle i studie design, indsamling og analyse af data, beslutning om at offentliggøre, eller forberedelse af manuskriptet

Konkurrerende interesser:.. Forfatterne har erklæret, at der ikke findes konkurrerende interesser

Introduktion

DNA methylering af promotorelementer CpG-øer er forbundet med gensuppression i tumorprøver sammenligne til normale modpart, og dets unikke genom-dækkende profiler har været knyttet til tumorprogression og kan bruges til at forudsige patientoverlevelse [1]. Global hypomethylering blev påvist i bryst- og colontumorer sammenligning med tilsvarende normale væv [2], [3]. Mere specifikt i brystcancer, er det blevet vist, at genet organ hypometylering er associeret med gendæmpning, mens hypermethylering af områder tæt på et transkriptionsstartsitet (TSS) tendens til at forårsage en lignende virkning [4]. Desuden samspil mellem DNA-methylering og transkriptionsfaktorer (TFS) er vigtige for regulering af humane cellefænotyper. Med fremme af sekventering teknologi, storstilet analyse af genom-dækkende methylering bliver mulig. Adskillige eksperimentelle metoder er blevet udviklet til at indfange methylerede DNA’er, herunder MeDIP [5], MBD [6], methylC [7], og RRBS [8]. Kombineret med high-throughput sekventering teknologier, kan disse metoder nu effektivt bestemme genom-dækkende methylering profiler i celler. Endvidere er der blevet foreslået forskellige beregningsmetoder og statistiske metoder til analyse af differentielt methylerede regioner (DMR). Disse eksperimentelle og beregningsmæssige teknologier gør det muligt at finde det funktionelle forhold mellem cancerspecifikke methyleringsmønstre og gensuppression og deres tilknytning til klinisk-patologiske parametre, føre til identifikation af kandidat biomarkører for diagnose og prognose [9].

Her beskriver vi en ny kræft methylome system, der systematisk indsamler, organiserer, visualiserer og analyserer et stort sæt af DNA methylering data ved sekventering fra human endometrie og brystkræft. Datasættene opnås ved anvendelse MBDCap-seq protokol, en teknik, der anvendes til at indfange methylerede DNA’er ved anvendelse af en methyl-CpG bindende domæne (MBD) protein-søjle efterfulgt af næste generation sekventering [10]. De lave omkostninger og fordomsfri visning af methylering profiler af både CpG og ikke-CpG øområder gør den velegnet til genom-dækkende methylering profilanalyse. 191 patientprøver (169 tumor og 21 normale prøve) og 41 brystcancer-cellelinier blev forarbejdet med MBDCap-seq protokol, genererer i alt ca. 6,6 mia entydigt kortlagt sekvens læser. Datasæt blev præ-behandlet og opbevaret i en MySQL-database. CMS tilbyder brugervenlige værktøjer til hurtig identifikation af differentielt methylerede regioner (DMRs) blandt forskellige grupper af prøver (fx normale versus tumor), uanset deres gen nærhed. Methylering intensiteter blev genereret for både hele genomet (opløsning i 100 bp) og gen (for hver RefSeq kommenteret gen) niveauer. Desuden har gen-ontologi, biologiske veje, og andre molekylære signatur gen sæt databaser blevet integreret i CMS, så sammenligning (via methylering) af funktionelle og biologiske korrelerede gener på tværs af forskellige typer kræft, og undersøge systemisk ændring på biologisk vej, funktion og interaktion netværk niveauer. Brugere kan uploade deres methylering profiler (genereret fra næste generation sekventering teknologier i 100 bp opløsning) eller gen-sæt til at observere forskellen methylering ved at sammenligne med vores unikke samling af tumorer. Desuden kan brugerne downloade methylering intensiteter fra et område af interesse, eller hele genomet for yderligere analyse (ved at klikke på linket i “Ressourcer” side af hjemmesiden). Med CMS, kan biologerne få adgang til alle gen af ​​interesse, undersøge og opdage epigenetisk betydelig fænomen, såsom (men ikke begrænset til) methylering forskellen mellem tumortyper, gener med korrelerede methylering profiler og konkordans, differentielt methylerede gener inden for en sti, sammenligning af DNA methylering og histon modifikation mærker.

Resultater

CMS integrerer database (fra genom-dækkende methylering sekventering data fra humane kræftformer), web interface teknologi, og kraftfulde statistiske og analytiske funktioner sammen, så genom- bred methylering profiler visualisering og meningsfuld biologisk fænomen opdagelse af humane kræftformer (Figur S1 i File S1).

genom-dækkende MBDCap-sekventering af endometrie og brystkræft

i alt 232 kliniske prøver og cellelinier fra humant bryst- og endometriecancer kohorter blev behandlet og deponeret i databasen. Blandt dem, 77 er brysttumorer, 10 normale bryst prøver, 41 brystcancercellelinier (ICBP [11]), 92 endometrie tumorer (71 ikke-tilbagevendende prøver og 21 tilbagevendende prøver) og 12 normale endometrie prøver. MBDCap-sekventering teknologi blev anvendt til at påvise de methylerede regioner. Methylerede fragmenter, der er bundet til et methyl-CpG bindende domæne protein blev elueret til sekventering med Illumina /Solexa Genome Analyzer II. Ca. 12,7 mia sekvens læser blev genereret og 52% læser blev kortlagt til unikke genom steder. Genom-dækkende sekventering af DNA-methylering af dette store sæt af kliniske prøver og cellelinier gjort dette en unik undersøgelse af tumor methylome profiler (Figur S1 i File S1). Data fra mere end 1000 kliniske prøver, herunder æggestokkene, oral, colorectal, hepatocellulært carcinom, lunge- og prostatakræft, vil i sidste ende blive indsat på denne database.

Design af web-interface og database

den web interface er udviklet i Java ved hjælp af SideCache [12] rammer, støttet af en offentligt tilgængelig JavaScript grafik bibliotek (https://www.walterzorn.de/) for grafisk og billedgengivelse. CMB hjemmeside er indsat i en Apache Tomcat webserver (https://tomcat.apache.org/), og støttet af en MySQL-database af methylering data (Figur S1 i File S1). Funktionen og analysemetoder indlejret i rammen blev skrevet i R script. Desuden blev en web service API også gennemført for at muliggøre integration med andre genom hjemmesider. Denne web interface var fuldt testet i Firefox, og er godt kompatibel med Safari og Chrome. Det er også kompatibel med IE med en handicappet (se Visualisering af methylering datasæt afsnit)

Visualisering af methylering datasæt

CMS kan visualiseres i to forskellige tilstande:. Genomisk visning og gen centreret visning .

genomisk View.

den genomiske visning er for hele genomet visualisering og analyse af methylering intensitet (figur 1).

Denne webside er designet til genom- bred visualisering og analyse af methylering intensitet (A, B, C). Methylering intensitet er pre-beregnet for et 100 bp bin størrelse og er vist ved hjælp af en rød gradient Heatmap. En række af genomiske anmærkninger og funktionelle værktøjslinjer giver brugerne flere muligheder i at surfe på websiden. Statistiske metoder blev indlejret, herunder DMR analyse (A) og statistisk beregning (C). Links til UCSC genom browser (D), og til gen-visning (E) er til rådighed for yderligere analyse

Forskellige typer af data spor blev gennemført for de genomiske visualisering funktioner (figur 1A, B):. Genomisk koordinere spor (den genomiske placering af visualiserede region, herunder kromosom, region start- og slutpositioner); GC-indhold spor (GC procentdel efter genomisk position, beregnet i 100 bp opløsning); h3k4me1 histon modifikation styr på GM12878 celle-line (fås fra UCSC genom bygge hg19, wgEncodeBroadHistoneGm12878H3k4me1StdSig.bigWig bord, liftover til hg18); bevaring sekvens numre fra UCSC (fås fra UCSC genom build hg18); CpG island spor (fås fra UCSC genom bygge hg18, https://genome.ucsc.edu); Gene annotation spor (herunder gen start og slutposition, gen symbol og tiltrædelse nummer); og methylering intensitet spor (er) (methylering intensiteten er repræsenteret ved farvedybde, mørkerøde svarer til høj methylering værdi, hvide midler lave eller ingen methylering værdi, i 100 bp opløsning). Detaljeret annotation er vist i variabelt tip visning, når en bruger bevæger musen over GC-indhold, CpG ø og gen annotation spor. Et enkelt klik på methylering profiler spor (r) kan generere en popup dialog med methylering intensitet (læser tal for den pågældende stilling, denne funktion er deaktiveret i IE). Den methylering intensitet spor er fleksibel med flere muligheder (valgt fra “Spor” drop-down-knappen i værktøjslinjen). Generelt er der to typer af methylering intensitet spor, at brugerne kan vælge at display –

individuel

eller

summariske

spor. En individuel track viser genomet hele methylering intensitet ved 100 bp bin størrelse af hver tumor /normal prøve valgt. Brugere kan vælge at vise en tumor kun (fx bryst eller endometrie), eller alle tumorer sammen. Resumé spor (figur 1C Se Integreret statistiske metoder nedenfor) indeholder globale statistikker af middelværdi, frekvens og forskel fra alle tumorer.

En samling af veldesignede funktionelle værktøj-barer er inkluderet i denne webside. Brugere kan navigere rundt i genomet ved at zoome ind og ud, bevæger venstre eller højre langs genomiske retning, eller flytter til tilstødende gener. Brugere kan søge gen /region af interesse ved direkte at skrive gen symboler eller region koordinater.

DMR analyse (se Integreret statistiske metoder nedenfor) blev gennemført i den genomiske seeren. I DMR-funktion, kan brugerne vælge kandidat prøver ved at markere afkrydsningsfelterne i methylering intensitet spor (r), og derefter udfylde de nødvendige parametre (se materialer og metoder). Standardværdier er forvalgt. DMR vil output en fil i en tabulatorsepareret tekstformat (se materialer og metoder). Alle output-filer vil blive genereret on-demand og effektivt, men kan være begrænset af den download hastighed på brugerens netværk.

Links til UCSC genom browser blev genereret (Figur 1D, se Visualisering af DNA methylering og histon sektion modifikation af data for eksempel på brug). En liste af gener, der indgår i den aktuelle genomiske region er vist nederst til venstre på genomiske udsigt webside, og links er skabt til at få adgang genet centric visning for de særlige gener (figur 1E).

Gene Centric Vis.

En alternativ måde at visualisere methylering data er den Gene-centreret visning, som viser methylering heatmap af udvalgte gen sæt (figur 2).

Denne webside er designet til visualisering og analyse af methylering intensitet på genniveau. I værktøjslinjen, fire lag af muligheder for at aktivere specifikke valg gen sæt. Methylering intensiteter for promotorområder af gener (+/- 2 kb nærheden TSS region) blev præ-beregnet og blev vist under anvendelse af en rød gradient Heatmap. En hvid /grønt felt på siden af ​​genet symbol viser promotorregioner af denne bestemt gen med eller uden CpG øen (s). Hvis du klikker på det gen-symbolet i venstre side af Heatmap panelet vil bringe brugeren tilbage til den genomiske seeren centreret på det valgte gen, tillader visualisering af detaljer methylering mønstre.

I denne webside, kan brugerne skrive et gen symbol og visualisere status for methylering af det givet gen på tværs af alle tumorprøver, sammen med de øverste 40 mest korrelerede gener med lignende methyleringsmønstre beregnet af Pearson korrelation (se Materialer og fremgangsmåder). Alternativt fire lag af muligheder for at gøre det muligt for valg af specifik biologisk funktion, interaktion netværk, og korrelerede gen sæt (Figur 2). Der er otte primære klasser af gen-sæt (nogle af dem kan indeholde delmængder). Disse er foruddefineret i det første lag, herunder korrelerede gener (se materialer og metoder), Kromosomale, Gene ontologi, forstyrrelse sæt, biologiske veje, microRNA, transkriptionsfaktorer og Kræft gen kvarter. De primære gensæt navne og deres kilder er anført i tabel 1 [13] – [19]. Methylering status for en udvalgt gen sæt kan visualiseres for alle tumorer i CMS, eller nogen tumor typer af brugerens valg. Store gensæt kan sinke methylering Heatmap rendering tid, hvorfor det er at foretrække at vælge mindre gensæt at starte processen. Den “Filter Søg” valgmulighed giver brugeren mulighed for at finde alle gen sæt (undtagen dem blandt de “korreleret Gener”), der indeholder ord i søgefeltet.

I Heatmap panelet, methylering intensiteter blev forudberegnede som gennemsnittet af normaliserede (lineær normalisering, se Materialer og fremgangsmåder) læser nummer indenfor +/- 2 kb af en transkriptionsstartsitet (TSS) og blev opbevaret i MySQL-databasen. Forskellig fra den genomiske opfattelse genet centric seeren er organiseret som følger: tumor eller normale prøver er placeret i kolonner, og generne er rækker, der ligner almindelige microarray-format. Den Heatmap farveskala af gen centreret visning er den samme som den for genomisk visning. Promotor regioner med eller uden CpG ø (e) kommenteret med en hvid /grøn boks på siden af ​​gen-symbol. Den Heatmap panel gør det muligt at visualisere forskellige /lignende /særlige methylering profiler (se Discovery ved brug af CMS afsnit) mellem forskellige tumortyper, eller blandt de gener i lignende biologisk signifikante kategorier.

Hvis du klikker på det gen-symbolet på venstre side af heatmap panelet vil bringe brugeren tilbage til den genomiske seeren centreret på det valgte gen, tillader visualisering af detaljer methylering mønstre i promotoren, exon, intron og dets naboregioner.

Input og output

I genomisk opfattelse, brugere, der ønsker at visualisere og analysere egne data kan aktivere en brugerdefineret spor. De indsendt af brugere data er private, session-baseret (ikke gemt efter afslutningen af ​​sessionen), og ikke kan ses af andre. På den anden side, for et område af interesse (mindre end 1 Mbp, vises i nederste højre hjørne af websiden af ​​genomisk visning), kan brugerne downloade læser information (i BED-format) til yderligere analyse.

gen centreret visning, vi gav også en fil upload mulighed for at give brugerne mulighed for at uploade deres tilpassede gen sæt (kun officielle gen symboler). Den brugerdefinerede gen sæt vil blive vist som “Bruger Input” i drop-down knappen på Gene Set lag. Brugerne kan også downloade methylering intensiteten af ​​den aktuelle Heatmap panel ved at klikke på knappen i nederste højre på websiden.

Embedded statistiske metoder

Hypermethylering af CpG øer i genet promotoren en af ​​de hyppigste ændringer, der fører til cancer, og en vigtig epigenetisk mekanisme til gendæmpning. For at muliggøre påvisning af forskellen methylering regioner mellem to sample grupper blev DMR identifikation funktion integreret i rammen. I CMS, individuelle methylome spor (herunder bruger uploadet custom-spor) eller sammenfattende spor kan henføres til en af ​​to grupper, der defineres som “behandlet” og “kontrol” (se Visualisering af methylering datasæt afsnit). En DMR detektionsalgoritme, baseret på

t

-test, kan vælges Wilcoxon test eller Pearson korrelation at vurdere betydningen af ​​differentiel methylering op til 1 mega basepar. Beskrivelsen af ​​DMR-algoritmen findes i de materialer og metoder.

Ud over DMR-funktionen, vi også designet resumé spor at visualisere de gennemsnitlige methylering intensiteter og afsløre iboende karakteristika for hver tumor gruppe. Tre typer sammenfattende spor vises sammen som vist i figur 1C, de er: (a) Mean spor, hvilket giver gennemsnitlig methylering status over en bestemt gruppe af prøver. I øjeblikket oversigtsstatistikker evalueres i løbet af i) alle prøver, ii) normals, tumorer og cellelinier af brystkræft, og iii) endometrie ikke-tilbagevendende tumorer, tilbagevendende tumorer, og normal af endometrie; (B) Methylering frekvens spor (se Materialer og fremgangsmåder). Mean og frekvens spor give indsigt, om methylering ændring er fra flertallet prøver eller mindretal prøver med stor methylering intensitet; (C) Forskel spor, der visualiserer forskellen methylering af middelværdi /frekvens forskel mellem grupper af prøver ved hver bin størrelse, såsom tumor vs normal-middelværdi for brystkræft, og ikke-tilbagevendende /tilbagevendende vs normal-freq for endometrie.

Tumor specifik methylering profiler

De tumorigenese mekanismer er forskellige blandt kræft, er derfor vigtigt at finde genetiske /epigenetisk forskelle for yderligere analyse. Her anvendte vi HOXB2 (human homeobox B2) gen, et medlem af Antphomeobox familie, der koder for et kerneprotein med en homeobox DNA-bindende domæne, og en kendt gen associeret med tumorvækst og invasivitet [20], [21] som en eksempel for at illustrere, hvordan CMS er i stand til at bestemme tumor specifikke methylering profiler til bryst og livmoderkræft.

i genomisk opfattelse, kan brugerne skrive HOXB2 i navigationen boksen, og vælg “Alle Tumorer” i tracks drop-down boks, klik derefter på “Opdater View” knappen. For en bedre visning af methylering profiler, kan brugerne klikke på “zoom i” knappen fire gange. Klart hypermethylering blev fundet mellem brystkræft og normal (figur 3A), herunder fire regioner (

s

-værdi 0,01) beregnet af DMR funktionen med standardparametre. Imidlertid hypomethylering blev fundet mellem endometriske tumorer og normalt væv (figur 3B), herunder en region med

s

-værdi 10

-4 (tabel S1 i File S1). Derudover kan brugerne gennemse resumé sporet ved at vælge “Alle skitser” i sporene drop-down box. Den gennemsnitlige track, der repræsenterer hundredvis af individuelle spor, forenkler visualiseringen af ​​forskelligt methylerede regioner giver en mere intuitiv resultat. Udover gener, der er hypermethyleret kun i brysttumorer (sammenlign med bryst raske), kan brugerne også finde gener, der er hypermethyleret kun i endometriske tumorer (sammenlign med endometriske normaler) (såsom CCDC81, figur S2 i File S1), og i begge tumorer (såsom SOX11, figur S3 i File S1).

HOXB2 blev hypermethyleret i brysttumorer sammenlignet med bryst normal (A), mens hypomethylated i endometriecancer tumorer sammenlignet med endometrie normal (B).

Lignende methylering profiler blandt biologisk relaterede gener

homeodomæne generne koder transkriptionsfaktorer, der påvirker differentiering og proliferation under udvikling. I det menneskelige genom, er fire klynger af homeodomæne gener (Hoxa, HOXB, HOXC og Hoxd) fordelt på kromosomerne 7p15, 17q21, 12q13 og 2q31 hhv. Ikke-klynger homeodomæne gener er fordelt over hele genomet. Et direkte spørgsmål er “hvad er de andre gener, der viser det samme methylering mønster som for HOXB2, måske deler den samme methylering mekanismen?” Fortsætter med den tidligere proces på den genomiske visning, kan brugerne klikke genet linket i venstre bund at få genet centric visning. De øverste 40 korrelerede gener af HOXB2 er vist i figur 4. De fleste af dem har en lignende methylering profil som HOXB2, som er hypermethyleret i brysttumorer (figur 4, blå streg box), og er enten hypomethylated eller viser ingen forskel i endometriske tumorer sammenlign normalt væv (figur 4, grøn streg boks).

gensæt med lignende methylering profiler af HOXB2 blev fundet ved at vælge de “korreleret gen” gensæt i genet centreret visning. De fleste af de gener er hypermethyleret i brysttumorer (blå streg boks), og med ingen signifikant forskel i endometrie prøver (grøn streg boks).

I de 40 korrelerede gener, tre af dem tilhører HOXB gen familie (HOXB2, HOXB4 og HOXB7), tre gener indeholder homeodomæne (DLX1, LHX4, og VAX2) og to af dem hører til HIST genfamilien (HIST1H3I og HIST1H4L). En lignende methylering profil af generne i samme genfamilie definerer methylering konkordans, hvilket kan føre til synkroniseret gene silencing. Desuden kan brugerne også finde de genomiske naboer HOXB2 ved at vælge “Kromosomal” gen sæt i lag én, “CHR17” i lag to, “q” arm i lag tre og “chr17q21” i lag fire. Denne cytoband dækker 287 gener, og huser HOXB genklynge herunder tre gener (HOXB2, HOXB4 og HOXB7) overlappede med de 40 HOXB2 korrelerede gener. Bemærk, at de tre gener er begge i samme genfamilie og samme genomiske sted, hvilket kan indikere signifikant biologisk konkordans til disse gener. Brugerne kan finde manglende værdier i flere gener i “Kromosomale” gen-sæt, på grund af manglen på udskrift annotation inden NCBI reference Sequence (RefSeq) frigivelse indeholdt i UCSC genom browser eller forældede gen symboler. Dette fænomen sker også for de andre 7 klasser af kategorier.

Differentielt denatureret gen sæt, som en vej

For at undersøge den systemiske ændring af biologisk vej aktivitet eller funktioner, som vedrører HOXB2 eller anden HOX familie gener, vi undersøgte følgende gensæt at illustrere den funktionelle opdagelse ved hjælp CMS værktøjer. HOXB13, et HOX familiemedlem bosat i klyngen af ​​HOXB2 og viser et lignende mønster methylering som HOXB2. HOXB13, er også et medlem af “androgen-medieret vej”, som det er vist i figur 5. Det viser en distinkt hypermethylering mønster blandt brysttumorer, men ikke brystkræft cellelinier og livmoderkræft. Konkret distinkt hypermethylering mønster af BRCA1, SNURF, GMTM2, NROB1, CDK11B, LATS2, HRAS, MAPK3, RPS6KA3 og EGR1 afgrænse klyngens status methylering af brystkræft tumor (ikke celle-linjer), sammen med HOXB13.

Den “Androgen-medieret signalering” gensæt som indeholder HOX cluster gener blev udvalgt som et eksempel. Adskillige gener i den blå streg boksen er hypermethyleret i brysttumorer sammenlignet med normale væv, mens andre viser ingen signifikant forskel. For endometrie prøver, er der ingen signifikant forskel fundet for nogen af ​​genet mellem tumorer og normaler.

Vi sammenlignede også methylering profiler til Tamoxifen-resistente gener [22], og identificeret flere hypermethyleringsassocierede gener i brysttumorer, såsom ACTA1, ISG15, PTK6 og SEPHS2 (figur 1E). De fleste af dem viste ikke signifikant forskel i endometrie prøver.

Visualisering af DNA methylering sammen med histon modifikation af data

En bekvem URL-link til UCSC åbner den aktuelle genomiske region i UCSC genom browser for brugere, der ønsker at se andre genomiske data (nederst til højre på den genomiske opfattelse, figur 1D). Alternativt kan brugerne vælge op til fire intensitet spor og se disse spor sammen med andre standard spor i UCSC genom browser.

For eksempel blev DLC1 gen rapporteret at have øget DNA methylering på sit transkriptionsstartsitet (TSS ) region, mens reduceret histon modifikation i H3K4me1, H3K4me3 og H3K27ac på TSS region [4]. Brugere kan skrive DLC1 i genomisk udsigt webside, og visualiseret TSS-regionen (CHR8: 13,033,864-13,035,942) ved at klikke på “zoom i” og “flytte” knapperne. Vi kan få det overordnede indtryk, at bryst tumorer hypermethylerede forhold til bryst raske, mens endometrie tumorer viser ingen forskel i forhold til endometrie normaler. Brugere kan hente 4 prøver tilfældigt af markere afkrydsningsfeltet i højre side af websiden for bryst prøver (f.eks brn80, brt22, brt69 og brt37), og klik derefter på “Visualiser valgte rækker i UCSC Genome Browser knappen” i nederst til højre på websiden, for at åbne en UCSC webside. For at sammenligne med histon modifikationer spor, brugerne skal vælge “fuld” for hver brugerdefineret spor og de overordnede Histon spor. De histon modifikation spor (figur 6) er i overensstemmelse med tidligere rapport [4] selv om disse data ikke kan komme fra brystkræft. Brugerdefinerede spor (DNA methylering) af brystkræft er steget methylering (svarende til tidligere fund) med en undtagelse (den 3. spor, brt22), som viser patientens specifikke mønstre (figur 6A). Ikke overraskende var der ingen øget methylering fundet for endometriske prøver (figur 6b).

TSS region DLC1 anvendes som eksempel. 4 prøver blev tilfældigt udvalgt ved at markere afkrydsningsfeltet i højre side af websiden for bryst prøver (fx brn80, brt22, brt69 og brt37). Den “fuld” valgmulighed for enhver brugerdefineret spor og de overordnede Histon numre blev valgt til sammenligning af DNA-methylering og histon modifikation mærker. Lignende resultater blev opnået som tidligere rapport [4]. En undtagelse (3

rd spor, brt22) blev fundet, hvilket viser patientens specifikke mønstre (A); og der var ingen øget methylering fundet for endometrie prøver (B).

Diskussion

I vores undersøgelser blev HOXB2 brugt som et eksempel for at finde ud af biologisk vigtige oplysninger ved brug af CMS . Dette skyldes HOXB2 blev fundet som en regulator af tumorvækst i brystcancer [23]. Interessant nok fandt vi HOXB2 blev hypermethyleret i endometriske normale væv sammenlignet med endometriske tumorer (figur 3B). I tidligere undersøgelse blev HOXB2 rapporteret at være vigtige i endometriske normale celler [24]. Desuden HOXB2, HOXB4 og HOXB7 sammen viste nøglefunktion i lungekræft [25]. I vores undersøgelse identificerede vi også, at disse 3-gener er korrelerede i deres methylering profiler. Dette kunne tyde på, at disse tre gener fungere sammen i bryst- og livmoderkræft. Endvidere HOXB13 og BRCA1 er alle fra “androgen-medieret vej” (figur 5), og er alle fundet at være hypermethyleret i brysttumorer end normalt væv i vores undersøgelse. Dette er også i overensstemmelse med tidligere rapport, at HOXB13 fungerer som repressor af androgen receptor signalering i prostatakræft, hvilket kan påvirke BRCA1 (cofaktor i forbindelse med AR) [26].

Der har været flere epigenetik hjemmesider til rådighed i tidligere offentliggjorte rapporter. En af de mest berømte er køreplan Epigenomics Project (REP) (https://www.roadmapepigenomics.org/). Dette projekt bestod af en gruppe af forskellige databaser, browser /visualisering værktøjer og bioinformatiske værktøjer. Brugerne kan enten se mange slags epigenetiske mærker i deres browser (f.eks UCSC REP, https://www.epigenomebrowser.org/), eller downloade data fra en af ​​datalagre (http: //www.ncbi.nlm. nih.gov/epigenomics). Sammenlignet med CMS, REP er mere omfattende i både data sort og afledte værktøjer. Dog er CMS designet til at give kliniske tumorprøver, og vi har yderligere statistiske metoder specielt til genom-dækkende analyse og sammenligning af disse prøver (som DMR detektion og korrelerede gener funktion).

Konklusion

i denne undersøgelse foreslog vi CMS til visualisering og analyse af methylering datasæt for cancere. Et stort antal datasæt blev indsamlet og behandlet i vores database. Adskillige statistiske værktøjer blev indlejret til dataanalyse. Visualisering blev udviklet gennem et Java-baseret web-interface. Nyttige opdagelser blev foretaget af den omfattende anvendelse af denne ramme. Et stort datasæt, en række værktøjer og omfattende program med biologisk og translationel signifikans gør denne ramme kraftfulde og unikke i kræft methylering forskning.

Materialer og metoder

vævsprøver, cellelinje og MBDCap- seq

Vævsprøver blev opnået som en del af vores igangværende arbejde med at karakterisere molekylære forandringer i endometrie og brystcarcinomer.

de ICBP brystcancercellelinier genomisk DNA blev isoleret ved QIAamp DNA Mini Kit ( Qiagen) ved at følge producentens protokol.

Be the first to comment

Leave a Reply