PLoS ONE: Anvendelse af genom-dækkende Association Studies for Cancer Research and Drug Repositionering

Abstrakt

Selvom genom-dækkende forening undersøgelser har identificeret mange risici loci forbundet med kolorektal cancer, det molekylære grundlag for disse foreninger er stadig uklart. Vi havde til formål at udlede biologiske indsigt og fremhæve kandidatgener af interesse inden GWAS risiko loci. Vi brugte en

i silico

pipeline baseret på funktionel annotation, kvantitativ trait loci kortlægning af cis-virkende gen, PubMed tekst-mining, protein-protein interaktionsstudier, genetiske overlapninger med kræft somatiske mutationer og knockout mus fænotyper, og funktionelle berigelse analyse til at prioritere de kandidatgener på kolorektal cancer risiko loci. På baggrund af disse analyser, observerede vi, at disse gener var mål for godkendte behandlinger for kolorektal cancer, og foreslog, at lægemidler, der er godkendt til andre indikationer kan repurposed til behandling af kolorektal cancer. Denne undersøgelse sætter fokus på anvendelse af offentligt tilgængelige data som en omkostningseffektiv løsning til at udlede biologiske indsigt, og giver en empirisk bevis for, at den molekylære basis for kolorektal cancer kan give vigtige leads for opdagelsen af ​​nye lægemidler

Henvisning.: Zhang J, Jiang K, Lv L, Wang H, Shen Z, Gao Z, et al. (2015) Anvendelse af genom-Wide Association Studies for Cancer Research and Drug Repositionering. PLoS ONE 10 (3): e0116477. doi: 10,1371 /journal.pone.0116477

Academic Redaktør: Giuseppe Novelli, Tor Vergata-universitetet i Rom, Italien

Modtaget: 27. september 2014 Accepteret: 8. december 2014 Udgivet: 24 marts 2015

Copyright: © 2015 Zhang et al. Dette er en åben adgang artiklen distribueres under betingelserne i Creative Commons Attribution License, som tillader ubegrænset brug, distribution og reproduktion i ethvert medie, forudsat den oprindelige forfatter og kilde krediteres

Data Tilgængelighed: Alle relevante data er inden for papir og dens Støtte Information filer

Finansiering:. Dette arbejde blev støttet af National Key Technology Support Program (Grant nummer: 2104000032), National Natural Science Foundation of China (Varenummer: 81.372.290) og National Natural Science Foundation of China (Varenummer: 81.372.291).

konkurrerende interesser:. forfatterne har erklæret, at der ikke findes konkurrerende interesser

Introduktion

Siden indførelsen af ​​high-density enkelt-nukleotid polymorfisme (SNP) genotypebestemmelse arrays, har forskere anvendt genom-dækkende forbindelsesundersøgelser (GWAS) for at identificere utallige loci forbundet med en lang række sygdomme. Langt størstedelen af ​​SNP’er identificeret af GWAS ligger inden for de intergeniske eller intronregioner (ca. 88%) [1,2]. GWAS har også muliggjort opdagelsen af ​​mange genetiske variationer af kolorektale cancere (CRC). Det næste skridt var at identificere de gener, der er blevet berørt af kausale varianter, hvilket ville gøre det muligt for os at oversætte de risikofaktorer SNPs til meningsfulde indsigt på patogenese.

De fleste rapporter har simpelthen impliceret den nærmeste genet til en GWAS hit som en mål af den funktionelle variant uden beviser [1]. Identifikationen af ​​udtryk kvantitativ egenskab loci (eQTL) er blevet foreslået som en lovende metode til at finde de kandidatgener forbundet med en sygdom risiko [3] [4]. Det skal bemærkes, at identificere en eQTL giver kun en indirekte bevis for en sammenhæng mellem genotype og gentranskription [1].

Så vidt vi ved, er der simpelthen ingen god måde at identificere disse målgener, som er nøglen til at forstå den mekanisme, hvormed GWAS varianter handling. Så vi foreslog en bioinformatik rørledning til at prioritere de mest sandsynlige kandidat gener ved hjælp af flere biologiske datasæt. Syv kriterier blev vedtaget at prioritere kandidatgener. Den udbredte eQTL ovennævnte kriterium er kun én af syv kriterier i støbeskeen.

En måde at fremskynde oversættelsen af ​​data fra GWAS i kliniske fordele, er at bruge resultaterne til at identificere nye indikationer for behandling med eksisterende molekyler. GWAS kan anvendes til at konstruere narkotikarelaterede netværk, medvirken narkotika repositionering. Selvom GWAS ikke direkte identificere de fleste af de eksisterende lægemiddeltargets, er der flere grunde til at forvente, at nye mål alligevel vil blive opdaget ved hjælp af disse oplysninger [5,6]. De første resultater på narkotika nyorientering undersøgelser med anvendelse af netværksanalyse er opmuntrende og foreslå retninger for fremtidig [7] udvikling. Ved at integrere reumatoid arthritis genetiske fund med kataloget over godkendte lægemidler til leddegigt og andre sygdomme, Okada Y et al forudsat en empiriske data til at indikerer, at genetiske metoder kan være nyttige til at understøtte genetik-drevet genomiske drug discovery indsats i komplekse menneskelige træk [8 ].

i den foreliggende undersøgelse, brugte vi den

i silico

rørledning til systematisk at integrere data om risiko loci for CRC biologi og lægemiddelforskning fra en række forskellige databaser.

materialer og metoder

En oversigt over undersøgelsens design er vist i fig. 1. Biologiske kandidatgener blev opnået fra GWAS identificerede CRC risiko loci. Dernæst blev genetiske data integreres med resultaterne af statistiske analyser, beregningsmæssige metoder, og offentligt tilgængelige store datasæt til at prioritere de opnåede gener, og foreslå nye mål for lægemiddelbehandlinger.

Et hundrede og syvogfyrre kandidat gener blev opnået fra 50 CRC risiko loci. En bioinformatik rørledning blev udviklet til prioriteringen af ​​disse kandidatgener. Syv kriterier blev anvendt til at score generne: (1) CRC risiko missense variant; (2)

cis

-eQTL; (3) PubMed tekst mining; (4) PPI; (5) kræft somatisk mutation; (6) knockout mus fænotype; og (7) funktionel berigelse. Omfanget af overlapning med target gener for godkendte CRC narkotika blev også vurderet.

CRC risiko loci fra GWAS

Vi hentede CRC risiko SNPs fra National Human Genome Research Institute (NHGRI) GWAS katalog database den 31. januar 2014 [2]

Biologiske kandidatgener fra CRC risiko loci

det er et velkendt faktum, at risikoen SNPs angiver haplotyper, hvor de funktionelle varianter bor.; derfor, det næste skridt var at identificere deres mål gener. Med vedtagelsen af ​​multi-anmærkninger mellem risiko SNPs og de omgivende gener,

snp2gene

tilladt konventionel anmærkning på grund af deres nærhed, samt koblingsuligevægt [9].

For hver af de GWAS SNPs involveret, vi brugte den

snp2gene

at identificere kandidatgener. For hvert gen i risikoen loci, vi evalueret hvis genet var den nærmeste genet til CRC risiko SNP inden risikoen locus.

Prioritering af kandidatgener

Ved at bruge flere biologiske datasæt, vi udtænkt en bioinformatik rørledning til at prioritere de mest sandsynlige kandidatgener.

for det første funktionelle anmærkninger for CRC risiko SNPs blev identificeret ved

ANNOVAR

[10]. Egenskab-associerede varianter blev beriget i kromatin varemærker, særligt i H3K4me3 [11]. H3K4me3 data for 34 celletyper kunne give den fine kortlægning af associerede SNPs at identificere kausale variation i de tidligere undersøgelser [12]. Så vi vurderet, om CRC risiko SNPs og SNPs i bindingsuligevægt (r

2 0,80) blev overlappende med H3K4me3 toppe af 34 celletyper. De H3K4me3 data blev indhentet fra National Institutes of Health køreplan Epigenomics Mapping Consortium ved en permutation procedure med 10

5 gentagelser [12]. Vi identificerede gener for CRC risiko SNPs eller SNPs fra koblingsuligevægt (r

2 0,80), der blev kommenteret som missense varianter

For det andet har vi vurderet den

cis

-expression kvantitativ. trait loci (

cis

-eQTL) effekter ved hjælp af data fra 5.311 europæiske emner fra undersøgelsen om mononukleære celler fra perifert blod (PBMC’er) [13]. Westra HJ et al. havde lavet en browser til rådighed for alle væsentlige

cis

-eQTLs, opdages på et falsk opdagelse sats på 0,50. (https://genenetwork.nl/bloodeqtlbrowser/) I deres undersøgelse blev eQTLs anset

cis

-eQTLs når afstanden mellem SNP kromosomale position og sonden midtpunktet var mindre end 250 kb. De eQTLs blev kortlagt ved hjælp af Spearman rang korrelation på imputerede genotype doser. Resulterende korrelationer blev derefter omdannet til P-værdier, og deres respektive z scoringer blev vægtet med kvadratroden af ​​stikprøvestørrelsen.

At evaluere

cis

-eQTL gener af risikofaktorer SNPs, det var kun nødvendigt at give alle risici SNP. Når CRC risiko SNP ikke var tilgængelige i eQTL datasæt, vi alternativt brugt resultaterne af bedste proxy SNPs i koblingsuligevægt med den højeste r

2 værdi (r

2 0,80).

tredje ved hjælp genet relationer mellem impliceret loci (

GRAIL Salg), vi vurderede graden af ​​slægtskab mellem gener i sygdoms regioner.

GRAIL

er et værktøj til at undersøge forholdet mellem gener i forskellige sygdom forbundet loci. Givet mange genomiske regioner eller SNPs forbundet med CRC,

GRAIL

søgninger efter ligheder i offentliggjort videnskabelig tekst blandt de tilknyttede gener [14]. En p-værdi på 0,05 blev betragtet som signifikant. For at undgå publikationer, der rapporteres på eller var påvirket af sygdommen regioner opdaget i de seneste scanninger, bruger vi kun de PubMed abstracts offentliggjort før december 2006, inden den seneste stormløb af GWA papirer identificere nye foreninger, undgå stærk slagside i retning generne nærmeste til de tilknyttede SNP’er. Denne tilgang effektivt undgår dette problem. [14].

Dernæst brugte vi Disease Association Protein-Protein Link evalueringsværktøj

(dapple)

til vurdering af tilstedeværelsen af ​​signifikante fysiske tilslutningsmuligheder blandt proteiner kodet af kandidatgener af protein-protein-interaktion (PPI), er rapporteret i litteraturen.

dapple

tager en liste over frø SNPs, der omdanner dem til gener baseret på overlap. Hypotesen bag dapple er, at en genetisk variation påvirker et begrænset sæt af underliggende mekanismer, der er påviseligt ved PPI [15]. En p-værdi på 0,05 blev betragtet som signifikant

Nest, vi opnåede cancer somatiske mutation gener fra Katalog over somatiske mutationer i Cancer (

COSMIC

) database [16], og hentede knockout. mus fænotype etiketter og gen-information fra databasen Mouse Genome Informatics (MGI) [17] den 8. april 2014. Vi definerede alle CRC risikofaktorer gener indgår i CRC risikoen loci, og evalueret overlapningen med kræft fænotyper med registrerede somatiske mutationer, og fænotype etiketter knockout mus gener med menneskelig ortologe. Hypergeometriske fordeling test blev anvendt til overlappende statistiske analyser med signifikans ved en p-værdi på. 0,05

Endelig har vi udførte funktion berigelse analyse for at undersøge, om gener, der berøres af SNPs blev beriget for specifikke funktionelle kategorier eller veje. David Bioinformatik Resources, der omfattede Gene Ontology (GO), Kyoto Encyclopedia of Gener og genomer (Kegg) og Mendelian Inheritance in Man (OMIM) blev anvendt til analyser. [18] De opnåede resultater blev betragtet som signifikante ved et

s

værdi 0,05

Vi scorede hver af generne ved hjælp af følgende udvælgelseskriterier, og beregnet antallet af de tilfredse kriterier:. (1) gener med missense varianter; (2)

cis

-eQTL gener af risikofaktorer SNPs; (3) gener prioriteret af PubMed tekst mining; (4) gener prioriteret af PPI-netværk; (5) cancer somatisk mutation gener; (6) gener prioriteret af tilknyttede knockout mus fænotyper; og (7) gener prioriteret ved funktionel berigelse analyse.

Korrelationer af kandidat gen prioriteringskriterier blev evalueret af Pearson korrelationsanalyse. Hvert gen blev scoret baseret på antallet af kriterier, der var opfyldt (scores varierede fra 0-7 for hvert gen) i tilfælde af svage korrelationer. Gener med en score på ⩾2 blev defineret som ‘biologiske risikofaktorer gener’.

Drug validering og opdagelse

Hvis human genetik kan validere lægemiddeltargets, så det kan bruges til at identificere, om den godkendte midler, der anvendes til behandling af andre indikationer, kan anvendes til behandling af CRC. Vi præsenterer her en analyse af den potentielle anvendelse af GWAS data, narkotika repositionering.

Vi opnåede drug target gener og tilsvarende oplysninger om narkotika fra Drug Bank [19] og terapeutiske mål Database (TTD) [20] den 18. okt , 2013. Vi valgte drug target gener, der havde farmakologiske aktiviteter og var effektive i humane ortologe modeller, og dem, der kommenteret med nogen af ​​de godkendte, klinisk undersøgelse eller eksperimentelle narkotika.

de narkotika målgener kommenteret til CRC narkotika blev manuelt udvundet af professionelle onkologer. For at mindske af de falsk positive, kun de stoffer i henhold til gældende klinisk brug var involveret i undersøgelsen, som kunne findes i de NCCN klinisk praksis retningslinjer tarmkræft. [21]

Vi udvundet gener fra direkte PPI med biologiske CRC risiko gener ved hjælp af protein interaktion netværksanalyse-2 (

PINA2)

, der integrerer seks kendte manuelt kurateret PPI databaser [22].

Vi evaluerede muligheden for at udforske proteinprodukter fra de identificerede biologiske risikofaktorer gener, eller eventuelle gener fra en direkte PPI netværk som mål for godkendte CRC narkotika eller lægemidler til andre indikationer. Lad x være sæt af de biologiske CRC risikofaktorer gener og gener i direkte PPI med dem (n

x gener), y være det sæt af gener med protein produkter, der er direkte mål for godkendte CRC lægemidler (n

y gener), og z være det sæt af gener med protein produkter, der er direkte mål for alle godkendte lægemidler (n

z gener). Vi definerede n

x∩y og n

x∩z da antallet af gener overlappende mellem x og y og mellem x og z henholdsvis. Hypergeometriske fordeling tests blev anvendt til overlappende statistiske analyser, og ap værdi 0,05 blev betragtet som statistisk signifikant

Resultater Salg

I den foreliggende undersøgelse blev 50 CRC-associerede SNP’er opnået fra NHGRI (. tabel 1), og 140 gener blev opnået på grundlag af nærhed og koblingsuligevægt hjælp af

snp2gene

(S1 tabel).

Funktionelle anmærkninger af CRC risiko SNPs

de fleste SNP’er (62%) blev placeret i intergeniske regioner (S2 Table). To SNP’er blev identificeret i bindingsuligevægt med missense SNPs (r

2 0,80; S3 tabel). Dernæst vurderede vi 50 CRC risiko loci for beriget epigenetiske kromatin mærker [12]. Af de 34 celletyper undersøgt, vi observerede en betydelig berigelse af CRC risikofaktorer alleler med H3K4me3 toppe i rektal slimhinde celler (

p

= 0,00014 og 0,00023 hhv) (S4 tabel).

Cis -expression kvantitativ egenskab loci (

cis

-eQTL)

Brug af

cis

-eQTL data fra PBMC undersøgelse [13], fandt vi, at 13 risikofaktorer SNPs viste

cis

-eQTL effekter (p 0,0016 og FDR 0,5). (S5 Table)

PubMed tekst-mining

Fireogtyve gener blev prioriteret på grundlag data opnået ved PubMed tekst mining bruge

GRAIL

med gen-baseret p 0.05 [14] (S6 Table)

Protein-protein interaktion (PPI)

To gener blev prioriteret ved PPI netværk ved hjælp af gen-baserede

dapple

med p 0.05 [15] (S7 tabel).

Kræft somatisk mutation

Blandt de 522 gener med registrerede somatiske mutationer opnået fra COSMIC database [16], en betydelig overlapning blev observeret i gener, der er forbundet i ikke-hæmatologiske kræftformer (5/6, p = 2.41E -05) (S8 tabel).

Knockout mus fænotype

Vi evaluerede overlap med gener impliceret i knockout mus fænotyper [17]. Blandt de 30 kategorier af fænotyper, vi observeret ni kategorier væsentligt beriget med CRC risikofaktorer gener (p 0,05)., Ledet af kraniofaciale fænotype (S9 Table)

Funktionel berigelse analyse

GO analyse indikeret, at nogle få gener blev beriget i tre kategorier (S10 tabel); to med Kegg veje observeret i kræft (p = 0,002), og en med småcellet lungekræft (p = 0,011) var funktionelt relateret (S11 tabel). Funktionel analyse af OMIM demonstrerede berigede gen sæt i kolorektale sygdomme (S12 tabel)

På baggrund af disse nye resultater, vi vedtog følgende syv kriterier for at prioritere hver enkelt af de 140 gener fra 50 CRC risiko loci:. (1 ) gener med CRC risiko missense variant (n = 2); (2)

cis

-eQTL gener (n = 13); (3) gener prioriteret af PubMed tekst mining (n = 24); (4) gener prioriteret af PPI (n = 2); (5) kræft somatisk mutation gener (n = 6); (6) gener prioriteret af associerede knockout mus fænotyper (n = 40); og (7) gener prioriteret af funktionelle berigelse analyse (n = 31)

Fordi disse kriterier viste svage korrelationer med hinanden (R

2 0,48; S13 tabel)., hvert gen blev scoret baseret af antallet af kriterier, der var opfyldt (scores varierede 0-7 for hvert gen)

Femogtredive gener (25,2%) havde en score . 2, som blev defineret som ‘biologiske risikofaktorer gener’ ( S1 fig.). Tre loci omfattede flere biologiske CRC risikofaktorer gener (f.eks ROS1 og GOPC ved rs2057314) (Tabel 2).

For at give empirisk bevis af rørledningen, vi analyserede gen scoringer. Gener med højere biologiske scoringer var mere tilbøjelige til at være nærmest risikoen SNP (62,8% for gen score ⩾ 2, 24% for gen score 2; p 0,001). I mellemtiden, rektal mucosa i celler viste signifikante overlappende proportioner med H3K4me3 toppe sammenlignet med andre celletyper.

Endelig har vi vurderet den potentielle rolle genetik i forhold til lægemiddelforskning til behandling af CRC. Hypergeometriske fordeling tests blev anvendt til overlappende statistiske analyser. Vi opnåede 11303 gener parvis fra kurateret PPI databaser. Vi opnåede 871 drug målgener svarende til godkendt, i kliniske forsøg eller eksperimentelle lægemidler til sygdomme hos mennesker (S14 tabel). Af hensyn til beregning pålidelighed blev kun CRC narkotika i den første linie terapi involveret i undersøgelsen. Otte målgener godkendte CRC lægemidler blev inkluderet (S15 tabel).

Enogtredive biologiske CRC risikofaktorer gener overlappede med 533 gener fra den udvidede PPI-netværket (S2 Fig. Og S3 Fig.). Vi fandt et overlap på 5/8 drug target gener af godkendte CRC lægemidler (5/8 vs 70/781, 12.09-fold berigelse, P = 0,00013). Alle 871 drug målgener (uanset indikation sygdom) overlappede med 70 gener fra PPI-netværket, hvilket antydede, at berigelsen var 1,55 gange højere end den, der forventes ved en tilfældighed alene (p = 0,00012), men mindre ved 7,78 gange sammenlignet med nuværende godkendte CRC lægemidler (p = 1,78 × 10

-5). Eksempler på godkendte CRC behandlinger identificeret ved denne analyse omfattede irinotecan, regorafenib, og cetuximab (fig. 2).

Sorte linjer angiver forbindelser.

Korrelation af godkendte lægemidler til andre sygdomme med biologiske CRC risiko genet blev også vurderet. Et eksempel på medikament repositionering (fig. 3) er anvendelsen af ​​crizotinib, et godkendt lægemiddel til ikke-småcellet lungekræft til behandlingen af ​​CRC [16]. Arsentrioxid vrinostat, dasatinib, estramustin, og tamibarotene er alle lovende lægemidler til behandling af CRC (fig. 4).

Diskussion

GWAS har identificeret utallige sygdoms- tilknyttede genetiske varianter. Imidlertid har betydelige hindringer hæmmet vores evne til at identificere gener, der berøres af kausale varianter og belyse den mekanisme, hvorved genotype påvirkninger fænotype.

De fleste rapporter har simpelthen impliceret den nærmeste genet til en GWAS ramme uden betydelige beviser [1] . Denne undersøgelse prioriteret de mest sandsynlige målgener. blev identificeret i alt 31 biologiske CRC risikofaktorer gener. Selvom biologiske CRC risikofaktorer gener er mere tilbøjelige til at være kausale gener, dette stadig skal bekræftes af basale molekylære studier ved hjælp af avancerede teknologier. Edwards et al forudsat en rørledning til opfølgende undersøgelser, der omfatter fint kortlægning af risikofaktorer SNPs, prioritering af formodede funktionelle SNP’er, og in vitro og in vivo eksperimentel verifikation af forudsagte molekylære mekanismer til at identificere de målrettede gener [1].

GWAS kritiseres for deres manglende klinisk oversættelse på grund af størrelsen af ​​effekten. Men enkelte små effektstørrelser ikke nødvendigvis udelukker kliniske anvendelighed. Sanseau et al foreslået at anvende GWAS for lægemiddel repositionering, der betragtes som en lovende strategi i translationel medicin. I en undersøgelse undersøger 3-hydroxy-3-methyl-glutaryl-coenzym A, et velkendt kolesterolsænkende medicin, blev SNPs inden dette gen utvetydigt med lav massefylde lipopolysaccharid kolesterol i GWAS data. [6] Deres undersøgelse omfattede alle GWAS-associerede gener, der blev valgt fra GWAS katalog, uden præstation om CRC stoffer.

I den foreliggende undersøgelse har vi fokuseret på nyorientering lægemidler til CRC baseret på prioritering af kandidatgener i de GWAS-identificerede loci. For eksempel er crizotinib, arsentrioxid, vrinostat, dasatinib, estramustin, og tamibarotene også lovende repurposed lægemidler til CRC. Selv er nødvendige for at bekræfte resultaterne af denne undersøgelse yderligere undersøgelser, vi mene, at disse mål lægemidler valgt kunne være lovende lægemiddelkandidater til behandling af CRC.

GWAS data er nyttige i at yde indsigt i biologi sygdomme, men kan også oversætte disse fører til rentable muligheder i lægemiddeludvikling. Men GWAS data ikke give detaljerede patofysiologisk information; Derfor kan de nyligt identificerede anvendelser gamle lægemidler muligvis være bivirkninger [23]. Vellykket nyorientering af et lægemiddel indebærer en kombination af resultater fra offentliggjort litteratur, og klinisk forskning.

Selv om der var en række positive aspekter fra denne undersøgelse, der var nogle begrænsninger så godt. For det første blev data for PBMC undersøgelsen bruges til

cis

-eQTL analyse. Selvom eQTLs identificeret fra én vævstype kan være et nyttigt surrogat at studere genetik for genekspression i et andet væv [24], anvendelse af vævsspecifikke eQTLs er sandsynligvis mere nyttige i forståelsen af ​​patogenesen af ​​CRC [25]. For det andet af de 34 celletyper undersøgte, vi kun observeret en betydelig berigelse af risiko SNP med H3K4me3 toppe i rektal slimhinde celler. Ikke desto mindre, berigelsen var ikke signifikant for kolon mucosa celler.

I denne undersøgelse har vi integreret genetiske data og statistiske analyser, beregningsmæssige metoder, og offentligt tilgængelige store datasæt, prioritere kandidat gener, og foreslå nye mål for CRC medicinsk behandling. Vi mener, at målgener og lægemidler udvalgt af denne fremgangsmåde kunne lovende kundeemner i udviklingen af ​​lægemiddelkandidater til behandling af CRC, selv om yderligere undersøgelser er berettiget til bekræftelse af disse resultater.

Støtte oplysninger

S1 fig. . Histogram fordeling af gen scoringer

Femogtredive gener med en score på 2 blev defineret som ‘biologiske risikofaktorer gener’

doi: 10,1371 /journal.pone.0116477.s001

(TIF)

S2 fig. Overlapning af 31 biologiske gener plus 553 gener i direkte PPI med dem og narkotika målgener.

Vi fandt overlap af 5 gener fra 8 narkotika målgener godkendte CRC lægemidler (12.09-fold berigelse, p = 1,78 × 10

-5). Alle 871 drug target gener (uanset indikation sygdom) overlappede med 70 gener fra PPI-netværket, hvilket indikerer en 1,55 gange højere berigelse end forventet tilfældigt alene (p = 1,20 × 10

-4); men mindre end 7,78 gange berigelse i forhold til CRC lægemidler (p = 1,30 × 10

-4)

doi:. 10,1371 /journal.pone.0116477.s002

(TIF)

S3 Fig. PPI netværk af biologiske CRC risikofaktorer gener og narkotika målgener

Pink:. Drug target gener; Orange: CRC risikofaktorer gener; Cyan:. Direkte PPI gener i PINA2 database

doi: 10,1371 /journal.pone.0116477.s003

(TIF)

S1 Table. Oversigt over 140 kandidatgener baseret på nærhed og koblingsuligevægt

doi:. 10,1371 /journal.pone.0116477.s004

(XLSX)

S2 Table. Risiko SNPs kommenteret af

annovar

doi:. 10,1371 /journal.pone.0116477.s005

(XLSX)

S3 tabel. Missense variant i koblingsuligevægt (r

2 0,8) med risiko enkelt nukleotid polymorfier kommenteret af

ANNOVAR

doi:. 10,1371 /journal.pone.0116477.s006

(XLSX)

S4 Table. Overlapning af kolorektal cancer risiko enkelt nukleotid polymorfier med H3K4me3 toppe i celler

doi:. 10,1371 /journal.pone.0116477.s007

(DOCX)

S5 Table.

cis

-expression kvantitativ egenskab loci af kolorektal cancer risiko enkelt nukleotid polymorfier

doi:. 10,1371 /journal.pone.0116477.s008

(XLSX)

S6 Table. Gener prioriteret af PubMed tekst mining

doi:. 10,1371 /journal.pone.0116477.s009

(XLSX)

S7 Table. . Gener prioriteret af protein-protein interaktion netværk

doi: 10,1371 /journal.pone.0116477.s010

(XLSX)

S8 Table. Overlapning af kolorektal cancer risiko gener med kræft somatiske mutation gener

doi:. 10,1371 /journal.pone.0116477.s011

(XLSX)

S9 tabel. Gener prioriteret af knockout mus fænotype hjælp hypergeometriske fordeling test

doi:. 10,1371 /journal.pone.0116477.s012

(DOCX)

S10 Table. Gener prioriterer gå berigelse analyse

doi:. 10,1371 /journal.pone.0116477.s013

(XLSX)

S11 Table. Gener prioriteret af Kegg berigelse analyse

doi:. 10,1371 /journal.pone.0116477.s014

(XLSX)

S12 tabel. Gener prioriteret af OMIM berigelse analyse

doi:. 10,1371 /journal.pone.0116477.s015

(XLSX)

S13 tabel. Korrelationer biologiske kandidat gen prioriteringskriterier

doi:. 10,1371 /journal.pone.0116477.s016

(XLSX)

S14 Table. En liste over narkotika målgener

doi:. 10,1371 /journal.pone.0116477.s017

(DOCX)

S15 tabel. Oversigt over godkendte lægemidler for tarmkræft og målgener

doi:. 10,1371 /journal.pone.0116477.s018

(DOCX)

anerkendelser

Tak for hjælp af data analyse fra Suzhou BioNovo Gene Co., LTD

Finansiering kilde:.

Dette arbejde blev støttet af National Key Technology Support Program (Grant nummer: 2104000032), National Natural Science Foundation of China (punkt nummer: 81372290) og National Natural Science Foundation of China (Varenummer: 81.372.291)

.

Be the first to comment

Leave a Reply