PLoS ONE: Kræft Specifik Lang kodende RNA Vis Differentiale Expression mønstre og Konkurrerende Endogen RNA Potentiale i hepatocellulært carcinom

Abstrakt

Lange ikke-kodende RNA (lncRNAs) regulerer genekspression ved at handle med microRNA (miRNA). Dog er rollerne for kræft specifikke lncRNA og dens relaterede konkurrencedygtige endogene RNA (Cerna) netværk i hepatocellulært carcinom (HCC) ikke fuldt forstået. De lncRNA profiler i 372 HCC patienter, herunder 372 tumor og 48 tilstødende ikke-tumor levervæv, fra The Cancer Genome Atlas (TCGA) og NCBI GEO omnibus (GSE65485) blev analyseret. Cancer specifikke lncRNAs (eller HCC relaterede lncRNAs) blev identificeret og korreleret med kliniske funktioner. Baseret på bioinformatik genereret fra miRcode, starbase, og miRTarBase, vi konstrueret en lncRNA-miRNA-mRNA-netværk (Cerna netværk) i HCC. Vi fandt 177 cancerpatienter specifikke lncRNAs i HCC (fold ændring ≥ 1,5, P 0,01), 41 af dem blev også discriminatively udtrykkes med køn, race, tumorklassificering, AJCC tumor stadium, og AJCC TNM. Seks lncRNAs (CECR7, LINC00346, MAPKAPK5-AS1, LOC338651, FLJ90757, og LOC283663) viste sig at være signifikant associeret med samlet overlevelse (OS, log-rank P 0,05). Kollektivt, viste vores resultater de lncRNA ekspressionsmønstre og et komplekst Cerna netværk i HCC, og identificeret en kompleks kræft specifik Cerna netværk, som omfatter 14 lncRNAs og 17 miRNA i HCC

Henvisning:. Zhang J, Fan D, Jian Z, Chen GG, Lai PBS (2015) Cancer specifik lang kodende RNA Vis Differentiale Expression mønstre og Konkurrerende Endogen RNA Potentiale i hepatocellulært carcinom. PLoS ONE 10 (10): e0141042. doi: 10,1371 /journal.pone.0141042

Redaktør: Xin-Yuan Guan, The University of Hong Kong, KINA

Modtaget: August 6, 2015; Accepteret: 2 oktober 2015; Udgivet: 22 okt 2015

Copyright: © 2015 Zhang et al. Dette er en åben adgang artiklen distribueres under betingelserne i Creative Commons Attribution License, som tillader ubegrænset brug, distribution og reproduktion i ethvert medie, forudsat den oprindelige forfatter og kilde krediteres

Data Tilgængelighed: Alle relevante data er inden for papir og dens støtte Information filer

Finansiering:. Denne undersøgelse blev støttet af Specialized forskningsfonden for ph.d.-programmet for videregående uddannelse og forskning Grants Rådets Øremærkede Research Grants fælles Forskningscenter Scheme (nr M-CUHK406 /13) og National Natural Science Foundation of China (nr 81.472.339). De finansieringskilder havde ingen rolle i studie design, indsamling og analyse af data, beslutning om at offentliggøre, eller forberedelse af manuskriptet

Konkurrerende interesser:.. Forfatterne har erklæret, at der ikke findes konkurrerende interesser

Introduktion

kodende RNA’er er RNA-molekyler, der ikke koder for proteiner. De kan opdeles i flere undertyper, herunder lange ikke-kodende RNA (lncRNA), microRNA (miRNA), ribosomalt RNA (rRNA), lille nucleolar RNA (snoRNA), og transfer-RNA ifølge HUGO Gene Nomenclature Committee (HGNC) (http: //www.genenames.org).

Efter identificering af lncRNA i malignitet sygdomme, er der gennemført et stigende antal undersøgelser af de biologiske roller lncRNAs i forskellige kræftformer, herunder HCC [1], esophageal skællede cellecarcinom [2], colorectal cancer [3], renalcellecarcinom [4] og prostatacancer [5]. Den unormale udtryk for lncRNAs gennem interaktioner med miRNA eller mRNA er involveret i reguleringen af ​​tumor progression og tumor biologiske adfærd i HCC [6-8]. De kræft specifikke lncRNAs kan også påvirke invasionen og metastase af HCC [9].

I 2011 Salmena

et al

. præsenteret en konkurrerende endogen RNA (Cerna) hypotese, som samlet transkriptomet og dannede en regulerende RNA netværk [10]. Hovedtanken er, at alle typer af RNA-transkripter kommunikere med hinanden ved at konkurrere om binding til delte miRNA-bindingssteder ( “miRNA respons elementer” eller “MREs”). Denne form for RNA konkurrence krydstale eksisterer mellem proteinkodende messenger-RNA’er og ikke-kodende RNA’er såsom lncRNA, pseudogener og cirkulære RNA’er [11]. Desuden kan kunstige miRNA svampe også deltage i dette netværk til at regulere genekspression [12].

Zhu et al. rapporterede, at lncRNA ekspressionsprofil af HCC ved microarray analyse fra tre HCC patienter [13]. Men der er mangel på undersøgelser med stor skala stikprøvestørrelse og høj gennem detektionsmetoder på udtrykket mønstre af kræft specifik lncRNA i HCC, og det er uvist, om lncRNAs er korreleret med total overlevelse, køn eller andre kliniske funktioner, eller om den afvigende ekspression af lncRNAs i HCC har nogen Cerna potentiale. For nylig, RNA sekventering data fra The Cancer Genome Atlas (TCGA) projekt eller GEO give offentligheden lncRNA, miRNA, og mRNA data for HCC. For at løse de ovennævnte spørgsmål, vi udforsket lncRNAs i HCC hjælp datasæt fra TCGA og GEO. Disse to datasæt omfattede RNA-sekvens resultater for i alt 372 HCC tumorvæv og 48 hosliggende ikke-tumor liver vævsprøver. Så vidt vi ved, denne undersøgelse er den første til at gøre brug af i stor skala sekventering database til at undersøge kræft specifikke lncRNA ekspressionsmønstre og Cerna netværk i HCC. Denne nye tilgang til at forudsige kræft specifik lncRNA og Cerna netværket kan hjælpe os med at forstå funktionen af ​​lncRNAs i HCC.

Metoder

Patienter og prøver

I alt 360 patienter med HCC blev hentet fra TCGA data portalen. Udelukkelseskriterierne blev fastsat som følger: 1) histologisk diagnose er ikke HCC; 2) prøver uden udfyldte data til analyse; og 3) Samlet overlevelse mere end 2000 dage. Samlet set blev der i alt 322 HCC patienter inkluderet i vores undersøgelse. Blandt disse 322 HCC patienter blev de tilstødende ikke-tumor levervæv hentet fra 43 individer. Denne undersøgelse opfylder retningslinjerne offentliggørelse, som TCGA (https://cancergenome.nih.gov/publications/publicationguidelines). En anden GEO datasæt (GSE65485) blev hentet fra GEO (https://www.ncbi.nlm.nih.gov/geo/), som omfattede 50 HCC væv og 5 tilstødende ikke-tumor levervæv. Da data blev indhentet fra TCGA og GEO, blev yderligere godkendelse af en etisk komité ikke påkrævet.

sekvens data RNA procession og beregningsmæssige analyse

RNA udtryk data (niveau 3) af den tilsvarende patienter (tumor og /eller tilstødende ikke-tumorvæv) blev hentet fra TCGA data portal (op til feb 24, 2015). De lncRNA og mRNA udtryk profiler blev genereret fra RNA-sekventering rå læser ved RNASeqV2 efterbehandling rørledninger og demonstreret som RSEM (RNA-Seq ved Forventning-Maximization) normaliseret tæller data. Den miRNA udtryk profil blev udført ved hjælp af Illumina HiSeq 2000 miRNA sekventering platforme (Illumina Inc, USA) og demonstreret som læser per million miRNA (RPM) kortlagt data. Fordi udtryk profildata mRNA, lncRNA, og miRNA allerede blev normaliseret ved TCGA blev ikke yderligere normalizations anvendes på disse data. GEO datasæt blev også genereret fra Illumina HiSeq 2000 platform og normaliseret som FPKM (fragmenter pr kilo baser af exoner for per million kortlagt læser) data. Den lncRNA analyser blev udført ved hjælp af BRB-ArrayTools (version 4.4) er udviklet af Dr. Richard Simon og BRB-ArrayTools Development Team [14].

Konstruktion af Cerna netværk og KEEG Pathway Analyse

opførelsen af ​​Cerna netværk omfattede tre trin: (i) kræft specifik lncRNA filtrering: kræft specifikke lncRNAs med absolut fold ændring ≥ 3,0 (enten opregulering eller nedregulering) og P 0,05 blev bibeholdt. For at forbedre data pålidelighed, har kræft specifikke lncRNAs ikke kommenteret af GENCODE (https://www.gencodegenes.org/) blev kasseret; (Ii) lncRNA-miRNA interaktioner forudsagt af miRcode (https://www.mircode.org/) og starbase v2.0 (https://starbase.sysu.edu.cn/); (Iii) mRNA er omfattet af miRNA med eksperimentel støtte blev hentet fra miRTarBase (https://mirtarbase.mbc.nctu.edu.tw/). For yderligere at øge den robuste denne Cerna netværk, blev den maksimale information koefficient (MIC) algoritme og maksimal parametrisk udforskning (mine) statistik informations-baserede anvendt i TCGA datasæt til at filtrere par-wised relationer [15]. Et netværk graf blev konstrueret og visualiseret ved hjælp Cytoscape v3.0 [16]. De kodende gener involveret i Cerna netværk var input til Database til anmærkning, Visualisering og integreret Discovery (DAVID) [17] for KEEG pathway berigelse analyse.

Statistisk analyse

Data blev præsenteret som gennemsnit ± SD. Forskelle mellem grupper blev bedømt ved to stikprøver t test og signifikansniveauet blev sat som 0,001 som standard til at styre den falske opdagelse sats (FDR). Den univariate Cox proportionel risiko regressions blev gennemført for at finde ud af de lncRNAs korreleret med total overlevelse [18]. P-værdi mindre end 0,05 blev betragtet som statistisk medmindre det specifikt er angivet. De statistiske analyser blev udført af BRB-ArrayTools eller R sprog [19].

Resultater

Cancer specifikke lncRNAs i HCC

Vi identificerede 604 lncRNAs fra TCGA datasæt og 357 lncRNAs fra GSE65485. For en enkelt lncRNA, viste det sig i TCGA datasæt eller begge TCGA og GEO datasæt. Vi fandt, at 177 lncRNAs og 37 lncRNAs differentielt blev udtrykt mellem HCC væv og tilstødende ikke-tumorvæv i TCGA datasæt og GEO datasæt (absolut fold ændring ≥ 1,5, P 0,01, S1 Table), hhv. For yderligere at øge de data pålidelighed, valgte vi 28 lncRNAs inkluderet i GENCODE og disse lncRNAs havde en absolut fold ændring ≥ 3,0 fra enten TCGA eller GEO datasæt til at bygge Cerna netværk [20]. Endelig 28 lncRNAs (18 opreguleret, 10 nedreguleret). Udvalgt til Cerna netværk (tabel 1)

Denne tabel viste 28 kræft specifikke lncRNAs for Cerna netværk konstruktion med absolut fold ændring ≥ 3,0, P 0.01 og medtaget i GENCODE.

De korrelationer mellem kræft specifikke lncRNAs og kliniske funktioner

De 177 lncRNAs fra ovenstående afsnit blev yderligere analyseret i henhold til kliniske funktioner, herunder køn, race, tumor klasse, AJCC TNM, AJCC patologisk stadium, vaskulær invasion, ny tumor begivenhed, tumor status, og alder ved diagnose i TCGA og /eller GEO datasæt. Der var i alt 41 kræft specifikke lncRNAs, niveauet af der var også signifikant forskellige i kliniske funktion sammenligninger (P 0,001, tabel 2). Fem lncRNAs (LINC01554, LOC255167, A1BG-AS1, LINC00526, og MIR22HG) blev udtrykkes forskelligt i tre eller fire kliniske funktion sammenligninger.

Denne tabel viste 41 kræft specifik lncRNA som også blev udtrykkes forskelligt i kliniske funktion sammenligninger.

Efterfølgende at identificere de potentielle lncRNAs med prognostiske karakteristika, blev niveauerne af 177 lncRNAs i TCGA datasæt blev profileret ved hjælp af den univariate Cox proportionel risiko regressions model og seks lncRNAs sig at være signifikant associeret med samlet overlevelse (log-rank P 0,05). Blandt de seks betydende lncRNAs, tre lncRNA (CECR7, LINC00346, og MAPKAPK5-AS1) var negativt associeret med OS, mens de resterende tre (LOC338651, FLJ90757, og LOC283663) var positivt korreleret med OS (figur 1).

(Vandret akse: samlet overlevelsestid: dage, Lodret akse: overlevelse funktion).

miRNA målrette lncRNAs forudsagt af miRcode og starbase

Vores tidligere undersøgelse har fundet 207 HCC- tilknyttede miRNA som differentielt blev udtrykt mellem HCC væv og tilstødende ikke-tumorvæv [21]. Vi valgte 33 miRNA fra 207 HCC-associerede miRNA i nuværende TCGA datasæt (absolut fold ændring ≥ 3,0, P 0,001, S2 tabel). Her har vi fokuseret på, hvorvidt disse miRNA vil målrette over 28 kræft specifikke lncRNAs. I Cerna netværket, miRNA interagere med lncRNAs gennem MREs, vi dermed søgt efter de potentielle MREs i lncRNAs hjælp miRcode [22] og starbase v2.0 [23]. Resultaterne viste, at 17 ud af 33 kræft specifikke miRNA kan interagere med 15 af 28 cancerpatienter specifikke lncRNAs (tabel 3).

MIR-199A-1 og MIR-199A-2 var betragter som en enkelt miRNA i vores undersøgelse

miRNA mål forudsagt af miRTarBase

at etablere lncRNA-miRNA-mRNA-netværk (Cerna netværk), det næste skridt var at søge efter mRNA ramt af miRNA. Baseret på de miRNA, der er beskrevet i tabel 3, vi søgte miRNA-målrettede mRNA med eksperimentelle beviser ved hjælp miRTarBase [24]. Resultaterne identificeret 17 miRNA herunder MIR-10B, MIR-135A-1, MIR-139, MIR-182, MIR-183, MIR-184, MIR-195, MIR-199A-1/2, MIR-214, miR- 33B, miR-34C, miR-375, miR-376c, miR-383, miR-424, miR-93, og miR-96 (tabel 4). Hver miRNA-mRNA parret blev eksperimentelt valideret af mindst to af følgende metoder, herunder reporter assay, western blot, qPCR, microarray, pSILAC (pulserende stabil isotop mærkning med aminosyrer i cellekultur) eller NGS (CLIP-seq eller Degradome-seq ). Ifølge allOnco database (https://www.bushmanlab.org/links/genelists), de fleste af deres mål er cancer-associerede gener såsom SIRT1, VEGFA, RASA1, RAF1, PTEN, MAPK9, MAPK8, MAPK1, MYC, MYB, KRAS, JAK2, IGF1R, IDH2, FOXO3, FOXO1, E2F3, E2F1, MAPK14, CDKN2A, CDKN1A, CDK6, CD44, CCNF, CCNE1, CCND3, CCND2, RUNX2, BCL2, CCND1, APC, AKT2, Akt1, ABCA1, etc.

Cerna netværk konstruktion og KEEG pathway analyse

Baseret på ovennævnte data (tabel 3 og 4), vi bygget en lncRNA-miRNA-mRNA Cerna netværk. For at få mere robuste resultater, brugte vi den maksimale information koefficient (MIC) algoritme til at screene de par-wised relationer baseret på ekspressionsniveauerne af den lncRNA, miRNA, og mRNA i TCGA datasæt (MIC 0,15 og MIC-p

2 0,15, se Methods). 14 lncRNAs og 17 miRNA var involveret i den foreslåede Cerna netværket (figur 2).

For at forstå de signalveje, der er involveret i Cerna netværk, mRNA’erne blev analyseret af DAVID database. Ifølge antal gener, der er involveret, vi listet de øverste 15 Kegg veje i vores undersøgelse (tabel 5). Ti cancerrelaterede pathways herunder veje i cancer, pancreascancer, melanom, prostatacancer, kronisk myeloid leukæmi, kolorektal cancer, gliom, småcellet lungecancer, blærecancer, og ikke-småcellet lungecancer, blev beriget med mRNA’er, et andet 5 ikke-kræftrelaterede veje såsom MAPK signalvejen, fokal vedhæftning, cellecyklus, neurotrophin signalvejen, T-celle receptor signalvejen blev også beriget.

P-værdi blev korrigeret for flere hypotese test ved hjælp af Benjamini- Hochberg metode (se også S3 Table)

diskussion

for nylig har lncRNAs blevet dukket op som rigelige regulatorer af celle fysiologi i HCC og deres funktioner kan variere [25, 26] . Kun få undersøgelser har forsøgt at afsløre lncRNA udtryk profiler i HCC ved microarray med snesevis af eller endnu mindre stikprøvestørrelse [13]. LncRNA og mRNA coekspression netværket blev bygget af unormalt udtrykte lncRNA og mRNA [13]. Enkelte studier beskrevne interaktioner mellem miRNA og lncRNAs [27, 28] eller mRNA og lncRNA [29] i HCC, hvis resultater viste, at lncRNAs kan fungere som en del af Cerna netværk, men sådan Cerna netværk er stadig dårligt udforsket. I den foreliggende undersøgelse, vi identificeret tumor-specifikke lncRNAs i HCC og undersøgte deres fordelinger i forskellige kliniske funktioner og deres foreninger med samlet overlevelse på grundlag af genom-dækkende RNA profiler af 372 HCC væv og 48 tilstødende ikke-tumor levervæv. Derudover har vi konstrueret en Cerna netværk med kræft specifikke lncRNAs og miRNA som giver et system biologiske synspunkter lncRNA-miRNA-mRNA interaktioner.

Baseret på de næste generation af RNA-sekvens data fra TCGA og GEO, fandt vi, at 177 cancer specifikke lncRNAs blev differentielt udtrykt i HCC tumorvæv og tilstødende ikke-tumor levervæv. Derefter viste vi, at 41 kræftpatienter specifikke lncRNAs også var unormalt udtrykt i forskellige grupper af kliniske patologiske funktioner såsom køn, race, tumor kvalitet, AJCC TNM, AJCC patologisk stadium, vaskulær invasion, ny tumor begivenhed, tumor status og alder ved diagnose. Blandt de lncRNAs der differentielt udtrykte i tre eller fire grupper, blev MIR22HG rapporteret at være en indikator for kemiske stressreaktioner i menneskeskabte pluripotente stamceller [30]. Vi konkluderede, at ekspressionen af ​​visse lncRNAs ikke er ligeligt fordelt i visse situationer. Fremtidige undersøgelser på dette område bør være korrekt udformet til at klare denne kendsgerning. Tidligere undersøgelser rapporterede seksuelle ulighed af HCC forekomst [31], det differentielt udtrykte lncRNA mellem kvindelige og mandlige findes i denne undersøgelse kan bidrage til dette fænomen. Men disse ujævnt fordelt lncRNAs muligvis ikke signifikant associeret med samlede overlevelse.

Med hensyn til sammenhængen mellem kræft specifikke lncRNAs og patienternes overlevelse, fandt vi, at seks lncRNAs var relateret til HCC samlede overlevelse. Blandt de tre risikable lncRNAs, CECR7 er en kandidat lncRNA for Cat Eye Syndrom [32]. Funktionen af ​​de to andre risikabelt og tre beskyttende nye lncRNAs er stadig uklart. Det skal også bemærkes, at fem af disse seks lncRNAs (CECR7, LINC00346, LOC338651, FLJ90757, og LOC283663) ikke udtrykkes forskelligt i enhver klinisk funktion sammenligning. Derfor kan lncRNAs der ikke forskelligt udtrykker i kliniske funktion sammenligninger være korreleret med total overlevelse, mens lncRNAs der forskelligt udtrykker i kliniske funktion sammenligninger ikke kan være nødvendigt at være forbundet med den samlede overlevelse.

Vi mener, at der kan være nogle cross-samtaler mellem lncRNA, miRNA og mRNA i forløbet af HCC. Vi anvendes flere skridt til at øge nøjagtigheden af ​​Cerna netværk forudsigelse. Først vi kun medtaget kræft specifikke lncRNAs og miRNA, der havde en absolut fold ændring ≥ 3,0 og blev kommenteret af GENCODE. For det andet blev forholdet mellem lncRNA og miRNA, og miRNA og mRNA forudsagt af eksperimentemner understøttede algoritmer eller databaser såsom miRcode, starbase og miRTarBase. Disse to målinger sikret, at de relationer, identificerede ville ske ikke alene

i silico

situationer, men også af eksperimentelle-støttede beviser.

For yderligere at forbedre effektiviteten af ​​vores forudsigelse, den maksimale information koefficient (MIC ) algoritme og maksimal parametrisk udforskning mine) statistik (information-baserede blev brugt til at filtrere par-wised relationer baseret på lncRNA-miRNA-mRNA ekspression sammenhænge. Generelt gen co-ekspression netværk analyse, Pearsons korrelation er et mål for lineær regression, men det er meget følsomt over for outliers. MIC og MINE er i stand til at undersøge og karakterisere alle potentielt interessante relationer i en kompleks datasæt [33].

Cerna netværk vi byggede bringer lys en ukendt Cerna regulatoriske netværk i HCC. I denne nyligt identificerede Cerna netværk, mange onkogener og tumor suppressorer deltager i HCC udvikling og behandlinger. En nylig undersøgelse viste også, at lncRNA-miRNA-mRNA interaktioner var aktive og kan virke som potentielle prognostiske biomarkører i kræft [34].

Som konklusion, vores undersøgelse har fundet kræft specifikke lncRNAs i HCC bruger hundredvis af kandidat lncRNAs og målestok prøver store, og oplyses unormal udtryk mønster af kræft specifikke lncRNAs under forskellige kliniske funktioner. Vigtigere, har vi konstrueret en Cerna netværk til at foreslå en ny tilgang til lncRNA forskning i HCC. Vores resultater tyder på, at kræft specifikke lncRNAs i HCC kan deltage i et komplekst Cerna netværk.

Støtte Information

S1 Table. 177 og 37 differentielt udtrykte lncRNAs mellem HCC væv og tilstødende ikke-tumorvæv i TCGA datasæt og GEO datasæt

doi:. 10,1371 /journal.pone.0141042.s001

(XLS)

S2 tabel. 33 HCC-associerede miRNA mellem HCC væv og tilstødende ikke-tumorvæv i TCGA datasæt

doi:. 10,1371 /journal.pone.0141042.s002

(XLS)

S3 Table. Alle KEEG veje beriget af de kodende gener involveret i Cerna netværk (P 0,05)

doi: 10,1371 /journal.pone.0141042.s003

(XLS)

Tak

Vi takker Mr. Rocky Ho for deres tekniske assistance. Resultaterne er offentliggjort eller vist her, er helt eller delvist baseret på data genereret af TCGA Research Network: https://cancergenome.nih.gov/. Denne undersøgelse blev støttet af SRFDP og RGC ERG Fælles Forskningscenter (Nej: M-CUHK406 /13). Og National Natural Science Foundation of China (No.81472339)

Be the first to comment

Leave a Reply