Abstrakt
Baggrund
Identifikation af gener, der er kausalt impliceret i onkogenese er et vigtigt mål i kræftforskning. Det anslås 10-20% af cancerrelateret gen mutationer resulterer i spring af en eller flere exoner i det kodede transkripter. Her rapporterer vi om en strategi til at screene i en global mode for sådanne exon-skipping begivenheder ved hjælp mønster baseret Korrelation (PAC). PAC-algoritmen har tidligere været anvendt til at identificere differentielt udtrykte splejsningsvarianter mellem to på forhånd definerede undergrupper. Som genetiske ændringer i kræft er prøve specifikke, vi testede evne PAC til at identificere afvigende udtrykt exons i enkelte prøver.
vigtigste resultater
Som en proof-of-principle, testede vi PAC strategi for menneskelige kræft prøver, hvoraf den komplette kodende sekvens af otte cancer gener var blevet screenet for mutationer. PAC opdaget alle syv exon-skipping mutanter blandt 12 cancer cellelinjer. PAC identificerede også exon-skipping mutanter i kliniske kræft prøver selvom detektion blev kompromitteret på grund af heterogene (vildtype) udskrift udtryk. PAC reduceret antallet af kandidatgener /exons til efterfølgende mutationsanalyse af to til tre størrelsesordener og havde en betydelig sand positiv sats. Vigtigere er det, af 112 tilfældigt udvalgte outlier exons, sekvensanalyse identificeret to nye exon skipping begivenheder, to nye base-ændringer og 21 tidligere rapporterede baseændringer (SNPs).
Konklusioner
evne PAC til berige for muterede udskrifter og identificere kendte og nye genetiske ændringer bekræfter dens egnethed som en strategi til at identificere kandidat cancer gener
Henvisning:. Schutte M, Elstrodt F, Bralten LBC, Nagel RIA Duijm E, Hollestelle a, et al. (2008) Exon Expression Arrays som et værktøj til at identificere nye Cancer Genes. PLoS ONE 3 (8): e3007. doi: 10,1371 /journal.pone.0003007
Redaktør: Christopher Arendt, Sanofi-Aventis, USA
Modtaget: 10 juni, 2008; Accepteret: 31 Jul 2008; Udgivet: 20 August, 2008
Copyright: © 2008 Schutte et al. Dette er en åben adgang artiklen distribueres under betingelserne i Creative Commons Attribution License, som tillader ubegrænset brug, distribution og reproduktion i ethvert medie, forudsat den oprindelige forfatter og kilde krediteres
Finansiering:. Dette arbejde blev støttet af Susan G. Komen Breast Cancer Foundation (BCTR0601309), den hollandske Cancer Society Koningin Wilhelmina Fonds, DDHK 2002-2687 og Erasmus MC Mrace 2005.
konkurrerende interesser: forfatterne har erklæret, at der ikke konkurrerende interesser eksisterer.
Introduktion
Kræft er drevet af mutationer i gener, der styrer spredning af celler, de kan overleve og deres integritet. Skærme til formål at identificere sådanne cancer-gener bruger ofte kromosomal placering og /eller funktionelle egenskaber for at udvælge kandidater gener til efterfølgende mutation analyse [1] – [4]. Selv om der er identificeret mange kandidat kræft gen loci, den arbejdskrævende mutation analyse alvorligt hæmmer finde den tilsvarende kræft genet. Andre gen søgestrategier har fokuseret på afvigende genekspressionsmønstre at identificere kandidater. For eksempel blev gen-mutanter, der resulterer i præmature termineringskodoner identificeret ved screening for gener, der specifikt er udtrykt følgende kemiske inhibering af nonsens-medieret RNA henfald [5]. Endvidere blev fusionsgener i prostatacancer identificeres ved screening for outliers i en stor gruppe af gen-udtryk profiler [6].
human cancer genmutationer ofte resultatet i skipping af en eller flere exoner fra de kodede transkripter [7] – [9]. Exon-spring mutationer kan være forårsaget af nukleotidsubstitutioner inden konsensus splejsningssteder eller ved deletioner, der spænder hele exoner. Derudover kan exon-skipping mutationer være forårsaget af relativt små intrageniske insertioner, deletioner eller duplikationer. Selvom exon-skipping mutationer repræsenterer en anslået 10-20% af alle kræftrelaterede genmutationer [4], [9] – [12], har ingen high throughput metode været til rådighed til screening for sådanne mutationer. Her beskriver vi Mønster Based Korrelation (PAC) som en tilgang til at identificere kandidat cancer gener ved screening for exon-skipping begivenheder i en global mode. Detaljeret mutationsanalyse derefter kun begrænses til PAC-identificerede outlier exons. Som en proof-of-principle, demonstrerer vi effekten af PAC strategi for tidligere identificerede exon-skipping mutationer i brystcancercellelinier og i kliniske hjerne tumor prøver. Vi viser også, at AKP kan identificere roman exon springe arrangementer med underliggende genetiske ændringer i kendte cancer gener og i tilfældigt udvalgte PAC-identificerede outlier exons.
Resultater
Outlier exon identifikation ved Mønster Baseret Korrelation (PAC)
i denne undersøgelse har vi udviklet en ny metode til at screene exon-skipping begivenheder i humane cancer prøver. Fordi mutationer i cancer ofte er meget heterogene med hensyn til deres intragenisk sted, individuelle tumorer udtrykker ofte unikke RNA-arter. Screening for mutationer, der resulterer i at springe af en eller flere exoner i det kodede transkript kræver derfor screening for unikke, exon-sprunget, transkripter inden for en specifik prøve kohorte. Kort fortalt exon-niveau ekspressionsprofiler dannet ved anvendelse Affymetrix Menneskelige Exon arrays, der bestemmer ekspressionsniveauet af næsten alle exoner til stede i det humane genom. Mønstret baseret Korrelation (PAC) algoritme anvendes derefter til at beregne den forudsagte ekspressionsniveauet af hver exon (eller probe-sæt). Vi derefter identificere afvigende exoner ved at trække den forudsagte ekspressionsniveauet af exoner fra deres målte ekspressionsniveau, med værdier svarende nul, når den målte ekspressionsniveauet af et exon svarede til dets forudsagte ekspressionsniveau (formuleret i detaljer under Methods). PAC-algoritmen er blevet anvendt til at identificere differentiel splejsning mellem foruddefinerede grupper [13]. I denne undersøgelse har vi testet PAC algoritmen for sin evne til at identificere udtrykkes afvigende exoner i enkelte prøver af en veldefineret kohorte af cellelinier eller tumorer. PAC effektivt normaliserer variabiliteten i genekspression niveauer mellem prøver og, i en enkelt prøve, normaliserer variabiliteten i signalintensitet mellem probesæt af samme transkript (fig. 1).
(A) Normaliserede udtryk data af alle exons i
PTEN
gen. Hver exon probe sæt er repræsenteret ved en prik i den fuldt optrukne linie; flere probesæt kan rettes mod den samme exon. (B) PAC normaliserer variabiliteten i genekspression niveauer mellem prøver og, i en enkelt prøve, variabiliteten i signalintensitet mellem probesæt af samme transkript. PAC beregning tillader derfor hurtig påvisning af spring af
PTEN
exon 4 i brystcancer-cellelinie MDA-MB-468 på grund af en
PTEN
c.253 + 1G T splejsningsstedmutation at vi tidligere havde identificeret [17].
PAC registrerer exon-skipping begivenheder i brystcancercellelinier
Vi testede gennemførligheden af PAC strategi for et panel af 12 humane brystcancer celle linjer, der var blevet screenet for mutationer i syv tumorsuppressorgener:
BRCA1
,
CDH1
,
MAP2K4
,
PTEN
,
p16
,
p53
RB1
[14] – [18], og upublicerede resultater). Mutation analyse blev udført ved sekventering af den komplette kodende sekvenser af gener og analyse af alle mutationer på begge genomiske genfragmenter og udskrifter. Sammen de 12 cellelinier indeholdt syv gen mutanter, der bør være detekterbar ved PAC, da de resulterede i skipping otte exoner blandt fire tumorsuppressorgener (mutationer er beskrevet i tabel 1). Vi har udforsket PAC strategi ved forskellige cut-off niveauer, identificere afvigende exoner, der blev givet udtryk for mindre end 16 gange, 8-fold, 4 gange, 2,8-fold og 2,5-fold end deres forudsete udtryk niveau (dvs. PAC værdier -4,0, -3,0, -2,0, -1,5 og -1,3 henholdsvis). Outlier exons blev identificeret uden forudgående kendskab til mutation data.
Fra i alt 3,4 millioner centrale probe sæt, vi analyseret for de 12 cellelinjer (290.000 core probe sæt per prøve), PAC identificeret 21.151 (0,6%) outlier probe sæt på PAC værdi -4,0 og 94.590 (2,8%) outlier probe sæt på PAC værdi -1,3 (fig. 2A). Alle probe sæt på PAC værdier -2.0 (34.137 probe sæt svarende til 31,357 exons og 10,247 gener) er opført i supplerende data tabel S1. Når alle PAC-værdier er plottet i en frekvens histogram, observeres en hale mod negative ende (fig. 2A). Denne skæve fordeling giver et groft skøn af den falske positive sats på de forskellige PAC niveauer. PAC af de syv fuldt karakteriseret tumorsuppressorgener i de 12 cellelinier involverede analyse af 1.200 exoner (1.752 probesæt). PAC korrekt detekteret seks af de otte springes exoner ved brug PAC værdi -4.0, syv sprunget blev påvist exoner ved PAC værdi -2.0 og alle otte sprunget exoner blev påvist på PAC-værdi -1,3 (fig. 2C). Vigtigt er det, blev antallet af falsk positive outlier exons væsentligt reduceret ved PAC værdi -4,0 i forhold til PAC værdi -1,3, hvilket resulterer i en forøgelse af den sande positive sats fra 9% til 24% af de identificerede afvigende exons (fig. 2D) . Til sammenligning, stikprøvekontrol af 24/1200 exoner har en 85% sandsynlighed for ikke at finde nogen sand positiv mutation og kun et 10
-8 chance for at finde 6 eller mere. For de kendte cancer-gener, der anvendes i vores undersøgelse, den sande positive rate af vores tilgang dermed langt overstiger tilfældig exon udvælgelse. I denne henseende kan en reduktion af antallet af falsk positive kandidatgener i første omgang være langt mere fordelagtigt for et gen søgning projekt end præcis identifikation af alle sande positive outlier exons. Sammen vores resultater viser, at PAC strategi er pålidelig i at opdage exon-skipping mutanter i kræftceller.
(A) og (B) Samlet antal PAC-detekteret outlier probe sæt blandt 290.000 centrale probe sæt i 12 brystcancercellelinier og i 14 glioblastomer henholdsvis. (C) Antal sprunget exoner detekteret af PAC som en procentdel af alle otte sprunget exoner til stede i brystcancer-cellelinier, eller som en procentdel af den 36 springes
EGFR
exoner til stede i glioblastomer (se tabel 1 ). (D) Antal afvigende exons (sande plus falske positiver) og antallet af sande positive outlier exoner opdaget af PAC blandt de syv tumorsuppressorgener og
EGFR
onkogen. Ægte positive outlier exons omfatter alle PAC opdaget oversprungne exons og to missense mutationer (
PTEN
c.274G C i CAMA1,
MAP2K4
c.551C G i MDA-MB-134VI).
PAC præstation i prøver med heterogen udskrift udtryk
i lighed med andre genetiske screeningsmetoder, PAC er mest velegnet til at detektere homozygote genetiske ændringer. For eksempel er den laveste PAC værdi, når 50% vildtype-transkripter er til stede (som kan være tilfældet for en heterozygot genetisk ændring) er -1.0. Den noget kompromitteret påvisning af sprunget exons på PAC værdi -4,0 i forhold til PAC-værdi -1,3 (dvs. seks vs. alle otte sprunget exons) i vores panel af brystkræft cellelinier derfor kan have været forårsaget af ekspressionen af en anden afvigende udskrift der stadig indeholder (en del af) exon. Faktisk en anden
CDH1
transkript længde af mindre intensitet blev detekteret i CAMA-1 (fig. 3A), splejsningsstedet mutant, der var blevet detekteret kun på PAC værdi -1,3.
Skipping af
CDH1
exon 11 i brystcancercellelinie CAMA-1 kun blev påvist ved PAC værdi -1,3, sandsynligvis på grund af ekspression af et andet afvigende transkript variant (*), som blev påvist ved konventionel RT-PCR. (B) Angivelse af
EGFR
udskrifter blev påvist i glioblastom prøver ved Real-Time RT-PCR, ved hjælp af primere designet til at anneale inde i exon 2-7 sletning region af
EGFRvIII
isoform ( grå søjler) eller uden for sletning regionen (sorte søjler). Forskelle i Ct-værdier mellem de to udskrift fragmenter er vejledende for
EGFRvlll
isoform ekspressionsniveauerne. Alle fem prøver med
EGFRvIII
isoform udtrykte også betydelige mængder af vildtype
EGFR
udskrifter, sandsynligvis kompromitterende outlier påvisning af PAC (angivet med “opdaget” og “ikke fundet”). Wild-type, prøver med normale udskrifter; Controls, ikke-maligne hjerne prøver.
Til yderligere æsler udførelsen af AKP i prøver med heterogen (vildtype og mutant) udskrift udtryk, vi udførte PAC på 14 kliniske glioblastom prøver (valgt til at indeholde 70% tumor kerner), der havde genomiske amplifikationer af
EGFR
onkogen. Glioblastomer med
EGFR
amplifikationer ofte bære en intragenisk sletning af exons 2 til 7, hvilket resulterer i ekspression af det konstitutivt aktive
EGFRvIII
isoform [8], [19]. Men glioblastomer udtrykker det
EGFRvIII
isoform også ofte udtrykker vildtype
EGFR
udskrifter. Denne heterogene
EGFR
udtryk er relateret til forstærkning af
EGFR
locus forud for sletning af exons [20], selv om ikke-maligne celler i glioblastom prøver også kan udtrykke
EGFR
. Af de fjorten glioblastom prøver anvendt i denne undersøgelse, seks udtrykt
EGFRvIII
(i alt 36 sprunget exons), hvoraf fem udtrykte også betydelige niveauer af vildtype
EGFR
afskrifter, som bestemt ved kvantitativ real-Time PCR (qPCR) (fig. 3B) (utilstrækkelig RNA tilbage af den sjette prøve med
EGFRvIII
udtryk til at udføre qPCR).
fra i alt 4,1 millioner core probe sæt, der vi analyseret for disse 14 prøver (290.000 core probe sæt per prøve), identificerede PAC 1646 (0,04%) outlier probe sæt på PAC værdi -4,0 og 39.936 (1,0%) outlier probe sæt på PAC værdi -1,3 (fig. 2B). PAC identificeret således tre til ti gange mindre outlier exons i glioblastomer sammenlignet med brystkræft cellelinier (Fig. 2A). Alle probe sæt på PAC værdier -2.0 (11.287 probe sæt, svarende til 10.903 exons og 6.264 gener) er opført i supplerende data tabel S1. Denne mindre antal afvigende exoner i glioblastomer kan være relateret til deres homogene histopatologi og deres yderst lignende genekspressionsprofiler [13], [21], til tilstedeværelsen af ikke-neoplastiske celler i tumorprøverne, eller kan afspejle prøveudtagning bias grundet til små kohorte størrelser.
PAC af
EGFR
gen i de 14 glioblastomer involverede analyse af 392 exons (434 probe sæt). PAC opdaget to af seks
EGFRvIII
udtrykke tumorer (12 af de 36 sprunget exons) på PAC værdier -2,0 og lavere (tabel 1 og fig. 2C). Af de to glioblastomer med
EGFRvIII Hoteller, som var blevet opdaget af PAC, en markant havde (dvs. 5 gange) mere mutant end vildtype
EGFR
udskrifter. I denne tumor, Ct-værdi forskel var 2 mellem qPCR fragmenter inde (måling kun vildtype
EGFR
transkripter) og uden for (måling både vildtype og
EGFRvlll
transkripter) den
EGFR
exon 2-7 sletning region (fig. 3B). Den anden glioblastom havde en lignende forskel udtryk plan mellem vildtype og
EGFRvlll
udskrifter (Ct-værdi forskel på ~1.5) som de tre glioblastomer der ikke var blevet opdaget af PAC, men havde lavere samlet
EGFR Salg transcript niveauer. Det fremgår, at AKP påvisning af
EGFRvIII
isoform er bestemt af det samlede udtryk på
EGFR
udskrifter i kombination med forholdet
EGFRvIII
vildtype
EGFR
udskrifter, hvor prøver med for højt
EGFR
transkriptniveauer kan undslippe PAC detektion på grund af mætning af sonden sæt involverede. Disse resultater viser, at PAC-strategien kan detektere exon-skipping mutanter i kliniske cancer prøver, hvis forholdet mutant /vild-type-transkript er højt, og når probesæt er inden for det lineære detekteringsområdet af mikroarrayet.
PAC præstation i detektering af tilbagevendende outlier exoner
PAC ydeevne kan også udfordret af tilbagevendende outlier exons. Sådanne ofte springes exons vil resultere i en undervurdering af exon /transkript-forhold i PAC-algoritmen og således øge PAC værdier. Vi evaluerede derfor udførelsen af AKP med at afsløre tilbagevendende outlier exoner ved gentaget erstatning af
EGFRvIII
udtrykke prøver med prøver, der udtrykte kun vildtype
EGFR
(fig. 4A). Når seks af 14 prøver udtrykker
EGFRvIII
, sletning af exons 2-7 i GBM67 ikke opdaget af PAC. PAC-værdier faktisk faldt med faldende forhold af vildtype versus mutant prøver. Imidlertid faldet var relativt lille og resulterede i identifikationen af en enkelt af de seks slettede exoner når forholdet var faldet til en mutant prøve blandt 14 prøver. Vi simulerede også PAC påvisning af tilbagevendende mutationer med to brystcancercellelinier, hvoraf HCC1937 havde sprunget
RB1
exon 22, og vi var allerede i stand til at identificere mutant blandt to prøver op til endnu fem mutanter fra blandt seks prøver (fig. 4B). Disse simulering forsøg viser, at AKP fungerer godt i at identificere tilbagevendende exon-skipping mutationer.
(A) Simulation eksperiment for at bestemme AKP præstation i detektering af tilbagevendende exon-skipping begivenheder blandt kliniske glioblastom prøver, hvor mutant prøver udtrykker
EGFRvIII
isoform med sletning af exon 2 til 7. Den kohorte af 14 glioblastomer omfattede seks mutant prøver, der blev erstattet af prøver vildtype gennem gentagelse, baseret på deres position fra venstre til højre i fig. 3B. Sletning af
EGFR
exon 6 i prøve GBM67 blev opdaget kun som unik mutant prøve. (B) Simulation eksperiment for at bestemme PAC resultater i påvisning tilbagevendende exon-skipping begivenheder blandt brystkræft cellelinier under anvendelse af vildtype-cellelinje CAMA-1 og
RB1
exon 22 deletionsmutant HCC1937. De to cellelinier blev analyseret under forskellige kohorte størrelser, med enten vildtype eller mutant cellelinie som enkelt prøve. Mutanten prøve blev stadig detekteret ved PAC værdi -2.0 med fem tilbagevendende mutanter blandt seks prøver. Det gennemsnitlige ekspressionsniveau
RB1
exon 22 faldt til under PLIER 50, når mere end fem mutanter blev simuleret, hinder PAC analyse (se Materialer og fremgangsmåder).
Påvisning af nukleotidsubstitutioner og nye genetiske ændringer ved PAC
udførelsen af PAC blev yderligere vurderet ved analyse af afvigende exons udvalgt blandt alle kandidater på PAC værdi ≤-2,0 i brystcancercellelinier og kliniske glioblastom prøver. I alt blev 44 og 68 outlier exons screenet i brystcancercellelinier og glioblastom prøver hhv. Sekvensanalyse af PCR amplificeret afvigende exoner identificeret to hidtil ukendte exon skipping events og to hidtil ukendte genetiske baseændringer i glioblastom prøver, samt en række af tidligere konstaterede baseændringer (homozygot SNP’er) i brystcancer-cellelinier (n = 5) og glioblastomer ( n = 16). RT-PCR-eksperiment resultater er beskrevet i supplerende data Tabel S2.
De fleste af genetiske ændringer identificeret af PAC var enlige nucleotidændringer, både i brystkræft cellelinier (fem kendte SNP’er) og i glioblastomer (to roman bund ændringer og 16 kendte SNP’er). Desuden to ud af ti tidligere identificerede onkogene punktmutationer, som ikke resulterede i exon springer hændelser blev også AKP påvist i vores kohorte af brystkræft cellelinier:
MAP2K4
c.551C G i MDA-MB-134VI og
PTEN
c.274G C i CAMA-1; [16], [17] (fig. 5). Single nucleotide mismatches er blevet anvendt til at definere hybridiseringsspecificitet på andre Affymetrix microarray platforme. Analogt kan enkelt nukleotidsubstitutioner i kræft også forårsage reduceret hybridisering til sonderne på microarray og således blive detekteret som outlier exons fra PAC. Faktisk alle PAC detekterede baseændringer og SNP’er var centralt lokaliseret i proben indstilles udvælgelse region og overlapper flere af sine individuelle prober (fig. 5).
(A) PAC forudsiger springer af 5′ ende af
PTEN
exon 5 i CAMA-1 brystcancer cellelinje. Denne cellelinje indeholder et nukleotid substitution inden den identificerede exon. Denne base ændring ikke inducerer exon springe men er centralt beliggende inden for alle tre sonder af sondens sæt (B). Den centrale beliggenhed foreslår denne mutation forårsager en reduceret affinitet til proberne på exon-array.
En af PAC identificerede hidtil ukendte exon skipping begivenheder var forudsagt til at resultere i en deletion af de fire 3′-enden exons af
EGFR
(fig. 6A). Denne exon-skipping begivenhed skyldtes en genomisk deletion som bestemt ved anvendelse semikvantitativ PCR på genomisk tumor-DNA. Sammenlignet med 5′-enden af
EGFR
locus i GBM157, 3’viste ende mindre forstærkning (ACt -2.5) mens andre prøver viste lige amplifikation mellem 5′- og 3′-enden af genet (ACt 0,3 ± 1,9). Tilsvarende 3 ‘deletioner i
EGFR
tidligere er blevet observeret i gliomer [19]. Det andet exon-skipping begivenhed forudsagt af PAC ville resultere i en deletion af exon 30 i
FCGBP
cDNA (fig. 6B). Denne deletion vil forårsage et rammeskift, der forudsiges at resultere i et trunkeret protein. Fraværet af exon 30 blev bekræftet ved RT-PCR og sekvensanalyse (fig. 6C). Nye identificerede enkeltstoffer baseændringer omfatter en enkelt baseændring 1934C G (S645C) i
EGFR
gen, (Fig 6A og D.), Og en enkelt baseændring 946G A (G316R) i
TLE2
genet (fig. 6E). Den G316R (946G A) mutation i
TLE2
gengives “patologisk” af PMUT (mmb2.pcb.ub.es:8080/PMut/) og “ikke tolereres” af SIFT Blink (blocks.fhcrc. org /finkæmme /SIFT_BLink_submit.html). Sammenfattende det hidtil ukendte exon skipping begivenheder og baseændringer identificeret ved analyse af et udvalgt sæt af afvigende exoner bekræfter egnetheden af PAC til at identificere kandidat cancer-gener.
(A) PAC påvisning af hidtil ukendte genetiske ændringer i
EGFR
. PAC forudsagt springer af de sidste fire exoner GBM157 og 5′-enden af exon 17 i GBM172. Semikvantitativ PCR på genomisk DNA bekræftede deletionen i GBM157 (ikke vist). (B) PAC forudser springe af exon 30 i
FCGBP
gen i GBM60. (C) RT-PCR bekræftede
FCGBP
exon springe begivenhed i GBM60; andre tumorer viste ikke denne exon skipping. (D) Direkte sekventering identificerede en enkelt baseændring i
EGFR
i GBM172 (som forudsagt af PAC, se fig. 6A). (E) Bekræftelse af en PAC forudsagt ændring i
TLE2
gen i GBM60. Nukleotidsubstitutionen overlapper med individuelle sonder af sonden sæt.
Diskussion
Vi har udviklet en metode, der bruger mønster baseret Korrelation (PAC) til at screene for kræft genmutationer, der forårsager exon springe i de kodede udskrifter. Vi viser, at AKP korrekt opdaget alle syv tidligere identificerede exon-skipping mutanter i brystcancer-cellelinjer og to af seks mutanter i kliniske glioblastom prøver. De sande og falske positive blev bestemt på forskellige stringens. Vigtigere er det, PAC identificeret en række nye genetiske ændringer, herunder dem, der påvirker splejsning, der tidligere havde gået uopdaget. Disse nye genetiske ændringer er enten i kendte cancer gener (
EGFR
), resulterer i et rammeskift (
FCGBP
) eller gengives “tolereres ikke” af gen-forudsigelse algoritmer PMUT og SIFT Blink (
TLE2
). Yderligere forsøg er nødvendige for at afgøre, om ændringer i de nye kandidat cancer gener (
FCGBP
og
TLE2
) er faktisk onkogen. Et betydeligt antal af nukleotidsubstitutioner der er placeret inden sonden sæt valg region er også PAC detekteret (fig. 5). Vores resultater således klassificere AKP som en pålidelig metode til at screene for kandidat cancer gener i en global mode.
Genekspression profilering på de enkelte exoner er først for nylig blevet muligt gennem frigivelse af exon arrays. Her, har vi undersøgt virkningen af PAC at identificere exon-skipping mutanter, men strategien kan også anvendes til at udlede den primære struktur af gentranskripter [13], [22]. Det er vigtigt at bemærke, at PAC-algoritmen, beskrevet under materialer og metoder, er i det væsentlige en simpel formel, der forudsiger outlier exoner baseret på fold ændring forskelle mellem målte og forudsagte exon ekspressionsniveauerne. Andre metoder kan også anvendes til at identificere outliers (fx n standardafvigelser fra middelværdien udtryk niveau), men har brug for at tage højde for ikke-linearitet i genekspression niveauer mellem prøverne (især for kræft gener) og den begrænsede stikprøvestørrelse. På grund af de høje sande positive rater opnået ved PAC, vi ikke yderligere undersøge alternative statistiske metoder.
PAC-algoritmen er uafhængig af vifte platform eller organisme, tillader anvendelse af PAC strategi i en bred vifte af biologiske systemer . Adskillige algoritmer til exon-niveau ekspression profilering er kommercielt tilgængelige, herunder Stratagene ArrayAssist (www.stratagene.com), Partek Genomics Suite (www.partek.com) og Genomatix Suite (www.genomatix.de). Selv om hver af disse softwarepakker er relativt ligetil, vigtige fordele ved PAC er, at den tillader påvisning af unikke outlier exoner uden forudgående kendskab til kodende gen eller dets transkript struktur, og at det ikke kræver prædefinerede undergrupper af prøver med differentiel ekspression af vildskuddet exons.
Som med enhver global screening strategi, PAC har sine forudsætninger for at opdage afvigende exons. Først og fremmest, identifikation af afvigende exoner kræver deres transkript ekspressionsniveau at være inden for det lineære detekteringsområdet af exon array, som er bestemt af deres transkript ekspressionsniveauet samt hybridisering effektivitet og specificitet probesæt involveret. Valgkredsen testprøverne er en anden overvejelse, især når begge mutant og vildtype udskrifter kan udtrykkes. For eksempel brystkræft cellelinien kohorte omfattede to splejsningssted mutanter, som undslap påvisning ved PAC fordi hver havde en anden transkript længde af stor intensitet, der førte fra kryptiske splejsning (
BRCA1
c.5396 + 1G A i MDA-MB-436 [14] og
P16
c.150 + 2T . C i MDA-MB-436 (. Nagel
et al
, indleveret til offentliggørelse) Desuden PAC afsløring af
EGFRvIII
udskrift isoform i kliniske glioblastomer blev bestemt ved det samlede udtryk niveau
EGFR
udskrifter, der var nær grænserne for lineære opdagelse i alle fem
EGFRvIII
glioblastomer , men også af forholdet mellem den
EGFRvIII
isoform versus vildtype
EGFR
udskrifter (fig. 3B). en naturlig følge er, at AKP ydeevne kan være kompromitteret i forbindelse med afsløring af en outlier exon når vilde -type udskrifter udgør mere end en fjerdedel af alle udskrifter af det pågældende gen, som kunne være tilfældet i tumor prøver med mindre end 75% neoplastiske celler. Men ekspressionsniveauerne af mutant og vildtype alleler typisk i rimeligt forhold til deres allel frekvens og påvisning ved PAC således igen bestemmes af den (relativt) ekspressionsniveauet af outlier-transkriptet. PAC udfører derfor bedst i fravær af vildtype-transkriptet ekspression. Homozygote udskrifter overvejende findes blandt tumorsuppressorgener, hvor ofte en allel er muteret ledsaget af tab af den anden allel
indflydelse allel nøgletal blev yderligere understreget i vores simuleringer af tilbagevendende outlier afsløring af PAC:. Det
EGFRvIII
isoform i GBM67 blev fundet kun én gang det var til stede som en unik outlier blandt 14 prøver, mens det ikke var blevet opdaget i vores oprindelige PAC skærm, der omfattede fem andre
EGFRvIII
udtrykke glioblastomer (fig . 4A). Men syntes denne sub optimale PAC ydeevne ikke er relateret til en gentagelse af outliers, som tilbagevendende outliers let blev identificeret blandt cellelinjer – selv når de findes i fem ud af seks cellelinjer (Fig 4B.). Simuleringen eksperimenter viste også, at to cellelinjer var tilstrækkelige til pålideligt at detektere afvigende exoner og at mere end otte cellelinjer ikke yderligere at forbedre PAC ydeevne, mens der for kliniske tumorprøver ti banke den minimale, men tyve ville være foretrukket (fig. 4).
Hvor effektiv kan PAC være i detektion af mutationer i kræft genomer? Fra vores udvalg af afvigende exons, identificerede vi -20% (21/112) SNPs, ca. 2% (2/112) roman baseændringer og ca. 2% (2/112) exon springer begivenheder. Når herunder alle nucleotidsubstitutioner, den falske positiver i disse eksperimenter er ~76%. I forlængelse heraf amplifikation og sekventering 1.763 reaktioner på en enkelt prøve (alle outliers i PAC-værdier -4.0) kan forventes at give så meget som 34 hidtil ukendte baseændringer og 34 exon skipping begivenheder. Derfor kan vores tilgang blive klassificeret som en meget effektiv screeningsmetode til kandidat cancer gener, især sammenlignet med tilfældig udvælgelse af exons. Yderligere undersøgelser bør derefter udføres for at bestemme, om identificerede ændringer er kausal for tumordannelse og /eller progression, for eksempel ved screening for yderligere mutationer (f.eks deletioner missense mutationer) i andre tumorprøver eller ved funktionel analyse af de identificerede mutanter.
Materialer og metoder
prøver
Vores samling af 41 offentligt tilgængelige humane brystcancercellelinier havde været udsat for mutationsmønstre skærme på syv tumorsuppressorgener:
BRCA1
(Breast Cancer modtagelighed Gene 1, OMIM 113.705),
CDH1
(E-cadherin, OMIM 192.090),
MAP2K4
(MAP kinase kinase 4, alias
MKK4
; OMIM 601.335),
PTEN
(Phosphatase og Tensin Homolog, OMIM 601.728),
p16
(CDK4-inhibitor, alias
INK4a
,
CDKN2A
; OMIM 600.160),
p53
(Tumor Protein p53, OMIM 191.170) og
RB1
(retinoblastom modtagelighed Gene 1, OMIM 180.200) [14] – [18] (Nagel
et al.
indsendt til publikation). Mutationsanalyse involverede sekventering af hele den kodende region af disse gener på genomisk DNA samt analyse af det kodede transkript. De tolv brystkræft cellelinier blev anvendt til denne undersøgelse var: CAMA-1, EVSA-T, HCC1937, MDA-MB-134VI, MDA-MB-157, MDA-MB-435s, MDA-MB-436, MDA-MB- 453, MDA-MB-468, MPE600, OCUB-F og SK-BR-5. Kliniske glioblastom prøver blev frosset i flydende nitrogen umiddelbart efter kirurgisk resektion fra patienter på Erasmus University Medical Center, som beskrevet andetsteds [13]. Patologisk gennemgang afslørede mindst 70% tumor kerner for hver prøve. Mutation analyse af
EGFR
onkogen (epidermal vækstfaktor receptor, OMIM 131.550) i glioblastomer blev udført ved konventionel RT-PCR og efterfølgende sekventering af udskrifter fra prøver med
EGFR
amplifikationer.
Leave a Reply
Du skal være logget ind for at skrive en kommentar.