PLoS ONE: Genome Wide Identifikation af Recessive Cancer Gener af kombinatoriske Mutation Analyse

Abstrakte

Vi udtænkt en ny procedure for at identificere humane cancer gener, der handler i en recessiv måde. Vores strategi var at kombinere bidragene fra de forskellige typer af genetiske ændringer til tab af funktion: amino-syre udskiftninger, frame-skift, gen sletninger. Vi studerede over 20.000 gener i 3 Gigabases af kodende sekvenser og 700 array-komparative genomiske hybridiseringer. Recessive gener blev scoret efter nukleotid uoverensstemmelser under positivt selektivt pres, frame-skift og genomiske deletioner i kræft. Fire forskellige tests blev kombineret sammen giver en cancer recessiv p-værdi for hver undersøgt gen. Et hundrede og halvtreds fire ansøgerlande recessive cancer gener (p-værdi 1,5 × 10

-7, FDR = 0,39) blev identificeret. Slående, de prototypiske kræft recessive gener

TP53

,

PTEN

CDKN2A

alle rangeret i top 0,5% gener. Funktionerne væsentligt berørt af kræft mutationer præcis overlapper de kendte cancer gener, med den kritiske undtagelse for fravær af tyrosinkinaser, som forventet for et recessivt gen-sæt

Henvisning:. Volinia S, Mascellani N, Marchesini J, Veronese A, Ormondroyd E, Alder H, et al. (2008) Genom Bred Identifikation af Recessive Cancer Gener af kombinatoriske Mutation Analysis. PLoS ONE 3 (10): e3380. doi: 10,1371 /journal.pone.0003380

Redaktør: Mikhail V. Blagosklonny, Ordway Research Institute, USA

Modtaget: Juli 3, 2008; Accepteret: September 17, 2008; Udgivet: 10. oktober 2008

Copyright: © 2008 Volinia et al. Dette er en åben adgang artiklen distribueres under betingelserne i Creative Commons Attribution License, som tillader ubegrænset brug, distribution og reproduktion i ethvert medie, forudsat den oprindelige forfatter og kilde krediteres

Finansiering:. Dette arbejde blev støttet af Program Project Grant No. P01CA76259 fra National Cancer Institute (CMC) og af tilskud fra AIRC, PRRIITT Regione Emilia Romagna og MIUR (SV)

konkurrerende interesser:. forfatterne har erklæret, at der ikke konkurrerende interesser eksisterer.

Introduktion

En række metoder er blevet anvendt til identifikation af kræft gener [1]. Procedurer er udviklet, der tillod identifikation af gener som forårsager cellulær transformation [2], [3], og af komplekse processer såsom invasionsevne og metastase [4]. In vitro og in vivo-metoder, ved hjælp af cellulære eller dyremodeller, førte generelt til opdagelsen af ​​dominerende cancer gener eller onkogener. På den anden side har tumorsuppressorer blevet opdaget hovedsageligt af molekylærgenetiske fremgangsmåder. Sådan er behovet for at identificere yderligere tumorsuppressorer eller recessive cancer gener, at nye tests for tab af funktion fortsat blive udviklet [5].

Mange velkarakteriserede cancer gener havnen somatiske basesubstitutioner eller små indsættelse /sletning. For eksempel kodende region frame-skift og punktmutationer tegner sig for 75% af de somatiske mutationer i

CDKN2A

og

TP53

, to store tumorsuppressorgener [6], [7], [ ,,,0],8]. Den onkogen

B-raf

, først beskrevet over 20 år siden, viste sig også at være muteret i nogle menneskelige kræftformer [9] sammen

PI3K

og nogle tyrosinphosphataser [10]. I mellemtiden har andre kræft gener blevet opdaget gennem fænomenet nedarvede prædisposition. Familiær kræft er sjælden i sammenligning med ikke-arvelig cancer, men en række recessive gener er blevet identificeret under anvendelse af bindingsanalyse [11], [12]. Stor skala super-familien sekventering projekter, dvs. kinome og phosphatome projekter, følges, og viste, at selv om missense mutationer findes i nogle medlemmer af disse to superfamilier, de er et fælles grundlag for somatiske kræft mutationer. Greenman og medarbejdere [13] foretog omfattende sekventering af 518 protein-kinase-gener i 210 kræftformer. Kinaser er blevet impliceret i mange aspekter af tumorigenese og flere er nu blevet valideret som mål for lægemiddelterapi [14]. I deres analyse af indsamling af cellulære kinaser, den kinome, Greenman et al. [13] identificerede 1.000 mutationer. Mutationer var relativt almindelige i kræft i lungerne, mave, ovarie, kolon og nyre og sjældne i kræft i testiklerne og bryst, og i carcinoid tumorer, som normalt findes i mavetarmkanalen. Tumorer med defekter i DNA-mismatch repair nærede stort antal mutationer, hvorimod andre typer af tumor afslørede ingen detekterbare mutationer. For at skelne chauffør fra personbiler mutationer, Greenman et al. anvendes en statistisk model sammenligner den observerede-til-forventet forhold mellem synonyme (ingen aminosyre ændring) mutationer med den for ikke-synonyme (ændret aminosyre) mutationer. En øget andel af ikke-synonyme mutationer indebærer udvælgelse tryk under tumorigenese. Samlet, der er konstateret de 158 forudsagte driver mutationer i 120 kinase gener. I modsætning til de tilbagevendende mutationer i

BRAF

i maligne melanomer [15] mest kinase mutationer identificeret på tværs af forskellige tumortyper var derfor enkelt hits. For nylig, Træ og medarbejdere [16] brugt en anden strategi, men nåede lignende konklusioner, med fuldstændig sekventering af 20,857 udskrifter fra 18,191 gener i et begrænset antal tumorer (11 bryst og 11 tyktarm). Det store antal automatisk detekterede DNA mutationer straks forudsat følgende spørgsmål: hvordan man kan identificere fra en potentielt stort antal sekvensfejlparringer dem, der er sygdomsfremkaldende for kræft patogenese. En række af efterfølgende filtre viste, at de fleste af dem var tavse (ikke resulterede i aminosyreændring) og et tilsvarende beløb var single nucleotide (SNP’er). Det endelige antal mutationer, som blev defineret som virkelig somatisk påvirket mere end 1000 gener. Interessant, blev nogle fælles driver mutationer identificeret blandt de kinase gener i disse studier. Dette er i overensstemmelse, for eksempel med konstateringen af, at kun 1 ud af 18 medlemmer af

PI3K

familie havde somatiske mutationer i kræft [17].

Interessante observationer kan foretages fra en nøjagtig global undersøgelse af mutationerne rapporteret i cancer. Futreal et al. [18] gennemført en sådan udvidet folketælling fra bibliografi angiver, at så mange som 299 gener bidrager til human cancer. Men 70% af disse gener er forbundet med leukæmier, lymfomer og mesenkymale tumorer, som tegner sig for kun 10% af kræfttilfælde. Endvidere ca. 75% af disse gener er associeret med translokationer, og mindst 90% af noterede cancer gener er dominerende på celleniveau (dvs. aktiverede onkogener, fusion oncoproteiner). Alligevel er det almindeligt anerkendt, at langt størstedelen af ​​kimcellelinje mutationer, der resulterer i cancer prædisposition er recessive [18]. Det synes derfor sandsynligt, at de fleste af cancer gener er recessive og forbliver stadig uopdagede.

Af disse grunde vi udtænkt en hidtil ukendt fremgangsmåde til identifikation af kandidat recessive cancer-gener fra genom-skala datasæt. Vi anvendte vores hidtil ukendt fremgangsmåde til mine data fra sekvenser og sammenlignende genomiske hybridiseringer. Vores metode tager højde for de forskellige gen inaktivering tilstande, der spænder fra punktmutationer til hele gen sletninger. Antagelsen bag vores undersøgelse var, at ved at studere kræft gener fra forskellige mutationsmønstre perspektiver og kombinere de respektive sandsynligheder, kunne sekventering støj og polymorfier filtreres fra og bona fide recessive cancer gener ville blive identificeret.

Resultater

Høst kandidat mutationer fra EST’er

i dette papir, blev en ny fremgangsmåde anvendes til identifikation af gener muteret i ikke-arvelige humane cancere (figur 1). procedure indsamlede sekvens oplysninger fra databasen udtryk sekvens tag (EST) og en passende algoritme den var skræddersyet til at udtrække information fra “lav kvalitet” sekvensdata. Proceduren analyseret mere end 3 × 10

9 nukleotider af menneskelig kodende sekvens i over 5.600.000 EST’er afledt fra både raske og ondartede væv og cellelinier. EST’erne er potentielt meget værdifuld for mutation studier, da de repræsenterer klonede enkelte alleler, men er også ubekræftede sekvenser, med en høj grad af sekventering fejl [19], [20]. Derfor, for at udnytte det fulde potentiale af EST’erne måtte vi udvikle en metode til påvisning af bona fide “kræft” mutationer i en situation med hyppige sekventering fejl eller i bedste fald polymorfier. Selvom tidligere arbejde [19] forsøgt at vurdere sekventering fejlprocent i EST’erne, fulgte vi en alternativ rute. Vores procedure er baseret på den antagelse, at satsen for sekventeringsfejl var konstant for hvert menneske gen, ved hver nukleotid position. Som en naturlig følge, vi antaget, at “gen /position-specifikke sekventering fejlrate” var konstant på tværs normale og cancer EST biblioteker. Siden bunden sammensætning, kontekst og sekvens er per definition konstant inden for hver forskellig menneskeligt gen, vi troede disse forudsætninger var sikker. Kun undtagelser ville være på grund af tumorer huser DNA reparation defekter.

Diagrammet viser trinene i proceduren for evaluering af mutation sandsynligheder og data strømme mod identifikation af kandidat recessive cancer gener. Molekylære data blev udtrukket fra offentlige databaser (dbest og GEO på NCBI, og Stanford Microarray Database). Et meget stort antal opstillinger (over 4,5 millioner) blev opnået i over 24.000 humane gener fra BLAST analyse af 3 Gbases af EST-sekvenser. De linjeføringer blev analyseret til at udtrække uoverensstemmelser, der blev deponeret i Cancer Mutome lokale SQL-database. De misforhold blev derefter evalueret af særlige procedurer for at knytte mutationsmønstre p-værdier til hvert menneske gen. Sideløbende hermed blev næsten 20.000 menneskelige gener analyseret fra 744 vifte CGH at definere deres tilbøjelighed til sletning i cancer. De specifikke mutationelle p-værdier blev kombineret til frembringelse af en recessiv cancer p-værdi. En genom delmængde af 154 gener, blandt hvilke

TP53

,

PTEN

,

CDKN2A

CDKN2B

var til stede, blev valgt (kræft p-værdi . 1.5 × 10

-7)

høj sekventering støjen var forventet at være til stede i det heterogene EST database og kræft er en kompleks mangesidet genetisk sygdom, derfor en enkelt statistisk test ville ikke give pålidelige udvalg af cancer-gener. Desuden ønskede vi at fokusere på recessive gener, inaktiveret ved forekommende begivenheder. Således at analysere de forskellige mutationsvarianter former for recessive cancer genet, vi udtænkt således en række mutationsbegivenheder tests. De statistiske tests blev til sidst kombineret for at identificere de gener, der ofte inaktiveres i kræft.

Med udgangspunkt i RefSeq menneskelige mRNA repository, blev 27,184 sekvenser (defineret Forespørgsler) justeret til mere end 5,6 millioner humane EST-sekvenser, fra 7574 forskellige EST biblioteker, for i alt næsten 3,0 Gbases af kodende sekvens. Blaster [21] blev kørt for hver forespørgsel versus EST’erne og 3,839,543 succesfulde linjeføringer blev produceret (gemt i Alignments SQL tabellen af ​​Cancer Mutome databasen) for 24,932 menneskelige forespørgsler (Stats database tabel). Et gennemsnit på 150 hits (høj scoring par, HSP. Eller sekvenser) blev produceret for hver forespørgsel (human gen eller splejsning variant). Kvalitetskontrollen af ​​BLAST alignments var af den største betydning for vores strategi. For at minimere udvinding af tekniske fejl definerede vi en stringent tærskel for tilpasning kvalitet (expect≤1E-21) og de kvalitetskrav ender linjeføringer lave blev kasseret. Alle (43,965,904) nucleotidsekvenser uoverensstemmelser og huller /indsættelser, blev registreret i databasen Mutationer bordet. Aminosyre (AA) udskiftninger og for tidlige stop (33,614,754 paradoksproblemer) blev derefter udvalgt fra alignments (AA_Mutation tabel). For at reducere kompleksiteten, og det forventede antal falske positiver, besluttede vi at evaluere kun de gener med et højt antal fejlparringer (uanset prøver status kræft). En forbehandling baseret på inter-kvartil interval (IQR) blev derfor anvendt og 8.972 gener (IQR højere end 0,5) blev bibeholdt til yderligere kræft mutation analyser. Disse gener var tilstrækkeligt rige på formodede mutationer (paradoksproblemer) at opfylde rollen som potentielle kræft gen kandidater.

Den første del af vores strategi var identifikation af gener huser inaktivere punktmutationer. Vi evaluerede punktmutationer ifølge frekvens, placering, kapacitet til at ændre aminosyresekvensen, og konsekvenser på læseramme. Vores procedure blev således skræddersyet til at overveje statistisk alle de ovennævnte funktioner i et punkt mutation.

Data mining for amino-syre-udskiftninger og utide

Vi definerede pAA som sandsynligheden for, at et gen viser en overskud af aminosyresubstitutioner i cancer sammenlignet med ikke cancer prøver. pNSSR stedet angiver sandsynligheden for, at de betydelige aminosyresubstitutioner i kræft prøverne er under positivt selektionstryk. For at detektere kortdistance gruppering af kræft mutationer, fælles i kræft recessive gener, og at balancere støj, dvs. sekventering fejl, valgte vi en parret t-test koblet til en glidende vindue. Vi normaliseret tællinger af fejlparringer i to klasser, kræft og kontrol, ved anvendelse af en genspecifik og position specifik faktor. Null mismatch tællinger blev justeret til enhed, før normalisering. Normaliseringsreferencerne værdier blev opnået, for hvert gen og ved hver nukleotid position, da de lokale forhold i de sekventerede nukleotider i kræft og kontrolprøver. Den parrede t-test (kræft kontra kontrol, parret for kodoner) blev påført på en glidende vindue med en længde på 25 kodoner. For at udføre en robust assay en kodon blev først vurderet ved alignment mindst 10 gange i hver klasse (kræft og kontrol). Genspecifikke konfidensgrænser for T scorer, hvor der genereres af bootstrap analyse og en tærskelværdi p-værdi på 0,05 blev anvendt til at udvælge de betydelige aminosyrepositioner. For hver humane gen, blev en p-værdi (PAA) endelig associeret med summen af ​​toppene for de betydelige T scores. En uoverensstemmelse sekvens blev indspillet kun én gang for hver EST bibliotek.

En overvurdering af PAA kunne skyldes passager mutationer, såsom dem der produceres af ændrede DNA reparation systemer, udbredt i nogle kræft. Da passager mutationer bør være tilfældigt fordelt over genomet, blev en ekstra test derfor implementeret for at forfine PAA. Forholdet mellem ikke-synonyme (NS) til synonyme (S) DNA-mutationer er et mål for det selektive tryk under tumorudvikling, som synonyme ændringer næppe vil udøve en vækstfordel og vil blive selektivt tabt [17]. Endvidere fejlparringer grund sekventeringsfejl, samt differential repræsentation (kræft til normal differentiel ekspression), forventes alle at være neutral med hensyn til de NS til S-forhold. Kodonerne signifikante for aminosyresubstitutioner (p 0,05) blev derfor analyseret for positivt tryk. Som en proof-of-concept, blev NS /S-forhold i

TP53

muteret region analyseret af parret t-test (p 0,033, FDR = 0,092) og afslørede højere værdier i kræft end i kontrol. Således anvendes vi NS til S kvotientkriteriet til hvert gen, i kaskade efter at for den lokale mutation frekvens (PAA) beskrevet ovenfor. Bootstrap blev igen anvendt til at definere p-værdier. Sandsynligheden for en cancer protein med hyppige aminosyreændringer (PAA) koblet til selektiv positivt tryk i cancer (pNSSR), to begivenheder, som ikke uafhængige, blev defineret som gennemsnittet af de to respektive p-værdier (PAA-NSSR).

data mining for frame-skift i kræft EST’erne

efter at have defineret for hver menneskeligt gen en p-værdi for kausale aminosyresubstitutioner i sporadiske kræftformer, vi havde brug for et tilsvarende indeks for gen inaktivering grundet åben læseramme skifter i exons. Cancer-gener kan sprænges ved mikro-insertioner eller -deletions i deres kodende sekvens, hvilket resulterer i en ændret primære struktur. En genom bred undersøgelse af vores misforhold database viste, at en enkelt nukleotid ændringer var langt de mest almindelige indrykninger /deletioner i EST’eme. Vi angivet med pFrameshift sandsynligheden for, at et gen havde et overskud af frame-skift, skyldes enkelt nucleotid deletioner /insertioner i kræft, i forhold til kontrol væv. Vi testede den hypotese, at disse mutationer var hyppige i cancer gener, ved at studere igen

TP53

. Vores analyse viste, at enkelt nukleotid frame-skift forbundet til kræft var ikke-tilfældigt beriget i

TP53

. Når man ser for frame-skift induceret af 1 nukleotidinsertioner /sletninger, blev en tilsvarende test, der for PAA designet, som nærmere beskrevet i eksperimentelle procedurer, for at generere pFrameshift.

Identifikation af slettede gener i kræft ved høj opløsning matrix komparative genomisk hybridisering

Kræft gener kan påvirkes i deres genomiske struktur af store amplifikationer og sletninger. forventes recessive cancer gener, der skal slettes eller på anden måde inaktiveret, og denne komponent skal indgå i vores mutations model. Vi er derfor tildelt hver menneskelige gener p-værdier til sletning i kræft. For at opnå sådanne p-værdier, vi samlet data fra høj opløsning komparative genomiske hybridiseringer af 744 tumorer i Geosoft databasen. Vi brugte vifte CGH (aCGH), fremstillet af GEO (NCBI) og SMD (Stanford Microarray Database), med tilstrækkelig høj opløsning til at skelne de menneskelige gener (information for prøver og datasæt i supplerende tabel S1). Hver tumor prøve blev sammenlignet med en sund kontrol prøven på en to-kanals oligonukleotid-baseret platform. De humane gener blev evalueret i hver prøve ved anvendelse af den normaliserede log2 ratio (tumor i forhold til kontrol). Forskellige prober i forbindelse med det samme gen blev midlet. Gene symboler blev brugt som nøgler til utvetydigt at identificere et gen inden for og på tværs af platforme. Data blev normaliseret ifølge udbyderne. Som forbehandling skridt vi reduceret analysen kompleksiteten ved at bevare kun de gener med høj variabilitet (standardafvigelse af log

2 forholdet 0,2). Så for hvert gen vi beregnet fraktilerne i loggen

2 nøgletal (kun for gener målt i mindst 300 prøver). Et gen påvirket af sletninger i tumorer ville have en lav (negativ) log

2 forholdet 5

thpercentile, mens en med amplificeringer ville vise en høj (positiv) 95

percentil.

bootstrap-analyse (tilfældig swap mellem tumor og styrekanaler) blev anvendt til at simulere genspecifikke 5

th og 95

th percentiler. Derefter blev genspecifikke p-værdier for deletioner (pDeletion) endelig beregnes som den procentdel af simulerede 5

th percentiler overstiger den reelle 5

th percentiler. På dette tidspunkt, måtte vi tage i betragtning to fænomener, der er forbundet til aCGH men ikke er knyttet til kræft: kønskromosomer og polymorfe strukturelle kopi nummer variationer (CNVs). Kontrolprøven i aCGHs var ofte fra mandlige (mere end 50% af aCGHs), mens omtrent halvdelen af ​​tumorerne var af kvindelig oprindelse og dermed manglede Y-kromosomet. Derfor blev forventes Y-kromosom-gener at fremstå som slettet, eller bedre “pseudo-slettet”. Omvendt forventes vi X-kromosomet generne, undtagen dem, der tilhører den pseudo-autosomal region, til at fremstå som “pseudo-amplificeret”. Gener lokaliseret i kønskromosomerne faktisk opførte sig korrekt, som vist detaljeret for pseudo-autosomal region 1 (PAR1) i Xp22 (supplerende fig S1). Polymorf CNVs, fra normalbefolkningen variabilitet og ikke forbundet med kræft, bør også føre til store fold-ændringer, hvilket resulterer i høje 95

th eller lav 5

th percentiler. forventes dog, at polymorfe CNVs, ikke er associeret med cancer, ikke ville vise betydelige pDeletion værdier. Faktisk ville deres 5

th percentiler ikke betragtes som signifikant efter den tilfældige swap simulering.

CDKN2A

CDKN2B

blev identificeret som de mest slettede gener i humane kræftformer;

PTEN

,

ATM

, og

TP53

blev også identificeret som slettede (p-værdier 0,001). Tre tusind og tre hundrede halvfjerds fire gener var signifikant slettet (p 0,001)

Kombination af mutation analyser:. De kandidat recessive cancer gener

Kræft gener påvirkes af forskellige typer af punktmutationer og af kromosomale ændringer. Vi definerede en kandidat kræft gen som recessive når påvirket af mutationer potentielt fører til tab af funktion; dvs. når det blev hyppigt muteret i dets kodende region og hyppigt ændringer i dets genomiske struktur, navnlig slettet. Kombinationen af ​​de forskellige genom brede tests producerede en p-værdi for recessive cancer gener. Den recessive cancer gen (pRecessiveCancer) p-værdi blev defineret som produktet af de tre p-værdier (PAA-NSSR, pFrameshift, pDeletion). Et hundrede og halvtreds fire menneskelige gener blev medtaget i den endelige kandidat gen liste efter kombinatorisk mutation analyse blev udført (pRecessiveCancer 1,5 × 10

-7). Antallet af kræft recessive gener i en simulering ved tilfældig sammenslutning af de fire genmutationsundersøgelserne var 60,5 (falsk opdagelse sats på 0,39). Valget af den kombinatoriske tilgang syntes at være specifik, da tre klassiske recessive cancer gener,

TP53 Hotel (16

th position),

PTEN Hotel (92

nd) og

CDKN2A Hotel (135

th) blev opdaget. Når vi sammenlignet kandidat gen-sæt til hele genomet, ingen større skævhed opstået mod gen-størrelse og strukturelle polymorfier, som forventet fra en velopdragen statistisk procedure. De recessive cancer gen størrelser adskilte sig ikke væsentligt fra det af hele den menneskelige genom (supplerende figur S2). Når vi overvejet kopi nummer variationer, kræft gen-sæt indeholdt 15 polymorfe CNVs (15/154 eller 10%), mens 13,6% af alle gener scoret for pDeletion indeholdt mindst én CNV. Denne forskel i forhold var ikke signifikant (p 0,05), hvilket tyder på, at der ikke var nogen falsk berigelse for CNVs af vores metode, som forventet af udformningen af ​​algoritmen

Gene ontologi og funktionel analyse

de mekanismer og funktionelle veje er forbundet med kræft recessive gener blev statistisk vurderet. Den berigelse i Gene ontologi (GO) vilkår blev vurderet ved hjælp af EASE, på https://david.abcc.ncifcrf.gov. De biologiske processer i høj grad påvirket i kræft gen sæt er anført i supplerende tabel S2. De signifikante GO vilkår grupperet efter EASE funktionel klyngedannelse var: ATP /nucleotidbindende, celledød /apoptose, cellecyklus, mitokondrier, RNA-bindende, methylering, tumor suppressor, DNA metabolisme og DNA-reparation (EASE berigelse score 2, EASE P- værdi 1 × 10

-4, Benjamini p-værdi 0,01). En meget overlappende funktionel spektrum blev opnået for de Cancer Census gener [18]. De mest bemærkelsesværdige undtagelser fra de overlappende ontologier i to cancer gen-sæt var relateret til “proteintyrosinkinaser”, fraværende fra kandidaten recessive listen. Disse proteiner er en af ​​de mest repræsenterede klasser af onkogener, eller dominerende cancer gener. En funktionel klassificering svarende til den i EASE opnåedes med bingo og Cytoscape (data ikke vist), hvor nogle af de mest betydningsfulde cellulære processer identificeret var involveret i cancer patogenese, såsom cellecyklus, celledød /apoptose (korrigeret p-værdi 1 × 10

-3). Endelig frembragte vi en kontrolgruppe af humane gener ved tilfældig associering p-værdierne fra de fire genmutationsundersøgelserne. Når EASE og bingo blev anvendt på denne kontrolordning ingen signifikante GO vilkår blev identificeret.

Diskussion

Vi udtænkt og anvendt en multi-tier genom-dækkende data mining assay mod identifikation af gener tilbøjelige til “recessive-type” mutationer i kræft. P-værdier fra hvert lag blev kombineret for at fremstille en “recessive cancer gen” p-værdi (tabel 1 og 2). Tre af de mest bemærkelsesværdige kræft recessive gener, dvs.

TP53

,

PTEN

CDKN2A

, rangeret 16

th, 92

nd og 135

th henholdsvis blandt alle testede humane gener. Den blokdiagram af vores rationale og datastrømmen er vist i figur 1. Testene kan opdeles i to grupper: en for påvisning af punktmutationer (aminosyresubstitutioner og frame-skift) og en for strukturelle ændringer (store deletioner). I princippet kunne vi også brugt en test for partielle gen sletninger, men i ESTer intra-gen omlejringer kan forveksles med alternativ exon splejsning.

Be the first to comment

Leave a Reply