PLoS ONE: Epidemiologi af Doublet /multiplet Mutationer i lungekræft: Bevis at en delmængde Opstår ved Chronocoordinate Events

Abstrakt

Baggrund

Noget tyder stærkt på, at spontane dublet mutationer i normale mus væv generelt skyldes chronocoordinate begivenheder. Disse chronocoordinate mutationer tider afspejler “mutation brusere”, som er flere chronocoordinate mutationer spænder mange kilobaser. Men lidt er kendt om mutagenese af dublet og multiplet mutationer (domuplets) i human cancer. Lungekræft tegner sig for omkring 25% af alle kræftdødsfald. Heri analyserer vi epidemiologi domuplets i

EGFR

og

TP53

gener i lungekræft.

EGFR

gen er et onkogen, hvor dubletter er generelt driver plus driver mutationer, mens

TP53

genet er et tumorsuppressorgen med en mere typisk situation, hvor dubletter stammer fra en driver og passager mutation.

Metode /vigtigste resultater

EGFR

mutationer identificeret ved sekventering blev indsamlet fra 66 offentliggjort papirer og vores opdaterede

EGFR

mutation database (www .egfr.org).

TP53

mutationer blev indsamlet fra IARC version 12 (www-p53.iarc.fr). For

EGFR

TP53

dubletter, ingen klart signifikante forskelle i race, blev der observeret etnicitet, køn og rygning status. Doublets i

EGFR

TP53

gener i menneskets lungekræft er forhøjede om otte og tre gange, henholdsvis i forhold til spontane dubletter i mus (6% og 2,3% versus 0,7% ).

konklusioner /betydning

Selv om ingen kendetegn er endelig, de samlede egenskaber af dublet og multiplet mutationer i lungekræft er i overensstemmelse med en delmængde stammer fra chronocoordinate begivenheder i

EGFR

gen: i) de otte rammeskift dubletter (til stede i 0,5% af alle patienter med

EGFR

mutationer) er grupperet og producere en netto i-frame ændringer; ii) ca. 32% af dubletter er meget tæt afstand (≤30 nt); og iii) multipletter indeholde to eller flere tætliggende mutationer.

TP53

mutationer i lungekræft er meget tæt afstand (≤30 nt) i 33% af dubletter, og multipletter generelt indeholde to eller flere meget tætliggende mutationer. Arbejde i modelsystemer er nødvendigt at bekræfte betydningen af ​​chronocoordinate begivenheder i lunge og andre kræftformer

Citation:. Chen Z, Feng J, Buzin CH, Sommer SS (2008) Epidemiologi af Doublet /multiplet Mutationer i lungekræft : Dokumentation for, at en delmængde Opstår ved Chronocoordinate Events. PLoS ONE 3 (11): e3714. doi: 10,1371 /journal.pone.0003714

Redaktør: Amanda Ewart Toland, Ohio State University Medical Center, USA

Modtaget: 4. august, 2008; Accepteret: 10. oktober 2008; Udgivet: November 13, 2008

Copyright: © 2008 Sommer et al. Dette er en åben adgang artiklen distribueres under betingelserne i Creative Commons Attribution License, som tillader ubegrænset brug, distribution og reproduktion i ethvert medie, forudsat den oprindelige forfatter og kilde krediteres

Finansiering:. Institution.

konkurrerende interesser:. forfatterne har erklæret, at der ikke findes konkurrerende interesser

Introduktion

Kræft er en heterogen, multi-trin, kompleks genetisk sygdom som følge af akkumulerede mutationer. Cancere generelt blev anset for at opstå ved akkumulering af en anslået 5-7 forårsagende mutationer [1], [2]. For nylig, dog Vogelstein og andre har vist i bryst- og tarmkræft, at individuelle tumorer ophobes -90 somatisk muterede gener [3]. Men et meget mindre antal (anslået til ~11) vil sandsynligvis blive involveret i tumorigenese i en given tumor. Ophobningen af ​​så mange medvirkende mutationer er svært alene at forklare ved frekvensen af ​​flere uafhængige mutationsbegivenheder. Ophobningen af ​​mutationer i visse kræftformer kan afspejle en mutator fænotype med globalt tilfældige mutationer [4] – [6]. Sekventiel udvælgelse tilbyder en anden forklaring [7], [8]. En mutation forårsager over-replikation, hvilket giver anledning til en klon, som yderligere over-replikerer skyldes en anden mutation, etc. For nylig eksistensen af ​​mutations- brusere blev rapporteret, øge muligheden for “kræft i et øjeblik”, hvis der forekommer spredt mutation brusere . Mutation brusere blev fundet efter analyser af intrageniske dublet mutationer afslørede, at de blev grupperet og chronocoordinate [9].

Vi viste, at hovedparten af ​​dubletter i

EGFR

gen har en anden mutation mønster relativ til slåbrokker og består af chauffør plus driver mutationer, på grund af sekventielle eller chronocoordinate mutationer, formodentlig efterfulgt af funktionel udvælgelse af to individuelt sub-optimale mutationer [10]. Desuden erhvervede andet mutationer (fx T790M) i fire

Der er rapporteret EGFR

dubletter efter behandling med gefitinib og erlotinib og forbundet med lægemiddelresistens og sygdomstilbagefald [11], [12]. I modsætning hertil fleste

TP53

og

Laci

dubletter viser driver plus passager mutationer i lungekræft og i normal Big Blue mus væv hhv. Men epidemiologi og mekanismer, der ligger mutagenese af dubletter og flere mutationer er uklare.

For at belyse hyppigheden af ​​dubletter og den klare mutation mønster og frekvenser i

EGFR

gen, epidemiologi dublet mutationer i lungekræft analyseres og sammenlignes med dubletter i

TP53

gen. Heri finder vi, at rygning status, race, etnicitet, køn og alder ikke er risikofaktorer for dublet forekomst i

EGFR

og

TP53

gener. Den relative frekvens af dubletter er højere i human lungecancer end i normalt musevæv. Eksistensen af ​​OMIDI par (se Terminologi og forkortelser i materialer og metoder) i

EGFR

, den høje frekvens af allel versus sammensatte heterozygote dubletter, den høje frekvens af tætliggende dubletter, og klyngedannelse i multipletter er i overensstemmelse med chronocoordinate mutationer, der bidrager til mindst en delmængde af

EGFR

TP53

dublet og multiplet mutationer findes i humant lungekræft.

Resultater

epidemiologi dublet mutationer i EGFR og TP53 gener i lungekræft

Analyse af rygning status, køn og etnicitet ikke afslører en betydelig forskel i dublet frekvens i

EGFR

gen (tabel 1, tabel S1). Gennemsnitsalderen for patienter med slåbrokker og dubletter er ens (61,4 ± 11,3

vs

65,8 ± 10,3).

Resultaterne for

TP53

gen i lunge kræft er ens med én undtagelse. Hyppigheden af ​​

TP53 Salg dubletter er betydeligt højere i asiater end i kaukasere (3,2%

vs

1,8%, P = 0,03) (tabel 1, tabel S2), men dette er ikke signifikant, når korrigeret for multipel sammenligning (seks Fishers eksakte test udføres for

EGFR

og

TP53

gener). er nødvendige for at vurdere dette punkt Yderligere data.

Samlet set 98/1627 (6,0%) af EGFR mutationer og 54/2387 (2,3%) af TP53 mutationer i humane lungekræft er dubletter, en meget højere frekvens end der blev observeret i

lacI

gen i Big Blå mus (8 gange og 3 gange, respektivt) (tabel 2).

Doublets tendens til at klynge i EGFR og TP53 gener i lungekræft: den “halveringstid for mutation afstand” er 9 bp og 15 bp

Spontan

Laci

dubletter (0,7% af den samlede mutationer) er grupperet med en afstand fitting en eksponentiel fordeling og viser et tilsvarende mutation mønster til singletter, hvilket indikerer en chronocoordinate begivenhed [13], [14]. Baseret på dubletten afstanden mellem to mutationer,

EGFR

dubletter kan opdeles i to grupper: den proksimale gruppe ( 100 bp, gennemsnitlig afstand 22,8 ± 24,4-bp) og den distale gruppe ( 809 bp , gennemsnitlig afstand 12,3 ± 5,1 kb) (tabel S1). Analogt til

Laci

dubletter, en delmængde [40% (39/98)] i

EGFR

dubletter forekommer i samme exon med proksimal afstand viser en eksponentiel (R

2 = 0,9979 ) snarere end en kvasi-ensartet fordeling (fig S1). Halvdelen af ​​dubletter har mutationer adskilt af 9 bp eller mindre (den “halveringstid mutation afstand”, se Terminologi i materialer og metoder).

Afstanden fordeling for

TP53

dubletter i lunge kræft forekommer i samme exon (43%, 23/54) viser også proksimal afstand ( 86 bp, gennemsnit 20,2 ± 20,9 bp) og passer til en eksponentiel fordeling (R

2 = 0,979) (tabel S2, figur S1) med en halveringstid på mutation afstand på 15 bp. Dubletter forekommer i forskellige exoner har distale mellemrum (131-4504 bp, gennemsnitlig 1317,9 ± 1000 bp) adskilt af en intron. En lignende afstand til den, der i lungekræft blev fundet for

TP53

dubletter inden for samme exon i bryst- og tarmkræft, med en halveringstid på mutation afstand på 24 og 16 bp (tabel S4 og S5) .

således omkring en tredjedel af

EGFR

TP53

dubletter er stærkt grupperet (≤ 30 bp) og alle dubletter forekommer inden for en enkelt exon har en international mutation afstand, der er eksponentielt fordelt snarere end den forventede kvasi-ensartet fordeling i overensstemmelse med chronocoordinate begivenheder i

lacI

i normal mus væv.

de OMIDI par er stærke beviser for klynger chronocoordinate mutationer

Det store flertal af spontan menneskelig germlime eller somatiske mus MIDIs er OMIDIs (

FIX

, Big Blue); ja, omkring halvdelen er enlige basedeletioner [15] – [18]. I modsætning hertil er der en meget lille brøkdel af OMIDIs (0,26%, 4/1526) og sense-mutationer (0,13%, 2/1526) i

EGFR

singletter, i overensstemmelse med en stærk selektion for mutationer, der ændrer, snarere end at slette, funktion. Otte af 98 (6%)

EGFR

dubletter indeholder et par læserammeforskydningsmutationer (OMIDI par; se forkortelser i materialer og metoder). Alle otte af de OMIDI par er tæt afstand (tabel 3, figur S2), med nettoresultatet er en i-ramme-mutation. Givet en OMIDI mutation, en anden tilfældig mutation 3 ’til den første (enten IMIDI eller OMIDI) vil genoprette læsning ramme kun 1/3 af tiden, og en sub-brøkdel af tredje stadig protein beskærer fordi en nonsense mutation sker før til den anden mutation. I alt 0,49% af rapporterede

EGFR

mutationer (8/1627) er grupperet OMIDI par uden trunkering mutation forekommer inden anden OMIDI. Disse otte OMIDI par forventes at opholde sig på den samme allel; ellers vil sammensatte heterozygote OMIDI dubletter føre til to allele trunkeringer, fjerne alle

EGFR

genfunktion. I mellemtiden bør begge de grupperede OMIDIs også forekomme i hurtig rækkefølge (chronocoordinate mutationer) i den samme celle cyklus, fordi frekvensen af ​​sekundære mutationer tilfældigt forekommende i en proliferation-deficient celle er resultatet af en enkelt OMIDI er sjælden. De resterende 14 deletioner (i exoner), 9 indels og 3 dubletter er alle i ramme (IMIDI) mutationer (tabel 2; Tabel S1).

Mutationerne i det indre OMIDI pair rapporteret i

TP53

gen er 2309 bp fra hinanden, i forskellige exons (tabel S2, ID # 14373), og i modsætning til de OMIDI par i

EGFR

gen, ikke sammen gendanne læserammen. Salg

EGFR multipletter er i overensstemmelse med en singlet og en højt grupperet chronocoordinate anden mutation

Fire trillinger og en quadruplet i

EGFR

blev fundet med en frekvens på 0,3% (5 /1627) af lungekræft med mutationer før behandling med tyrosinkinaseinhibitoren (TKI) (tabel 4). Det er af interesse at par af mutationer i hver af de trillinger og tre mutationer i quadruplet er tæt grupperet med proksimal afstand (3-60 bp), svarende til dubletter i

lacl

i normale musevæv. Den tredje mutation er beliggende i en anden exon med distal afstand. Dataene er konsistente med sekventiel selektion af to mutationer, hvori en af ​​mutationerne er en chronocoordinate dublet eller triplet.

TP53

multipletter (6 trillinger og en quadruplet) også udgør 0,3% ( 7/2387) af de samlede mutationer (tabel S3). Fem multipletter (71%, 5/7) bor i samme exon eller to exons, i overensstemmelse med en mutation, og én chronocoordinate dublet. Syv multipletter havde mutationer adskilt af 15 afstand regioner. Af disse blev seks meget klynger (≤30 nt) og ni var inden 100 nukleotider eller mindre. Firs procent (16/20) af flere mutationer i brystkræft og 76% (25/33) i kolorektal cancer også opholde sig i en eller to exons (tabel S6, S7).

En sammenligning af OMIDI par og tætliggende dublet og multiplet mutationer i

EGFR

og

TP53

gener er vist i tabel 5. frekvensen af ​​OMIDI par i

EGFR

gen er ca. 10 gange større end i

TP53

gen (og den ene OMIDI pair i

TP53

gen ikke resulterer i en netto i-frame mutation), hvilket afspejler den hyppigere udvælgelse af mutationer at ændre, frem for at slette, EGFR proteinfunktion. Hyppigheden af ​​tætliggende mutationer i dubletter og multipletter i begge gener ligner

Alle karakteriseret EGFR dubletter er allel:. En betydelig delmængde af chronocoordinate mutationer giver en alternativ forklaring

Ved ansigt værdi, allelisme data tyder på, at chaufføren /føreren mutationer i

EGFR

skal være på det samme molekyle [10]. Men eksistensen af ​​en væsentlig delmængde af chronocoordinate mutationer giver en alternativ forklaring. Seksten heterozygot

EGFR

dubletter fra tre forskellige studier er blevet analyseret af kloning eller allel-specifik forstærkning (tabel S1) [10], [19], [20]. Efterfølgende sekventering af produkterne viste, at alle disse alleler var enten dobbelt muteret eller vildtype, hvilket viser, at i alle tilfælde blev begge mutationer placeret på samme allel. Hvis dubletten par skyldes uafhængige begivenheder, kan halvdelen forventes at være sammensatte heterozygoter. Observation af 100% allelisme (16/16) vs. nul sammensatte heterozygoter (p = 0,002) kan afspejle, at, funktionelt, er driver /driver mutationer skal være på det samme molekyle selvom EGFR protein danner dimerer [10] . Men data er også i overensstemmelse med 50% chronocoordinate begivenheder, formodentlig under streng replikation eller patch reparation, og 50% uafhængige sekventielle mutationer uden krav om, at de to mutationer være på det samme molekyle, (8 af 8 allele mutationer observeret, når fire af otte er forventes tilfældigt;.. p≤0.08)

desværre, for at vi ved, ikke er blevet udført allel analyse på heterozygote

TP53

dubletter

diskussion

Vi præsenterer den første analyse af epidemiologi dubletter i lungekræft. Rygning status, race, etnicitet, køn og alder er ikke Risikofaktorer for dublet forekomst i lungekræft. Den høje frekvens af klynger dubletter, den eksponentielle fordeling af afstand, forekomsten af ​​i-frame klynger OMIDI par, er allele natur dubletter, og klyngedannelse af multipletter i

EGFR

TP53

er i overensstemmelse med et betydeligt mindretal af chronocoordinate mutationer i human cancer. Men der er advarsler for hver af de ovennævnte observationer (se nedenfor).

Vi viser, at dubletter er hyppigere i

EGFR

TP53

gener i menneskets kræft end i spontane somatiske mutationer i normalt muse væv. Inden for rammerne af stikprøvestørrelse, betyder dublet frekvens ikke naturligvis afhænge af rygning status, køn, etnicitet, eller alder.

TP53

genet er muteret i omkring halvdelen af ​​alle tumorer og kan anvendes som en “mutagen test”, det vil sige, de relative frekvenser af de forskellige typer af mutation kan anvendes som en epidemiologisk redskab til at udforske bidrag af eksogene mutagener vs. endogene processer i brystkræft [21], [22]. Vi antager, at de højere mutationsrater forventes i rygere oftere ville producere dublet mutationer. Men der er ingen signifikant forskel mellem rygere og ikke-rygere, i overensstemmelse med dubletter og multipletter skyldes endogene processer.

Data er i overensstemmelse med chronocoordinate mutationer (med forbehold)

Flere aspekter af data er i overensstemmelse med en delmængde af

EGFR

TP53

dubletter skyldes choronocoordinate begivenheder snarere end fra hypermutabilitet (tilfældig fordelt afstand) eller sekventiel valg. Omkring 32-35% af dubletter fundet i

TP53 Hotel (35%, 19/54) og

EGFR Hotel (32%, 31/98) gener er enten OMIDI par eller meget grupperet dubletter adskilt af ≤30 nt. Men der er advarsler for hver slutning, der skal udelukkes i det fremtidige arbejde.

Den væsentligste værdi af nærværende analyse er at generere data, der begrænser vores hypoteser, og ved Occam

s barbermaskine, generere en simpel hypotese (den delmængde af chronocoordinate hændelser) i overensstemmelse med flere data.

(1) OMIDI par er det bedste bevis for chronocoordinate mutationer. For de fleste gener, de fleste spontane MIDIs er OMIDIs, men i

EGFR

gen, OMIDIs er sjældne, er i overensstemmelse med det overordnede valg for ændret funktion snarere end manglende funktion. Det er bemærkelsesværdigt, at de otte

EGFR Salg dubletter indeholdende OMIDI pairs alle har tætliggende mutationer, der resulterer i en netto i ramme-mutation, hvilket frembringer en EGFR-protein med potentielt ændret, snarere end fraværende, funktion. Der er imidlertid ikke eksperimentelle beviser af et protein indeholder en af ​​disse dublet mutationer blevet påvist. Den mest rimelige forklaring på denne forekomst er gennem chronocoordinate mutationer, der er valgt sammen for ændret proteinfunktion. En alternativ forklaring er, at OMIDI par eller anden måde kunne være sekventiel, selvom tilfældige mutationer inden for et par nukleotider i genomet skal være yderst usandsynligt.

(2) Den relativt høje frekvens af klynger dublet mutationer i

EGFR

gen er i overensstemmelse med chronocoordinate mutationer. Den eksponentielle fordeling af afstanden mellem de to mutationer i

EGFR

TP53

dubletter i samme exons (R

2 = 0,98). Er meget usandsynligt tilfældigt

En simulering blev udført tidligere for hver af de

TP53

exon 5-9 for at teste nulhypotesen, at mutationer i

TP53

dubletter er selvstændige arrangementer, og at fordelingen af afstanden mellem de to mutationer kun afhænger af spektret af mutationer i

TP53

gen og størrelsen af ​​mutationen target [13]. Den første mutation af hver simuleret dublet blev trukket tilfældigt baseret på den observerede fordeling af singlet mutationer i en given exon. Brug af singlet fordeling fra TP53 IARC-databasen (release 8) tegner sig for bias, som kan skyldes tætliggende hotspots. Den anden mutation i dublet blev trukket tilfældigt baseret på en ensartet fordeling over TP53-kodende sekvens for at exon, da det er sandsynligt, at være en “blaffer” (passager) mutation, snarere end en driver mutation for tumoren.

mutationen afstand i de simulerede dubletter blev sammenlignet med 402 faktiske

TP53

dubletter i databasen IARC fra alle typer af kræft. Resultaterne viste, at to mutationer i dubletter er ikke uafhængige begivenheder ved statistisk sammenligning af de observerede og forventede fordelinger, og oplyste, at flere dubletter skete med en mutation afstand på mindre end 30 nukleotider end forventet tilfældigt (P = 0,03, 0,02, 0,0006, og 0,01 for exonerne 5-8). Disse resultater stemmer overens med forekomsten af ​​chronocoordinate mutationer i humane

TP53

gen. En alternativ forklaring på gruppering af dubletter er, at de kan repræsentere nogle endnu miskendte funktionelle begrænsninger.

(3) allele natur dubletter er i overensstemmelse med chronocoordinate mutationer. Blandt 98 dublet par rapporteret i litteraturen, kun nogle få er blevet analyseret for at bestemme, om de er til stede på samme eller forskellige alleler. Blandt 16 afprøvede ved kloning eller allel-specifik amplifikation dublet par blev alle 16 par fundet at være til stede på den samme allel. Men for de resterende dublet par, hvori kloning eller allel-specifik amplifikation ikke blev udført, den mulighed, at mutationerne var til stede på forskellige alleler kan ikke udelukkes.

(4) Den relativt høje frekvens af multipletter med to eller flere klynger mutationer og en ekstra mutation på en distal placering også argumenterer for en chronocoordinate mutationsbegivenhed plus en uafhængig enkelt mutationsbegivenhed. Igen kunne en alternativ forklaring inddrage funktionelle begrænsninger på de grupperede mutationer.

I aggregat, disse data er i overensstemmelse med et bidrag på klynger chronocoordinate mutationer til human cancer. Et overskud af dubletter eller multipletter med en delmængde af klynger fordeling forekommer oftere end forudsagt ved en tilfældighed i en lang række organismer, herunder riboviruses, DNA-virus, prokaryoter, gær og eukaryote cellelinjer og væv [23], [24].

data support driver plus passager TP53 dubletter i lungekræft

om 22% af den anden mutationer i dubletter forventes at være tavse, hvis de er “passager” mutationer, snarere end “fører” mutationer [25]. I

TP53

dubletter, der er fem tavse og to intron nukleotidændringer (13%, 7/54), ikke signifikant forskellig fra de 23,5% tavse nukleotidændringer forventes at forekomme med tilfældige passager mutationer (p = 0,46 ) [26], [27]. Silent nukleotidændringer (18%, 4/22) inden

TP53

multipletter er også tæt på 23,5%. Tilsammen udgør disse data indebærer, at

TP53

dubletter og multipletter består af en chauffør plus passager mutation mønster, i modsætning til føreren /driver mønster findes i

EGFR

dubletter [10].

Doublet mutationer er associeret med mutation brusere i mus [9]. Fremkomsten af ​​massivt parallelle sekventering kan lette analysen af ​​et tilstrækkeligt antal prøver til at definere eventuelle dubletter og derefter afgøre, om disse dubletter er forbundet med mutation brusere i kræft. De ikke-tilfældige klyngedannelse mutationer i mutation brusere bør give mere endelige data for forekomsten af ​​chronocoordinate mutationer i humane kræftformer. Bidrag mutation brusere til kræft er endnu ikke fastslået.

Materialer og metoder

Terminologi og forkortelser

Mutation spektrum.

De relative frekvenser af mutationer på specifikke steder.

Mutation mønster.

De relative frekvenser af forskellige typer af mutationer, fx C til T overgange vs. T til C-overgange.

Singlet.

en enkelt mutation er identificeret inden for et gen [13].

Tandem-basen mutation (TBM).

en mutation, der resulterer i base-ændringer på tilstødende nukleotider [28], [29].

Doublet.

To mutationer identificeret inden et gen, herunder en blanding af TBM og ikke-TBM mutationer.

multiplet.

Tre eller flere mutationer identificeret i et gen, eksklusive den situation, hvor alle mutationer er tilstødende. Multipletter kan indeholde en blanding af TBM og ikke-TBM mutationer.

Domuplets.

En mutant, der er enten en dublet eller en multiplet. Ca. 1% af

Laci

mutant plaques er domuplets [9]

MIDI

Microinsertion, sletning eller Indel..; en indsættelse, sletning eller Indel, der resulterer i en gevinst eller et tab på 1 til 50 nukleotider [10].

IMIDI.

I-frame MIDI

OMIDI.

Out-of-frame MIDI

Halveringstid af mutation afstand.

fra den eksponentielle fit til data, intervallet af mutation afstand svarende til intervallet omfatter halvdelen af resterende mutationer i prøven. Dette svarer til halveringstiden af ​​en radioaktiv isotop.

Chronocoordinate mutation.

Flere mutationer der sker i den samme celle cyklus og i hurtig rækkefølge, typisk inden for få sekunder til minutter [13].

mutation bruser.

Chronocoordinate multiple mutationer, der strækker sig over flere kilobaser [9].

Silent mutation.

En neutral mutation, der ikke ændrer proteinstruktur, herunder synonyme kodningsændringer region. Det erkendes, at lejlighedsvise mutationstyperne overlapper hinanden, for eksempel kan en tavs mutation aktivere et kryptisk splejsningssite eller kan inaktivere den normale splejsningssted hvis det forstyrrer splejsningsdonor konsensussekvensen [30]. I praksis blev fundet meget få sådanne overlapninger.

Prøver og mutationsanalyse

For at undersøge mekanismen og karakteristika af dubletter og multipletter,

EGFR

mutationer identificeret ved sekventering var indsamlet fra 66 offentliggjort papirer og vores opdaterede

EGFR

mutation database [10], [31] (www.egfr.org).

TP53

mutationer blev indsamlet fra IARC version 12 (www-p53.iarc.fr) og udelukkede mutationer i lungefibrose og i lungekræft hos patienter, der udsættes for røgfyldte kul emissioner, radon, sennepsgas, asbest, tungmetaller og atombomben stråling (y-stråler). Vi udelukkede også to papirer, hvor multiple mutationer omfattede 50% af de samlede mutationer, sandsynligvis på grund af PCR-artefakter, da multiple mutationer generelt kun udgør -3% af de samlede mutationer.

TP53

mutationer i bryst og tarmkræft også blev hentet og afstanden fordeling af dubletter /multipletter blev analyseret.

Statistisk analyse

Mutation mønstre og andre kategoriske tæller distributioner blev testet for betydelige forskelle ved Fishers eksakte test eller uordnet R × C kontingenstabeller ved hjælp af “Fisher-Freeman-Halton” test gennemføres af StatXact statistisk analyse softwarepakke (Cytel software Corporation, Cambridge, MA).

Støtte Information

figur S1.

En undergruppe af dubletter viser proksimal afstand og passer til eksponentiel fordeling i EGFR og p53-gener i lungekræft. Panel A viser adskillelsen (i basepar) mellem de to mutationer i EGFR proksimale dubletter (n = 37). De afstandskrav blev inddelt i tre grupper, med afstande på 1-41 bp, 42-82 bp og 83-123 bp, og plottet ved midtpunktet af hver gruppe (20, 60, og 100, henholdsvis). Adskillelse er her defineret som antallet af nukleotider mellem, men ikke inklusive, de to mutationer i en dublet. For MIDIs, er separation defineres som antallet af nukleotider mellem, men ikke inklusive, starten af ​​den første og anden MIDIs. Panel B viser afstanden (i basepar) mellem de to mutationer i p53 proksimale dubletter (n = 23). De afstandskrav blev inddelt i tre grupper, med afstande på 1-31 bp, 32-62 bp og 63-93 bp, og plottet ved midtpunktet af hver gruppe (15, 30, og 45, henholdsvis).

doi: 10,1371 /journal.pone.0003714.s001

(0,62 MB PPT)

figur S2. Salg Dubletter i EGFR-genet, der danner OMIDI par Vildtype (wt) EGFR sekvens i exon 19 fra nukleotid 2227 til 2280, er vist. De otte OMIDI par i lungekræft er diagrammet for at vise sletninger (i magenta), indsættelser (i grønt) og en region, der duplikeres (i gult). Bemærk, at to af dubletter består af to deletioner hver, fem dubletter består af en deletion plus en Indel, og én dublet har en overlapning (indsættelse) plus en Indel. I hvert tilfælde er læserammen genoprettet (se netto tekst udgår)

doi:. 10,1371 /journal.pone.0003714.s002

(0,03 MB DOC)

tabel S1. Salg Supplerende Tabel 1

doi: 10,1371 /journal.pone.0003714.s003

(0,07 MB XLS)

tabel S2. Salg Supplerende Tabel 2

doi: 10,1371 /journal.pone.0003714.s004

(0,07 MB XLS)

tabel S3.

Supplemenatary Tabel 3

doi: 10,1371 /journal.pone.0003714.s005

(0,03 MB XLS)

Tabel S4. Salg Supplerende Tabel 4 fotos doi: 10,1371 /journal.pone.0003714.s006

(0,08 MB XLS)

tabel S5. Salg Supplerende Tabel 5

doi: 10,1371 /journal.pone.0003714.s007

(0,11 MB XLS)

tabel S6. Salg Supplerende Tabel 6 fotos doi: 10,1371 /journal.pone.0003714.s008

(0,04 MB XLS)

tabel S7.

Supplerende Tabel 7

doi: 10,1371 /journal.pone.0003714.s009

(0,06 MB XLS)

Tak

Vi takker Wenyan Li og Jiesheng Chen for DNA sekventering.

Be the first to comment

Leave a Reply