PLoS ONE: Identitet af Descent Kortlægning af Grundlægger Mutationer i Cancer Brug High-Resolution Tumor SNP Data

Abstrakt

Tætte genotype data kan anvendes til at påvise kromosomfragmenter arvet fra en fælles forfader i tilsyneladende ubeslægtede individer. En sygdomsforårsagende mutation arvet fra en fælles grundlægger kan således detekteres ved at søge efter en fælles haplotype signatur i en prøve population af patienter. Vi præsenterer her FounderTracker, en beregningsmetode for hele genomet detektion af stiftere mutationer i kræft ved hjælp af tætte tumor SNP profiler. Vores metode er baseret på to antagelser. Først, vildtype-allel ofte undergår tab af heterozygositet (LOH) i tumorerne af kimlinie mutationsbærere. Sekund, vil overlapningen mellem ancestral kromosomfragmenter nedarvet fra en fælles grundlægger definere en minimal haplotype konserveret hos hver patient bærer grundlægger mutation. Vores tilgang bygger således på påvisning af haplotyper med betydelig identitet ved afstamning (IBD) deling inden tilbagevendende regioner af LOH at fremhæve genomisk loci sandsynligvis at huse en grundlægger mutation. Vi valideret denne fremgangsmåde ved at analysere to real cancer datasæt, hvor vi med succes identificeret stiftende mutationer af velkarakteriserede tumorsuppressorgener. Vi anvendte derefter simulerede data til at vurdere evnen af ​​vores metode til påvisning IBD skrifter som en funktion af deres størrelse og frekvens. Vi viser, at FounderTracker kan registrere haplotyper med lav prævalens med høj effekt og specificitet, betydeligt bedre end eksisterende metoder. FounderTracker er således et stærkt værktøj til at opdage ukendte grundlægger mutationer, der kan forklare en del af den “manglende” arvelighed i kræft. Denne metode er frit tilgængelige og kan bruges online på FounderTracker hjemmeside

Henvisning:. Letouzé E, Sow A, Petel F, Rosati R, Figueiredo BC, Burnichon N, et al. (2012) Identitet af Descent Kortlægning af Grundlægger Mutationer i Cancer Brug High-Resolution Tumor SNP data. PLoS ONE 7 (5): e35897. doi: 10,1371 /journal.pone.0035897

Redaktør: Thomas Mailund, Aarhus Universitet, Danmark |

Modtaget: Februar 22, 2012; Accepteret: 23. marts 2012; Udgivet: Maj 2, 2012 |

Copyright: © 2012 Letouzé et al. Dette er en åben adgang artiklen distribueres under betingelserne i Creative Commons Attribution License, som tillader ubegrænset brug, distribution og reproduktion i ethvert medie, forudsat den oprindelige forfatter og kilde krediteres

Finansiering:. Dette arbejde er en del af CIT-programmet fra den franske Ligue Nationale Contre le Cancer (https://cit.ligue-cancer.net/index.php/en). Dette arbejde blev støttet af tilskud fra Institut National du Cancer og CNRS (LIA NEOGENEX) til Enzo Lalli; CNPq og slag tilskud til Bonald C. Figueiredo. Dette arbejde blev støttet af programmet Hospitalier de Recherche Clinique tilskud COMETE 3 (AOM 06 179). De finansieringskilder havde ingen rolle i studie design, indsamling og analyse af data, beslutning om at offentliggøre, eller forberedelse af manuskriptet

Konkurrerende interesser:.. Forfatterne har erklæret, at der ikke findes konkurrerende interesser

Introduktion

med fremkomsten af ​​SNP arrays og næste generation sekventering, er det nu muligt at genotypebestemme millioner af SNP’er i et enkelt forsøg, til en lav pris. Dette har gjort det muligt at detektere DNA-regioner arvet fra en fælles forfader i to tilsyneladende ubeslægtede individer. To strækninger af DNA siges identisk ved nedstigning, hvis de er identiske skyldes fælles afstamning. Påvisningen af ​​identitet ved afstamning (IBD) i populationer betragtes som en yderst lovende fremgangsmåde til sammenkædning kortlægning af sygdomsgener. Faktisk er sammenkædning analyser udføres normalt i små stamtavler indeholder nært beslægtede individer. Derfor IBD segmenter identificerede tendens til at være for lang til at afgrænse fokale områder af interesse med et begrænset antal kandidatgener. Derimod skrifter af IBD i ubeslægtede individer sjældent spænde mere end et par centimorgan (CM). Befolkning-baserede linkage studier er således meget nyttigt for den fine afgrænsning af kandidat-loci [1]. Adskillige kraftfulde metoder er blevet beskrevet til påvisning skrifter af IBD mellem par af individer, baseret på tætte gradvis [2], [3] eller unphased [4], [5] genotypebestemmelse data. Disse metoder er nyttige for parvis IBD afsløring, men populationsbaseret sammenkædning mapping kræver påvisning af genomiske regioner med en signifikant overskud af IBD i tilfælde af sygdom i forhold til kontrol. To metoder blev for nylig foreslået til påvisning af IBD mellem flere individer: en Markov Chain Monte Carlo metode (MCMC) [6], og DASH (DASH Associates Delte haplotyper) [7], en graf-baserede algoritme, som bygger på parvise IBD segmenter at udlede klynger af IBD individer. En væsentlig begrænsning af MCMC er, at det involverer intens beregning og er derfor ikke egnet til analyse af store datasæt bestående af high-density SNP profiler. DASH er meget hurtigere, men kun returnerer en liste med haplotyper, der er identiske med afstamning i adskillige prøver. Betydelig berigelse i tilfælde sygdom kan derefter blive vurderet gennem en statistisk association test. Men denne tilgang tager kun hensyn til omfanget af bevarede haplotyper, og ikke deres længde. Men en lang haplotype, selv stødt på i nogle få tilfælde, er tilbøjelige til at indikere tilstedeværelsen af ​​en grundlægger mutation.

Vores metode er specielt dedikeret til kortlægning af cancer gener. Et centralt træk ved cancere er, at tumorceller akkumulere kromosomafvigelser tilvejebringer en vækstfordel i cancer progression, således at tumoren genomet sidst bliver et stærkt omarrangeret version af den konstitutive genom af patienten. Desuden er placeringen af ​​somatiske ændringer delvis drevet af tilstedeværelsen af ​​risikofaktorer alleler i kimcellelinje-genomet [8]. Især patienter arver en kimcellelinje mutation i et tumorsuppressorgen hyppigt miste sin normale modpart i cancerceller, afslører den mutante fænotype, som i Knudson to-hit model [9]. Således er kimlinie mutationer ofte placeret i områder af tab af heterozygositet (LOH). Denne funktion er særlig nyttig for bindingen kortlægning af cancer-gener. For det første kan regioner LOH bruges til at prioritere jagten på tilbagevendende IBD. For det andet, når en genomisk region undergår LOH, kun en af ​​de to parentale kromosomer forbliver i tumor-DNA, så haplotypen af ​​denne kromosom er givet direkte af tumoren SNP profil, uden behov for en haplotype-udfasning trin. Minimale regioner LOH er således et ideelt udgangspunkt til påvisning af tilbagevendende IBD i en population prøve af tumorer.

Vores metode er beregnet til detektion cancer-associerede mutationer arvet fra en fælles grundlægger, hjælp tilbagevendende IBD i minimal regioner af LOH (figur 1). Byggende på kønscellelinie algoritme [3] for parvis IBD detektion i fasede haplotyper beskriver vi helt tilgang, der tager hensyn til både hyppigheden og længden af ​​IBD segmenter til karakterisering af væsentligt konserverede haplotyper i et sæt af tumor prøver. Vi validerer denne tilgang på to reelle kræft datasæt. I det første datasæt, som omfatter 13 barndom adrenocortikale tumorer fra det sydlige Brasilien, vi afgrænse en konserveret haplotype spænder 520 kb omkring den tidligere rapporterede p.R337H

TP53

grundlægger mutation. I den anden datasæt, som omfatter 30 fæokromocytom og paragangliomer, vi opdager en ny grundlægger mutation af

SDHD

gen, til stede i kun to prøver. Endelig viser vi med simuleret data, som FounderTracker registrerer konserverede haplotyper med lav prævalens med høj effekt og specificitet, betydeligt bedre end eksisterende metoder.

Resultater

Afsløring konserverede haplotyper i tilbagevendende regioner LOH

Vores strategi for populationsbaseret sammenkædning kortlægning af stiftere mutationer i kræft er illustreret i figur 1. en mutation breder gennem en population overføres inden for en kromosom fragment fra den fælles forfader, der bliver mindre fra generation til generation på grund af genetiske rekombination ved meiose. Alle mutationsbærere er således identisk med nedstigningen til deres fælles forfader til kromosomet region huser kimcellelinje mutation. Desuden er vildtype-modstykke til mutantgenet hyppigt tabt ved LOH i tumorer, der forekommer i kimlinie mutationsbærere. Vores tilgang til kortlægning af stiftere mutationer ved hjælp SNP-array data dermed involverer (i) identificere tilbagevendende regioner LOH, (ii) at rekonstruere tumor haplotyper i disse regioner, og (iii) søgning efter tilbagevendende IBD i tumor haplotyper.

Dette diagram illustrerer principperne bag vores metode. En stifter mutation (rød stjerne på skematisk diagram af kromosomer) spredes gennem en population i et kromosom fragment (i rødt) har arvet fra den fædrene stifter (A). På grund af krydsende-overs (stiplede linier) mellem homologe kromosomer ved meiose, er denne kromosom fragment forkortet gennem generationer, således at mutationsbærere (angivet med rødt) i sidste ende havnen kun en kort identisk med afstamning (IBD) haplotype omkring mutant gen (B ). Desuden er vildtype-modstykke til kimcellelinje mutationer ofte tabt af LOH i tumorer, således at stifter mutationen typisk ligger inden for et minimalt område af LOH (C). Som følge heraf er grundlægger mutation beliggende inden for en haplotype konserveret i hver mutation bærer (peak IBD score), i den minimale region LOH (D).

Med én probe målretning hver af de to alleler af hver SNP, SNP arrays er et udmærket redskab til genomet hele påvisning af LOH, og flere algoritmer er blevet beskrevet til dette formål [10], [11]. I denne undersøgelse, bruger vi Genome Ændring Print metode [12] for at opdage LOH, der definerer et sæt af tilbagevendende regioner LOH på grundlag af deres frekvens i sættet tumor data.

Vi derefter rekonstruere haplotypen af det tilbageholdte allel i hver tumor (figur 2). Da kun en af ​​de to kromosomer forbliver i tumoren grundet LOH, genotyperne opnået for tumor-DNA direkte tilvejebringe haplotypen af ​​kromosomet tilbageholdes i tumorceller. I øvrigt, hvis konstitutiv DNA er også tilgængelig, en sammenligning af de unphased genotyper af konstitutiv DNA med tumoren haplotypen kan udføres at udlede haplotypen af ​​den tabte kromosom. For at estimere fejlprocenten i forbindelse med denne tilgang, vi sammenlignede haplotyper rekonstrueret to tumorer fra den samme patient, hvor det samme kromosom blev tabt ved LOH [13], og vi opnåede en meget lav fejlprocent ( 5 × 10

-5)

genotyper kan udledes SNP-array data, med B allel frekvens (BAF), som karakteriserer fluorescens forholdet mellem A- og B-alleler i hvert locus:.

BAF = B /Hotel (

A + B

). I konstitutiv DNA, hver SNP er til stede som to alleler. Genotypen af ​​hver SNP (AA, AB, eller BB) kan således bestemmes ud fra BAF (0, 0,5 eller 1, henholdsvis), men ikke haplotypen af ​​hvert kromosom. Hvis derimod en af ​​de to kopier er bortfaldet, LOH i tumoren, tumor SNP profil direkte afspejler haplotypen af ​​kromosomet, der tilbageholdes i tumoren. Hvis parrede konstitutive og tumor DNA-prøver er tilgængelige, kan haplotypen af ​​det tabte kromosomet rekonstrueres ved at sammenligne de to profiler.

Endelig har vi søger efter markant tilbagevendende IBD i sæt af rekonstruerede tumor haplotyper. Den analytiske rørledning til dette trin er repræsenteret i figur 3. Segmenter af parvise IBD først identificeret med kimcellelinje algoritmen [3]. Vi derefter tildele en score for hver parvis IBD segment, idet der tages hensyn til både antal og allele frekvenser af SNPs inden for hvert segment (se materialer og metoder). En IBD score beregnes derefter for hver SNP markør, som summen af ​​snesevis af alle de parvise IBD segmenter indeholder denne SNP. skal også tages bindingsuligevægt (LD) i betragtning, fordi genomiske regioner af stærk LD systematisk vil have høje IBD scorer (Figur S1). Vi har derfor sammenligne, for hver SNP, IBD score opnået for tumorer med en null fordeling af IBD scoringer etableret ved hjælp af en reference sæt haplotyper fra raske kontrolpersoner (f.eks fasede haplotyper fra 1.000 genomprogramledere projekter).

FounderTracker rørledning til tilbagevendende IBD detektion er opdelt i to trin. En IBD score er først beregnet for hver SNP markør i tumoren sæt af haplotyper. IBD score er afledt af de parvise IBD segmenter identificeret med kimcellelinje algoritme. Det tager hensyn til deres længde og allele frekvenser af SNPs inden for hvert segment. Det IBD score for tumorer sammenlignes derefter med en null fordeling etableret fra en reference datasæt, at identificere de SNPs med IBD score betydeligt højere end forventet ved en tilfældighed.

Anvendelse på tilfælde af barndommen adrenocortikale tumorer i det sydlige Brasilien

Som en proof-of-concept, vi først anvendt vores metode til eksemplet med barndommen adrenocorticale tumorer (ACT). Disse sjældne kræftformer (0,3-0,4 tilfælde om året per million børn under en alder af 15 år) er usædvanligt udbredt i det sydlige Brasilien (3,4-4,2 tilfælde pr million) [14], hvor de næsten altid knyttet til en bestemt kimlinie mutation af

TP53

(c.1010G a, p.R337H) [15], [16], identificeret som en grundlægger mutation [17]. Vi analyserede 13 brasilianske tilfælde af ACT og seks matchede blodprøver på Illumina 370K SNP arrays. Alle tumorer blev fundet at bære p.R337H

TP53

mutation. Vi brugte Genome Ændring Print metode til at påvise LOH. Denne metode identificeret to regioner viser LOH i alle prøver: en 4,4 Mb region på 11p15, og hele kromosom 17. Vi derefter brugt FounderTracker at registrere markant tilbagevendende IBD i disse to regioner. Ingen signifikant region af IBD blev påvist i 11p15 regionen (fig S1), men højsignifikante IBD scoringer blev opnået for 17p13 regionen (q-værdi 2,2 × 10

-16). Især peak IBD score defineret en 520 kb region omkring

TP53

genet (figur 4a). Detaljeret haplotype analyse viste, at de muterede kopier tilbageholdes i 13 tumorer viste en identisk haplotype for denne region, mens de vildtype-kopier rekonstrueret for de seks patienter med matchede blodprøver viste forskellige haplotyper (figur 4b). Denne tilbagevendende IBD segment svarer således til kromosomet fragmentet bærer p.R337H

TP53

mutation arvet af alle patienter fra den fælles grundlægger, som ikke er blevet forstyrret af crossover i slægt.

den IBD score beregnes langs kromosom 17 for det sæt af 13 barndom adrenocorticale tumorer (ACT) viser en betydelig top ved 17p13.1 (a). De kraftige stigninger i IBD score kurve svarer til grænserne for IBD segmenter i hvert par af tumorer. Toppen region er vist detaljeret i panel B, med haplotyperne af de 13 kromosom kopier tilbageholdes i tumorer (huser mutant

TP53

allel), og haplotyperne af kromosomet eksemplarer tabt ved LOH (huser en vildtype

TP53

allel) rekonstrueres for de seks patienter med matchede normale blodprøver. Haplotyperne af vildtype alleler er alle forskellige, hvilket viser eksistensen af ​​forskellige haplotyper for denne genomiske region i den analyserede population. Derimod en haplotype fælles for alle mutantalleler spænder over 470 kb opstrøms og 32 kb nedstrøms

TP53

(repræsenteret ved en tyk rød linje). Denne bevaret haplotype svarer til kromosom fragment huser R337H

TP53

mutation arvet fra fædrene grundlægger.

Den gennemsnitlige længde af parvise IBD skrifter omkring

TP53

var 5.4 cm (der spænder fra 0,88 cm til 19 cm, figur S2). Som parvise IBD segmenter skønnes at have en længde på

1 /Kreis (

2n

) Morgans efter

n

generationer (dermed

2n

meiose) [ ,,,0],2], dette tyder på, at p.R337H

TP53

mutation opstod omkring ni generationer siden.

Anvendelse på tilfælde af fæokromocytom og paragangliomer

fæokromocytom og paragangliomer er neuroendokrine tumorer skyldes binyremarven og fra sympatiske eller parasympatiske paraganglia væv hhv. Disse tumorer forekommer i forbindelse med nedarvede cancer syndromer i -30% af tilfældene [18]. Kønscellelinie mutationer forbundet med familiær fæokromocytom omfatter mutationer af

RET

,

NF1

,

VHL

,

TMEM127

,

MAX

, og gener, der koder proteiner fra succinatdehydrogenase kompleks (

SDHA

,

SDHB

,

SDHC

,

SDHD

og

SDHAF2

). Her har vi anvendt vores metode til grundlægger mutation opdagelse til et sæt af 30 fæokromocytom /paragangliomer fra ubeslægtede patienter. Prøver blev fuldt karakteriseret, hvad angår germlinie mutationer, og analyseret på Illumina 610K SNP arrays. LOH analyse viste ti regioner med LOH frekvens over 20%, ved 1p, 3p, 3q, 6Q, 11 p, 11q, 17p, 17q, 21q, og 22q (figur 5A, øverst). For disse regioner, blev tumor haplotyper rekonstrueret fra B allelfrekvens profiler, og analyseret med FounderTracker at opdage bevarede kromosom segmenter. Denne analyse viste en 2,34 cM region med signifikant IBD ved 11q23.1 (figur 5A, nederst). Interessant i denne kromosom segment 32 gener, herunder

SDHD

, og er identisk med afstamning i to prøver (HS_048 og HS_158, figur 5B), som er netop de to prøver i vores kohorte, for hvilken en c.64C T (p.Arg22X) kønscellelinie

SDHD

mutation blev identificeret (tabel S1). Dette fund viser, at p.Arg22X

SDHD

mutationer i disse to tilsyneladende uafhængige patienter stammer fra en enkelt grundlægger, og yderligere at validere relevansen af ​​vores metode til påvisning grundlægger mutationer i kræft.

( A) LOH analyse viste 10 kromosom arme med LOH frekvens 20% i vores sæt af 30 fæokromocytom og paragangliomer (øverst). Disse regioner blev analyseret under anvendelse FounderTracker at detektere konserverede haplotyper, afslører en enkelt væsentligt region på kromosom arm 11q (nederst). (B) Visualisering af den betydelige region identificeret på kromosom 11 med Integrative Genomics Viewer [44]. Den IBD score er repræsenteret som en blå linje over tumor haplotyper. Haplotyper er repræsenteret som serier af blå og gule lodrette linjer, som svarer til SNP’er med henholdsvis “A” og “B” genotype, ifølge Illumina nomenklatur. Den betydelige region opdaget af FounderTracker svarer til den lange haplotype der er identisk i tumorer HS_048 og HS_158, og resulterer i en høj IBD score for dette segment. Denne region indeholder 32 gener, herunder

SDHD

(angivet med rødt).

Evaluering af magt af metoden med simulerede data

Barndommen ACT er en ideel casestudie for populationsbaseret sammenkædning kortlægning. Da denne sygdom er yderst sjælden i fravær af p.R337H

TP53

grundlægger mutation, alle de valgte gennem en stikprøvekontrol af tumorer prøver bære denne mutation. I de fleste sammenhænge, ​​tumorer, der kan tilskrives en given grundlægger mutation udgør kun en delmængde af kræft i en population. Vi har vist med fæokromocytom /paragangliom datasæt at FounderTracker var i stand til at opdage en grundlægger mutation til stede i kun to ud af 30 prøver (7%). For yderligere at evaluere resultaterne af vores metode, genereret vi simulerede data ind, som vi kunstigt indført bevarede haplotyper af forskellige længder og frekvenser. Vi benchmarkes FounderTracker ved at analysere de samme simulerede data med DASH-algoritmen, for nylig udviklet til at opdage klynger af individer, der deler en identisk haplotype [7], som vi tilpasset vores formål (se Materialer og metoder). Denne fremgangsmåde gav gode resultater med de barndom ACT datasæt (Figur S3), validering sin relevans som benchmark metode.

Alle haplotyper bevaret i ≥ 50% prøver lykkedes opdaget af enten metode (tabel 1). Både FounderTracker og DASH var i stand til at opdage haplotyper bevaret i ≥15% prøver med god effekt ( 0,9), men FounderTracker betydeligt bedre end DASH i det lave frekvensområde (≤10%) (tabel 1, figur 6). ROC kurver angiver, at FounderTracker registrerer tilbagevendende IBD segmenter med høj følsomhed og specificitet ned til et minimum frekvens, der afhænger af længden af ​​IBD segmenter. IBD skrifter på 5 cm detekteres med god effekt ( 0,9) fra en frekvens på 5%, mens der registreres korte segmenter på 1 cm med samme effekt kun ved frekvenser ≥15%. Den falske opdagelse, beregnet på tværs af alle simuleringer, var ubetydelig for begge metoder (henholdsvis 8,6 × 10

-3 og 5,4 × 10

-4 for FounderTracker, og DASH).

udførelsen af ​​FounderTracker blev vurderet under forskellige betingelser, i sammenligning med DASH-metoden. Evnen af ​​hver metode til påvisning konserverede haplotyper blev etableret som en funktion af haplotype længde (1 til 5 cm) og prævalens (2 til 10% af prøverne). For hver tilstand, blev den gennemsnitlige ROC optegnes ved at anvende hver metode til 100 simulerede datasæt.

De simulerede data præsenteres her svarer til SNP indholdet af Illumina 1M-Duov3 beadchip (1,199,187 markører). For at vurdere virkningen af ​​SNP tæthed om udførelsen af ​​metoden, analyserede vi de samme simulerede data, begrænset til de eneste 373,397 SNPs i Illumina HumanCNV370-Quad chip. Selv om der var en lille forringelse i afsløring af korte haplotyper (0,5 cm) med Illumina CNV370 array, vi opnåede et sammenligneligt niveau af ydeevne med både markør tætheder (Figur S4). Det er blevet anslået, at 85% af det humane genom er udspændt af haplotype blokke af 10 kb eller større i europæiske prøver [19], således at størstedelen af ​​de mest SNP’er er godt fanget af hel-genom genotypebestemmelse arrays indeholdende 100.000 markører eller mere, enten direkte eller gennem bindingsuligevægt [20]. Vores resultater er i overensstemmelse med dette tal og give vigtige oplysninger om den vifte af anvendeligheden af ​​vores metode, hvilket tyder på, at strømmen kan opnås med den nuværende generation af arrays er tæt på den maksimale effekt af IBD kortlægning.

Køretiden af FounderTracker er lineært forbundet med antallet af prøver og SNP-markører analyseres. For eksempel behandling af barndommen ACT datasæt (13 prøver, 9,762 SNP’er) tog 4 min 07 sek, og den længste løb vores simuleringer for et datasæt på 100 kromosom 1 haplotyper (80,158 SNP’er), tog 2 timer 48 minutter på en enkelt kerne af en Intel Xeon X5470 Quad-Core processor, der kører på 3,33 GHz. Men som bemærket ovenfor, ville lille stigning i ydelse kunne forventes, fra analysen af ​​tættere SNP data, så den mængde data analyserede kan være begrænset med hensyn til markører, til den aktuelle SNP indholdet af HD-arrays.

diskussion

de fleste af de fundne hidtil grundlæggervirkning blev afsløret ved målrettede undersøgelser af polymorfe markører omkring velkendte kræft-relaterede mutationer. Vi introducerer her den første systematisk tilgang til detektering grundlægger mutationer på en genom-plan, fra tætte SNP profiler af tumorprøver

SNP arrays er meget udbredt i kræftforskning til to hovedformål:. Opdagelsen af ​​kimcellelinje risiko varianter i lift eller associeringsaftaler undersøgelser, og identifikationen af ​​tilbagevendende kromosomomlejringer. Deltagerne typisk studere udelukkende kimcellelinje-genomet for forbindelsesundersøgelser, eller tumor-genomet til analyse af kromosomomlejringer, men en kombineret analyse af risikofaktorer alleler og kromosomafvigelser har vist sig at være frugtbar [21]. I denne undersøgelse anvendte vi LOH at prioritere regioner af interesse for IBD kortlægning. En af begrænsningerne ved denne fremgangsmåde er, at andre mekanismer, såsom mutation eller promotor hypermethylering, kan inaktivere vildtype-modstykke til et mutantgen i fravær af LOH. Imidlertid har tidligere undersøgelser vist LOH at være en fælles “anden hit” i kimlinie mutationsbærere [22], [23]. Vores tilgang er derfor sandsynligt, at være relevant i en stor del af tilfældene. Desuden kan høj tillid haplotyper udledes tumor SNP profiler i områder af LOH. IBD detektering kan således udføres med strenge parametre, hvilket gør metoden særdeles specifik. Endelig LOH på en kræft-gen locus vil sandsynligvis være mere hyppige i mutationsbærere end hos ikke-bærere, som allerede vist for

BRCA

gener [24]. Ved at overveje kun prøver med en LOH for hver kandidat region, kan vi således være i stand til at opdage konserverede lavfrekvente haplotyper, der ikke ville have opdaget som væsentlige ved at betragte hele tumor indstillet.

Ingen eksisterende tilgang var præcis konstrueret til systematisk detektion af stiftende mutationer i cancer, men DASH fremgangsmåde til påvisning klynger af haplotyper deler identitet-by-afstamning kan let tilpasses til vores formål. Forskellen mellem FounderTracker og DASH ligger i karakteriseringen af ​​markant tilbagevendende IBD fra parvis IBD-kampe. DASH identificerer klynger af haplotyper konserveret i adskillige prøver. Man kan derefter teste, om en af ​​disse haplotyper er signifikant overrepræsenteret i tumorer, sammenlignet med normale kontroller. En begrænsning ved denne fremgangsmåde er, at når klynger identificeres, er foreningen testen ikke tage hensyn til længden af ​​konserverede haplotyper. Derimod vurderer FounderTracker tilgang en IBD score, der tager hensyn til både hyppigheden og længden af ​​bevarede haplotyper. Som et resultat, FounderTracker betydeligt over DASH til detektering haplotyper konserveret i ≤10% prøver. Dette gør en vigtig forskel i form af applikationer, da grundlægger mutationer vil sandsynligvis være relativt sjældne i de fleste tilfælde. For eksempel vil en grundlægger mutation til stede i kun 5% af tumorer, der ligger inden for en bevaret haplotype af gennemsnitlig længde 5 cm, (ligesom p.R337H

TP53

mutation i brasiliansk ACT) påvises med en effekt på 0.92 med FounderTracker versus 0 med DASH (tabel 1). Desuden er haplotypen omkring

SDHD

, bevaret i to paragangliomer, registreres ikke ved DASH (Figur S5). En anden eksisterende metode til påvisning af IBD i flere individer er Markov Chain Monte Carlo (MCMC) tilgang [6]. Men denne metode er meget beregning-intensive og forfatterne beskrev sin ansøgning til små datasæt kun (højst 15 prøver og 1278 SNPs). Da vi forsøgte at anvende denne tilgang til vores sæt af data til barndommen adrenocorticale tumorer, metoden undladt at konvergere efter flere dage. Derimod FounderTracker kunne behandle det samme datasæt i et par minutter. Vi konkluderer, at MCMC er ikke meget velegnet til analyse af high-definition SNP-array data.

Vi viser, med simulerede data, at vores metode kan detektere konserverede haplotyper på mindst 0,5 cm i længde (figur S4) . Chapman

et al.

Viste, at efter 100 generationer af tilfældig parring i en voksende befolkning, ville IBD skrifter har en gennemsnitlig længde på 0,6 cm [25]. Vores metode er derfor velegnet til påvisning af cancer-relaterede mutationer, der forekom mindre end 100 generationer siden. Da FounderTracker afhængig af null fordeling af IBD scores at identificere væsentligt bevarede haplotyper, vi kraftigt opfordre FounderTracker brugere til at bruge referenceprøver af samme herkomst som tumor prøver at beregne null distributioner. I mangel af en brasiliansk henvisning datasæt, brugte vi CEU data for 1000 genomer projektet som reference for analysen af ​​adrenocorticale tumorer, fordi befolkningen i Parana tilstand er overvejende af europæisk oprindelse [26].

med hensyn til frekvens, kan FounderTracker opdage, med høj effekt, hapiotyper bevaret i mere end 5% af prøverne, afhængigt af længden af ​​IBD segmenter. Andelen af ​​tumorer huser en grundlægger mutation i en tilfældig population prøve afhænger hovedsageligt af den genetiske mangfoldighed af befolkningen og forekomsten af ​​sygdommen. Sjældne kræftformer, såsom barndommen ACT, med en højere forekomst i et bestemt geografisk område er ideelle til IBD kortlægning, fordi næsten alle tilfælde skyldes grundlæggeren mutationen. I almindelige sygdomme, såsom brystkræft, blev højfrekvente grundlægger mutationer beskrevet første gang i geografisk eller kulturelt isolerede bestande. For eksempel

BRCA1

BRCA2

grundlægger mutationer blev oprindeligt opdaget i Ashkenazi jødiske befolkning [27], [28], og i Finland [29], hhv. Imidlertid har den omfattende analyse af disse to gener i mange geografiske områder siden afsløret eksistensen af ​​mere end 20 forskellige grundlægger mutationer i forskellige regioner [30]. Disse resultater tyder på, at grundlægger mutationer kan være mere udbredt end i øjeblikket troede. FounderTracker kan bruges online via en web-applikation, og kildekoden kan downloades fra vores hjemmeside (https://cit2.ligue-cancer.net/FounderTracker).

Materialer og metoder

patienter og etik redegørelse

Tretten ACT patienter fra en brasiliansk kohorte [31] blev inkluderet i denne undersøgelse. Etisk godkendelse for studiet blev opnået fra Pequeno Príncipe Hospital Etiske Komité (Curitiba, Brasilien) og CONEP (Federal Etiske Komité i Brasilia, Brasilien) i 2009. I alle tilfælde, en af ​​forældrene eller juridiske repræsentanter underskrev et informeret samtykke godkendt form af lokale etiske komité. DNA blev ekstraheret fra tumoren og perifert blod som tidligere beskrevet [31].

TP53

mutation analyse blev udført som beskrevet tidligere [32].

Tumor prøver fra tredive patienter med fæokromocytom eller paragangliom fra den franske COMETE netværk, indsamlet af Georges Pompidou europæiske Hospital, blev inkluderet i denne undersøgelse. Etisk godkendelse for studiet blev opnået fra den institutionelle Review Board (CPP Paris-Cochin januar 2007). Alle patienter skal have skriftligt informeret samtykke til indsamling af prøver og efterfølgende analyser. Tumor-DNA blev ekstraheret som tidligere beskrevet [33]. Klinisk

NF1

diagnose og genetisk testning for

RET

,

SDHA

,

SDHB

,

SDHC

,

SDHD

og

VHL

blev udført som tidligere beskrevet [33].

SNP-array hybridisering og forbehandling

De 13 adrenocorticale tumor prøver blev analyseret med Illumina HumanCNV370-Duo v1. 0 chips, der indeholder 370,404 sonder og de seks matchede normale prøver blev analyseret med Illumina HumanCNV370-Quad v3.0 chips, der indeholder 373,397 sonder. De 30 fæokromocytom /paragangliomer blev analyseret med Illumina Human610-Quad v1.0 chips, der indeholder 620,901 sonder. Hybridisering blev udført af IntegraGen (Evry, Frankrig), i henhold til instruktionerne fra array producenten. Rå fluorescerende signaler blev importeret til Illumina BeadStudio software og normaliseret, som tidligere beskrevet [34], for at opnå den log R ratio (LRR) og B allel frekvens (BAF) for hver SNP. page:

https://mathgen.stats.ox.ac.uk/impute/impute_v2.html#download_reference_data.

Assessing

Be the first to comment

Leave a Reply