PLoS ONE: Linkage Analysis i Familiær Ikke-Lynch syndrom Kolorektal Cancer Familier fra Sweden

Abstrakt

Familie historie er en stor risikofaktor for tarmkræft og mange familier adskille sygdommen som en tilsyneladende monogeniske træk. Et mindretal af familiær kolorektal cancer kunne forklares ved kendte monogene gener og genetiske loci. Familiær polypose og Lynch-syndrom er to syndromer, hvor prædisponerende gener er kendt, men mange familier er blevet testet uden at finde den prædisponerende gen. Vi udførte et genom bred bindingsanalyse i 121 kolorektale familier med en forøget risiko for colorectal cancer. Familierne blev konstateret fra afdelingen for klinisk genetik ved Karolinska Universitetshospital i Stockholm, Sverige og blev anset for negativ for familiær polypose og Lynch-syndrom. I alt 600 patienter blev genotype anvendes enkelt nukleotid polymorfi-chips. Parametric- og ikke-parametriske sammenkædning analyser blev beregnet ved hjælp af MERLIN i alle og delmængder af familier. Ingen statistisk signifikant resultat blev set, men der var suggestive positive HLODs over to i parametrisk kobling analyse. Dette blev observeret i en recessiv model for familier med høj risiko, på locus 9q31.1 (HLOD = 2,2, rs1338121) og for familier moderat risiko, på locus Xp22.33 (LOD = 2,2 og HLOD = 2,5, rs2306737). Brug familier med tidlig debut, recessiv analyse foreslog en locus på 4p16.3 (LOD = 2,2, rs920683) og en på 17p13.2 (LOD /HLOD = 2,0, rs884250). Ingen NPL score over to blev set for nogen af ​​familierne. Vores sammenkædning undersøgelse gav yderligere støtte til det tidligere foreslået region på kromosom 9 og foreslog yderligere loci at være involveret i tyk- kræftrisiko. Sekventering af gener i regionerne vil ske i fremtidige undersøgelser

Henvisning:. Kontham V, von Holst S, Lindblom A (2013) Linkage Analysis i Familiær Ikke-Lynch syndrom Kolorektal Cancer Familier fra Sverige. PLoS ONE 8 (12): e83936. doi: 10,1371 /journal.pone.0083936

Redaktør: Nathan A. Ellis, University of Illinois i Chicago, USA

Modtaget: 8. oktober, 2013; Accepteret: November 18, 2013; Udgivet: 11. december 2013 |

Copyright: © 2013 Kontham et al. Dette er en åben adgang artiklen distribueres under betingelserne i Creative Commons Attribution License, som tillader ubegrænset brug, distribution og reproduktion i ethvert medie, forudsat den oprindelige forfatter og kilde krediteres

Finansiering:. Økonomisk støtte blev tilvejebragt gennem regional aftale om medicinsk uddannelse og klinisk forskning (ALF) mellem Stockholm County Council og Karolinska Institutet (20.110.483), den svenske Cancer Society (110.439), det svenske forskningsråd (20.103.543), Stockholm Cancer Foundation (111.232) og Nilsson-Ehle Foundation. Den SNP teknologiplatform i Uppsala er støttet af Knut Alice Wallenberg Foundation via Wallenberg Consortium og Uppsala Universitet. De finansieringskilder havde ingen rolle i studie design, indsamling og analyse af data, beslutning om at offentliggøre, eller forberedelse af manuskriptet

Konkurrerende interesser:.. Forfatterne har erklæret, at der ikke findes konkurrerende interesser

Introduktion

Kolorektal cancer (CRC) er stigende i forekomst og er rangeret som den anden og tredje mest almindelige kræftform i den vestlige verden og Sverige. CRC har en levetid risiko på 5% og påvirker mænd og kvinder lige. En væsentlig risikofaktor er en familie historie af sygdommen og 20-25% af alle CRC tilfælde har en nær slægtning med samme sygdom [1]. Kendte syndromer såsom familiær adenomatøs polypose (FAP) og Lynch-syndrom er ansvarlige for mindre end 5% af kolorektal kræfttilfælde [2], som efterlader et flertal af de familiære tilfælde kolorektal cancer uforklarlige. Arven foreslår ofte en dominerende overførsel af sygdommen, men recessiv nedarvning og endda en kompleks arv er blevet foreslået [3]. Et syndrom, familiær CRC type X, er blevet foreslået til familier, der opfylder kriterierne for Lynch-syndrom, men uden germlinie mutationer [4]. Men familier negative efter Lynch syndrom diagnostik kun sjældent opfylder disse strenge kriterier, mest fordi et senere udbrud eller reduceret penetrans. Senest Genome Wide Association Studies (GWAS) er blevet anvendt til at finde genetiske loci forbundet med en vis risiko for at udvikle CRC. Disse loci; 6p21, 8q23.3, 8q24.21, 9p24, 10p14, 11q13.4, 11q23.1, 14q22.2, 15q13.3, 16q22.1, 18q21.1, 19q13.1 og 20p12.3, 1q41, 3q26. 2, 12q13.13, 20q13.33, Xp22.2 [5-14] kunne til en vis grad støtte forklaringen på CRC som en kompleks sygdom. Historisk set har koblingsanalyse været et effektivt værktøj finde monogeniske sygdom, der forårsager kolorektal cancer gener som APC [15], MSH2 [16] og MLH1 [17]. Også nye kandidat regioner for yderligere eksistensen af ​​moderat til fremhæve penetrant CRC loci er blevet rapporteret fra sammenkædning undersøgelser, men ingen afslappet mutation er endnu ikke fundet. Den loci på kromosom 9q [18-20], 3q [21,22] og 14q [23,24] er blevet rapporteret mere end én gang. En tidligere binding studie i familiær savtakket neoplasi foreslog et locus på kromosom 2q [25]. For nylig 4 forskellige loci med en betydelig HLOD over 3; på kromosomerne 12q24 i alle CRC familier, 4q21 i begyndelsen onset-, 15q22.31 i høj risiko- og 8q13.2 i familier moderat risiko blev foreslået [26]. Den aktuelle undersøgelse udført et genom bred kobling (GWL) scanning med 600 personer fra 121 svenske CRC familier og analyseret alle familier, tidlig onset-, høj risiko og risikofaktorer familier moderate separat.

Materialer og metoder

Etik erklæring

Undersøgelsen blev gennemført efter aftale med den svenske lovgivning for etisk tilladelse og i henhold til beslutningen i Stockholm regionale komité (2008 /125 til 31,2). Alle deltagere gav skriftligt informeret samtykke til at deltage i undersøgelsen.

Patienter

De familier blev konstateret gennem kliniske genetik afdeling på Karolinska Universitetshospital i Stockholm, Sverige mellem 1990 og 2005. FAP blev udelukket ved hjælp af medicinske journaler fra berørte enkeltpersoner og Lynch-syndrom blev udelukket ved hjælp af vores nuværende kliniske protokol [27]. Familier blev inkluderet i undersøgelsen, hvis der var mindst to berørte slægtninge informative for bindingsanalyse, således i det mindste en sib-pair. Nærmere oplysninger om de familier er vist i tabel 1. Tidlig debut familier blev defineret som familier med en gennemsnitlig alder på diagnose mindre end 50, blev der høj risiko familier defineret som familier med tre eller flere berørte personer i nære slægtninge. risiko familier Moderat blev defineret som familier med to eller flere søskende er ramt. Otte familier opfyldt kriterierne for CRC type X [4] (to overlappede med tidlig debut familier), men blev ikke analyseret særskilt

Total

. 3 CRC

middelværdier 50

Sibs kun

No. families12127849Mean age64624866No. familier med en hvilken som helst 5027886No. familier med nogen. 607221822Table 1. Beskrivelse af familier i koblingsanalyse

CSV Hent CSV

Genotypning

Genomisk DNA blev ekstraheret fra perifert blod ved hjælp af standardprocedurer. Genotypebestemmelse blev udført separat i to forskellige sæt af familiens materiale. Genotypebestemmelse af 548 patienter med 6090 markører blev udført af Illumina Infinium analysen [28,29] ved hjælp af Illumina HumanLinkage-12 DNA-analyse perle chip. Den samlede reproducerbarhed i genotypen data var 99,996% baseret på 6,25% af duplikerede genotypings. Den gennemsnitlige takst pr SNP var 99,57%. Derudover blev 52 personer med genotype ved hjælp af Illumina Golden Gate-analysen [30] og Illumina Linkage Panel IVb (6008 markører). Den samlede reproducerbarhed i genotypen data var 100% baseret på 2,2% af duplikerede genotypings. Den gennemsnitlige takst pr SNP var 97,27%. Arrays blev behandlet i henhold til fremstiller protokol på SNP teknologiplatform i Uppsala og tilgængelige efter anmodning.

Linkage analyse

Pedcheck [31] blev brugt til at kontrollere for den indledende Mendelsk nedarvning analyse blandt familierne. Familien baseret genetisk model blev brugt til parametrisk sammenkædning analyse for alle kromosomer, herunder kromosom X. Som supplement ikke-parametrisk analyse ved hjælp Whittemore og Halpern NPL statistik blev lavet [32]. LOD score samt heterogenitet LOD scoringer blev beregnet ved hjælp af MERLIN (version 1.1.2) [33] og blev givet for alle genotypede positioner. Analyser blev udført under antagelse både dominante og recessive træk. For autosomal dominant og recessiv arvegang sygdommen allel frekvens blev sat til 0,0001. De penetrans satser for den dominerende og recessive arvegang for homozygot normal, heterozygot og homozygot påvirkede blev sat til 0,05, 0,80, 0,80 og 0,001, 0,001, 1,0 hhv.

Personer med kolorektal cancer eller en polyp med høj grad dysplasi blev kodet som påvirkes. Familiemedlemmer med uklare status blev kodet som ukendt. Familier blev konstateret under forudsætning af en dominerende træk og ægtefæller blev derfor kodet som upåvirket. Fire forskellige analyser blev udført ved anvendelse af forskellige sæt af familier og patienter; alle familier, alle familier med mindst tre tilfælde (højrisiko), alle familier med CRC blandt søskende (moderat risiko) og familier med en gennemsnitsalder under 50 (tidlig debut) at være sammenlignelige med resultaterne fra den seneste kobling undersøgelse af Cicek et al.

alle 121 familier, herunder alle fag fra både genotype sessioner, blev brugt til sammenkædning analyse. Således blev to markørstoffer filer fusioneret og 7256 markører blev anvendt i analysen. Merlin som standard tillader maksimalt 24 bit til hver familie, hvorfor fire store familier måtte deles. Familierne blev delt, så hver sub-familie brugte en fælles forfader og anbragt i den grænse, som defineret mens du kører programmet. De oprindelige 121 familier blev analyseret som 126 (én familie skulle opdeles i tre).

Da tilstedeværelsen af ​​koblingsuligevægt (LD) kan puste multipoint sammenkædning statistik, en tærskel på r

2 = 0,1 er blevet brugt til at undgå, at falske positive resultater oppuste statistikken [34]. LD blandt SNPs med r

2 0,1 tegnede sig for, ved MERLIN organisere markørerne i klynger. MERLIN gør brug af befolkningens haplotypefrekvenser at påtage LD inden for hver klynge. For at opretholde ensartethed i vores undersøgelse delmængder blev de samme klynger løbende er blevet anvendt i alle analyser.

Resultater

I alt 600 personer fra 121 familier lykkedes genotype. Analyserne blev udført for alle og hver af tre forskellige undergrupper; høj risiko, moderat risiko og tidlig debut familier (tabel 1). Der var ingen individuel statistisk signifikant (over tre) LOD score eller HLOD i nogen af ​​analysen (figur 1). Der var imidlertid positive HLODs over to (tabel 2).

a) Plot af HLODs for alle familier i undersøgelsen, dominerende (i rød) og recessive (i blå) modeller (n = 121).

b) LOD /HLOD plot af studier gruppe med mere end 3 berørte individer (n = 27)

c) LOD /HLOD plot af studiegruppen med gennemsnitsalderen for diagnose 50 (n = 8).

d) LOD /HLOD plot af studiegruppen med berørte sibs (n = 49).

* -negative værdier af scoringer er ikke plottet vist.

For b, c, d – bestemmelsesgrænseværdier er repræsenteret i rød, er HLODs repræsenteret i Cyan

Study Group

nr. Af familier

web omegn cM, SNP

Model

HLOD (α)

Alle families121 —- Mere end 3 affected279q31.1102.68, RS1338121Recessive2.212 (0,66) Middel alder ved diagnose 5084p16.37.17, RS920683Recessive2.184 (1,00) 17p13.211.51, RS884250Recessive2.086 (1,00) Familier med Berørte Sibs49Xp22.337.42, RS2306737Recessive2.486 (0,79) Tabel 2. Oversigt over tarmkræft lift resultater med maksimal observeret HLODs større end 2.

CSV Hent CSV

for familier højrisiko (i alt 27 familier) én locus på kromosom 9q31.1, viste en HLOD over to antager recessive arv og en anslået 66% af familier forbundet (tabel 2). Maksimalt var for markør rs1338121 med et HLOD på 2,2. LOD på samme locus i recessiv model var 0,7. For dominerende sygdom viste dette locus en LOD score på 1,4 og en HLOD på 1,6.

For familier moderat risiko (i alt 49 familier, analyseret som 50) et locus på spidsen på kromosom Xp havde LOD og HLOD over to med maksimal 2,2 og 2,5 henholdsvis for markør rs2306737 i recessive analyse ( tabel 2). LOD score og HLOD for dominerende analyse var begge 1.8.

Endelig for gruppen af ​​familier med tidlig debut (kun 8 familier) to loci viste positive LOD score og HLODs over to i recessiv analyse (tabel 2). Den ene var distalt på kromosom 4p med en maksimal LOD og HLOD på 2,2 for rs920683 og den anden var på kromosom 17p13.2 med en maksimal LOD og HLOD på 2,0 for rs884250. LOD og HLOD for dominant analyse var 0,976 på kromosom 4p og 1,25 på kromosom 17p13.2. De bestemmelsesgrænseværdier var ens i parametrisk og ikke-parametrisk analyse og 100% knyttet familier blev antaget for begge loci.

Ingen NPL score over to blev set for nogen af ​​familierne. HLODs over 2 præsenteres i tabel 2. Alle loci med en HLOD 1,0 i parametrisk analyse er vist i tabel 3.

Study Group

No. Af Familier

Linked Region

cM, SNP

Model

HLOD (α)

Alle Families1211q32.1204.36, RS2032018Dominant1.191 (0,46) 5p15.233.99, RS879253Dominant1.258 (0,48) 9q22. 3197,96, RS4534181Dominant1.602 (0,59) 94,37, RS7037744Recessive1.632 (0,32) Xp11.2179.25, RS2015312Dominant1.414 (0,72) 4p16.32.97, RS736455Recessive1.653 (0,38) 6p21.164.36, RS722269Recessive1.892 (0,28) 8p2233.01, RS334206Recessive1.479 (0,26) 18p11.2140.13, RS1043925Recessive1.351 (0,27) Mere end 3 affected271q32.2211.46, RS1507765Dominant1.414 (0,61) 2p16.277.83, RS1483869Dominant1.438 (0,60) 4q28.3134.94, RS426029Dominant1.045 (0,54) 5p15 .134.80, RS1505034Dominant1.678 (0,71) 9q31.1102.68, RS1338121Dominant1.672 (0,79) 12q13.1263.98, RS7532Dominant1.086 (0,51) 16q12.265.68, RS1990637Dominant1.556 (0,77) Xp11.2179.24, RS1560514Dominant1.788 (1,00) 1q25 .2178.47, RS227530Recessive1.554 (0,55) 4p16.32.97, RS736455Recessive1.903 (0,68) 18p11.2140.13, RS1043925Recessive1.605 (0,48) Xp11.367.42, RS1137070Recessive1.267 (0,56) Middel alder ved diagnose 5082p16.374.90, RS1394207Dominant1.145 (1,00) 9p21.345.61, RS10757309Dominant1.614 (1,00) 10q22.186.06, RS1227938Dominant1.200 (1,00) 16q2180.78, RS17822576Dominant1.181 (1,00) 17p13.124.87, RS1391766Dominant1.258 (1,00) 1p3372.10, RS1934405Recessive1.244 (1,00) 6p21.167.58, RS4714772Recessive1.335 (1,00) 9p21.345.61, RS10757309Recessive1.501 (1,00) 10q26.3166.39, RS7072831Recessive1.239 (0,90) 18q11.242.92, RS12959039Recessive1.279 (1,00) Familier med Berørte Sibs494p15.238.72, RS216113Dominant1.112 (0,96) 6q23.3136.59, RS975676Dominant1.848 (1,00) Xp22.3311.69, RS749706Dominant1.860 (1,00) 6q14.191.67, RS885582Recessive1.241 (0,33) 12q23.1107.90, RS17290272Recessive1.034 (0,26) 14q24.378.12, RS888412Recessive1.032 (0,29) 20q13.3193.25, RS186659Recessive1.410 (0,37) tabel 3. Oversigt over tarmkræft lift resultater med maksimal observeret HLODs mellem 1 og 2.

CSV Hent CSV

diskussion

Vi brugte SNP genotypning til at udføre en koblingsanalyse i 121 CRC familier og fandt ikke nogen overordnede statistisk signifikante resultater med en LOD eller HLOD løbet 3. et par store familier blev splittet for at kunne bruge MERLIN, og mistede lidt af sin magt i analysen. Effekten af ​​dette var af ringe betydning.

Men vi fandt bestemmelsesgrænseværdier og HLODs over 2, tyder på kobling. En tidligere sammenkædning undersøgelse brugt 356 familier og viste et locus med HLOD 3 (12q) og 4 med HLOD 2 (om kromosomer 4q, 15q, 17q og 12q), alle i dominerende analyse [26]. Vi fandt ingen støtte til nogen af ​​disse regioner i vores analyse.

I vores substudie af familier stor, høj risiko (mere end tre affecteds), et sted på kromosom 9q31 blev fundet. Samme region er blevet foreslået før, men i dominerende modeller, og blev her igen identificeret ved os ved hjælp af bindingsanalyse i en recessiv model. Dette locus er tidligere foreslået af en sib-pair undersøgelse og en undersøgelse ved hjælp af kobling i mange slægt og også tidligere af os i én stor familie med endetarmskræft og adenomer [18-20]. Disse tre undersøgelser brugte mikrosatellitter til genotypning mens tidligere linkage studier ved hjælp af SNPs var ude af stand til at replikere locus [18,26,35]. En undersøgelse har også vist støtte for regionen under anvendelse af en fem-SNP-haplotypen i regionen [36]. To gener er hidtil blevet foreslået som de prædisponerende gener i denne region. Først blev det foreslået, at kimcellelinje allelspecifik ekspression resulterede i reduceret ekspression af genet ændring SMAD-medieret TGF-beta signalering [37]. For det andet en undersøgelse af GALNT12 genet demonstrerede beskærer somatiske og germline mutationer i CRC patienter, men ingen i kontrol og genetiske defekter i O-glycosyleringsvejen delvist ligger til grund afvigende glycosylering, og derved bidrage til udviklingen i en delmængde af CRC [38] . Regionen foreslået af vores foreliggende undersøgelse overlapper godt med regionen foreslået af en familie før [19]. Regionen strækker sig over næsten 9 Mb og indeholder de ovennævnte gener og talrige andre. Fire familier bidrager mest til den positive, dominerende og recessive HLOD score. Kun én familie havde tidlig debut sygdom. Den Cicek undersøgelse defineret for en tilsvarende gruppe af 67 familier en locus med HLOD 3 (15q) og 4 med HLOD 2 (kromosomer 12q, 14q, 17q og Xp) nogle hjælp dominant eller recessiv (kromosom 14) model. Vi fandt ingen støtte for nogen af ​​de regioner i vores undersøgelse. Men vi havde en HLOD 1 tæt på kromosom X-regionen.

For familier moderat risiko, med berørte sibs kun én region på spidsen på kromosom X blev foreslået i recessiv model (max HLOD = 2,2) og svarer til den kromosom 9 locus der var også en positiv, men lavere LOD anvendelse af en dominerende model (0,7). Denne region er næsten 6 Mb, er ikke blevet foreslået før og indeholder talrige kandidatgener. Den Cicek Undersøgelsen omfattede 200 moderat risiko familier og også ved hjælp af recessive model, de identificerede én locus med en HLOD 3 (8Q) og 4 loci med en HLOD 2 (kromosomer 1q, 6p, 8Q og 22q). Vi kunne ikke finde støtte for en af ​​disse loci.

Endelig observerede vi ved hjælp af en recessiv model to loci med høje HLODs (4p og 17p) for tidlig debut familier. Men denne gruppe bestod af kun 8 familier. Familie 8 var også blandt familier de højrisiko knyttet til kromosom 9 locus og for denne størrelse familie forventes det, at en hel genom undersøgelse skal generere kobling til mange regioner, og dermed de fleste vil være falsk positive. Vi kunne ikke replikere nogen af ​​loci fra Cicek et al. hjælp dominant eller recessiv model (kromosomer 4q, 14q, 15q og 22q).

En tidligere undersøgelse med fokus på adenom og endetarmskræft adenom og carcinom fundet kobling til kromosomale regioner på kromosomerne 18q21 og 2p22 i 69 familier, mens en sub- analyse af 55 familier med cancer viste kun binding til kromosom 3q21-24 [21]. Ingen af ​​disse regioner blev bekræftet af Cicek undersøgelse eller ved denne undersøgelse. Det er overraskende, at 4 sammenkædning undersøgelser, herunder dette, alle bruger SNP-markører ikke generere nogen overlappende loci [21,26,35]. Der er flere forskelle mellem undersøgelserne imidlertid som er mulige forklaringer på denne uoverensstemmelse. Det etnicitet af emnerne i undersøgelserne er forskellige, en undersøgelse er fra USA, den ene er fra Hollands, en fra England og vores undersøgelse er baseret på den svenske befolkning. Stikprøverne er også forskellige, den amerikanske undersøgelse har i alt 356 familier, hollænderne kun syv store familier, den britiske undersøgelse 69 og vores studie 121 familier. Rekrutteringsprocessen også afveg mellem alle fire studier, men generelt de fleste af de forskellige resultater kan også forklares ved biologi og forskellige prædisponerende elementer i hvert prøvesæt. Fremtidige eksperimenter nødt til at overveje denne heterogenitet i deres design.

Lidt til vores overraskelse, vi også kunne se positive parametriske LOD-score i denne undersøgelse i forhold til vores tidligere [22,23], hvor blev opnået kun HLODs. Dette kan være relateret til den kendsgerning, at vi bruges SNPs stedet for mikrosatellitter i denne undersøgelse. Mikrosatellitter er langt mere informativ og dermed ofte meget lave negative bestemmelsesgrænseværdier ses når en familie ikke er forbundet. I denne SNP orienteret eksperiment havde få familier bestemmelsesgrænseværdier under -2 og dermed magten til at udelukke kobling i vores eksperiment var lav. Men magt at detektere binding blev tilbageholdt (som vi testede ved hjælp af vores familie 24 med en LOD på 3 til chromosom 9 locus) [19]. Resultatet kan også vedrøre den omstændighed, at familier i denne undersøgelse blev mindre i forhold til vores tidligere undersøgelser under anvendelse af 20 og 30 store stamtavler [22,23]. Her brugte vi en anden strategi med 121 mindre familier og i modsætning til vores tidligere forbindelsesled undersøgelser vi kunne finde støtte til kandidaten region på kromosom 9. Vi har tidligere brugt SimWalk2 til koblingsanalyse med mikrosatellitmarkører, men det var ikke befordrende for analyse af SNP data . For at retfærdiggøre at bruge MERLIN, vi analyserede familie 24 og kromosom 9 ved hjælp SimWalk2 (data ikke vist), som tog tre uger at gennemføre, men opnåede identiske resultater.

Som konklusion vores sammenkædning undersøgelse gav yderligere støtte til regionen på kromosom 9, nogle beviser for nye loci at være involveret i tyk- kræftrisiko og ingen støtte til andre tidligere rapporteret loci. Dette antydede heterogenitet hvis familiær CRC bør påvirke udformningen af ​​fremtidige associerings- og sammenkædning studier.

Tak

Genotypning blev udført af SNP teknologiplatformen i Uppsala, (www.genotyping.se). Support efter bioinformatik infrastruktur for Life Sciences (BILS) er taknemmeligt anerkendt.

Be the first to comment

Leave a Reply