PLoS ONE: Amplikon Sekventering af kolorektal cancer: Variant Opkald i Frosne og formalinfikserede Prøver

Abstrakt

Næste generation sequencing (NGS) er en ny teknologi bliver relevant for genotypning af kliniske prøver. Her har vi vurderet stabiliteten af ​​amplikon sekventering fra formalin-fikseret paraffin-indstøbt (FFPE) og parret frosne prøver fra kolorektale kræft metastaser med forskellige analyser rørledninger. 212 amplicon regioner i 48 kræftrelaterede gener blev sekventeret med Illumina MiSeq hjælp DNA isoleret fra resektion prøver fra 17 patienter med kolorektale cancer levermetastaser. Fra ti af disse patienter, parret frisk frosne og rutinemæssigt behandlet FFPE væv var til rådighed for sammenlignende undersøgelse. Prøve kvaliteten af ​​FFPE væv blev bestemt ved mængden af ​​amplificerbare DNA ved anvendelse qPCR, sekventering biblioteker blev vurderet ved anvendelse Bioanalyzer. Tre bioinformatiske rørledninger blev sammenlignet for analyse af amplikon sekventeringsdata. Udvalgte hot spot mutationer blev revideret ved hjælp Sanger sekventering. I de sekventerede prøver fra 16 patienter blev 29 ikke-synonyme kodning mutationer identificeret i elleve gener. Oftest var mutationer i TP53 (10), APC (7), PIK3CA (3) og KRAS (2). En høj overensstemmelse mellem FFPE og parrede frosne vævsprøver blev observeret i ti matchede prøver, afslører 21 identiske mutation opkald og kun to mutationer forskellige. Sammenligning af disse resultater med to andre almindeligt anvendte variant ringer værktøjer udviste imidlertid høje afvigelser. Derfor kan amplicon sekventering potentielt anvendes til at identificere hot spot mutationer i kolorektal cancer metastaser i frosne og FFPE væv. Der er dog bemærkelsesværdige forskelle mellem resultaterne fra forskellige variant ringer værktøjer, som ikke kun relateret til DNA-prøven kvalitet. Vores undersøgelse understreger behovet for standardisering og benchmarking af variant ringer rørledninger, der vil være behov for translationelle og kliniske anvendelser

Henvisning:. BETGE J, Kerr G, Miersch T, Leible S, Erdmann G, Galata CL, et al. (2015) Amplikon Sekventering af kolorektal cancer: Variant Opkald i Frosne og formalinfikserede prøver. PLoS ONE 10 (5): e0127146. doi: 10,1371 /journal.pone.0127146

Academic Redaktør: Jeong-søn Seo, Seoul National University College of Medicine, Republikken Korea

Modtaget: 10. januar, 2015; Accepteret: 13. april, 2015; Udgivet: May 26, 2015

Copyright: © 2015 BETGE et al. Dette er en åben adgang artiklen distribueres under betingelserne i Creative Commons Attribution License, som tillader ubegrænset brug, distribution og reproduktion i ethvert medie, forudsat den oprindelige forfatter og kilde krediteres

Data Tilgængelighed: Alle relevante data er tilgængelige via den europæiske Nucleotide Archive (ENA) under tiltrædelsen nummer PRJEB8754

Finansiering:.. JB er blevet støttet af et fællesskab fra Hartmut-Hoffmann-Berling International Graduate School (HBIGS)

konkurrerende interesser:. forfatterne har erklæret, at der ikke findes konkurrerende interesser

Introduktion

på grund af de seneste fremskridt i dybe sekventering teknologier, har bemærkelsesværdige indsigter opnået på de ændringer, erhvervet af kolorektal cancer (CRC) genomer under kræftfremkaldende proces, i høj grad udvide vores syn på CRC genomisk progression [1-3]. Løftet, at efter strukturel karakterisering af kræft genomer, vil den kliniske beslutningsproces være styret af de enkelte genomiske tumor profiler er dog fortsat at være opfyldt. Ikke desto mindre, udvikling af nye målrettede lægemidler fremhæver behovet for pålidelige og omkostningseffektive metoder til molekylær karakterisering af kræft genomer at identificere patienter, der i sidste ende reagerer på behandling på grundlag af druggable mutationer, forudsigende ændringer eller erhvervet resistens-markører.

Målrettet sekventering baseret på PCR amplikoner repræsenterer en realistisk tilgang til evaluering af handlingsrettede mutationer, mutationsmønstre hot spots eller prædiktive ændringer i kræft genomer til kliniske studier. Sammenlignet med hele genomet eller exome hele sekventering, en høj dybde af sekventering ( 1000 læser) på det genomiske loci af interesse kan nås, således letter detektion af lavfrekvente varianter i heterogene tumorprøver blandet med stromaceller [4 , 5]. Som følge af den forholdsvis lave antal basepar, der skal sekventeres per patient, multiple prøver, også for longitudinal analyse, kan analyseres parallelt på bench-top maskiner såsom Illumina MiSeq, sænke omkostninger og potentielt muliggør rutinemæssig klinisk anvendelse i nær fremtid.

Men for klinisk anvendelse og til translationelle undersøgelser af arkiverede kliniske prøver, der stadig mange problemer, der skal løses. De fleste almindeligt tilgængelige prøver til klinisk diagnostik og biomarkør undersøgelser er formalin-fikseret, paraffinindlejrede (FFPE) væv fra patologiske arkiver, som deres langtidsopbevaring er relativt enkel og omkostningseffektiv sammenlignet med frosne materiale. Det er imidlertid kendt, at formalin fiksering fører til kovalent binding af DNA, RNA og protein ved methylenbroer, deaminerings- og oxidationsreaktioner, dannelse af cykliske uædle derivater og også til DNA-fragmentering [6]. Disse DNA ombygninger hæmmer sekventering teknologier, der fører til mindre robuste resultater og vanskeligheder med fortolkningen af ​​data fra sekventering eksperimenter. Endvidere er en guld standard metode til analyse af næste-generations sekventering (NGS) data mangler og kvalitetssikringsprogrammer ikke lanceret endnu. Forskellige bioinformatiske analyse værktøjer og rørledninger er udviklet til NGS data. Men det lader til, at reproducerbarheden mellem dem skal forbedres [7]. Desuden statistiske modeller til variant opdagelse og variant evaluering, der er designet til hel-exome eller hel-genom data, der består af mange prøver med lav dækning, er måske ikke optimal til små amplicon datasæt med få målrettede regioner. Således er der ingen generelt accepteret standard på hvordan du udfører variant kald på amplicon sekventering data. Disse problemer understreger behovet for prøveforberedelse og analyse af data rørledninger optimeret til amplikon sekventering af kliniske prøver.

I denne undersøgelse beskriver vi en eksperimentel og bioinformatik pipeline til amplikon sekventering af kliniske friske frosne og FFPE prøver fra CRC. Særlig fokus er tegnet på udarbejdelse af sekventering biblioteker fra lav kvalitet FFPE prøver. Den bioinformatik rørledning, ved anvendelse af en tilpasset Genome Analysis Toolkit (GATK) Unified Genotyper, er forklaret i detaljer og sammenlignet med andre almindeligt anvendte variant ringer metoder med hensyn til deres egnethed til amplicon-sekventering under anvendelse af FFPE materiale.

Materialer og metoder

patienter

Thirty-tre prøver fra 17 patienter, som gennemgik resektion af levermetastaser af CRC i Institut for Kirurgi, Universitetshospital Mannheim mellem februar 2012 og februar 2013 blev inkluderet i denne undersøgelse. Af alle disse patienter, enten friske frosne eller formalin-fikseret paraffin-indstøbt (FFPE) væv blev anvendt til DNA isolation. Fra 10 patienter, parret frosne og FFPE væv var til rådighed for undersøgelsen og fra 5 patienter, matchede primære tumorer kunne opnås fra arkiverne af Patologisk Institut, University Hospital Mannheim. Ydermere er en matchet primær-metastase pair fra en neuroendokrine karcinom i tyndtarmen (Pat05), primær kultur materiale fra en patient (Pat16), materiale fra en prostatacancerpatient og cellelinier DLD-1, HCT116, HT55, Huh7, HEK293T , HS68 og SW480 blev inkluderet i sekventering løber og analyser for andre projekter eller som kontroller. Prøver blev analyseret i to sekventering kørsler, én patient (Pat13) blev analyseret i begge kørsler som kontrol. Alle cellelinier blev opnået fra ATCC. kan findes oplysninger om patienter i S1 tabel.

Etik godkendelse

Etik board godkendelse blev opnået fra Medical Ethics Kommissionens II i det medicinske fakultet Mannheim, Heidelberg Universitet, Mannheim, Tyskland (nr 2012-293N-MA, 2013-841R-MA, 2014-551N-MA). Skriftligt informeret samtykke fra donorerne af vævsprøver blev opnået til brug i forskningen.

prøveforberedelse

Frosne prøver og cellelinjer.

Prøver fra levermetastaser fra CRC patienter blev transporteret i RPMI cellekulturmedium og blev hurtigt nedfrosset på tøris og efterfølgende opbevaret ved -80 ° C. DNA-isolering blev udført med Qiagen DNeasy Blood Tissue Kit (Qiagen, Hilden, Tyskland) ifølge producentens anbefalinger, herunder RNase-spaltning (Fig 1A). Cellelinier blev pelleteret og DNA blev isoleret med den samme protokol. Udvundet DNA blev fortyndet og anvendes direkte til fremstilling af sekventering biblioteker.

(A) Prøveforberedelse workflow. DNA blev isoleret fra friske frosne eller FFPE CRC levermetastaser resektion prøver med Qiagen blod og væv eller FFPE kit, hhv. Frosne prøver derefter direkte undergik sekventering bibliotek forberedelse, pooling af biblioteker, kvalitetskontrol og sekventering. FFPE prøver blev desuden testet for DNA kvalitet ved qPCR. Bibliotek kvalitet blev testet med Bioanalyzer. For prøver med lave mængder af korrekt størrelse DNA amplikoner (fragmenter på 310bp) blev nye biblioteker forberedt med højere start DNA-koncentrationer og re-analyseret med Bioanalyzer. Prøver med endnu lave mængder af DNA med korrekt størrelse og meget fragmenteret DNA blev udelukket. (B) ΔCq-værdier for kvalitetskontrol PCR indikerer dårlig prøve kvalitet. DNA-koncentrationen af ​​fragmenter mellem 250bp og 450bp efter bibliotek præparat blev beregnet med Agilent Bioanalyzer og plottet mod ΔCq værdier FFPE kvalitetskontrol PCR. (C) højere ΔCq-værdier korrelerer med lavere gennemsnitlig dybde på sekventering. (D) Dækning fordeling af amplikoner fra alle parrede FFPE og frosne prøver, normaliseret til hele prøven dækning. Frosne prøver havde en gennemsnitlig dybde på 4622, FFPE prøver 1852.

FFPE prøver.

Væv fra levermetastaser var blevet fikseret i formalin und indlejret i paraffin under rutinemæssig patologisk oparbejdning . Egnede blokke blev valgt og fem 10 um skiver blev anvendt til DNA-ekstraktion uden mikrodissektion. En slide farvet med hæmatoxylin og eosin (H 150 bp). At sammenligne mængder DNA i den ønskede størrelse region, blev koncentrationen af ​​DNA ampliconer i området fra 250-450bp beregnet. Koncentration af DNA med en størrelse mellem 250bp og 450bp varierede meget mellem 51,7 og 93831,9 pg /pl (gennemsnit 5675,1 pg /pl, median 672,2 pg /pl) inden for de biblioteker af forskellige prøver og omvendt korreleret med ΔCq værdier (Spearman s Koefficient: -0.805 fig 1B, S2 tabel). For prøverne med lave DNA-koncentrationer på 310bp amplicon blev bibliotek præparat gentaget under anvendelse højest mulige DNA beløb (S1 Fig, S2 tabel). Bioanalyzer afslørede højere koncentrationer af DNA omkring 250-450bp (365,3 pg /pl-5669,8 pg /pl; betyde 6190,9 pg /pl; median 1996,3 pg /pl), dog med betydelig baggrund af korte DNA-fragmenter. Efter PCR oprydning af biblioteker, blev kort DNA-fragmenter reduceret, men tre prøver viste også mindskede mængder af 310bp amplicon og blev derfor udelukket fra sekventering.

Databehandling

Bioinformatik analyse pipeline er vist i fig 2A. Læser blev justeret mod hg19 henvisning genom ved hjælp af BWA algoritme implementeret MiSeq software (MiSeq Reporter v2.2.29). BAM filer blev kvalitets-kontrolleres med FASTQC (v.0.9.5, https://www.bioinformatics.babraham.ac.uk/projects/fastqc/). Indels i sekvensjustering filer blev venstrestillet og lokal justering omkring indels blev gjort med RealignerTargetCreator og IndelRealigner værktøjer fra Genome Analysis Toolkit (GATK, udgave 2,4-9) [8]. Base kvalitet score rekalibrering blev udført. Duplicate kortlægning og mærkningen blev ikke anses for egnet til amplikon sekventering og dermed udeladt.

(A) Sekventering analyse workflow. Sekvensjustering filer gennemgik lokal-justering omkring indels, venstre justering og base kvalitet score rekalibrering. Efter variant ringer med GATK Unified Genotyper blev annotation og effekt forudsigelse af fundne varianter gøres ved hjælp SnpEff. Rå varianter af alle prøver blev filtreret af tilpassede parametre med SnpSift. Varianter indgår i 1000 genomer Projektdata blev udelukket kun få somatiske mutationer i kræft. (B) Høj frekvens på TP53 og APC-mutationer blandt somatiske mutationer identificeret i CRC levermetastaser (frosne og FFPE væv). Farvede felter repræsenterer tilstedeværelsen af ​​en ikke-synonyme kodende SNP (blå), en mutation, der fører til et stop-codon (grå) eller et rammeskift mutation (orange). Bars opsummere mutationer til stede i hver patient (lodrette søjler) eller hvert muterede gen (vandrette streger). Notatet nogle gener indeholde mere end en mutation.

Unified Genotyper rørledning

Variant kald.

Unified Genotyper fra GATK (version 2,4-9) blev bruges til variant kald. Alle prøver blev behandlet parallelt og opdelt i individuelle variant filer for hver prøve efter variant kald. Maksimal dækning pr locus blev forøget fra standarden 250 til 9.000.000 at tage højde for den høje dybde af amplicon-sekventering. (Nedsampling til lavere dybde sker i hel-exome undersøgelser for at øge hastigheden ved at spare hukommelse). tærsklen Den mindste tillid til at kalde blev sat til 10, minimumstærsklen tillid til at udsende til 30. SNP’er og indels blev vurderet på samme tid. En region liste over alle ampliconer blev anvendt til at definere regioner for enkelt-nukleotid polymorfisme (SNP) og Indel kald til at øge analyse hastighed. Som et alternativ, blev Unified Genotyper rørledningen bruges ved at behandle hver prøve individuelt, ellers de samme parametre blev anvendt

Variant annotation og effekt forudsigelse

SnpEff (version 2.0.5, http..: //snpeff.sourceforge.net/) [9] blev anvendt til variant annotation og effekt forudsigelse og GATK VariantAnnotator værktøjet blev kørt med-A SnpEff mulighed for at tilføje de SnpEff anmærkninger med den højeste biologiske betydning for hver variant til variant kald format (VCF) filer. Efterfølgende blev vcf-fil med oplysninger om alle sekventerede prøver opdelt i individuelle prøve variant filer ved hjælp af GATK SelectVariants programmet. Varianter blev kommenteret med variant frekvenser i 1000 genomer projekt ved hjælp af SnpSift (https://snpeff.sourceforge.net/SnpSift.html) anmærke funktion [9].

Variant filtrering.

SnpSift fra SnpEff pakken blev anvendt til filtrering af rå varianter. Følgende kvalitet-filter kriterier er anvendt: kvalitet ved dybde større end 0,8 (QD 0,8), total dybde til at kalde varianter på et bestemt sted på over 200 (DP 200), Fisher streng (Phred-skaleret p-værdi anvendelse af Fishers eksakte test til påvisning streng bias) mindre end 70 (FS 70), minimum variant tillid over 1500 (QUAL 1500), kortlægning kvalitet større end 40 (MQ 40) og kortlægning kvalitet rangsumtest højere end -15 (! eksisterer MQRankSum

Be the first to comment

Leave a Reply