PLoS ONE: Impact of Pre-Analytiske variabler på Cancer Målrettet Gene Sequencing Efficiency

Abstrakt

Tumor prøver ofte bevaret som formalin-fikserede paraffin-indstøbt (FFPE) væv blokke, den mest almindelige kliniske kilde til DNA sekventering. Heri, vi evaluerede effekten af ​​præ-sekventering parametre til at guide en ordentlig prøve valg til målrettet gen sekventering. Data fra 113 FFPE lunge tumor prøver blev indsamlet, og målrettet gen sekventering blev udført. Biblioteker blev bygget ved hjælp brugerdefinerede sonder og blev parret ende sekventeret på en næste generation sekventering platform. En PCR-baseret kvalitetskontrol (QC) assay blev anvendt til at bestemme DNA kvalitet, og et forhold blev genereret i sammenligning med kontrol-DNA. Vi observerede, at FFPE opbevaringstid, blev PCR /QC-forholdet, og DNA input i udarbejdelsen biblioteket signifikant korreleret til de fleste parametre for sekventering effektivitet, herunder dybde af dækning, tilpasning sats, insert størrelse, og læse kvalitet. En samlede score ved anvendelse af de tre parametre blev genereret og viste sig meget præcis at forudsige sekventering metrics. Vi viste også bredt læse count variabilitet i genomet, med dårligere dækning i områder med lav indhold GC ligesom i

KRAS

. Prøve kvalitet og GC-indhold havde uafhængige effekter på sekventering dybde, og de dårligste resultater blev observeret i regioner med lav indhold GC i prøver med dårlig kvalitet. Vores data bekræfter, at FFPE prøver en pålidelig kilde til målrettet gen sekventering i kræft, forudsat tilstrækkelig prøve kvalitetskontrol udøves. Tissue kvalitet bør rutinemæssigt vurderes for præ-analytiske faktorer, og sekventering dybde kan være begrænset i genomiske regioner med lav indhold GC hvis suboptimale prøver udnyttes

Henvisning:. Araujo LH, Timmers C, Shilo K, Zhao W , Zhang J, Yu L, et al. (2015) Virkningerne af Pre-Analytiske variabler på Cancer Målrettet Gene Sequencing Effektivitet. PLoS ONE 10 (11): e0143092. doi: 10,1371 /journal.pone.0143092

Redaktør: Sumitra Deb, Virginia Commonwealth University, UNITED STATES

Modtaget: September 4, 2015; Accepteret: September 26, 2015; Udgivet: November 25, 2015

Copyright: © 2015 Araujo et al. Dette er en åben adgang artiklen distribueres under betingelserne i Creative Commons Attribution License, som tillader ubegrænset brug, distribution og reproduktion i ethvert medie, forudsat den oprindelige forfatter og kilde krediteres

Data Tilgængelighed: Alle relevante data er inden for papir og dens Støtte Information filer

Finansiering:. LHA understøttes af en Conquer Cancer Foundation of ASCO Long-Term International Fellowship (LIFE) og en Landon Foundation-AACR INNOVATOR Award for International Samarbejde i Cancer Research. Dette arbejde blev finansieret af en NIH /NCI 1RC1 CA146260-01, NCI R01CA60691, NCI R01CA87895, NCI P30CA022453, og Ohio State Cancer Center Support Grant (CCSG), NCI CA16058. T.G.N og C.J.M. er ansat af GenomOncology. Denne bidragyder ydet støtte i form af lønninger til forfattere (T.G.N og C.J.M), men havde ikke nogen ekstra rolle i studie design, indsamling og analyse af data, beslutning om at offentliggøre, eller forberedelse af manuskriptet. De specifikke roller disse forfattere er formuleret i afsnittet forfatter bidrag

Konkurrerende interesser:. T.G.N og C.J.M. er ansat af GenomOncology. Dette ændrer ikke forfatternes overholdelse PLoS ONE politikker på datadeling og materialer.

Introduktion

I det seneste årti, en bedre forståelse af kræft biologi og identifikation af somatiske mutationer i kræft har ført til en ny æra i personlig onkologi. [1] Landmark eksempler omfattede opdagelsen af ​​mutationer i proto-onkogener c-

KIT

i gastrointestinale stromale tumorer (GIST), [2] epidermal vækstfaktor receptor (

EGFR

) i lunge adenokarcinomer, [3] og v-Raf murine sarkom viral onkogen homolog B1 (

BRAF

) i melanomer. [4] Tumorer huser disse mutationer demonstrerer fremragende følsomhed over for specifikke kinase inhibitorer er rettet mod de respektive aktiverede veje.

Disse onkogene mutationer er ofte defineret som cancer drivere, da de tilbyder en selektiv fordel til en celle klon, der er nødvendige for tumor initiering og vedligeholdelse. [5] i klinikken, kan de tjene som fingeraftryk, der hjælper klinikere at undertype kræftformer, der ellers er til stede lignende histologiske mønstre. [6-9] Mens mutations profilering er blevet et nyttigt redskab til bedre skræddersyede målrettede behandlinger, har nye udfordringer opstået herunder hyppige behov for at opnå optimale tumor prøver for ekstra gentest. [10-12] Desuden, flere tests kan anbefales i et klinisk miljø, hvor et væld af kandidat driver mutationer skal vurderes. I ikke-småcellet lungekræft (NSCLC), har ændringer i mindst 10 proto-onkogener blevet foreslået som potentielt “druggable”, med mutationsfrekvenser varierer fra 1% til 25% for

MAP2K1

KRAS

henholdsvis efter den undersøgte population. [13] den bedste algoritme til test, herunder sekventiel versus multiplex vurdering af sådanne ændringer er stadig et spørgsmål om forhandling.

Selvom Sanger sekventering traditionelt har været anvendt til påvisning af tilbagevendende punktmutationer i kræft, har nyere teknologier muliggjort en mere omfattende analyse af genetiske forstyrrelser. I dette scenario, den næste generation sekventering (NGS) platforme-også kendt som massivt parallelle sekventering-tilbyder en bred vifte af muligheder for at karakterisere kræft genomet. [14-16] F.eks tilgængeligheden af ​​hybridisering-capture teknikker giver en høj -throughput og omkostningseffektiv strategi til at vurdere hundreder af gener samtidigt. [16-19] som en kort metodisk gennemgang, er genomisk DNA (gDNA) oprenset fra tumor prøver og klippet af enten sonikering eller restriktionsenzymer i millioner af små fragmenter (tiere eller hundredvis nukleotider lang). Disse fragmenter hybridiseres derefter til en tilpasset probe sæt, der indeholder lokkemad specifikke for generne af interesse, og forstærkes til at generere sekventering bibliotek. En unik stregkode er ligeret til hvert bibliotek-svarende til hver prøve-som giver flere prøver, der skal samles sammen til sekventering. Adskillige kommercielle DNA opsamlingsteknologier er i øjeblikket tilgængelige, og mange institutioner har designet og implementeret tilpasset målrettede paneler til genotype kræft prøver. [10, 20, 21]

Klinisk tumor prøver ofte bevaret som formalin-fikseret paraffinindlejret (FFPE) væv blokke i biorepositories, og dette er den lettest tilgængelige kilde til opnåelse gDNA både i kliniske og forskningsmæssige indstillinger. [22-24] flere trin i FFPE behandling, er imidlertid kendt for at forårsage DNA-skader, der direkte påvirker DNA kvalitet og tilstrækkelighed for sekventering. For eksempel kan formalinfiksering resultere i forskellige typer af tværbindinger mellem to aminosyrer, to nukleinsyrer eller mellem en aminosyre og en nukleinsyrebase. [25-27] Disse kemiske modifikationer kan forvirre molekylær test gennem hæmning af enzymatisk manipulation af DNA. Formalinfiksering kan også forårsage nukleotid oxidation og deaminering, hvor sidstnaevnte er forbundet med udviklingen af ​​artefakt-nucleotid overgange (hovedsagelig C T i CpG-dinukleotider) blandt prøver opbevaret som FFPE [23, 28] Endelig methylen tværbindinger forårsaget af formalin kan medføre. i DNA-fragmentering, hvilket begrænser DNA længde til sekventering. Foruden formalinfiksering, vævspræparatet, paraffinindlejring og arkivering

per se

kan alle i sidste instans spille en rolle i prøver kvalitet. [29] Desuden FFPE blokke opnås ofte fra små biopsier, og lav væv mængde kan udgøre en yderligere begrænsning for sekventering. For at vurdere kvaliteten af ​​gDNA udvundet FFPE prøver, PCR-baserede kvalitetskontrol (QC) assays er blevet anbefalet. [30-33] Andre variabler kan påvirke endelige sekventering resultater omfatter mængden af ​​DNA bruges som input til biblioteket forberedelse, sekventering dybde, og den målrettede region af interesse (GC-indhold og sekvenshomologi).

Heri vi evaluerede den enkelte og kombinerede virkning af præ-sekventering parametre på målrettet gen sekventering effektivitet. Til dette formål har vi anvendt en fuldt kommenteret prøvesæt kendetegnet ved kendskab til en lang række præ-analytiske variabler, som blev genotype for en tilpasset gen panel under anvendelse af et kommercielt tilgængeligt målgenet sekventering tilgang-Agilent Haloplex Target Enrichment System (Agilent Technologies ). Denne platform adskiller sig fra andre hybridisering-capture teknikker ved, at en pulje af restriktionsenzymer anvendes til at fordøje prøve-DNA (i modsætning til lydbehandling), og proberne er designet med homologi kun til enderne af målrettede DNA restriktionsfragmenter. [34] efterfølgende universelle primere anvendt til at amplificere de indfangede regioner og vil generere en høj frekvens af tilsvarende læser, der ligner de fundne resultater i amplicon-baserede platforme (S1 Fig). Af denne grund, nogle sekventering metrikker som dobbeltarbejde sats og unikke læser kvantificering gælder ikke for denne teknologi. Vi verificerede også læse dybde variation i genomet, frigivet problematiske områder baseret på GC-indhold, og bestemt virkningen af ​​disse parametre på variant kald. Disse data kan være meget informativ til at vejlede den kliniske og forskningsverdenen i passende udvælgelse af kliniske prøver til målrettet gen sekventering, og i den korrekte fortolkning af sekventering resultater som funktion af prøve kvalitet og sekventering ensartethed.

Materialer og metoder

Kliniske prøver

undersøgte datasæt omfattede 113 lunge tumor prøver reseceret fra patienter på James Cancer Hospital /Ohio State University (OSU, Columbus, OH) mellem 1988 og 2011. Alle prøverne blev arkiveret som FFPE tumorblokke, og blev udvalgt på grundlag af væv tilgængelighed. Et hundrede og ti prøver var primær NSCLC (60 adenocarcinomer, 31 planocellulært karcinom, 10 adenosquamøst og 9 andre histologiske undertyper), mens 3 prøver var hoved og hals kræft (alle planocellulært karcinom) metastaserende til lungerne (tabel A i S1 Fil). Hver prøve blev tildelt en unik, uidentificerbare kode, og dato for kirurgi blev gennemgået og kommenteret at estimere tumor blok opbevaringstid. Den institutionelle Review Board godkendte dette projekt, og frafaldes behovet for samtykkende.

Tissue behandling

resektion prøver med repræsentative tumorvæv blev udvalgt til NGS test. For at øge tumor indhold, en patolog (K.S.) markerede en H 0,01 i alle tilfælde), og betyde basis kvalitet (

r

= -0,188, p = 0,046), og positivt korreleret til off-target rate (

r

= 0,285, p 0,01), kompatibel med bedre resultater, hvis nyere prøver valgt. Den QC-forholdet var korreleret til at indsætte størrelse (

r

= 0,601, p 0,01), og ubetydeligt korreleret til at målrette dækning (

r

= 0,183, p = 0,058), tilpasning sats (

r

= 0,169, p = 0,08), og base kvalitet (

r

= 0,162, p = 0,094). DNA input blev korreleret til total antal læser (

r

= 0,548), betyde target dækning (

r

= 0,549), tilpasning sats (

r

= 0,449), betyde basis kvalitet (r = 0,477), og off-target rate (

r

= -0,336, p 0,01 i alle tilfælde), men ikke for at indsætte størrelse (

r

= 0,081, p = 0,395). Disse data tyder på, at en bedre QC forholdet og højere DNA input i udarbejdelsen biblioteket kan forudsige større sekventering effektivitet.

Tre pre-analytiske variabler (FFPE opbevaringstid, PCR /QC-forholdet, og DNA input i udarbejdelsen bibliotek) var signifikant korreleret til de fleste post-sekventering parametre (A). De præ-analytiske variabler blev klassificeret som under eller over medianværdier for at illustrere indvirkningen på insert størrelse (B) og læst kvalitet /Phred score (C). Forkortelser: FFPE, formalin-fikseret paraffinindstøbte væv blokerer; PCR /QC, PCR-baserede kvalitetskontrol.

Den kombinerede effekt af præ-analytiske variabler

Den kombinerede effekt af præ-analytiske variabler blev vurderet i en uddannelse datasæt på 33 genomisk regioner, med median dybde af dækningen af ​​267 (interval 43-464). FFPE opbevaringstid var negativt korreleret til dybden af ​​dækning (

r

= -0,558, p 0,01, Fig 2A), mens QC ratio og DNA input var positivt korreleret (

r

= 0,37 og 0,47, henholdsvis; p 0,01 i begge, fig 2B og 2C). Ved hjælp af en multivariat analyse, viste vi, at hver af disse variabler var stadig signifikant korreleret til sekventering ydeevne (tabel E i S1 File). For at skabe et unikt tal, der anslår prøven kvalitet i denne kohorte, vi fusionerede alle tre variable i en kombineret score, som beskrevet i fremgangsmåder. Som forventet blev det kombinerede score højt korreleret med dybden af ​​dækningen i uddannelsen datasættet (

r

= 0,751; p 0,01, Fig 2D). For at bekræfte dens nøjagtighed, vi sammenlignet det med den gennemsnitlige mål dækning i alle undersøgte genomiske regioner (uafhængigt af fordomme forårsaget af kopi nummer ændringer), og til den læste dybde i baser huser hyppig kønscellelinie eller somatiske enkelt nukleotid variationer (SNV), der ligger i generne ikke anvendes i træningen datasæt. Der var stærk positiv korrelation mellem den kombinerede score og dybden af ​​dækning i alle disse tilfælde. Desuden viste vi stærk sammenhæng mellem den kombinerede score og 20x, 50x, og 100x target basis dækning (

r

= 0,779, 0,790, og 0,792 henholdsvis; p 0,01), samt til andre sekventering effektivitet parametre (tabel 2 og fig 3A).

FFPE opbevaringstid (A), PCR /QC-forhold (B), og DNA input (C) blev korreleret til sekventering dybde af dækning. En kombineret score (D) blev bygget på grundlag af disse tre parametre, og var stærkt korreleret til sekventering dybde. Forkortelser: FFPE, formalin-fikseret paraffinindstøbte væv blokerer; PCR /QC, PCR-baserede kvalitetskontrol.

Den kombinerede score var stærkt korreleret til post-sekventering parametre (A). Korrelation til 50x dækning blev anvendt til at definere før-analytiske tærskler, der kunne forudsige sekventering effektivitet, og er illustreret ved udglatning kurver (B).

Dernæst søgte at definere en præ-analytisk cut-off-værdien, der kunne forudsige passende sekventeringsresultaterne. Til dette formål har vi plottet før-sekventering variable (herunder den kombinerede score) mod 50x dækning i vores datasæt, og defineret 90% 50x dækning som en parameter for gunstige resultater. Ifølge denne analyse, en FFPE opbevaringstid på 8,6 år, en PCR /QC-forhold på 0,22, et DNA indgang på 960 ng, eller en kombineret score på 266 blev tærskler forbundet med sekventering effektivitet (Fig 3B).

lav dybde af dækningen var karakteristisk for regioner med lav GC-indhold

Udover prøve kvalitet, vi evaluerede effekten af ​​basen sammensætning på sekventering dybde. For at vurdere dybde af dækning ensartethed, vi vurderet den gennemsnitlige normaliserede dækning på tværs af de genomiske regioner udspændt af de designede prober. Vi demonstrerede en bred variabilitet, og observeret, at ringe dækning var signifikant associeret med regioner frembyder lavere GC-indhold (fig 4A). Den bedste dækning blev observeret i områder med 0,5-0,7 GC-indhold-forhold, med en markant forværring under 0,4 (p 0,01). Efterfølgende vi stratificeret prøver i henhold til baseline kvalitet (målt ved præ-sekventering kombineret score), og re-vurderet GC-indhold effekt. Især regioner med lav GC-indhold (under 0,4) haft værre dækning i hver stratum, med en udtalt lavere dækning i prøver med dårlig præ-sekventering kvalitet (Fig 4B).

Normaliseret dybde af dækning præsenterer bred variation inden genomet, med dårligere dækning observeret i regioner med lavere GC-indhold (A). GC-indhold virkning var additiv for at prøve kvalitet til at forudsige dybde af dækning, som observeres efter stratificering prøve fotos ved brug af kombinerede score (B). Forkortelser:. St. Dev, standardafvigelse. Obs: ** angiver signifikans ved p 0,01

Impact dækning variabilitet på gen hotspots

Da sekventering målinger er i sidste ende et surrogat for optimal variant kald, vi forhørt hvis prøven kvalitet. og GC-indhold vil have en indvirkning på target dækning på hotspot positioner i

KRAS

EGFR

. Som vist i tabel 3, disse gener eksemplificere de modstående yderpunkter af dækningen spektrum observeret heri. Mens hotspot positioner i

EGFR

præsenterede en ideel GC-indhold (0,51 til 0,55) og en optimal dækning,

KRAS

viste lavere GC-indhold (0,33-0,36) og en dramatisk værre dækning. Det mediane antal læser i

KRAS

codon 12 var kun 51 (interval 3-183) og 20x og 50x target-dækning var 87,9% og 51,4%, hhv. På den anden side, alle

EGFR

hotspot positioner præsenteret tilfredsstillende dækning (tabel 3). Som NGS variant ringer rørledninger ofte vil indeholde filtre baser på en minimal dækning (f.eks. 20x eller 50x), tilbagevendende

KRAS

mutationer kunne let forpasset på grund af lav dækning. Faktisk 12 ud af 22

blev opdaget KRAS

mutant tilfælde blandt prøver med 50 læser eller mindre, og 3 sager blev fundet med mindre end 20 læser (tabel F i S1 fil), som alle blev bekræftet af visuel læsning inspektion. Dårlig dækning i disse steder kan også forringe følsomheden til at detektere lave allel frekvens mutationer. Ved hjælp af en score grænse på 266 minimum kombineret, median antal læser i

KRAS

codon 12 var 72,5 (spændvidde 18-183) og 20x og 50x dækningen var 98,2% og 80,4%. I overensstemmelse med de seneste rapporter, vi observerede en negativ sammenhæng mellem PCR /QC-forholdet og dinukleotid CpG til TpG overgange (

r

= -0,186, p = 0,049). Lignende korrelationer blev ikke set på andre præ-analytiske variabler eller andre dinukleotid ændringer.

Diskussion

I den foreliggende undersøgelse, vi bekræftet, at kliniske FFPE prøver en pålidelig kilde til DNA for målrettet gen sekventering i kræft, forudsat tilstrækkelig prøve kvalitetskontrol udøves. Vi viste, at tre pre-analytiske variabler-FFPE opbevaringstid, PCR /QC-forholdet, og DNA input i biblioteket forberedelse-signifikant korreleret til de fleste parametre for sekventering effektivitet. Den kombinerede undersøgelse af disse funktioner kan være særligt nyttigt at definere prøve tilstrækkelighed for sekventering, som det fremgår af en poolet model stammer fra dem, der var stærkt korreleret til sekventering effektivitet. Vi viste også en signifikant variation i dybden af ​​dækningen i genomet, afhængig af GC-indhold-forholdet. Genomiske regioner med lavere GC-indhold præsenteret værre dybde af dækning, og denne virkning var additiv til at prøve kvalitet.

Det er vist, at NGS data fra FFPE prøver har mindre bibliotek skærstørrelser og større dækning variation. [23] heri, gik vi yderligere at demonstrere, at FFPE opbevaringstid, kan PCR /QC-forholdet, og DNA-input alle forudsige sekventering kvalitet inden for denne gruppe. For eksempel blev FFPE opbevaringstid (eller tumor alder) negativt korreleret til adskillige post-sekventering parametre, herunder dybde af dækning, insert størrelse, og base kvalitet. Disse resultater er i overensstemmelse med resultaterne fra Hedegaard et al [12], som også viste bedre resultater, når mere nylig opnåede FFPE prøver blev anvendt. I den forstand kan flere faktorer har negativt påvirket resultaterne i ældre prøver, herunder brugt tidligere for tumor fiksering, forarbejdning ikke-standardiserede metoder, indlejring, samt opbevaringstid

per se

. På den anden side, har Schweiger et al [39] ikke finde en påvirkning af tumor alder, sekventering dybde, men denne undersøgelse var begrænset af en meget lille stikprøve (kun 7 FFPE prøver). Selv ældre tumorer kan være en undtagelse i den kliniske omgivelser, kan patologer nødt til at bruge gamle FFPE prøver i konkrete forskningsprojekter indstillinger. Nogle mulige scenarier omfatter retrospektiv analyse af unikke prøver erhvervet i kliniske forsøg, undersøgelse af sjældne sygdomme, og når væv bank prøver er de eneste tilgængelige kilde. Hvis ældre prøverne skal medtages, kan det være vigtigt at vælge for dem med bedre DNA kvalitet (ved hjælp af skøn over DNA-fragmentering). Når alternative kilder er ikke en mulighed, hvilket øger DNA input eller sekventering dybde kan hjælpe med at overvinde de iboende begrænsninger relateret til længere prøve opbevaring og ældre håndtering metoder.

Forskellige metoder er blevet rapporteret til at vurdere kvaliteten af ​​gDNA stammer fra kliniske FFPE prøver. Disse omfatter kontrollere A260 /280-forholdet ved hjælp NanoDrop spektrofotometer (et forhold på 1,8 eller større antyder rimelig renhed), beregning af den anslåede dobbeltstrenget DNA beløb dividere qubit

® DNA estimering af NanoDrop (forhold mellem 0,4 eller højere er ideelle) , kører en alikvot af gDNA på en agarosegel eller TapeStation (fragmenter på 200 bp eller mindre indikerer dårlig kvalitet), eller ved anvendelse af en PCR-baseret fremgangsmåde. [30-33] i denne undersøgelse anvendte vi en standardprotokol anbefalet af producenten , baseret på PCR-amplifikation af genomiske regioner af forskellig størrelse. [35] lav kvalitet DNA vil generere mindre rigelige amplikoner, der simulerer de forventede resultater under målet berigelse. Denne form for analyse blev uafhængigt korreleret til dybden af ​​dækning, med højere forhold giver den bedste dækning. Dette PCR-baseret test er forholdsvis ligetil, billig, anvender lav mængde DNA som input, og er derfor lettere at anvende i de fleste laboratorier.

DNA input i præparatet biblioteket er et vigtigt tegn sekventering succes. [21 ] for platform, der anvendes i den aktuelle undersøgelse, producenten anbefaler mindst 225 ng gDNA (anslået af fluorescens metoder som PicoGreen

® eller qubit

®), der kan forhøjes i tilfælde af lav kvalitet DNA . Vores data viser, at DNA-input var korreleret til sekventering dybde, tilpasning sats, basis kvalitet, og off-target rate. Endnu vigtigere, DNA input var substituerbare med andre pre-sekventering parametre (tumor alder, PCR /QC) til at forudsige sekventering dybde. Det betyder, at højere DNA input ofte kan kompensere for lav kvalitet DNA, mens høj kvalitet DNA kunne anvendes på væsentligt lavere input, hvilket fremgår af den samlede score Analysen i denne.

Vi genererede en unik score, tager hensyn til data fra tre pre-analytiske variabler, demonstrerede uafhængig indvirkning på sekventering dybde. Desuden er vi spekulerede på potentielle afskæringsværdier for hver af disse variabler, der kunne hjælpe definere væv tilstrækkelighed for sekventering. Selvom det kan være attraktivt at overveje disse værdier i den rutinemæssige af sekventering laboratorier, skal drøftes nogle begrænsninger. For eksempel er det stadig usikkert, om denne evaluering kan anvendes på andre indstillinger, især hvis distinkte QC eller NGS analyser er ansat.

Be the first to comment

Leave a Reply