PLoS ONE: conceptualizing Cancer Drugs som Classifiers

Abstrakt

Kræft og raske celler har forskellige distributioner af molekylære egenskaber og dermed reagerer forskelligt på medicin. Kræft medicin ideelt dræbe kræftceller og samtidig begrænse skader på raske celler. Men den iboende varians blandt celler i både kræft og raske cellepopulationer øger vanskeligheden ved selektiv lægemiddelvirkning,. Her formalisere vi en klassifikation ramme baseret på den idé, at en ideel kræft narkotika maksimalt bør skelne mellem kræft og sunde celler. Mere specifikt bør denne diskriminering udføres på grundlag af målbare cellemarkører. Vi opdeler problemet i tre dele, som vi udforske med eksempler. Første, molekylære markører bør skelne kræftceller fra raske celler på single-celle niveau. For det andet skulle virkningerne af lægemidlerne statistisk forudsagt af disse molekylære markører. For det tredje bør lægemidler optimeres til ydeevne klassifikation. Vi finder, at ekspressionsniveauer af en håndfuld gener tilstrækkeligt til at skelne godt mellem enkelte celler i cancer og sundt væv. Vi finder også, at genekspression forudsiger effekten af ​​nogle kræftlægemidler, hvilket tyder på, at disse kræftlægemidler fungere som suboptimale klassificører hjælp gen profiler. Endelig har vi formulerer en ramme, der definerer en optimal stof, og forudser narkotika cocktails, der kan målrette kræft mere præcist end de enkelte lægemidler alene. Konceptualiserer kræft narkotika som at løse et problem diskrimination i high-dimensionelle rum af molekylære markører lover at informere design af nye kræftlægemidler og narkotika cocktails

Henvisning:. Lawlor PN, Kalisky T, Rosner R, Rosner MR, Kording KP (2014) Conceptualizing Cancer Drugs som Klassificører. PLoS ONE 9 (9): e106444. doi: 10,1371 /journal.pone.0106444

Redaktør: Sui Huang, Institut for Systembiologi, USA

Modtaget: Januar 6, 2014 Accepteret: 4. august, 2014 Udgivet: 23 September, 2014

Copyright: © 2014 Lawlor et al. Dette er en åben adgang artiklen distribueres under betingelserne i Creative Commons Attribution License, som tillader ubegrænset brug, distribution og reproduktion i ethvert medie, forudsat den oprindelige forfatter og kilde krediteres

Finansiering:. PL var støttet af National Institutes of Health 5P01NS044393. KK blev støttet af National Institutes of Health R01NS063399. RR og MR blev støttet af universitetet i Chicago Kvinders Board. TK blev finansieret af Machiah Foundation. De finansieringskilder havde ingen rolle i studie design, indsamling og analyse af data, beslutning om at offentliggøre, eller forberedelse af manuskriptet

Konkurrerende interesser:.. Forfatterne har erklæret, at der ikke findes konkurrerende interesser

Introduktion

Det centrale mål for behandling af kræft er at dræbe kræft væv mens sundt væv intakt. Effektive cancer medicin skal derfor skelne mellem kræftceller og raske celler. Derudover bør optimal kræftbehandling også være robust over for biologisk variabilitet såsom tumor og sund celle heterogenitet [1]. Ved at kombinere disse ideer, kan vi indramme kræft problemet på en måde, der balancerer den potentielle overlapning af sunde og kræft celle egenskaber med behovet for at dræbe aggressive kræftceller varianter (fig. 1). Mens behovet for at adskille kræft fra raske celler ligger til grund for nuværende kræftbehandling, til vores viden det har ikke været matematisk formaliseret. Udvikling af en matematisk ramme åbner mulighed for at oversætte indsigter fra beregningsmæssige videnskab i nye tilgange til kræftbehandling

Ideelt set cancer medicin udføre en beregning på celler:. Dræbe (hvis kræft) eller no-kill (hvis sunde).

Kræft medicin bør derfor opfattes som at udføre en beregning på celler. For eksempel, for giftige stoffer, cellulære mål føre til et enkelt resultat (dræber eller ikke dræbe) under behandlingen. Matematisk kan vi sige, at virkningen af ​​et lægemiddel er en kortlægning fra et sæt af egenskaber (mål i cellen) på en stokastisk, binær udgang (cellen lever eller dør) – det er præcis definition af en sorterer i felterne af statistikker og maskine læring [2]. I den forstand enhver cancer lægemiddel er faktisk en sorterer (fig. 2). Anvendelsen af ​​ordet “klassificeringen” til denne selektivt drab er ikke blot semantisk. I stedet vedrører en formel matematisk tilgang og værktøjskasse stammer fra maskine læring, som kan bidrage til udvikling af lægemidler.

Dette illustrerer, hvordan man kan kombinere oplysninger fra to cellulære markører til at konstruere en klassificeringen, der adskiller de to populationer (kræft og sunde celler) bedre end både markør alene.

Mange computer algoritmer er blevet udviklet til at løse problemer klassificering, og en rig litteratur findes inden for statistik og machine learning vedrørende effektive metoder til klassificering [2 ]. Disse beregningsmæssige felter tilbyder en bred vifte af tilgange, herunder kvantitative effektivitetsmålinger, effektive algoritmer til store datasæt, og metoder til forbedring klassificører. For eksempel har megen forskning rettet hvordan man kan kombinere svage klassifikatorer for at bygge bedre klassificører, antyder, at disse metoder kan tilpasses til lægemiddelkombination (fig. 2). Machine læring, definere søgningen efter klassificører som Optimizers, tilbyder en ren måde at beskrive en målrettet søgning. Dette papir er beregnet til at tydeliggøre ækvivalensen af ​​søgningen efter klassificører og søgen efter kræftmedicin.

Data fra nyudviklede omik tilgange muliggøre anvendelsen af ​​klassificeringen teori til narkotika optimering. Microarray og sekventering teknologi, for eksempel, giver os mulighed for samtidig at indsamle oplysninger om tusindvis af cellulære

markører Z – målinger, der kendetegner staten eller fænotype af cellen, såsom genekspression. Nogle af disse markører bør skelne kræftceller fra raske celler, medvirken i nøjagtig klassificering og kræft målretning. Vigtigt er dog ikke alle markører er molekylære lægemiddelkandidater. Molekylær

mål

er molekyler, cancer medicin rent faktisk bruger til at ændre celler. Men begravet i de tusindvis af målbare markører er en delmængde af markører, der

reflektere eller korrelerer med

de molekylære mål for narkotika. For eksempel kan ekspression af gener, som er nedstrøms for en lægemiddeltarget korrelerer godt med at lægemidlets virkning. Emerging bioteknologi giver os mulighed for at måle disse cellulære markører og analysere dem ved statistiske værktøjer som maskine at lære at forstå kræft mere fuldt ud.

Selvom kræft narkotika ikke formelt har karakteriseret som klassificører, machine learning er blevet grundigt anvendt på mange aspekter af cancer biologi. En gruppe har anslået brystkræft resultat ved at bruge maskinen, lære at skabe en 70-gen forudsigelse algoritme [3], mens vi og andre har brugt machine learning, i kombination med diskrete signalveje, at forudsige metastase overlevelse [4]. Andre har forsøgt at skelne mellem forskellige typer af kræft ved hjælp af mange typer af algoritmer, herunder Support Vector Machines (SVM) [5], [6], Principal Component Analysis [7], [8] og kunstige neurale netværk [9]. Alligevel andre forudser kemosensitivitet på grundlag af genekspression [10], [11] og signalanlæg netværk [12]. Men mens alle disse tilgange har gjort imponerende fremskridt og er nyttige i klinisk praksis, disse ideer er ikke blevet kombineret til at producere en principbaseret tilgang til kræft drug design.

Her foreslår vi en ramme for at designe kræftbehandling der strækker eksisterende idéer ved hjælp af klassificeringen konceptualisering. Vi først beskrive den strategi, og derefter, som et praktisk eksempel, foretage en analyse af eksperimentelle data til at vise, hvordan dette kan gøres i princippet. Den overordnede tilgang er opsummeret nedenfor:

Rammer for behandling af kræft

Formalisere kræft narkotika som klassificører bør informere hvordan vi behandler kræft. Der er tre væsentlige dele af denne tilgang, som vi først opsummere på et højt niveau, og derefter demonstrere under anvendelse af eksisterende eksperimentelle data: 1) Konkret definere det mål, der skal nås ved klassificering – nemlig hvilke celler til at dræbe, hvilke celler til at forlade, og hvordan man se forskel mellem de to; 2) Forstå behandlingsredskaber til vores rådighed; og 3) Optimalt bruge disse behandlingsmetoder værktøjer til at udføre den definerede klassifikation mål. Vi har sammenfattet definitioner og forudsætninger vedrørende denne ramme i tabel 1.

Definition af mål (del I)

Det første skridt er at skelne mellem kræft og sunde celler. Fordi dette er målet for kræftbehandling, er det vigtigt at konkret angive dette mål. For at gøre dette, bruger vi matematik algoritmer klassificering i forbindelse med målinger af cellemarkører. Klassificeringen besvarer følgende spørgsmål: hvor meget kræftceller adskiller sig fra raske celler, og som biologiske markører kan skelne dem? Det anmoder dette spørgsmål, mens eksplicit overvejer heterogenitet begge populationer. Markørerne kunne omfatte genekspression, overfladeproteiner osv Fordi skelne mellem kræft og sunde celler kræver under hensyntagen til uensartethed i hver population, har vi fokuseret på markører for enkelte celler snarere end cellepopulationer hvor det er muligt.

Klassificering af algoritmer i denne sammenhæng er designet til at give den maksimale separation af kræftceller fra raske celler i form af disse særlige markører. Som sådan, kan vi sige, at resultaterne af klassificeringen beskrive, hvad en hypotetisk “optimale” stof handler på disse markører kunne opnå. Del I af resultaterne viser, hvordan man kunne definere dette optimalitet målsætning ved hjælp genekspression i enkelte celler og udforsker, hvor mange markører og celler er nødvendige for at nå dette mål.

Forstå behandlingsredskaber til vores rådighed (del II)

Det næste skridt er at forstå, hvordan de tilgængelige behandlingsmuligheder værktøjer giver os mulighed for at udnytte de særlige markører for kræftceller. Vi bør stræbe efter at tilnærme den optimale lægemiddel ved at designe nye lægemidler eller kombinere eksisterende lægemidler. Her fokuserer vi på den anden.

Lægemidler bør ideelt målrette karakteristiske egenskaber af kræft, men de fleste lægemidler, der anvendes i klinikken ikke gør dette perfekt. Desuden deres virkningsmekanismer er forskellige. Det kan således være muligt at forudsige, hvordan eksisterende lægemidler bør kombineres til at producere mere ønskelige resultater. Faktisk gør denne forudsigelse ville afhænge vedrørende de aktioner narkotika til de særlige egenskaber ved kræft. For eksempel, hvis kræftceller adskiller sig fra raske celler primært via tre forskellige markører, tre lægemidler

kendt

til separat udnytte hver enkelt markør som klassificeringen teoretisk kunne kombineres. Del II af resultater viser denne idé ved at udforske forholdet mellem narkotika handling og molekylære egenskaber (genekspression).

Optimalt brug af behandlingsredskaber (del III)

Det sidste trin er at bruge matematik klassificering til at spørge, hvordan vores tilgængelige værktøjer (f.eks lægemidler) tillade os at nå vores mål. Fra den første del, vi ved, hvordan at skelne kræftceller fra raske celler. Fra anden, vi ved, hvordan vores medicin vedrører molekylære markører. Nu kan vi bruge disse to ideer til at optimere behandlingen ved at matche de klassificerer evner vores medicin til målsætningen angivne klassificering.

Her er vi igen vil fokusere på at optimere lægemiddelkombinationer. En metode ville være at forudsige lægemiddelkombinationer, der diskriminerer mellem kræft og raske celler bedre end både stof alene. Del III af resultater viser en tilgang, der, under ideelle betingelser, kunne opnå dette mål.

En begrænsning af denne undersøgelse er, at de aktuelt tilgængelige data for sådanne analyser er begrænsede og ikke ideel. Derfor, for at illustrere de tre dele af rammen klassificering ved hjælp af data fra virkelige biologiske prøver, har vi erstattet eller omdefineres celle fænotyper, når den ønskede celle data mangler.

Resultater

Del I : Definition af klassificering målet med molekylære målinger

Hvis kræftmedicin virke som klassificører, der bruger målbare markører som input, kan vi bruge standard klassificering algoritmer til at undersøge muligheden for at løse kræft versus raske problem klassifikation celle. Det er teoretisk muligt, at der er en optimal lægemiddel (eller lægemiddel-kombination), der opnår dette mål i praksis. Dette ville indebære, at et sådant lægemiddel ville dræbe cancerceller mens raske celler alene i videst muligt omfang. Vi vil bruge denne forestilling om en optimal lægemiddel som en guide til at analysere behandling. I praksis bør de faktiske lægemidler eller lægemiddelkombinationer vælges til at ligne den optimale lægemiddel. Vi anerkender, at ethvert tumor er anderledes, men vores mål her er at illustrere en tilgang til at skelne kræft fra ikke-kræft væv i én sammenhæng. Denne fremgangsmåde kan også anvendes på andre typer kræft.

For at afgøre, om det er teoretisk muligt at løse dette problem, vi har brug for et datasæt af celler med både kendte kræft tilstand og målte markører. Vi anvendte encellede transkriptionelle data fra tyktarmen [13]. Dette datasæt omfattede både et begrænset antal markører (45 gener) og et begrænset antal kolon væv undertyper og celler ( 200 celler). Således har vi fokus på at skelne mellem sunde og kræftceller i en væv undertype: stamceller-lignende celler. Fordi disse celler er så ens – som påpeget i den originale publikation – dette valg tjente til at gøre klassificering problemet mere udfordrende. Dette datasæt dermed tillod os at teste styrken i tilgangen klassificering.

Kan denne klassificering problem skal løses? Med andre ord kan de encellede transskription data forudsige celle tilstand (kræft eller ej)? For at besvare dette spørgsmål brugte vi en standard klassifikation algoritme, den legaliseret GLM [14], [15]. Test hvor godt sådan klassificeringsvariablerne algoritmer arbejde giver os mulighed for at give en øvre grænse for, hvor godt en faktiske stof kunne fungere, hvis det bruges genekspression alene.

Først ønskede vi at måle potentielle nøjagtighed denne klassificering. I klassifikationen er der forskellige typer af fejl, som man kan gøre. For eksempel er det let at fremstille et lægemiddel, der dræber alle kræftceller, men også dræber alle raske celler. Dette lægemiddel vil have 100% ægte positive (dræbte kræft celler), men også 100% falske positiver (dræbte sunde celler). Således til fuldt ud at karakterisere en klassificeringsstrategi vi bør analysere forholdet mellem de to typer af fejl. Standarden for nøjagtighed klassifikation er modtageren opererer karakteristik (ROC) plot. I dette plot andelen af ​​ægte positive afbildes som en funktion af andelen af ​​falske positiver (fig. 3) for at kvantificere både følsomhed og specificitet. Arealet under denne kurve (AUC) giver et samlet mål for ydeevne klassifikation med en maksimal værdi på 1 til en perfekt test. AUC for vores klassifikationsalgoritme var ~0.9, hvilket indikerer, at sunde og kræftceller kan godt klassificeret. Derfor er det teoretisk muligt at løse denne særlige kræft versus sund problem klassificering for enkelte celler med stor nøjagtighed ved hjælp af ekspressionsniveauerne for blot et lille sæt (~45) af gener.

Når målenøjagtighed celle klassificering som kræft eller sundt, bør man overveje begge typer af fejl: falske positive og falske negative (eller mere konventionelt, sande positiver). Dette illustreres af Receiver Operating Characteristic (ROC) kurve. Linjer angiver middelværdier, og fejl barer angiver bootstrapped 95% konfidensintervaller. Nøjagtigheden blev målt ved hjælp af cross-validering; og chance værdi blev bestemt ved anvendelse shuffle kontrol.

Næste vi spurgte

hvor mange

cellulære markører en optimal stof skulle klassificere celler præcist. Med andre ord, hvad der er det mindste antal markører en optimal lægemiddel skal overveje at se forskel mellem raske og kræftceller? Vi fandt, at et relativt lille antal gener – omtrent den bedste 10 (sorteret efter størrelsen af ​​fit parameter) – tilstrækkeligt til at klassificere en celle som kræft eller sundt med stor nøjagtighed (fig 3, 4.). Den intelligente magt klassificeringen mættede snart efter de bedste 10 gener blev inkluderet. Således er det kun et lille antal cellulære markører giver størstedelen af ​​de oplysninger, anvendes til at klassificere en celle som kræft eller sund.

Classification blev målt som arealet under kurven (AUC) af ROC-kurven. En perfekt klassifikatør ville opnå en AUC på 1, mens en tilfældig klassifikatør ville opnå en AUC of.5. Hver farvet linje repræsenterer et forskelligt antal celler anvendt til at træne klassifikatoren, der viser, at ydeevnen forbedres som anvendes flere celler. Linjer angiver middelværdier, og skraverede områder angiver bootstrapped 95% konfidensintervaller. Nøjagtigheden blev målt ved hjælp af cross-validering; og chance værdi blev bestemt ved anvendelse shuffle kontrol.

Evnen til at måle genekspression fra enkelte celler rejser spørgsmålet om, hvorvidt det er mere vigtigt at måle flere celler eller flere gener. For at besvare dette, kvantificeret vi den relative betydning af at øge antallet af målte celler versus antallet af målte gener per celle. Vi trænet klassifikatoren med antal celler i området fra to total (en sund, én tumorcelle) til 180 totale celler (95% af celler). Som ovenfor målte vi klassificeringen præstation, bortset fra at vi gjorde det for hver uddannelse scenario. Vi fandt igen, at udførelsen mættet efter et lille antal gener for hver træningsscenariet. Vigtigt er det, fandt vi også, at ydeevne fortsatte med at forbedre med et stigende antal uddannelse celler indtil ca. 80 blev anvendt (fig. 4). Således målinger fra mindst snesevis af celler er forpligtet til at redegøre for varians i en forenklet population af tumor og sunde celler.

I dette afsnit har vi vist, hvordan man foretager en analyse, der vil definere, hvad den optimale behandling – den “ideelle stof” – kunne udrette. Med en eksperimentel datasæt viste vi, at det er muligt nøjagtigt at løse kræft klassifikationsproblem. Denne type analyse kan også identificere de markører, der adskiller kræft fra raske celler. For den begrænsede datasæt, vi valgte, viste det sig, at løse klassificering problemet var muligt med ca. 10 markører og 80 celler. Men disse tal varierer fra tumorcellepopulation samt de særlige markører analyseres

Del II:. Klassificering af virkelige kræftlægemidler

I den første del af resultater, vi har undersøgt muligheden for en optimal cancer stof, der skelner mellem raske og kræftceller. I denne anden del af undersøgelsen, vil vi demonstrere

hvorvidt

og

hvordan

værktøjerne til vores rådighed (i dette eksempel, faktiske stoffer) kan klassificere celler. Dette vil hjælpe os med at forstå, hvordan man bruger faktiske medicin til at nærme sig opfyldelsen af ​​den optimale lægemiddel.

Specielt i det følgende eksempel, spørger vi, hvordan kræftmedicin

faktisk

vedrører molekylære markører. For at besvare dette spørgsmål, ville vi helst bruge enkelte celler. Dette er vanskeligt med enkelte celler, men fordi behandling og markør måling både potentielt ødelægge cellen. En mulig løsning er at muliggøre begrænset replikation af enkelte celler for at analysere markør status for et sæt af datterceller samtidig bestemmelse lægemiddeleffektivitet bruger andre datterceller. Imidlertid vil selv disse to sæt udviser heterogenitet med tiden. Da der ikke i øjeblikket tilgængelige genekspression data for sådanne bestande, der er blevet behandlet med lægemidler, er det nærmeste substitut etablerede cellelinjer, der har en klonal oprindelse og stort set genetisk homogene. Derfor brugte vi cellelinier som stand-ins til enkelte celler til at spørge, hvordan narkotika vedrører molekylære markører.

Fordi vores tidligere resultater tyder på, at vi har brug for snesevis af celler til at løse klassificering problemet, valgte vi at analysere en type af væv med mange etablerede cellelinier. Vi brugte derfor 45 luminale og basale-lignende brystcancercellelinjer karakteriseret ved Gray og kolleger [12]. De målte ca. 19.000 gener i disse brystkræftpatienter linjer under anvendelse microarrays, samt de kemoterapeutiske svarene fra disse linjer til hver af 74 lægemidler. Disse strækninger er en god repræsentation af området cellefænotyper findes i brystkræft og således repræsentere mere varians end en egentlig tumor. Alligevel giver disse cellelinjer tilladt os at spørge, hvordan cellemarkører relateret til lægemiddel følsomhed.

Vi anvendte en algoritme til at forudsige, om kræftlægemidler vil dræbe celler af en specifik cellelinie på grundlag af sine markører. Især vi estimeret narkotika følsomhed disse cellelinjer. Faktisk er nogle aspekter af narkotika svarene var forudsigelig. For eksempel har vi forudsagde den kemoterapeutiske reaktion på lægemidlet lapatinib, en tyrosinkinase inhibitor, der blokerer signalering af både EGF-receptoren og HER2 /neu. Vi opnåede en R

2 værdi på -0,5. den lave R

2 værdi viser dog, at vores forudsigelse af narkotika opførsel ikke var stærk. Dette kan skyldes den lille størrelse af datasættet, men kan også betyde, at ikke alle relevante markører blev målt, eller alternativt, at forholdet er ulineær og ikke opfanges af lineære maskine læringsmetoder. Mens molekylære markører, såsom genekspression ikke fange alle variabilitet, de synes at spille en rolle i at forudsige lægemiddelrespons. Derfor cellulære markører forudser en vis grad af narkotika adfærd, når de behandles som input til en sorterer.

Vi ønskede også at vide, hvor mange gener er tilstrækkelige til at forudsige den faktiske stof adfærd. For at gøre dette, vi målte lægemidlets adfærd som en funktion af antallet af gener. Lapatinib kun brug for et lille antal gener (~ 5) for at nå sit højdepunkt nøjagtighed (fig. 5). Således et lille antal cellulære markører forudsige, hvorvidt faktiske lægemidler dræbe en celle. Dette er vigtigt, fordi det viser, at vi ikke nødvendigvis behøver at overveje mange tusinder af gener ved konstruktionen terapier.

Drug respons blev forudsagt under anvendelse af molekylære markører (genekspression). Nøjagtighed kemosensitivitet forudsigelse, målt som R

2, som repræsenterer den mængde variation forklaret. Skraverede områder angiver bootstrapped 95% konfidensintervaller. Nøjagtigheden blev målt ved hjælp af cross-validering.

Hvis lægemidler virker som klassificører bruger et lille antal ejendomme, så et lægemiddel kan karakteriseres ved at plotte sin virkning som en funktion af ejendommene. Vi valgte derfor de to gener (SLC5A8 og PERLD1), der var i fællesskab bedst til at forudsige Lapatinib effekt på tværs af cellelinjer. Brug enkle grid interpolation og ekstrapolation rutiner vi plottet lægemidlets virkning som en Heatmap (fig. 6). Denne type visualisering viser, at selv to gener kan fange den komplekse opførsel af en cancer lægemiddel.

Drug aktivitet er til en vis grad forudsigelig hjælp molekylære markører.

Vi analyserer narkotika aktivitet som den vedrører molekylære markører (dvs. fænotypiske karakteristika ved en celle), men sådanne markører er ikke nødvendigvis molekylær

mål

(dvs. celle komponenter såsom proteiner, hvis funktioner er ændret af et lægemiddel). Ideelt set ville eksperimentelle data også målinger af markører mere tilbøjelige til faktisk udgøre lægemiddelkandidater såsom tyrosinkinasereceptorer, der er målrettet af Lapatinib. Selvom gentranskripter vi analyserer ikke er de direkte mål for sorteringsindretningen lægemiddel, de stadig forudsige lægemiddelrespons og er derfor nyttige. Således kunne denne tilgang anvendes med

enhver

type molekylær markør eller mål.

I dette afsnit har vi vist, hvordan man kan forstå opførslen af ​​faktiske lægemidler inden for vores rammer. I vores eksempel, vi relateret stof effekt til molekylære markører, som i teorien, tillader en at spørge, hvordan faktiske lægemidler vedrører de karakteristiske markører for kræftceller. Dette vil være vigtigt for den næste afsnit, hvor vi spørge, hvordan man optimalt kombinere narkotika. I dette datasæt, dog finder vi, at de målte markører suboptimalt forudsige lægemiddelrespons. I fremtiden data indsamlet fra mange flere cellepopulationer og et udvalg af markør typer vil være behov for at foretage klinisk plausible forudsigelser

Del III:. Optimering kræftbehandling

I de to foregående afsnit, vi har vist, hvordan en optimal cancer drug kunne klassificere celler som kræft eller ej, og at cellulære markører forudser et vist omfang, hvordan et virkeligt lægemiddel opfører. I dette afsnit, vi kombinere disse to ideer til at skitsere en mulig tilgang til at optimere kræftbehandling. Vi ser for

par af narkotika Hoteller, som klassificerer kræftceller bedre når de kombineres end enten alene narkotika.

Vi viser denne tilgang begrebsmæssigt hjælp genekspression data og narkotika følsomhed målinger fra samme panel af brystkræft cellelinier [12]. Desværre var vi ikke i stand til at opnå tilsvarende data for noncancerous cellelinjer. Derfor gjorde vi to justeringer for at vise, at disse typer af analyser er i princippet muligt: ​​1) vi igen behandlet hver klonal cellelinie som en stand-in for en enkelt celle; og 2) vi brugte evnen til at skelne mellem to underklasser af væv som mål klassificeringen snarere end at skelne sundt fra kræftceller. Især vi brugt basal-lignende og luminale undertyper af brystkræft, som

nogenlunde

svare til aggressive (mere metastatisk) og mindre aggressiv (mindre metastatisk) kræft. Vi er klar over, at den reelle situation er mere kompleks end denne forenkling; men denne skelnen er i sidste ende vilkårlig og blot tjener til at demonstrere vores tilgang med en reel fænotypisk forskel. I betragtning af denne definition, og disse data, vi spurgte, om det var muligt at finde to lægemidler, der diskriminerer mellem den luminale og basal-lignende brystkræft undertyper bedre end hvert lægemiddel alene.

Rigtige stoffer ikke helt skelne mellem sunde og kræftceller. Imidlertid kan vi bruge maskinindlæring til at beskrive, hvordan man kombinerer lægemidler for bedre at tilnærme den optimale lægemiddel. Dette er inspireret af den velkendte metode i machine learning kaldet styrke [16], hvor yderligere funktioner er tilføjet til en klassificeringen for at aktivere gradvist bedre ydelse. Mere specifikt givet klassificeringen mål (optimal lægemiddel) fra del I og narkotika faktiske adfærd fra del II, kan vi afgøre, hvilke par af narkotika bedst tilnærme den optimale medicin. For at gøre dette, vi igen bruge rammen GLM at indramme den ønskede behandling som en kombination af lægemidler. Vi gentage derefter gennem mulige to-drug kombinationer for at afgøre, hvilket par fungerer bedst. Denne idé giver os mulighed for at bestemme den bedste medicin kombination til klassificering.

Vi fandt flere lægemiddelkombinationer der tilnærmede den optimale medicin. En særlig kombination inkluderet lægemidlerne Lestaurtinib og GSK461364 (fig 7;. Sammenlign figur 2.). Disse stoffer tilsammen giver en bedre klassifikation end både stof alene (fig. 8). Således vores metode giver en mekanisme til at vælge yderligere stoffer på en måde, som bør give os mulighed for at målrette kræftceller mere effektivt. Disse resultater forudsætter, at lægemidler virker både selvstændigt og forud for et adaptivt respons på behandlingen. Andre strategier til at løse dette problem er præsenteret i diskussionen.

Bedre forskelsbehandling mellem cellepopulationer opnås ved at inkludere en ekstra stof. Tærsklen klassificering linje vist i virkeligheden repræsenterer en gradient relateret til “sandsynlighed for celledød”, som er angivet med skravering. Se tekst for fuld beskrivelse.

Nøjagtighed (AUC) opnået ved begge lægemidler sammen er bedre end hvert lægemiddel for sig.

I dette afsnit har vi vist, hvordan du optimerer behandlingen anvende de rammer klassifikation. Vi understreger igen, at vi bruger suboptimale biologiske data som eksempler for at præcisere karakteren af ​​vores tilgang, ikke at producere klinisk relevante forudsigelser. Større og mere udtømmende datasæt vil være behov for at gøre dette muligt. Desuden har vi gjort forenklinger usandsynligt at generalisere til klinisk praksis. Således bør ikke tages disse resultater som en klinisk indstilling. Ikke desto mindre denne analyse viser, at bruge rammen klassificering for at optimere behandlingen tager højde for iboende variation i fænotyper og kunne påvirke valget af en behandling til at skelne mellem kræft og sunde celler,.

Diskussion

Den tilgang til behandling af kræft

I denne undersøgelse har vi argumenteret for, at ansætte kræft narkotika som klassificører giver en begrebsmæssig ramme for at udtænke optimale behandlingsstrategier for kræft. Optimale narkotikamisbrug molekylære mål at dræbe kræftceller og samtidig minimere skader på raske celler. Vi betragtede dette problem som en, der kunne løses med værktøjer fra maskine læring og vise, hvordan dette kunne informere en strategi til behandling af kræft. Vi viser, at en klasse af molekylære markører, genekspression, var tilstrækkelig til at løse dette problem optimering ganske godt bruge de undersøgte datasæt. Vi viste også, hvordan at indarbejde iboende celle variation i analysen og anerkende faktiske narkotika som suboptimale klassificører. Endelig har vi foreslået måder at bruge rammen klassifikationen at udlede lægemiddeludviklingsprogrammer strategier, der udfører så tæt som muligt til en optimal stof.

Optimering kræftbehandling ved at kombinere stoffer i henhold til principperne klassificering er forholdsvis ligetil, hvis kombinerede lægemidler ikke påvirke hinanden. For eksempel kan det være, at en anden lægemiddel ikke signifikant interfererer med den molekylære mekanisme af den første, og

omvendt

når de administreres samtidigt. Hvis virkningerne af de individuelle lægemidler er additive, ville evnen hos et bestemt medikament til at klassificere kræftcellerne ikke blive påvirket af et andet lægemiddel. Således forbindelsen klassificeringen – lægemiddelkombinationen – ville klassificere cancerceller mere præcist end hvert lægemiddel alene. Det er også muligt, at svage ulineære interaktioner mellem lægemidler stadig kunne give en overlegen forbindelse klassifikator end hvert lægemiddel alene. Antages linearitet placerer en

øvre grænse

af, hvor godt lægemiddelkombinationer kunne arbejde.

Hvad hvis vi finder en anden medicin, der bør forbedre klassificering, men er ikke additiv med det første lægemiddel? Denne ikke-lineære afhængighed er meget sandsynligt, at være vigtigt. En løsning ville være at iterativt anvende den næste mest optimale lægemiddel, indtil vi finder en, der ikke i væsentlig grad vekselvirker med det første lægemiddel. Således kan vælge den bedste yderligere stof til en kombination kræver teoretiske og empiriske overvejelser. Denne metode kan ikke garantere, at en given kombination af lægemidler vil arbejde, men i stedet foreslår en mere effektiv måde at vælge narkotika cocktails til test.

Be the first to comment

Leave a Reply